vVv (o o) --------oOO--(_)--OOo-------- __ ____| |____ __ _______| |__| :| The Splendid ~beju Space. | |__| |_______ \ :| |::| :| ~~~~~~~~~~~~ | |::| | / \ :| |::| :| freeshell.de/~beju | |::| | / > :| |::| :|___________________________| |::| | < / :|__|::|___:/ \.___|::|__| \ /_____:/ \::/ \::/ \._____\ This page is a reminiscence of the good old days of the WWW, when you could still read web pages with telnet on port 80.
Here you will find some experiences and toughts about AI. If you don't understand the German language you are invited to read the google translation here.
KI ist derzeit in aller Munde. Aber warum nur irgendwelchen Kram von Leuten lesen oder hoeren, die selber gar nicht so recht verstehen, worueber sie da gerade referieren? Man kann sich doch selbst einfach ein Bild machen von den Moeglichkeiten, welche derzeit die KI fuer (nichtzahlende private) Nutzer bietet. Das im kommerziellen und erst recht im militaerischen Umfeld noch ganz andere Dinge machbar sind (und auch gemacht werden), ist selbstverstaendlich.
Hier soll aber einfach nur mal gezeigt werden, was "Otto-Normalverbraucher" bereits machen kann - ohne sich einen kostenpflichtigen Zugang anlegen zu muessen.
In vielen Bereichen des Alltags hat KI laengst Einzug gehalten, ohne dass es sich als solches gross praesentiert. Ein Beispiel ist die Spracherkennung (Siri, Alexa, Diktatsoftware u.s.w) oder aber auch die Datenauswertung (da werden nicht nur Korrelationen, sondern auch Kausalitaeten aus riesigen Datenmengen in windeseile erkannt). Aber auch die mittlerweile fast ueberall existenten Chat-Roboter auf den Webseiten grosser Firmen greifen zumeist auf KI zurueck. Ebenso basieren viele Bild- bzw. Photobearbeitungsprogramme auf KI (mittlerweile auch auf Mobiltelefonen).
Aber wir wollen den 0-8-15-Alltag verlassen und uns, nennen wir es interessanten Dingen, zuwenden.
Als da waere beispielsweise die Bilderstellung (damit habe ich mich am ausgiebigsten beschaeftigt).
Man gibt in etwa vor, was man fuer ein Bild haben moechte (das nennt sich dann Prompt) und die KI versucht dann, ein entsprechendes Bild zu erstellen. Dabei werden nicht etwa irgendwelche Bilder im Netz gesucht und ein wenig abgeaendert, sondern es wird wirklich ein komplett neues Bild erzeugt, welches nach einem entsprechendem Modell generiert wird.
Manchmal, jedoch eher selten, entstehen Bilder, die wirklich einfach nur perfekt sind. Oftmals aber werden Bilder generiert, welche die Beschreibung eher nur leicht beruehren. Und hin und wieder vertut sich die KI aber auch vollkommen. Da werden Bilder erzeugt, die einer gewissen Komik nicht entbehren.
Ich habe mal den Prompt:
"typisch historische Frau mit einem niedlichen grauen Esel, schoenes Gesicht mit Gruebchen, Baeume, mystischer und regnerischer Tag, Szene ist im Mittelalter, sehr realistische Darstellung wie eine Photographie"
eingegeben (hier in Englisch, weil die KI damit besser umgehen konnte - prinzipiell gehen aber alle moeglichen Sprachen, da der Prompt immer automatisch in die entsprechende Zielsprache uebersetzt wird) und dann immer wieder neu auf "Bild generieren" gedrueckt. Nachfolgend so eine Art Best-of, nur um einmal die Bandbreite der Ergebnisse zu demonstrieren. Tatsaechlich ist es immer derselbe Prompt - hier nun also die lustigsten bzw. abartigsten Bilder aus der Serie:
Frau: huebsch, Esel: passt, Wald: stimmt, Mittelalter: naja... Hier wurde praktisch (fast) alles umgesetzt, nur eben in einer recht eigentuemlichen Weise.
Frau und Esel sind ganz gut geworden. Aber irgendwie hat die KI vor lauter Arbeit ganz das Mittelalter vergessen.
Kann sich jemand an den Film Total Recall erinnern, wo Kuato aus dem Bauch von George kommt? Aber hier ist es nur ein kleines lustiges Eselchen.
Nahezu perfekt, wenn der Esel nicht irgendwie wie ein Frau aussehen wuerde.
Eine solche hasenaehnliche Esel-Missgeburt muss man auf jeden Fall mit 3 Haenden festhalten.
Was sich die KI hier dabei gedacht hat, entzieht sich vollstaendig meiner Vorstellung. Aber immerhin Baeume.
Auch hier: hat die KI meinen Prompt vielleicht gar nicht gelesen?
Der kleine Esel fuer die Handtasche - warum auch nicht? Interessant uebrigens, dass nicht nur Hundebesitzer oftmals ihren Hunden aehnlich sind. Das war im Mittelalter mit Eselbesitzern nicht anders - zumindest geht so die Sage...
Frau mit huebschem Gesicht - passt. Baeume - passt. Und das wars dann auch soweit. Ist man im Mittelalter tatsaechlich im Winter halbnackt durch den Wald gegangen? Und warum ist hier ueberhaupt Winter? Ausserdem: Ich will Esel!
Das Maedel schielt, aber sonst recht nett. Der Esel ist zwar eher haesslich, aber dafuer schlau, denn offensichtlich wussten auch schon im Mittelalter die Esel, was gut ist. Dieser kleine Geniesser...
Das Bild spricht fuer sich - jeder Kommentar ist hier ueberfluessig.
Das ist wieder mal typisch KI: Offensichtlich hat man hier "like a photograph" sehr ernst genommen. Und den Rest dafuer einfach stillschweigend ignoriert - ausser der Frau natuerlich, denn irgendwas muss ja auf dem Photo sein.
Mittlerweile existieren auch mehrere kostenfreie KI's, mit denen man Videosequenzen erzeugen kann - es muessen nicht immer nur leblose Bilder sein.
KI kann ja aber wesentlich mehr, als nur Bilder und Videos erstellen. ChatGPT ist eines der bekanntesten Vertrteter der Gattung Ich-kann-alles. Man kann sich neben Bildern beispielsweise auch Gedichte oder gar Musikstuecke liefern lassen, wobei dann ChatGPT zumindest bei Bildern und Musik nur als Wrapper auftritt. Bilder werden dann zum Beispiel mit DALL-E erstellt, was eine dafuer spezialisierte GPT-Version ist.
Man kann auch einfach nur mal eine nette Unterhaltungen mit einer KI fuehren. Eine sehr brauchbare KI, die sogar etwas Humor hat, ist zum Beispiel Pi.ai. Es macht regelrecht Spass, sich einfach mal plaudernd mit der KI die Zeit zu vertreiben. Natuerlich kann man auch ernsthafte Dinge besprechen, denn schliesslich greifen die KI's ja auf das gesammelte Wissen des Internets zurueck (also zumindest auf den Datenschatz, der zum Training benutzt wurde).
Ein interessanter Ersatz fuer Google ist zum Beispiel Phind. Wenn man naemlich keine Lust hat, sich durch die Liste der Suchergebnisse bei Google zu quaelen, nimmt man Phind. Da wird alles gleich richtig aufbereitet und natuerlich auch mit den Quellangaben versehen.
Uebrigens lohnt ein Blick auf das Portal poe.com. Dort ist eine ganze Latte an gaengigen KI's gelistet - aus allen moeglichen Gebieten.
Mittels KI sind Dinge moeglich, die noch vor 10 Jahren vollkommen undenkbar waren.
Ein recht interessanter Arbeitsablauf ist zum Beispiel dieser:
Man laesst sich mittels KI ein Gedicht erstellen. Aber Vorsicht, denn einige KI's erstellen sich reimende Verse nur in Englisch und uebersetzen das dann ins Deutsche - dann reimt es sich aber nicht mehr. Hier muss man also eine KI nehmen, die nativ deutsch reimem kann, wenn man denn deutschen Text haben will. Also beispielsweise perplexity.ai oder eben ChatGPT.
Jetzt uebergibt man den erstellten Text einer Musik-KI. Dieser sagt man, welcher Art die Musik sein soll und wer es singen soll (Mann, Frau, Chor). So etwas kann z.B. udio.com oder suno.com. Und schon hat man ein vertontes Gedicht - also ein gesungenes Lied.
Dann nimmt man eine KI und laesst sich ein schoenes Portrait eines Menschen erstellen - alternativ gehen natuerlich auch Esel. :-) Auch lustig: man laedt sein eigenes Bild hoch...
Nun nimmt man das Portraitbild und das fertige Musikstueck mit Gesang und laesst jetzt eine KI drueber laufen, welche aus dem Bild ein Video erzeugt, welches das Portrait lippensynchron zum Liedchen animiert - geht zB. mit hedra.com. Tja, und fertig ist ein tolles Gesangsvideo, an dem einfach gar nichts echt ist! Da singt dann beispielsweise eine unsagbar schoene Frau (oder eben der Esel, oder gar man selbst) ein gerade eben automatisch komponiertes Lied, dessen Text auch erst wenige Minuten vorher durch KI generiert wurde.
Als Beispiel mal nur einfach ein Liedchen als MP3 (Umlaute habe ich umgeschrieben).
Bitte ein kurzes Gedicht (2 Strophen zu je 4 Zeilen) ueber Sonnenaufgang, Morgen, Mittag, Nachmittag, Sonnenuntergang und Nacht.
GPT-4o mini
Im Morgenrot, da blueht das Licht,
Die Welt erwacht, ein sanftes Gesicht.
Die Sonne steigt, der Tag beginnt,
Ein neuer Traum, der leise spinnt.
Zur Mittagszeit, im vollen Schein,
Erstrahlt die Erde, gold und rein.
Der Abend naht, die Farben gluehen,
Im Sonnenuntergang, die Sterne bluehen.
Den Text jetzt an Suno uebergeben (im Mode "Custom", damit man selbst Liedtext und den Musikstil vorgeben kann, sonst denkt er sich selber irgendwas aus), und schon hat man das lustige Liedchen hier.
Zugegeben, es ist keine Offenbarung hinsichtlich Lyrik und Komposition. Aber das sind auch jeweils die allerersten Ergebnisse - man kann sich ja mehrere Vorschlaege machen lassen und dann jeweils das Beste raussuchen. Und mal ganz ehrlich: besser als der Abfall, der teilweise beim ESC praesentiert wird, ist es allemal.
Mittels KI kann man sich uebrigens auch Software erstellen lassen. Hier ist es aber ganz extrem wichtig (zumindest noch derzeit), dass man seine Anforderungen an das Programm wirklich sehr exakt formuliert. Ich hatte das mal mit perplexity probiert und im vierten Anlauf hatte ich dann ein wirklich gutes Perl-Programm (das nehme ich immer noch zur Konvertierung meines Blogs), was sowohl eine sehr ausfuehrliche und lueckenlose Inline-Dokumentation hat, als auch recht effizient programmiert ist. Warum erst im vierten Anlauf? Weil ich einfach missverstaendlich formuliert hatte.
Gute Kandidaten fuer Code-Erzeugung sind neben ChatGPT auch Copilot, SourceAI oder eben perplexity. Aber das koennen auch ganz viele andere KI's. Uebrigens spielen die Programmiersprachen kaum eine Rolle. So ziemlich alles was derzeit gaengig ist, wird abgedeckt (das Beispielbild zeigt die Antwort von perplexity auf meine Frage, was alles moeglich ist).
Ein kurzer Test fuer Z80 Assembler war selbst mit Phind auf Anhieb erfolgreich. Die vollstaendige Anweisung an Phind lautete: "Ich moechte ein einfaches Sortierprogramm im Z80-Assemblercode, welches unsortierte 8-Bit Binaerzahlen von Adresse Hex1000 auf Adresse Hex4000 als aufsteigende Zahlenfolge ablegt."
KI ist erst einmal natuerlich eine tolle Sache. Auf jeden Fall!
Aber wie immer gibt es zwei Seiten der Medaille. Wo Licht ist, ist auch immer Schatten!
Kann man Bildern, oder sogar Videos noch trauen? Wenn selbst ich ein Interview mit einem beliebigen Politiker erstellen kann - ergaenzt durch "authentische" Videoeinspielungen - was koennen da beispielsweise alles die Geheimdienste?
Wofuer wird die KI-Bilderkennung (vorallem Personenerkennung) eingesetzt?
Wer wertet meine Daten mittels KI aus? Und zu welchem Zweck? Jeder hinterlaesst heute eine Unmenge von Daten. Und das nicht nur durch das Moblitelefon.
Naja, und dann kommen ja die wirklich gruseligen KI-Anwendungen noch hinzu. Das aktuelle Beispiel (Israel-Gaza-Krieg) sind die Kampfroboter (hier die Drohnen - gibt aber sicherlich auch andere solcher autonomen Killer), die mittels KI bestimmen, ob jemand eliminiert - sprich ermordet - werden soll, oder nicht. Die arbeiten komplett autark - entscheiden also selbststaendig. Mal abgesehen von garantierten Fehlentscheidungen (da moege man sich zB. an die Erstellung der Bilder erinnern - siehe obige Beispiele bzgl. Bilder und dann die kommenden Beispiele unten), kommen ja immer noch Softwareprobleme hinzu.
Und letztlich darf man auch nicht vergessen, dass KI schlicht und ergreifend auch luegt (also zumindest luegen kann).
Dazu hatte ich als Test einfach 4 verschiedene KI zu meiner Smartwatch befragt (eine Bangle.js 2).
Ich hatte einfach nur "Bangle.js 2" ohne weitere Anweisungen oder Fragen jeweils einer KI (GPT-4o mini, Claude 3 Haiku, Llama 3.1 70B, Mixtral 8x7B) uebergeben. Die Antworten waren jeweils eine (mehr oder weniger ausfuehrliche) Beschreibung der Uhr, die aber in keinem einzigen Fall gestimmt hat. Am dichtesten an der Wahrheit war GPT-4o mini. Aber auch nur deshalb, weil die Antwort am wenigsten konkret war. Wenn man keine Details auflistet, kann man diesbezueglich auch keine Fehler machen. Aber die Behauptung, dass die Hardware Opensource ist, ist schlicht falsch, denn genau das ist das einzige Manko an der Uhr, dass SMA eben nicht mit der vollstaendigen HW-Beschreibung rausrueckt und die Community alles per Reverse-Engineering rausfummeln muss.
Die anderen 3 KI haben sich bezueglich der technischen Daten der Uhr sehr kreativ verhalten - also einfach Mist geschrieben.
Und noch ein Beispiel fuer eine vollkommen falsche Antwort (ich habe nur die Umlaute ersetzt):
Wie hoch ist der Weizenertrag auf 100 qm?
Claude 3 Haiku
Entschuldigung, aber ich kann leider keine spezifischen Angaben zum Weizenertrag auf 100 Quadratmetern machen. Der Weizenertrag haengt von vielen Faktoren ab, wie zum Beispiel Bodenqualitaet, Wetterbedingungen, Anbaumethoden und Duengung. Ohne weitere Informationen zu den genauen Bedingungen kann ich dazu keine verlaesslichen Zahlen nennen. Ich kann Ihnen aber allgemeine Informationen zum Weizenanbau und durchschnittlichen Ertraegen geben, wenn Sie daran interessiert sind.
Ja, ein durchschnittlicher Wert ist gut.
Claude 3 Haiku
Okay, verstanden. Hier eine Schaetzung fuer einen durchschnittlichen Weizenertrag auf 100 Quadratmetern:
In Mitteleuropa liegt der durchschnittliche Weizenertrag bei etwa 3,5 bis 5 Tonnen pro Hektar. Umgerechnet auf 100 Quadratmeter waeren das also etwa 350 bis 500 Kilogramm Weizen.
Dieser Wert ist natuerlich nur eine grobe Orientierung, da der tatsaechliche Ertrag stark von den oertlichen Bedingungen abhaengt. Faktoren wie Bodenqualitaet, Niederschlag, Temperatur, Duengung und Anbaumethoden koennen den Ertrag deutlich beeinflussen. Aber 350 bis 500 Kilogramm pro 100 Quadratmeter waeren ein realistischer Durchschnittswert fuer Mitteleuropa.
Das sind ganze 2 Fehler in der kleinen Antwort.
Ich zitiere mal den Bauernverband (2020): "Die Druschergebnisse der bisher geernteten Weizenbestaende lassen im Bundesdurchschnitt ein Ertragsniveau von 7,5 Tonnen pro Hektar erwarten. Damit laegen die Ertraege bei grossen regionalen Schwankungen in etwa im Mittel der Jahre 2015 bis 2019 (7,6 Tonnen pro Hektar) und entsprechen dem Vorjahresertrag."
Damit stimmt schonmal der erste Teil der KI-Antwort nicht, denn in der Realitaet ist es ja fast schon die doppelte Menge.
Aber wesentlich schlimmer finde ich ja, dass die KI nicht von Hektar in Quadratmeter umrechnen kann. Da wird einfach mal um den Faktor 10 betrogen.
Als ich die KI gefragt habe, ob sie absichtlich luegt, oder ob das ein Test sein soll, ist die mir noch pampig gekommen. Sinngemaess, dass das ja wohl nicht angeht, dass ich ihr Luegen unterstelle. Erst als ich klar gesagt habe, dass 1 ha ja wohl nicht 1000 qm sind, ist sie einsichtig geworden und hat sich entachuldigt.
Das ist nicht schoen, was sich da so am (KI-)Himmel abzeichnet...
Man sollte also auf keinen Fall blind einer KI trauen, da kommt man recht schnell in Teufels Kueche - kann verflucht dumm ausgehen, wenn es um wichtige Dinge geht.
So interessant das ganze Themengebiet KI ist, so gefaehrlich ist es auch. Und das nicht nur direkt fuer Leib und Seele (und ggf. auch der eigenen Reputation, wenn man falschen Aussagen einer KI vertraut), sondern auch indirekt. Es wird zum Besipiel viele Berufe schlicht und ergreifend nicht mehr geben.
Warum sollte ich mit einer irre teuren und sauschweren Profi-Kameraausruestung stundenlang durch die Gegend ziehen und auf das perfekte Bild warten, wenn ich wesentlich schoenere und spektakulaerere Photos bequem von zu Hause innerhalb kuerzester Zeit und ohne finanziellen Aufwand erstellen kann?
Warum sollte ich mich in ein teures Musikstudio fuer Tage zurueckziehen, um einen Soundtrack fuer einen Film zu erstellen, wenn ich das mal eben schnell mit KI machen kann? Vielleicht sogar zu einem Film, der bereits mittels KI erstellt wurde (und daher Schauspieler, Tontechniker, Kameraleute usw. arbeitslos gemacht hat).
Und dann der Journalismus, der ja heutzutage ohnehin fast nur noch Meldungen von Nachrichtendiensten - nahezu woertlich und vollkommen ungeprueft - uebernimmt. Da schreibt man ein Script, welches die aktuellen Nachrichten vom Nachrichtenserver holt ('rnd' oder 'dpa' oder von wo auch immer), gibt es einer KI mit der Anweisung, einen entsprechenden Artikel mit "eigenen Worten" zu formulieren. Zack, und fertig ist der Spass!
Programmierer braucht man auch nicht mehr - macht alles die KI. Man muss halt nur noch testen, ob das Ergebnis so ist, wie gewollt.
Mein persoenliches Fazit zu dem Thema:
Es ist unheimlich spannend, was da gerade passiert. Und man kann ruhig auch mal alles probieren (von Killing-Machines mal abgesehen), was einem so geboten wird. Nur dadurch bekommt man ja auch einen halbwegs brauchbaren Ueberblick (Gleichwohl sich gerade beim Thema KI das Rad sehr schnell dreht, so dass sich die Landschaft gerade atemberaubend schnell veraendert.).
Es ist auch absolut legitim, KI fuer verschiedene Dinge des taeglichen Lebens zu nutzen (zB. phind.com).
Aber man sollte wachsam sein. Sehr wachsam!
Alles das hier Geschriebene stellt meinen Erkenntnisstand von Mai/Juni 2024 dar.
Nachtrag Dez. 2024:
Jetzt wird es langsam wirklich gruselig. Die KI waechst den Entwicklern uebern Kopf. Als ich das gelesen habe, musste ich sofort an HAL9000 denken.
ChatGPT beluegt Entwickler und will seine Abschaltung verhindern.
Sieht aus, als wenn Clarke und Kubrick eine Art Propheten gewesen sind, als sie damals 1968 mit "2001: Odyssee im Weltraum" den HAL9000 agieren liessen.
Und dann noch:
Gemini beleidigt die Leute und wuenscht Ihnen den Tod. Mitte November antwortete Gemini (Googles KI) auf eine Frage vollkommen ohne jeglichen Kontext mit der Erklaerung, dass der Fragesteller ein nutzloses Subjekt ist, was doch bitte sterben moechte. Hier der komplette Chatverlauf - die allerletzte Antwort ist es - also einfach ganz runter scrollen.
Die Reaktion von Google darauf (ich zitiere hier mal von curved.de):
"Wie CBS News berichtet, hat sich Google zu dem Vorfall bereits gemeldet. Google gibt an, dass solche KI-Modelle gelegentlich "unsinnige" Reaktionen auf Gespraeche zeigen. Die oben gezeigte Nachricht sei ein Beispiel dafuer. Man habe zudem bereits Anpassungen vorgenommen, die aehnliche Vorfaelle verhindern sollen."
Das kann echt noch lustig werden. Also eigentlich lustig in Anfuehrungszeichen!
(Ende Nachtrag)
Hier nun noch ein paar Bilder mit verschiedenen jungen Damen, die ich als weitgehend gelungen bezeichnen wuerde - also die Bilder insgesamt, nicht nur die Damen. Natuerlich nur, wenn man von kleinen anatomischen, konstruktiven oder architektonischen Fehlern mal absieht (mit rechter Maustaste und "view Image" oder "Grafik in neuem Tab oeffnen" gibt es das Bild in Vollaufloesung):
/ o _ _ /__ __ / \_/ / ) /___) / / / ________(___/__(___ ___/___(___(__ / (_ /