~~~ Testergebnisse und Gedanken zur KI ~~~

zurück zum Blog

                               vVv
                              (o o)
                  --------oOO--(_)--OOo--------
        __    ____|                           |____    __
_______|  |__|   :| The Splendid ~beju Space. |    |__|  |_______
\     :|  |::|   :|       ~~~~~~~~~~~~        |    |::|  |      /
  \   :|  |::|   :|    freeshell.de/~beju     |    |::|  |    /
    > :|  |::|   :|___________________________|    |::|  |  <
  /   :|__|::|___:/                           \.___|::|__|    \
/_____:/  \::/                                     \::/  \._____\	

This page is a reminiscence of the good old days of the WWW, when
     you could still read web pages with telnet on port 80.
		

Here you will find some experiences and toughts about AI. If you don't understand the German language you are invited to read the google translation here.

KI ist derzeit in aller Munde. Aber warum nur irgendwelchen Kram von Leuten lesen oder hoeren, die selber gar nicht so recht verstehen, worueber sie da gerade referieren? Man kann sich doch selbst einfach ein Bild machen von den Moeglichkeiten, welche derzeit die KI fuer (nichtzahlende private) Nutzer bietet. Das im kommerziellen und erst recht im militaerischen Umfeld noch ganz andere Dinge machbar sind (und auch gemacht werden), ist selbstverstaendlich.
Hier soll aber einfach nur mal gezeigt werden, was "Otto-Normalverbraucher" bereits machen kann - ohne sich einen kostenpflichtigen Zugang anlegen zu muessen.

In vielen Bereichen des Alltags hat KI laengst Einzug gehalten, ohne dass es sich als solches gross praesentiert. Ein Beispiel ist die Spracherkennung (Siri, Alexa, Diktatsoftware u.s.w) oder aber auch die Datenauswertung (da werden nicht nur Korrelationen, sondern auch Kausalitaeten aus riesigen Datenmengen in windeseile erkannt). Aber auch die mittlerweile fast ueberall existenten Chat-Roboter auf den Webseiten grosser Firmen greifen zumeist auf KI zurueck. Ebenso basieren viele Bild- bzw. Photobearbeitungsprogramme auf KI (mittlerweile auch auf Mobiltelefonen).
Aber wir wollen den 0-8-15-Alltag verlassen und uns, nennen wir es interessanten Dingen, zuwenden.

Als da waere beispielsweise die Bilderstellung (damit habe ich mich am ausgiebigsten beschaeftigt).
Man gibt in etwa vor, was man fuer ein Bild haben moechte (das nennt sich dann Prompt) und die KI versucht dann, ein entsprechendes Bild zu erstellen. Dabei werden nicht etwa irgendwelche Bilder im Netz gesucht und ein wenig abgeaendert, sondern es wird wirklich ein komplett neues Bild erzeugt, welches nach einem entsprechendem Modell generiert wird.
Manchmal, jedoch eher selten, entstehen Bilder, die wirklich einfach nur perfekt sind. Oftmals aber werden Bilder generiert, welche die Beschreibung eher nur leicht beruehren. Und hin und wieder vertut sich die KI aber auch vollkommen. Da werden Bilder erzeugt, die einer gewissen Komik nicht entbehren.

Ich habe mal den Prompt:
"typisch historische Frau mit einem niedlichen grauen Esel, schoenes Gesicht mit Gruebchen, Baeume, mystischer und regnerischer Tag, Szene ist im Mittelalter, sehr realistische Darstellung wie eine Photographie"
eingegeben (hier in Englisch, weil die KI damit besser umgehen konnte - prinzipiell gehen aber alle moeglichen Sprachen, da der Prompt immer automatisch in die entsprechende Zielsprache uebersetzt wird) und dann immer wieder neu auf "Bild generieren" gedrueckt. Nachfolgend so eine Art Best-of, nur um einmal die Bandbreite der Ergebnisse zu demonstrieren. Tatsaechlich ist es immer derselbe Propt - hier nun also die lustigsten bzw. abartigsten Bilder aus der Serie:


Frau und Esel sind eins
Frau: huebsch, Esel: passt, Wald: stimmt, Mittelalter: naja... Hier wurde praktisch (fast) alles umgesetzt, nur eben in einer recht eigentuemlichen Weise.


Frau und Esel - aber kein Mittelalter
Frau und Esel sind ganz gut geworden. Aber irgendwie hat die KI vor lauter Arbeit ganz das Mittelalter vergessen.


Frau und Esel sind auch hier eins
Kann sich jemand an den Film Total Recall erinnern, wo Kuato aus dem Bauch von George kommt? Aber hier ist es nur ein kleines lustiges Eselchen.


Frau und Frau
Nahezu perfekt, wenn der Esel nicht irgendwie wie ein Frau aussehen wuerde.


Frau mit 3 Haenden und Hasen-Esel
Eine solche hasenaehnliche Esel-Missgeburt muss man auf jeden Fall mit 3 Haenden festhalten.


Weg mit Baeumen
Was sich die KI hier dabei gedacht hat, entzieht sich vollstaendig meiner Vorstellung. Aber immerhin Baeume.


alter Mann
Auch hier: hat die KI meinen Prompt vielleicht gar nicht gelesen?


Esel-Frau und Eselkind
Der kleine Esel fuer die Handtasche - warum auch nicht? Interessant uebrigens, dass nicht nur Hundebesitzer oftmals ihren Hunden aehnlich sind. Das war im Mittelalter mit Eselbesitzern nicht anders - zumindest geht so die Sage...


Frau im Winter
Frau mit huebschem Gesicht - passt. Baeume - passt. Und das wars dann auch soweit. Ist man im Mittelalter tatsaechlich im Winter halbnackt durch den Wald gegangen? Und warum ist hier ueberhaupt Winter? Ausserdem: Ich will Esel!


Esel guckt Frau in den Ausschnitt
Das Maedel schielt, aber sonst recht nett. Der Esel ist zwar eher haesslich, aber dafuer schlau, denn offensichtlich wussten auch schon im Mittelalter die Esel, was gut ist. Dieser kleine Geniesser...


Frau mit Eselkopf und Zwergesel in Art eines Wildschweins
Das Bild spricht fuer sich - jeder Kommentar ist hier ueberfluessig.


Photographie einer Frau
Das ist wieder mal typisch KI: Offensichtlich hat man hier "like a photograph" sehr ernst genommen. Und den Rest dafuer einfach stillschweigend ignoriert - ausser der Frau natuerlich, denn irgendwas muss ja auf dem Photo sein.


Mittlerweile existieren auch mehrere freie KI's, mit denen man Videosequenzen erzeugen kann - es muessen nicht immer nur leblose Bilder sein.
KI kann ja aber wesentlich mehr, als nur Bilder erstellen. ChatGPT ist eines der bekanntesten Vertrteter der Gattung Ich-kann-alles. Man kann sich neben Bildern beispielsweise auch Gedichte oder gar Musikstuecke liefern lassen, wobei dann ChatGPT zumindest bei Bildern und Musik nur als Wrapper auftritt. Bilder werden dann zum Beispiel mit DALL-E erstellt, was eine dafuer spezialisierte GPT-Version ist.
Man kann auch einfach nur mal eine nette Unterhaltungen mit einer KI fuehren. Eine sehr brauchbare KI, die sogar etwas Humor hat, ist zum Beispiel Pi.ai. Es macht regelrecht Spass, sich einfach mal plaudernd mit der KI die Zeit zu vertreiben. Natuerlich kann man auch ernsthafte Dinge besprechen, denn schliesslich greifen die KI's ja auf das gesammelte Wissen des Internets zurueck (also zumindest auf den Datenschatz, der zum Training benutzt wurde). Ein interessanter Ersatz fuer Google ist zum Beispiel Phind. Wenn man naemlich keine Lust hat, sich durch die Liste der Suchergebnisse bei Google zu quaelen, nimmt man Phind. Da wird alles gleich richtig aufbereitet und natuerlich auch mit den Quellangaben versehen.
Uebrigens lohnt ein Blick auf das Portal poe.com. Dort ist eine ganze Latte an gaengigen KI's gelistet - aus allen moeglichen Gebieten.

Mittels KI sind Dinge moeglich, die noch vor 10 Jahren vollkommen undenkbar waren.
Ein recht interessanter Arbeitsablauf ist zum Beispiel dieser:
Man laesst sich mittels KI ein Gedicht erstellen. Aber Vorsicht, denn viele KI's erstellen sich reimende Verse nur in Englisch und uebersetzen das dann ins Deutsche - dann reimt es sich aber nicht mehr. Hier muss man also eine KI nehmen, die nativ deutsch reimem kann, wenn man denn deutschen Text haben will. Also beispielsweise perplexity.ai oder eben ChatGPT.
Jetzt uebergibt man den erstellten Text einer Musik-KI. Dieser sagt man, welcher Art die Musik sein soll und wer es singen soll (Mann, Frau, Chor). So etwas kann z.B. udio.com oder suno.com. Und schon hat man ein vertontes Gedicht - also ein gesungenes Lied.
Dann nimmt man eine KI und laesst sich ein schoenes Portrait eines Menschen erstellen - alternativ gehen natuerlich auch Esel. :-) Auch lustig: man laedt sein eigenes Bild hoch...
Nun nimmt man das Portraitbild und das fertige Musikstueck mit Gesang und laesst jetzt eine KI drueber laufen, welche aus dem Bild ein Video erzeugt, welches das Portrait lippensynchron zum Liedchen animiert - geht zB. mit hedra.com. Tja, und fertig ist ein tolles Gesangsvideo, an dem einfach gar nichts echt ist! Da singt dann beispielsweise eine unsagbar schoene Frau (oder eben der Esel, oder gar man selbst) ein gerade eben automatisch komponiertes Lied, dessen Text auch erst wenige Minuten vorher durch KI generiert wurde.

Mittels KI kann man sich uebrigens auch Software erstellen lassen. Hier ist es aber ganz extrem wichtig (zumindest noch derzeit), dass man seine Anforderungen an das Programm wirklich sehr exakt formuliert. Ich hatte das mal mit perplexity probiert und im vierten Anlauf hatte ich dann ein wirklich gutes Perl-Programm (das nehme ich immer noch zur Konvertierung meines Blogs), was sowohl eine sehr ausfuehrliche und lueckenlose Inline-Dokumentation hat, als auch recht effizient programmiert ist. Warum erst im vierten Anlauf? Weil ich einfach missverstaendlich formuliert hatte.
Gute Kandidaten fuer Code-Erzeugung sind neben ChatGPT auch Copilot, SourceAI oder eben perplexity. Aber das koennen auch ganz viele andere KI's. Uebrigens spielen die Programmiersprachen kaum eine Rolle. So ziemlich alles was derzeit gaengig ist, wird abgedeckt (das Beispielbild zeigt die Antwort von perplexity auf meine Frage, was alles moeglich ist).
Ein kurzer Test fuer Z80 Assembler war selbst mit Phind auf Anhieb erfolgreich. Die vollstaendige Anweisung an Phind lautete: "Ich moechte ein einfaches Sortierprogramm im Z80-Assemblercode, welches unsortierte 8-Bit Binaerzahlen von Adresse Hex1000 auf Adresse Hex4000 als aufsteigende Zahlenfolge ablegt."

Ein Sortierprogramm fuer die Z80 CPU erstellt von der Phind KI. Eine Aufzaehlung der Programmiersprachen, welche Perplexity kann.


KI ist erst einmal natuerlich eine tolle Sache. Auf jeden Fall!
Aber wie immer gibt es zwei Seiten der Medaille. Wo Licht ist, ist auch immer Schatten!

Kann man Bildern, oder sogar Videos noch trauen? Wenn selbst ich ein Interview mit einem beliebigen Politiker erstellen kann - ergaenzt durch "authentische" Videoeinspielungen - was koennen da beispielsweise alles die Geheimdienste?
Wofuer wird die KI-Bilderkennung (vorallem Personenerkennung) eingesetzt?
Wer wertet meine Daten mittels KI aus? Und zu welchem Zweck? Jeder hinterlaesst heute eine Unmenge von Daten. Und das nicht nur durch das Moblitelefon.
Naja, und dann kommen ja die wirklich gruseligen KI-Anwendungen noch hinzu. Das aktuelle Beispiel sind die Kampfroboter (zB. Drohnen), die mittels KI bestimmen, ob jemand eliminiert - sprich ermordet - werden soll, oder nicht. Die arbeiten komplett autark - entscheiden also selbststaendig. Mal abgesehen von garantierten Fehlentscheidungen (da moege man sich zB. an die Erstellung der Bilder erinnern - siehe obige Beispiele), kommen ja immer noch Softwareprobleme hinzu.

Und letztlich darf man auch nicht vergessen, dass KI schlicht und ergreifend auch luegt (also zumindest luegen kann).
Dazu hatte ich als Test einfach 4 verschiedene KI zu meiner Smartwatch befragt (eine Bangle.js 2).
Ich hatte einfach nur "Bangle.js 2" ohne weitere Anweisungen oder Fragen jeweils einer KI (GPT-4o mini, Claude 3 Haiku, Llama 3.1 70B, Mixtral 8x7B) uebergeben. Die Antworten waren jeweils eine (mehr oder weniger ausfuehrliche) Beschreibung der Uhr, die aber in keinem einzigen Fall gestimmt hat. Am dichtesten an der Wahrheit war GPT-4o mini. Aber auch nur deshalb, weil die Antwort am wenigsten konkret war. Wenn man keine Details auflistet, kann man diesbezueglich auch keine Fehler machen. Aber die Behauptung, dass die Hardware Opensource ist, ist schlicht falsch, denn genau das ist das einzige Manko an der Uhr, dass SMA eben nicht mit der HW-Beschreibung rausrueckt und die Community alles per Reverse-Engineering rausfummeln muss.
Die anderen 3 KI haben sich bezueglich der technischen Daten der Uhr sehr kreativ verhalten - also einfach Mist geschrieben.
Man sollte also auf keinen Fall blind einer KI trauen, da kommt man recht schnell in Teufels Kueche - kann verflucht dumm ausgehen, wenn es um wichtige Dinge geht.

So interessant das ganze Themengebiet KI ist, so gefaehrlich ist es auch. Und das nicht nur direkt fuer Leib und Seele (und ggf. auch der eigenen Reputation, wenn man falschen Aussagen einer KI vertraut), sondern auch indirekt. Es wird zum Besipiel viele Berufe schlicht und ergreifend nicht mehr geben.
Warum sollte ich mit einer irre teuren und sauschweren Profi-Kameraausruestung stundenlang durch die Gegend ziehen und auf das perfekte Bild warten, wenn ich wesentlich schoenere und spektakulaerere Photos bequem von zu Hause innerhalb kuerzester Zeit und ohne finanziellen Aufwand erstellen kann?
Warum sollte ich mich in ein teures Musikstudio fuer Tage zurueckziehen, um einen Soundtrack fuer einen Film zu erstellen, wenn ich das mal eben schnell mit KI machen kann? Vielleicht sogar zu einem Film, der bereits mittels KI erstellt wurde (und daher Schauspieler, Tontechniker, Kameraleute usw. arbeitslos gemacht hat).
Und dann der Journalismus, der ja heutzutage ohnehin fast nur noch Meldungen von Nachrichtendiensten - nahezu woertlich und vollkommen ungeprueft - uebernimmt. Da schreibt man ein Script, welches die Nachricht vom Nachrichtenserver holt ('rnd' oder 'dpa' oder von wo auch immer), gibt es einer KI mit der Anweisung, eine entsprechende Meldung mit "eigenen Worten" zu formulieren. Zack, und fertig ist der Spass!

Programmierer braucht man auch nicht mehr - macht alles die KI. Man muss halt nur noch testen, ob das Ergebnis so ist, wie gewollt.

Mein persoenliches Fazit zu dem Thema:
Es ist unheimlich spannend, was da gerade passiert. Und man kann ruhig auch mal alles probieren (von Killing-Machines mal abgesehen), was einem so geboten wird. Nur dadurch bekommt man ja auch einen halbwegs brauchbaren Ueberblick (Gleichwohl sich gerade beim Thema KI das Rad sehr schnell dreht, so dass sich die Landschaft gerade atemberaubend schnell veraendert.).
Es ist auch absolut legitim, KI fuer verschiedene Dinge des taeglichen Lebens zu nutzen (zB. phind.com).
Aber man sollte wachsam sein. Sehr wachsam!

Alles das hier Geschriebene stellt meinen Erkenntnisstand von Mai/Juni 2024 dar.

Nachtrag Dez. 2024:
Jetzt wird es langsam wirklich gruselig. Die KI waechst den Entwicklern uebern Kopf. Als ich das gelesen habe, musste ich sofort an HAL9000 denken.
ChatGPT beluegt Entwickler und will seine Abschaltung verhindern.
Sieht aus, als wenn Clarke und Kubrick eine Art Propheten gewesen sind, als sie damals 1968 mit "2001: Odyssee im Weltraum" den HAL9000 agieren liessen.
(Ende Nachtrag)

Hier nun noch ein paar Bilder mit verschiedenen jungen Damen, die ich als weitgehend gelungen bezeichnen wuerde. Natuerlich nur, wenn man von kleinen anatomischen, konstruktiven oder architektonischen Fehlern mal absieht (mit rechter Maustaste und "view Image" oder "Grafik in neuem Tab oeffnen" gibt es das Bild in Vollaufloesung):

Eine Braut ganz einsam in einer gotischen Kirche. Eine Frau in einer Kirche. Eine betende Frau in einer Kirche. Eine Lautenspielerin als Kupferstich im Stile des 16. Jhd. Betende Tempeldienerin im alten Griechenland. Eine Nonne in weissem Gewand. Auf dem Mars im Jahre 2085. Eine moderne Baeuerin. Ein Bild in der Art der Pulp-Magazine der 40'er Jahre. Ungleiches Paar in Berlin. Luftwaffe um 1960. Eine Pilotin. Eine coole Truckerbraut vor ihrem Truck. Junge Dame nach einem Sommerregen in Berlin. Schaeferin. Als Gemaelde im Stile der Romantik. Baeuerin um 1850. Eine huebsche badende Dame. Eine Olivenverkaeuferin auf einem Markt in Griechenland um 1920. Eine sinnliche Frau mit Kranz im Haar. Ca. um 1800.


                                      
           /              o        
  _   _   /__     __
 / \_/   /   )  /___)   /   /   / 
________(___/__(___ ___/___(___(__
                      /            
                  (_ /