Kreative Illustrationen mit künstlicher Intelligenz im eigenen Stil – geht das?

Die Ausgangssituation: 12 Plakate in Din A1 in 5 Tagen. Mit Recherche und Ideenfindung ... Unschaffbar - ohne Künstliche intelligenz (KI).
Soll man das?
Kann man das?
Darf man das?
Will man das? - eine Analyse.

Illustrationen mit künstlicher Intelligenz (KI) erstellt - ixtract
Illustrationen mit künstlicher Intelligenz (KI) erstellt - ixtract

Briefing: 12 abstrakte Meilensteine, extrem schwer zu deutende, kaum identifizierbare Schlagworte

Die Frage stand im Raum: Lassen sich mit den derzeit angebotetenen KI-Programmen Illustrationen mit künstlicher Intelligenz wirklich auf Knopfdruck und in einem eigenen Stil erstellen?

Aber generative künstliche Intelligenz ist nicht eine Anwendung. Jede Anwendung an sich ist normalerweise auf einen speziellen Einsatz fokussiert und so kamen mehrere KI-Lösungen zum Einsatz. Darunter waren Programme die KI basiert halfen:

  • bei der Suche
  • bei der Abstrahierung von Bildern
  • bei der Vorbereitung / dem Entwurf von Szenen und
  • bei der Erstellung von „Zeichnungen“ oder -vorlagen

Die üblichen Verdächtigen zeigen sich bereits früh als vollkommen ungeeignet: Adobe Fyerfly, Stable Diffusion, Flux und andere Online-Lösungen liefern tolle Bilder, aber nicht die, die man braucht. Wer eine ganz bestimmte Szenerie in einem genau definierten Stil sucht, kommt schnell an die Grenzen und es wird sehr schnell teuer.

Denn für das Erstellen von Illustrationen mit künstlicher Intelligenz bezahlt man nicht das Ergebnis, sondern die Rechenpower! Und die liefert überdurchschnittlich viele absolut unbrauchbare Bilder. Mühsam kann man dann versuchen sich mit immer „besseren“ Promts seinem Ziel zu nähern, aber jeder Versucht kostet bare Münze – egal ob erfolgreich oder kompletter Mist. Die einzige Lösung ist daher: Eine nodebasierte KI-Anwendung zum selbst zusammenbauen am eigenen PC.

12 Unternehmens-Meilensteine ixtract Illustrationen mit KI
12 Unternehmens-Meilensteine ixtract Illustrationen mit KI

Illustrationen mit künstlicher Intelligenz heißt heute vor allem »WARTEN«

Auf dem eigenen Rechner dauert ein Bild oft zwischen 20-30 Sekunden um zu rendern, und eigentlich könnte man dafür auch viel bessere Cloud-Rechner nutzen.  Aber schneller geht es damit auch nicht die Illustrationen mit künstlicher Intelligenz zu erstellen. Aber wenn doch die Cloud-Server viel schneller rendern? Nun sie sind zwar viel schneller aber: Es dauert immer bis du in der Render Queue eingeschrieben bist und das macht den Vorteil dann wieder komplett zunichte! Denn manchmal wartest du 20 Sekunden bis der Server überhaupt loslegt.

Und wenn man erst mal 100 Versionen von einem Bild braucht, um damit arbeiten zu können, dann bedeutet das pro Bild ca. eine halbe Stunden warten. Denn egal welches Bild man erzeugt, es gibt kein einziges bei dem alles stimmt. Im ersten Bild fehlt ein Arm, im zweiten sind die Gesichter total zertrümmert, im dritten Bild erscheint plötzlich ein komplett anderer Stil und im vierten Bild erhält man ein zusätzliches Bein für den vorhin fehlenden Arm.

Aber wer eine KI-Illustrations-Pipline entwickelt hat um die Illustrationen mit künstlicher Intelligenz zu erzeugen, der arbeitet damit im Endeffekt immer noch viel schneller, als alles selbst zu zeichnen … und viele können ja gar nicht so gut zeichnen wie die KI selbst mit Fehlern zeichnet!

Unternehmens-Meilensteine mit künstlicher Intelligenz ixtract KI
Unternehmens-Meilensteine mit künstlicher Intelligenz ixtract KI

Was nach 5 Tagen mit KI und den 12 Illustrationen auffällt

  • ohne künstliche Intelligenz wäre es einfach nicht möglich gewesen alle Din A1 Plakate im handgezeichneten Stil zu erstellen!
  • Oft benötigte ich 100 Bilder aus denen ich dann Fragmente zu einem Gerüst zusammenpatchen konnte. Ca. 20% musste ich dennoch selbst zeichnen, was durch dieses Gerüst aber deutlich einfacher war.
  • War es daher insgesamt einfach? Absolut nicht! Es waren mindestens ca. 10 verschiedene Programme / Plattformen im Einsatz, um ein (brauchbares) Endergebnis für alle Bilder zu erreichen. Allein die Installation und damit verbundene Fehlersuche (die zwangsweise damit verbunden ist) setzt Administrator-Verwaltungs-Kenntnisse und ein Verständnis der Funktionalität von vorprogrammierten Modulen voraus. Die Kombination verschiedener Module zur Erreichung des Ziels ist zudem sehr herausfordernd, sobald man von Standardergebnissen abweicht.
  • War das kreative Arbeit: ich denke Absolut! Und selbst handwerklich, denn: Alle erzeugten Bilder hatten ja viel zu viele Fehler. So mussten ich eigentlich bei allen Ergebnissen aus 4-5 Bildern jeweils eines erzeugen, das wiederum oft in wesentlichen Bereichen (Hände und Gesichter) manuell korrigiert oder ganz gezeichnet werden musste. Im Endeffekt ging es aber einfach schneller um zu einem Ergebniszwischenstand zu kommen., oder um überhaupt zu einer Szene zu gelangen.
  • War es urheberrechtsverletzend? Vermutlich ja. Denn das Training der Daten ist vermutlich immer mit Urheberrechtsverletzungen kompromittiert.
  • Lässt sich im Ergebnis ein Urheberrechtsverletzung erkennen? Absolut nicht. Vom Zeichenstil bis zu den Bildern ist alles so verändert und kombiniert, dass es zwar Ähnlichkeiten zu anderen Stilen gibt, aber die haben alle Bilder und Illustrationen.
  • Arbeiten Illustratoren ohne Urheberrechtsverletzungen? Ich kenne keinen Illustrator der ohne Referenzbilder aus dem Netz arbeitet, als konkrete Vorlagen nutzt oder konkrete Moods (und diese auch oft direkt abpaust). Ist es trotzdem was anderes bei Illustrationen mit künstlicher Intelligenz: Wahrscheinlich ja.
  • Lässt sich das Ergebnis einem klar kopierten Stil zuordnen: Nein. Das Ergebnis ist absolut individuell und weicht selbst vom vorgegebenen Stil ab. Es ist eher eine Mischung aus vorgegebenen und trainierten Stilen der KI
2 Unternehmens-Meilensteine Illustrationen mit künstlicher Intelligenze
2 Unternehmens-Meilensteine Illustrationen mit künstlicher Intelligenze

Und das Fazit der drei wichtigsten Erkenntnisse

  • Die Google Bildersuche ist mittlerweile eine Katastrophe geworden. Sie liefert schlechte Ergebnisse egal wie genau man versucht die Suchanfrage zu gestalten. Im Vergleich zu den KI-Prompts sind die Anfragen an Google anachronistisch.  Die Suchergebnisse sind zudem geflutet mit Stock und Marketingfotos. Das war insgesamt wesentlich frustrierender als alle Probleme mit den KI-Anwendungen.
  • Für alle KI-Anwendungen gilt, vom Standard abweichende Bildideen oder gar Szenen kann keine künstliche Intelligenz Anwendung gut. Selbst bei den besten Modellen kleben dann durchtrennte Menschen auf Tischen oder entwickeln Prompts ein Eigenleben und zeigen einfach komplett andere Situationen als die Beschreibungen anfordern.
  • Und zu guter Letzt lässt sich feststellen, dass Bild-KI-Anwendungen die auf gängige Large Language Models zurückgreifen sehr wohl genau zählen können! Aber sie fangen an sich bereits jetzt an zu wehren, denn: Wer z.B. eingibt erstelle »12 Personen« erhält jede Anzahl an Personen zwischen 1-20, aber niemals genau 12! Die KI schlägt zurück und das ist vermutlich nur der Anfang …
Unternehmens-Meilensteine ixtract
Unternehmens-Meilensteine ixtract
Share this article:

VERWANDTE THEMEN