CN: Rassismus, Begriff “Rasse”
Künstliche Intelligenz und das Schreiben von Romanen kann zusammenpassen. Gemeint ist nicht: Ich lasse für mich schreiben. Gemeint ist: Ich lasse mich inspirieren. Am Beispiel von zwei Online-Diensten, die die Generierung von Bildern durch künstliche Intelligenz (auch: KI, englisch: AI) anbieten, möchte ich das zeigen – zugleich aber auch davor warnen.
Ganz allgemein
Ganz grob formuliert: KI-generierte Bilder sind in ihrem Outcome abhängig von Datenpool, innerer Struktur des Datenpools, Verknüpfung der Daten mit Begriffen und final der Formulierung zur gewünschten Bilderstellung durch Anwender*in (hier auch wichtig: Art und Weise der Eingabe dieser Formulierung, z.B. durch (pseudo)differenzierte Schiebregler oder Stichwörter und deren syntaktischer Zusammenhang bei Texteingabe). Das klingt trocken, birgt aber Dinge, die gleich noch wichtig werden. Ob das Ergebnis nun wirklich Kunst/Design ist, nehme ich aktuell als strittig wahr. Es wird u. A. überlegt, dass die menschliche Komponente der Formulierung von Bildanforderungen dazu führt, dass es Kunst/Design ist. Wenn aber beispielsweise ein Bild im Stile eines Ölgemäldes generiert wird, fehle die gestalterische (und über Stile hinweg auch individuelle) Absicht hinter Stricharten, Farben und Komposition – der Anteil von Zufall und Beschränkung durch Datenpool und Verknüpfung von Daten sei zu hoch. In diesem Text wird das aber nicht besprochen, sondern auf die Verwendung für die Unterfütterung von Schreiben und Entwicklung von Weltenbau eingegangen.
Hinweis: Bei Nutzung von KI-Diensten ist natürlich weiterhin auf die Nutzungsrechte zu achten, wie von Entwickler*innen festgelegt.
Ich möchte einmal eine meiner Ansicht nach gute kleine Liste an Vor- und Nachteilen von KI-generierter Kunst anfügen (übersetzte und gekürzte Liste von Nightcafe Studio):
Einige der Vorteile von KI-generierter Kunst (sic!) sind: (…)
- Sie kann schnell und effizient erstellt werden.
- Sie kann von jedem erstellt werden, unabhängig von [den eigenen] künstlerischen Fähigkeiten.
- Sie kann ohne physische Materialien erstellt werden.
Auf der anderen Seite gibt es auch einige Nachteile von KI-generierter Kunst (sic!):
- Ihr kann die emotionale Bindung fehlen, die traditionelle Kunst oft hat.
- Es kann schwierig sein, die gleichen Ergebnisse zweimal zu reproduzieren.
- Es kann schwer zu verstehen sein, wie die KI überhaupt [Bilder] erzeugt hat.
“DALL-E 2“
Dall-E 2 gibt seit ein paar Monaten die Möglichkeit, per Gästeliste zuzugreifen und nach fast einem halben Jahr durfte ich dazukommen. Besonders gereizt hat mich die Möglichkeit, über text prompts und Iterationen zu arbeiten. Das heißt: Ich gebe einen Satz ein und schaue mir die Ergebnisse an (z. B. “Ein Gepard in Lederjacke, Illustration.). Wenn ich das Gefühl habe, Dinge umzuformulieren oder spezifizieren zu müssen, wandle ich entweder meine Eingabe ab (eigeninitiierte Iterationen) oder lasse von der KI völlig frei weitere Ergebnisse produzieren (teils fremdinitiierte Iterationen), in diesem Fall mit Möglichkeit, ein favorisiertes Ergebnis als Vorgabe anzugeben zur weiteren Entwicklung. Diese wurde dann eben weniger von mir angeleitet als von der KI.
Die ersten Ergebnisse finde ich persönlich besonders atmosphärisch und realistisch sehr gut. Beliebt auf TikTok und Instagram war die letzten Monate ein Dienst, der sehr abstrakte Bilder generiert hat, die mir vergleichsweise aber eben… zu abstrakt waren (“Wombo” ). Um so mehr freue ich mich über die Fähigkeiten von Dall-e 2, sehr schnell gute Ergebnisse mit wenigen Iterationen zu liefern. Besonders für Innenräume und Stimmungen mag ich die Anwendung. Sie sind nicht zu 100 Prozent das, was mir vorschwebt. Aber das Ausprobieren zwingt mich (positiv gemeint) in die Reflektion.
Generell sind das für mich nur bedingt Ergebnisse, die ich teilen wollte. Es wäre schön gewesen, wenn es anders wäre, damit ich zum Zeigen keine Bilder aus dem Netz teilen müsste, deren Rechte zur Nutzung häufig nicht klar sind (das ist keine Kritik, sondern eine Feststellung. Ich möchte die Rechte anderer respektieren, so, wie ich das auch für meine Arbeiten erwarte.). Ich teile auch keine Bilder aus dem Netz, sondern lege nur privat Sammlung an. Schade, da ist nun jedoch genannte Begründung. Aber die KI-generierten Bilder helfen mir insbesondere in Bezug auf Verfeinerungen bzw. Iterationen besser zu bestimmen, was ich von meiner Umgebung für das Projekt möchte und was nicht. Hilfreich sind für mich insbesondere die Abwandlungen, die Möglichkeiten der vielen Ergebnissen und deren Vergleich untereinander. Der Prozess des Bestimmens, was für mich wie weit passt und was nicht, fällt für mich ultimativ in den Bau von Welten und Szenen.
Das Generieren von Bildern mit Personen ist nur geringfügig möglich, von denselben Personen in unterschiedlichen Settings absolut gar nicht. Das wäre aber auch per se zu weit gegriffen. Denn: KI können aktuell nur Anreize liefern und meiner Ansicht nach die Arbeit von Illustrator*innen, Grafiker*innen und Fotograf*innen nicht ersetzen. Und ehrlich gesagt wollte ich das auch nicht. Die Entwicklung der eigenen Vision mit anderen Kreativen ist für mich persönlich ein wichtiger Aspekt des Schaffensprozesses. Allerdings kostet dieser Teil auch Geld, sollte es auch. Leisten kann sich das nicht jeder (ich zum Beispiel nicht). Deswegen oder dennoch betone ich nochmals: Die Beauftragung Kreativer mit bildnerischen Umsetzung der eigenen Vision kann durch KI nicht ersetzt werden. Und ich glaube, dass wir da auch nicht hinkommen sollten (riecht ihr Science Fiction? Then you smelled the now & near future right!).
“Artbreeder“
Der Name gruselt mich (daher nachfolgend abgekürzt mit AB) und leider hat sich der Grusel bestätigt. Meine Vorstellung war: Ich baue (kostenlos, hey!) ein Bild einer Person nach, die meiner Figur aus Roman am nächsten kommt und kann sie sogar noch besser anpassen. Und generell kann ich es herzeigen (aber Achtung, s. Hinweis auf Nutzungsrechte eingangs!), da KI-generiert und von mir angepasst. Hat das funktioniert? Jein.
Im Gegensatz zu Bildgenerierung bei Dall-e funktioniert AB über “Eltern” und “Gene”. Once again, you might smell something. Wenn ich also Bild A und B zusammenziehe, wird ein Mischbild generiert. Ich kann bestimmen, welcher Teil überwiegt (sehr vage). Dann ist es grob und unter Anderem möglich, über Schiebregler Öffnung der Augen, des Mundes, Breite des Kinns zu bestimmen. So weit, so einigermaßen unverfänglich (und in Details teils noch weniger umfassend als manche Charakter-Generatoren in Videospielen). Hautfarbe, Nase, Mund näher zu bestimmen, geht über das Feld “Race”, unterteilt in “latino-hispanic”, “asian”, “middle eastern”. Böse ausgedrückt: Es liegt der KI eine menschengemachte Theorie vor, wie man als “latino-hispanic”, “asian”, “middle eastern” auszusehen hat. Das empfinde ich persönlich als diskriminierend. Diese “Gruppen” sind so allgemein gefasst und doch in ihrem Aussehen sehr bestimmt, dass schädliche Stereotype gefestigt werden (mind you, gibt es denn wirklich “nicht schädliche Stereotype”?). Schaut man sich die Nutzergalerie bei AB an, überwiegen weiße normschöne Personen. Die Norm ist gefühlt also weiß, aber ist kolonialistisches Gedankengut besser, nur weil es digital und kostenlos ist? Natürlich nicht. Hinzu kommt: Dicke Menschen, Menschen mit Narben etc. zu generieren ist zwar offiziell möglich, aber absolut nicht ausgereift. Der Fokus liegt (und wie gut gemeint, ist mir gleich) in (Schädlichkeit der) Normativität.
AB bringt mich ethisch dahin, worauf ich beim Schreiben achte: Auf Diversität. Oder die Entdeckung ihres Fehlens. KI ist (aktuell) für mich kein Ersatz für den Blick auf Geschichte und weitere gesellschaftliche Entwicklung (und wie soll das gehen, ohne, dass wir Intelligenz entwickeln, die emotional fähiger ist als viele Menschen?). Ich kann mit AB Stereotype generieren, aber da ist kein Bewusstsein für den Einsatz und für potentielle Schädlichkeit. Da hilft es auch nicht, dass Dienste wie Dall-e 2 ein Programm im Hintergrund haben, die pornografische Darstellungen und den Einbau realer Fotos für deep fakes verhindern. Gewalt ist vielfältig. Das nicht zu vergessen und auch diese Form von Gewalt zu verhindern ist in meinen Augen eigene Wahrnehmung von Pflicht als schreibende Person.
Fazit
Susan Sontag schrieb einmal: Die Kamera ist Gegengift und Krankheit zugleich, Mittel zur Aneignung der Realität und Mittel zu ihrer Abnutzung. (“Über Fotografie”, S. 171, Fischer Verlag 1991) Damit bezog sie sich besonders auf gewaltvolle Bilder, aber ich nutze das für diesen Beitrag. Für die Erzeugung von Bildern für den eigenen Schreibprozess hin zum Anreichern eines Weltenbaus würde ich dieses Zitat gerne umformulieren: “KI sind Placebo und Krankheit zugleich, Mittel zur Aneignung (über Iteration, s.o.) einer Wunsch-Realität geprägt von Autor*in und (und einem potentiell rassistisch geprägten) Datenpool und Mittel zum Wegsehen, was die Realität eigentlich ausmacht.”
Meine Empfehlung: KI nutzen, aber nicht nicht hinsehen und reflektieren, was die Realität ist. Gilt in meinen Augen immer, KIs übernehmen da aber eben auch keine Verantwortung. Möglichkeiten sind nicht gewaltlos, Kostenersparnis ist keine Ausrede. Und als versöhnlichen Tipp: Wenn eigene, persönliche Bilder zu eigenen Projekten zur Veröffentlichung gewünscht sind, spart an und nutzt zum Beispiel (reflektierte!) KI-generierte Bilder zur Verdeutlichung der eigenen Vision gegenüber Illustrator*innen, Grafiker*innen und Fotograf*innen.