KI und Kunst

Ko-Kreation mit StableDiffusion: Das Buchcover

Mein ursprünglicher Plan war es, ein paar Zeichnungen zu meiner Kurzgeschichte von einer KI generieren zu lassen. Da sich aber die Kurzgeschichte als eine normale Geschichte etabliert hat – von der ich für diesen Essay nur das erste Kapitel ver?ffentliche –, finde ich die Idee, ein Buchcover zu gestalten, doch ansprechender. Hierfür arbeite ich mit der KI StableDiffusion.

Durch die Forschungsliteratur habe ich eine ungef?hre Ahnung, wie genau die Prompts in solch ein Programm eingegeben werden müssen, um das gewünschte Ergebnis zu erhalten. Und an dieser Stelle tritt das erste Problem auf: Was das Schreiben betrifft, besitze ich gewisse F?higkeiten und Vorstellungen, wie das Werk am Ende aussehen soll. Zwar habe ich durchaus auch visuellen ?Geschmack‘, allerdings keine exakte Idee darüber, wie dick beispielsweise die Pinselstriche dargestellt werden sollen, wie das Bild ausgeleuchtet oder welche Brennweite verwendet werden soll. Hier ist es also zun?chst n?tig, genügend Inspiration zu sammeln, um gewisse Wünsche überhaupt erst entstehen zu lassen.

Was ich jedoch im Voraus in Bezug auf die Geschichte schon sagen kann, ist, dass es ein eher düsteres Cover mit neutralen bis dunklen Farben werden soll, die die Stimmung ad?quat widerspiegeln. Nach einigen ?berlegungen entscheide ich mich dazu, meine Protagonistin auf dem Buchcover abbilden zu lassen. Das Setting soll dabei die Gro?stadt sein, aus der sie stammt. Sie soll dabei im Mittelpunkt stehen, um sie herum viele Menschen, die allerdings nur verwischt zu sehen sind. Das soll symbolisch ihre Andersartigkeit, aber auch Einsamkeit, widerspiegeln, die sie aufgrund ihres KI-Seins erf?hrt. Aber auch der Fakt, dass sie im Buch die erste KI ist, die ?erwacht‘, soll damit zum Ausdruck kommen.

Also starte ich zun?chst gleich mit den wichtigsten Informationen zu meiner Idee und gebe, um bessere Ergebnisse zu erzielen, die Prompts auf Englisch (Sprachenauswahl spielt bei KIs eine wichtige Rolle) in das Programm ein: ?young woman standing in a big city by night with blurry people walking by, in gloomy dark colours“. Das Bild, das generiert wird, sieht zu meiner ?berraschung sehr gut aus und hat auch genau die Komponenten aufgegriffen, die ich angegeben habe. Allerdings finde ich den Stil, den ich dazu gew?hlt habe, n?mlich 'sai-cinematic', nicht passend für das Thema und probiere mehrere Stile durch, unter anderem 'futuristic sci-fi' und 'sai-comic book', wobei der letztere Stil am meisten meinen Vorstellungen entspricht. Eine besondere Auff?lligkeit ist dabei, dass, auch wenn ich mehrmals dieselben Prompts eingebe und mit dem gleichen Stil arbeite, immer ein ?hnliches Bild mit nur leichten ?nderungen generiert wird. Anders als erwartet, wird hier also nicht – wie bei ChatGPT – ein v?llig anderer Vorschlag geliefert, sondern es wird mit ?hnlichen oder gleichen Formen gearbeitet.

W?hrend meiner Tests f?llt mir aber noch eine andere Idee für ein Cover ein, der ich natürlich nachgehe. Statt der Protagonistin in Menschenform setze ich gezielt einen Roboter in Szene: Mit den Prompts “young woman who looks like a roboter in a big city at night surrounded by blurry people walking by, gloomy dark colours, big night sky” m?chte ich die Uressenz der Protagonistin nicht leugnen. Gleichzeitig hoffe ich, mit einem Roboter auf dem Cover etwas mehr Aufmerksamkeit generieren zu k?nnen, als mit einem Menschen.

Was mit dem Programm nicht gut funktioniert, ist die Darstellung von Schrift, die ich mehrmals versuche. Mein gewünschter Titel, für den ich mir ?I Am“ ausgesucht habe, l?sst sich durch die Eingaben ?with the words saying ?I Am‘“, ?the words ?I Am‘ written on top of it“ oder ?the title ?I Am‘“ nicht abbilden, weshalb ich mich dazu entscheide, ihn selbst mit Paint hinzuzufügen. An dieser Stelle ist es wichtig zu erw?hnen, dass andere Programme m?glicherweise schon in der Lage sind, auch Text in Bildern zu generieren. Für die Schriftart m?chte ich etwas, was den ?menschlichen‘ und emotionalen Aspekt meiner Protagonistin unterstreicht, weshalb ich eine Schriftart w?hle, die einer menschlichen Handschrift sehr nahekommt. Mit dem Cover hoffe ich also, sowohl die KI-Aspekte als auch die menschlichen Aspekte nach dem Erwachen der KI zu illustrieren, ohne dabei zu viel von der eigentlichen Geschichte vorwegzunehmen. 

 

Meinen Namen als Autor habe ich dabei bewusst weggelassen. Zum einen, da StableDiffusion offensichtlich eine Verwendung seiner Bilder ohne Angabe des Programmes nicht zulassen m?chte. Zum anderen, da ich dieses Bild nicht gezeichnet habe. Natürlich würde es ohne meine Ideen, Vorstellungen und Prompt-Eingaben nicht existieren, aber ich wurde, meiner Einsch?tzung nach, in keiner Weise künstlerisch t?tig, um es zu erstellen. Eher würde ich, wie auch schon die Autoren aus meinem Literaturkapitel, von einer Ko-Kreation sprechen. Meine Idee + meine Befehle = von der KI generiertes Werk.

Ehrlicherweise erleichtert mir die von StableDiffusion angegebene Wassermarke meine Einsch?tzung diesbezüglich. Für eine tats?chliche Ver?ffentlichung des Buches würde ich wahrscheinlich dennoch die Wassermarke ausschneiden und im Impressum erw?hnen, dass das Cover teilweise KI-generiert ist. Diese Entscheidung entspring zum Teil meiner Eitelkeit, teilweise ist sie meiner ?sthetischen Vorliebe geschuldet.

Die Arbeit mit StableDiffusion hat – zusammenfassend – deutlich schneller funktioniert als mit ChatGPT, was vor allem daran lag, dass ich schneller mit dem Ergebnis der KI zufrieden war. Beim Generieren von Bildern ist mein Anspruch dabei nicht so hoch, wie beim Generieren von Text, da ich nach meiner eigenen Einsch?tzung nicht malen oder zeichnen kann. Einzelheiten im Bild sch?tze ich als nicht so wichtig ein, wie bei einer Geschichte; und auch Emotionen müssen nicht so deutlich dargestellt werden. Letztlich konnte ich einen viel kleineren Aufwand bei der Prompteingabe bzw. generell bei dem gesamten Prozess bis hin zum gewünschten Ergebnis feststellen. Natürlich k?nnen die Ergebnisse von KI zu KI variieren – dies sind lediglich die Ergebnisse zu StableDiffusion.

Ein weiterer Gedanke w?hrend der Arbeit mit der KI war: Ist die Frage nach dem Autor eines Kunstwerks zum Ausstellen wichtiger als für ein Buchcover? Natürlich wird ein Buch auch distribuiert, aber nicht um des Covers willen, sondern wegen seines Inhalts. Und ist die Frage nach dem Autor bei ChatGPT folglich wichtiger? Ein Buch wird wegen der Geschichte gekauft, das Cover ist dabei oft lediglich ein Anreiz zum Kauf.

 

>> Weiter zu "KI und Sprechen"