„Ich bin der einzige Künstler, den die Natur kopiert.“ Abgesehen von seiner Arroganz und seiner Überheblichkeit, die in diesem Zitat zum Ausdruck kommen, war der spanische Maler, Grafiker, Schriftsteller, Bildhauer und Bühnenbildner Salvador Dalí einer der Hauptvertreter des Surrealismus und zählt zu den bekanntesten Malern des 20. Jahrhunderts. Etwas über 30 Jahre nach seinem Tod benennt das KI-Unternehmen OpenAI seine KI-Plattform zur Bildgenerierung DALL-E nach ihm. Der Name ist ein Kofferwort aus dem kleinen animierten Roboter Wall-E aus dem gleichnamigen Film und dem berühmten spanischen Surrealisten. Aber was hätte Dalí dazu gesagt? Was hätte er über die vielen generierten Bilder gesagt? Das vom französischen Dichter André Breton erschaffene „Surrealistischen Manifest“ von 1924 plädierte für eine ungehemmte Ausdrucksweise, die sich aus den unwillkürlichen Mechanismen des Geistes, insbesondere den Träumen, ableitet, und forderte die Künstler auf, die unerforschten Tiefen der Vorstellungskraft mit radikalen neuen Methoden und visuellen Formen zu erkunden. Diese reichten von abstrakten „automatischen“ Zeichnungen über hyperrealistische, von Träumen und Alpträumen inspirierte gemalte Szenen bis hin zu unheimlichen Kombinationen von Materialien und Objekten. Ob es der Name Dalí, seine Person, das Manifest oder die Kombination aus allem war – OpenAI unterstreicht durch den Namen DALL-E die Möglichkeiten, die Ergebnisse und indirekt auch die Relevanz der KI-Plattform. Doch ist das nicht auch etwas überheblich? Manch ein per KI-Bildgeneratoren generiertes Bild wirkt surreal, manch eines verstörend, viele wiederum beliebig. Mit Surrealismus hat das meines Erachtens wenig zu tun. Wie viele der generierten Bilder sind Datenmüll und verbrauchen nur unnötig Energie, welche Auswirkungen hat die Entwicklung von KI auf die Kunst und andere Kreativbereiche? Kann KI Kunst? Ich werfe einen ersten persönlichen Rückblick auf die Entwicklung.
Midjourney, DALL-E, Bing Image-Creator, Nightcafé – um an dieser Stelle einige der bekannten KI-Bildgeneratoren zu nennen. Die Liste wächst stetig und auch Adobe hat mit Adobe Firefly eine Plattform ins Leben gerufen, die mit dem richtigen Prompt erstaunlich gute Ergebnisse liefert. Perspektiven, Farben, Kontraste und Stile können per Klick geändert werden und erzeugen in Sekunden eine passende Bildkomposition. Die nachträgliche Bearbeitung in Photoshop ermöglicht das Modifizieren und Erweitern der Ergebnisse ebenso per Prompt direkt in der Anwendung. Objekte sind in Sekunden freigestellt und mit einem gewünschten Hintergrund versehen. Ein Kampagnenmotiv, ein Mailingheader, ein Social Media-Beitragsbild oder andere visuelle Elemente sind so in kürzester Zeit erzeugt. Über die Qualität der Ergebnisse lässt sich streiten, hier gehen die Meinungen auseinander, und welche KI Plattform für welchen Fall bessere Ergebnisse liefert, hängt meines Erachtens von den jeweiligen Anforderungen und dem Einsatz (Digital / Druck) ab. Farben, Kontraste, Details, Stil oder Maße bzw. Auflösung. In einem weiteren Beitrag werde ich mit den Plattformen experimentieren und auf die Ergebnisse eingehen.
Ein oft angesprochener Aspekt sind die Leidtragenden Grafikdesigner, Illustratoren oder Fotografen – alle schreien auf, weil Plattformen wie Midjouney Millionen von urhebergeschützen Bildern als Datenbasis nutzen.
Das Urheberrecht an Bildern steht grundsätzlich demjenigen zu, der sie erstellt hat – im Rahmen der KI, kommen hier mehrere Berechtigte in Frage, die KI selbst, der Betreiber (Entwickler) des KI-Bildgenerators oder der Nutzer, der den Input und die Vorgaben macht, so dass die KI nur Werkzeug des Nutzers oder auch Betreibers ist. Fest steht – die KI kann selbst und isoliert betrachtet keine urheberrechtlich geschützten Werken hervorbringen. Das Urheberrecht sieht als Voraussetzung für den Schutz vor, dass das Werk eine persönliche geistige Schöpfung ist, also von einer natürlichen Person geschaffen wurde. Die Rolle der Personen, deren Bilder ggf. als Basis dienten, ist ein ungeklärter Aspekt. Die Bild-KI Stable Diffusion wurde an unzähligen Fotos trainiert. Der Stock-Anbieter Getty Images sieht darin eine Urheberrechtsverletzung und zieht vor Gericht. Adobe wiederum sagt: Das erste Firefly-Modell wird anhand von mehreren Hundert Millionen hochauflösenden Bildern aus Adobe Stock, offen lizenzierten Inhalten und gemeinfreien Inhalten trainiert, die nicht mehr urheberrechtlich geschützt sind. Das heißt: Mit Firefly generierte Inhalte dürfen für gewerbliche Zwecke genutzt werden.
Komponieren, malen, schreiben – Kann KI Kunst?
Illustrationen, Fotos, Grafiken oder Szenerien generieren – das kann per Prompt auch der Laie und Nicht-Grafiker ohne Grafikprogramme. Aber wie sieht es mit der Kunst aus? Kann KI Kunst? In Frankreich komponierte ein neuronales Netz, dem Forscher*innen 45 Beatles-Songs als Datengrundlage gegeben hatten, eigenständig Daddy’s Car, einen Song ganz im Stile der Bandkomponisten John Lennon und Paul McCartney. Im Oktober 2018 erzielte Edmund de Belamy, ein von einer KI generiertes Gemälde, bei einer Auktion des New Yorker Auktionshauses Christie’s den Rekordpreis von 432.500 US-Dollar. In Tübingen entwickelte ein Team um den Neurowissenschaftler Matthias Bethge eine KI-Software, die die Werke großer Maler analysiert und reproduziert. Die Frage, die ich mir stelle: Ist die menschliche Kreativität im Bereich Gestaltung, Kreation und Komposition bald überflüssig? Was macht Kunst so besonders, dass die KI hier an ihre Grenzen kommt.
Der Maler Jackson Pollok mit seinem Spitznamen „Jack the Dripper“
Jackson Pollock. Vor einem seiner Bilder stehend betrachte ich die Farbe, wie sie mit ihrer Struktur sich von der Leinwand abhebt. Jedes seiner Bilder strahlt für mich Energie, Emotion und gleichzeitig eine besondere Art der Komposition aus. Ich stehe davor und stelle mir den berühmten abstraken Expressionisten vor, wie er sich tänzelnd über seine auf dem Boden liegende Leinwand bewegt. Natürlich spielt die Geschichte zu seiner Person eine zentrale Rolle, wenn es um die Begeisterung für den Maler Jackson Pollock geht – aber im Kern geht es um seine Werke, die heute für Millionenbeträge den Besitzer wechseln und die die abstrakte Malerei maßgeblich beeinflusst haben.
Meine erste Jackson Pollock Ausstellung war für mich fast wie für andere das erste Konzert ihrer Lieblingsband. Glücksgefühle, Aufregung, Begeisterung – Emotionen über alle Sinnesorgane. Die Begeisterung für sein Werk als Maler und gleichzeitig für seine emotionsgeladene Geschichte nimmt mich so sehr mit, dass ich jedes Mal ein Kribbeln im Bauch spüre, wenn ich vor einem seiner Bilder stehe. Es ist eine Begeisterung, die ich garantiert mit vielen Menschen teile und ja – hätte ich die nötigen finanziellen Mittel und den Platz an den Wänden, würde ich eines seiner Bilder versuchen käuflich zu erwerben. Ich könnte die besondere Magie seiner Malerei jeden Tag sehen, wahrnehmen und sogar ertasten, da kein pflichtbewusster Museumwärter mich davon abhalten kann.
Drip-Painting: Action Painting als Stilrichtung
1947 kam Jackson Pollock zu einer neuen Technik, die ihm internationalen Ruhm einbrachte. Seine Methode bestand darin, verdünnte Emaillefarbe auf eine ungespannte Leinwand zu schleudern und zu tropfen, die auf dem Boden seines Ateliers lag. Diese direkte, körperliche Auseinandersetzung mit seinen Materialien ließ Schwerkraft, Geschwindigkeit und Improvisation in den künstlerischen Prozess einfließen und erlaubte es der Linie und der Farbe, für sich allein zu stehen und völlig unabhängig von der Form zu funktionieren. So wurde Pollock bekannt mit der von ihm begründeten Stilrichtung des Action Painting. Seine im Drip-Painting-Verfahren angefertigten großformatigen Werke brachten ihm bereits zu Lebzeiten den Spitznamen „Jack the Dripper“ ein.
Jackson Pollock litt an schwerem Alkoholismus und wachsenden Depressionen, sodass er professionelle Hilfe in Anspruch nehmen musste. Bereits kurz nach seiner Entlassung aus einer Klinik erlitt er einen weiteren Zusammenbruch und er begann eine Behandlung bei Dr. Joseph Henderson, der Zeichnungen und andere Bilder in seiner Therapie verwendete. Dadurch lernte Pollock, seine Kunst zu nutzen, um sein innerstes Selbst auszudrücken, als Mittel zur Behandlung seiner schweren Depression. Pollocks Bilder wurden nun zutiefst persönlich, denn er betrachtete ihre Ausführung als „Selbstfindung. Jeder Künstler malt, was er ist. Der moderne Künstler arbeitet mit Raum und Zeit und drückt seine Gefühle aus, anstatt zu illustrieren“.
Liebe, Hass, Zorn, Freude, Trauer, Enttäuschung, Angst – Emotionen als Impulsgeber
Und das ist es, was Kunst aus meiner Sicht (unter anderem) ausmacht. Es sind die Emotionen – die Emotionen der Person, die das Werk erschafft und die Emotionen der Person, die das Werk wahrnimmt. Es sind Erfahrungen, Erlebnisse, Gefühle, die in Worten, Melodien, Farben, Formen oder Bewegungen ihren Ausdruck finden.
Dazu muss man erwähnen, dass es keine klare Definition für den Begriff Emotion gibt. So heißt es in einem Beitrag: Manche Forscher definieren Emotionen als körperliche Reaktionen, die sich im stammesgeschichtlichen Kampf ums Überleben entwickelt haben, andere als mentale Zustände, die einsetzen, wenn das Gehirn körperliche Reaktionen (oder neuronale Zustände) repräsentiert. Für manche sind unbewußte Impulse entscheidend, für andere dagegen bewußte Bewertungen und Klassifikationen. Manche halten körperliche Reaktionen für irrelevant und meinen, Emotionen spielen sich ausschließlich im Gehirn ab, andere sehen sie als Formen des Handelns oder Redens oder sogar als soziale Konstrukte, die sich nicht in Individuen ereignen, sondern gleichsam zwischen ihnen.
Natürlich kann man in Frage stellen, ob bei der Gestaltung eines Kampagnenmotives Emotionen in die Arbeit einfließen – wenn, dann ist es erfahrungsgemäß eher Frust und Wut, die eine Rolle spielen. Doch die kreative Leistung einer Person wird beeinflusst durch sein Können und je nach Situation auch durch seinen emotionalen Zustand.
Kreativität ist eine Eigenschaft, die dem Menschen zuzuordnen ist – noch. Die Psychologie des kreativen Prozesses, so heißt es besteht in einer dynamischen „Neuformierung von Informationen“. Psychologisch hängt dieser Prozess von folgenden Grundbedingungen ab: Begabung, Wissen, Motivation, Persönlichkeit. Persönlichkeitseigenschaften spielen hier eine zentrale Rolle: Offenheit für neue Erfahrungen, lebhafte Phantasietätigkeit, künstlerische Sensibilität, Gefühlstiefe, Flexibilität, Nonkonformismus und Ambiguitätstoleranz. Kreativität ist keine Fähigkeit, die es zu erlernen und dann anzuwenden gilt. Kreativität ergibt sich viel mehr aus den Einstellungen, Emotionen und Erwartungen, die eine Person in dem Moment hat, in der sie vor einer kreativen Herausforderung steht.“, erklärt Erstautorin und Kreativitätsexpertin Jennifer Haase. All das sind Eigenschaften und Faktoren, die wir einer Maschine oder einem technischen System wie künstlicher Intelligenz nicht zuordnen – noch nicht.
Kann KI kreativ sein?
Anfang des Jahres ging ein Rumoren durch die Musikwelt als ein Fan dem Musiker Nick Cave einen Songtext schickte, den eine künstliche Intelligenz in seinem Stil generiert hatte. Nick Cave fand die Imitation ziemlich scheiße und schreibt darüber in seinem Blog. Abgesehen von seiner sichtbaren Ablehnung dieser Technologie bringt er es auf den Punkt: Die Kunst, einen guten Song zu schreiben, liegt dem Musiker zu folge nicht in Nachahmung oder Replikation. Das Gegenteil sei der Fall. „Es ist ein Akt des Selbstmordes, der alles zerstört, was man in der Vergangenheit zu produzieren versucht hat. Es sind diese gefährlichen, herzzerreißenden Abweichungen, die den Künstler über die Grenzen dessen hinauskatapultieren, was er oder sie als sein bekanntes Selbst anerkennt.“ Songschreiben verlangt Menschlichkeit, so seine Auffassung.
In seinem Beitrag schreibt er auch: „Es ist absolut vorstellbar, dass KI ein Lied erzeugen kann, das zum Beispiel die Qualität von Nirvanas „Smells Like Teen Spirit“ hat. Ein Lied, das alle Kriterien erfüllt, die nötig sind, damit wir empfinden, was wir empfinden sollten, wenn wir ein Lied wie dieses hören. In diesem Fall könnte das zum Beispiel sein, sich aufzuregen und sich rebellisch zu fühlen. Es ist sogar plausibel, dass KI ein Lied erzeugt, das uns diese Gefühle intensiver empfinden lässt, als es jeder menschliche Songwriter tun könnte.
Aber ich glaube eben nicht, dass wir, wenn wir „Smells Like Teen Spirit“ hören, nur das Lied hören. Mir scheint, dass wir eigentlich die Reise eines verschlossenen, einsamen jungen Mannes hören, die in der amerikanischen Kleinstadt Aberdeen beginnt. Ein junger Mann, der nur so strotzte vor Abnormität und menschlicher Begrenztheit. Und der die Kühnheit besaß, seinen Schmerz in ein Mikrofon zu heulen und damit auf verschlungenen Pfaden die Herzen einer ganzen Generation erreichte.
Meine Meinung ist: Es besteht kein Bedarf, dass eine KI einen Nick Cave Song erzeugt. Nick Cave ist Musiker, Songwriter und Autor: Er will und kann es selber tun. Und sein Anspruch, seine Intuition und seine Bedarf etwas Neues zu erschaffen sind so hoch, dass KI keine Option darstellt. Er tut das, was er tut, um sich auszudrücken und seine Fans erwarten von ihm ein entsprechendes Ergebnis.
Wer gute Musik zu schätzen weiß, der wird Nick Cave mit Sicherheit Recht geben. Und wenn Nick Cave sein nächstes Album oder sein nächstes Buch von einer KI generieren lässt, verliert er mit großer Wahrscheinlichkeit nicht nur viele seiner weltweiten Fans, sondern auch sein Ansehen als Musiker und Künstler. Und trotzdem wird KI auch für Nick Cave eine Rolle spielen oder tut es bereits. Diejenigen, die seine Musik produzieren, verwenden Software, die durch KI die Prozesse und Workflows unterstützt.
Generative KI: Das Erzeugen von Bildern, Texten, Musik oder Videos
An dieser Stelle sollte man einmal erklären, von was wir hier eigentlich sprechen. Im Kern geht es um das Generieren von Inhalten mit Hilfe einer KI. Generative KI (englisch: Generative AI) kann von vorhandenen Artefakten lernen, um neue, realistische Artefakte zu generieren, die die Merkmale der Trainingsdaten widerspiegeln, diese jedoch nicht wiederholen. Sie kann eine Vielzahl von neuartigen Inhalten produzieren, wie Bilder, Videos, Musik, Sprache, Text, Softwarecode und Produktdesigns.
Während im Zentrum der aktuellen Debatte KI-Systeme stehen, welche Texte generieren können (z. B. OpenAIs ChatGPT oder Googles Bard), gibt es auch solche, die beispielsweise Bilder (z. B. Midjourney), Videos oder Ton erzeugen. Als Input dient ein sogenannter Prompt – eine Art geschriebener Arbeitsauftrag für das Modell. Dieser Prompt wird dann im Fall von Text-to-Text-Modellen vervollständigt. Die Qualität des Prompts hat deswegen auch großen Einfluss auf die Qualität des Outputs. Die folgenden Bilder habe ich in unter einer Minute mit Adobe Firefly per Prompt erzeugt. Man muss an dieser Stelle unterstreichen, dass somit jede Person ohne besondere Kenntnisse und Fähigkeiten Bilder erzeugen kann. Ein inspirierendes Erlebniss ist es auf jeden Fall.
Künstliche Intelligenz und die fehlende menschliche Eigenschaft
Künstliche Intelligenz ist seit der Veröffentlichung von ChatGBT, Discord und anderen Plattformen für jeden zugänglich – sofern man Internet hat und ein passendes Endgerät. In Sekunden generiert die KI Bilder, Texte oder sogar ganze Musikstücke – kreative Inhalte mit teilweise erschreckend guten Ergebnissen. Da stellt sich unweigerlich die Frage: Sind Künstler und Kreativschaffende damit obsolet? Gehen wir bald in Galerien oder Museen und schauen uns Werke an, die von KI erschaffen wurde? Schreibt eine KI das Drehbuch für den nächsten Blockbuster oder die Songs des nächsten Coldplay Albums? Oder anders gefragt: Würden wir ein neues Amy Winehouse oder Nirvana Album kaufen, das mit Hilfe von KI geschrieben oder erschaffen wurde? Hier gehen die Meinungen mit Sicherheit auseinander. Vielleicht hören sich Fans das Album aus reiner Neugierde an oder weil es im Musik-Abo eh jederzeit abrufbar ist. Doch was ist mit den Personen, die hinter diesen Namen stehen. Curt Cobain und Amy Winehouse haben Selbstmord begangen. Nur ihre Musik und die Geschichten zu ihren Personen leben weiter. Und damit sind wir wieder bei der Aussage von Nick Cave: Ihre Songs berühren uns. Wir wollen das Emotionale hören, das Alben wie Back to Black oder In Utero in sich tragen. Wir wollen das Leid, den Schmerz, die Wut, die Trauer oder auch die Freude hören und fühlen. Das würde in einem von einer KI erzeugten Song unweigerlich fehlen, denn KI kennt weder Schmerz noch Trauer. Sie kann nur das Musikalische in Form von Melodie, Text und Stimme erzeugen, basierend auf Daten, mit denen sie gefüttert wird. Manch einer Person reicht das aus und andere lehnen ein solches Ergebnis kategorisch ab.
Der Zukunftsforscher Bernd Flessner bewertet KI-Kunst vor allem mit Blick auf das Publikum. „Wenn ein Kunstwerk für die Rezipienten, die ein Bild anschauen, ein Musikstück anhören oder ein Buch lesen, etwas aussagt, dann ist es Kunst, völlig unabhängig davon, wie sie entstanden ist“, meint der Erlanger Wissenschaftler. Ein Algorithmus könne demnach genauso schöpferisch tätig werden wie ein Mensch. Dieser Aussage widerspreche ich, denn zum einen beantworten Künstler:innen, Kunstwissenschaftler:innen und andere Fachleute die Frage „Was ist Kunst“ sehr unterschiedlich und zum anderen ist Kunst aus meiner Sicht eine emotionale Ausdrucksform, die dem Menschen zuzuordnen ist.
Kann ChatGBT etwas mit dem Begriff Emotion anfangen? Fragen wir doch einfach ChatGBT selbst: „Was sind Emotionen?“ Die Antwort:
Wir fragen weiter: „Hat Künstliche Intelligenz Emotionen?“
KI kann Emotionen erkennen und einordnen – Anhand von Mimik, Gestik und Hirnströmen können hochauflösende Kameras und Sensoren schon heute Gefühle ablesen. Doch kann KI eigene Emotionen entwickeln?
Stand heute im Jahr 2024 kann Künstliche Intelligenz keine Emotionen entwickeln. Sie kann lediglich menschliche Emotionen erkennen, analysieren und bewerten (Affective Computing). Damit fehlt ihr aus meiner Sicht das Elementare, was insbesondere Kunst als kreative Leistung ausmacht. Wollen wir diese Eigenschaft nicht als das ansehen, was uns als Menschen von Maschinen und Systemen unterscheidet? Damit wir etwas haben, was uns ausmacht und was uns zu kreativer Leistung verhilft. Damit wir Dinge erschaffen, die einen emotionalen und gesellschaftlichen Wert für jetzige und zukünftige Generationen haben.
Ein erstes persönliches Fazit
Über KI, ihre Vorteile, ihren Nutzen und auch über ihre Risiken wird viel diskutiert. Ob KI-Bilder, -Songs und -Texte eine Daseinsberechtigung haben – aus meiner Sicht ja. Die Vorteile der neuen Technologie überwiegen auf gestalterischer und konzeptioneller Ebene. Ich teste aktiv mit KI-Bildgeneratoren, was möglich ist und wo ich für mich Nutzen und Vorteile sehe. Für den Bereich Grafikdesign habe ich mehrfach schon mit KI-generierten Bildern gearbeitet und diese für Designs bewusst eingesetzt. Aktuell haben sich für mich u.a. volgende Vorteile und Nutzen ergeben:
- Weniger Zeitaufwand für Bildrecherchen
- Schnelle Entwürfe für erste Entscheidungen
- Perspektiven und Körperhaltungen erzeugen
- Modifizieren und Anpassen von Hintergründen, Farben und Strukturen
- Erweitern von Bildbereichen
- Erzeugen von Versionen
Kann KI Kunst? Ich sehe bildende Kunst, anspruchsvolle Gestaltung oder Musik als Bereiche, die dem Menschen mit seinen Fähigkeiten zuzuordnen sind. Für mich ist Kunst im erschaffenden Kontext das, was uns Menschen ausmacht. Wir erschaffen Sie und hinterlassen Sie für nachfolgende Generationen. Und dafür sollten wir uns als Gesellschaft einsetzen. Man sollte sich über einen Aspekt immer im Klaren sein: Künstliche Intelligenz könnte ohne die von Menschen erschaffenen Werke nichts selber erschaffen; keine Lieder, keine Texte und keine Bilder. Aber: Künstliche Intelligenz beeinflusst schon jetzt Kunstschaffende weltweit und es gibt viele herausragende Beispiele, wie unter Einsatz von KI und Machine Learning Neues erschaffen wird. So bin ich beispielsweise auf den Medienkünstler Refik Anadol gestoßen. Seine Arbeiten bestehen häufig aus datengesteuerten maschinellen Lernalgorithmen, die aus Datenströmen abstrakte, immersive, traumähnliche Umgebungen schaffen. Als Medienkünstler ist er fasziniert von den Möglichkeiten, die das digitale Zeitalter und die maschinelle Intelligenz für eine neue Form der Ästhetik bietet.
Doch es entstehen gerade zu viele sinnlose und meist ungenutzte KI-Inhalte, die als Datenmüll in den digitalen Weiten umherschwirren und irgendwann verschwinden. Gerade KI-Bildgeneratoren sind eine maximale Verschwendung von Energieressourcen. Im Falle von Google verbraucht die künstliche Intelligenz 10 bis 15 Prozent des gesamten Stromverbrauchs des Unternehmens. Das entspreche für 2021 einem Verbrauch von circa 2,3 Terawattstunden, dem jährlichen Stromverbrauch aller Haushalte einer Stadt von der Größe Atlantas. Ein KI-Bild verbraucht die Energie einer Handyladung und seit letztem Jahr wurden mehr als 15 Milliarden Bilder mit Hilfe von Text-zu-Bild-Algorithmen erstellt. Seit dem Start von DALLE-2 erstellen Menschen durchschnittlich 34 Millionen Bilder pro Tag. Alleine diese Zahlen sollten zum Nachdenken anregen. Man muss nicht immer gleich die KI anwerfen, um etwas zu visualisieren. Papier und Stift in Kombination mit unserer Phantasie und unseren Emotionen erschaffen oft unerwartet spannende und inspirierende Ergebnisse.
In diesem Sinne plane ich meinen nächsten Kunstmuseumsbesuch, um mir das eine oder andere großformatige Original auf Leinwand anzusehen, begleitet durch die emotionale Musik von Nick Cave.