26. Oktober 2022 von Timo Haßlinger
Künstliche Kreativität - Kann eine KI kreativ sein?
Bei der Lösung vor allem rationaler Aufgaben bewährt sich KI immer häufiger. Doch wie sieht es mit kreativen Aufgaben aus, die sich nur schwer quantifizieren lassen? Mit dieser Frage, dem Stand der Technik und dem Potenzial von KI im kreativen Bereich beschäftige ich mich in diesem Blog-Beitrag.
Künstliche Intelligenz hat in den letzten Jahren einen anhaltenden Aufschwung erlebt. Immer mehr neue KI-Technologien werden entwickelt und eingesetzt. Dennoch bewegt sie sich nach wie vor primär im Umfeld sehr rationaler und aufgaben- beziehungsweise domänenspezifischer Anwendungsfälle. Es wird oft gesagt, dass das, was uns Menschen einzigartig macht, unsere Fähigkeit ist, große Schöpfungen in Kunst und Wissenschaft zu schaffen: kurz gesagt, unsere Kreativität. Kreativität ist eine Eigenschaft, die es erfordert, bestehende Grenzen zu überschreiten, um etwas Neues zu schaffen, das als kreativ bezeichnet werden kann. Es stellt sich nun die Frage, ob dies eine Eigenschaft ist, die sich auch eine KI aneignen kann, oder ob Kreativität eine Grenze einer KI darstellt, die uns Menschen vorbehalten ist. Wenn eine KI kreativ sein kann, stellt sich die Frage, welche Auswirkungen dies auf die Menschen hat, die im kreativen Bereich tätig sind, und wie dort eine Interaktion zwischen Mensch und KI aussehen könnte.
Was genau kann als kreativ bezeichnet werden?
Obwohl der Begriff der Kreativität im täglichen Leben verwendet wird, ist eine genaue Definition des Begriffs nicht trivial. Der Begriff hat viele Facetten und bietet Interpretationsspielraum. Das Cambridge Wörterbuch definiert Kreativität als“die Fähigkeit, originelle und ungewöhnliche Ideen zu produzieren oder etwas Neues oder Einfallsreiches zu schaffen”.
Kreative Aufgaben erfordern im Allgemeinen ein gewisses Maß an originellem Denken, umfassender Erfahrung und Verständnis für das Umfeld. Eine bekannte Definition stammt aus einer umfassenden Literaturstudie von Sarkar und Chakrabarti (2008), in der sie mehr als 200 dieser Definitionen analysierten und schließlich Kreativität wie folgt zusammenfassten:
“Creativity occurs through a process through which an agent uses its ability to generate ideas, solutions or products that are new and valuable”.
Die allgemeine Vorstellung ist, dass Kreativität die Fähigkeit einiger menschlicher Individuen ist, etwas zu schaffen, was vorher nicht existierte. Bei näherer Betrachtung zeigt sich jedoch, dass diese Schöpfungen in den meisten Fällen aus Konzepten hervorgehen, die bereits existierten oder hätten existieren können, die aber noch niemand explizit zu einem festen Produkt verbunden hat. Aus dieser Idee, bestehende Konzepte neu zu kombinieren, entstand Kunst wie Dalís “The Persistence of Memory”. Uhren wurden schon vorher gemalt, und jeder kannte das Konzept des Schmelzens, aber niemand hat diese Konzepte vorher so miteinander verbunden, wie Dali es getan hat. In der Geschichte gab es viele verschiedene Faktoren, die als Indikatoren für Kreativität verwendet wurden. Sarkar und Chakrabarti (2008) haben diese in zwei Hauptkategorien zusammengefasst: Neuheit (Ungewöhnlichkeit, Unerwartetheit, Überraschung) und Wert (Nützlichkeit, Qualität, Bedeutung). Novelty wird gewöhnlich als die definierende Eigenschaft eines kreativen Artefakts genannt, aber value ist ebenso notwendig und wichtig. Es ist leicht, an etwas zu denken, das noch nie zuvor entworfen wurde, wie ein Auto mit fünfzehn Rädern. Während ein solches Auto neuartig wäre, also einen hohen Neuheitsgrad hätte, fehlt diesem kreativen Artefakt der Wert.
Wie weit ist die Technik?
Das wohl bekannteste Beispiel für kreative KI ist das Gemälde „Edmond de Belamy“, das 2018 für 432.500 Dollar versteigert wurde. Es war das erste von einer KI gezeichnete Gemälde, das in einem Auktionshaus versteigert wurde. Die KI wurde mit Porträts aus dem 14. bis 20. Jahrhundert trainiert, um selbst eine Serie von elf Porträts der fiktiven Familie Belamy zu erstellen.
Samsung AI hat gezeigt, dass es möglich ist, ein Porträt in Form eines Gemäldes, wie z. B. die Mona Lisa, in ein Video umzuwandeln, so dass das Gesicht des Porträtierten im gewünschten Stil sprechen kann. Sogenannte Deepfake-Technologien können realistisch aussehende Fake-Videos erzeugen, indem bestimmte Teile des Mediums durch synthetische Inhalte ersetzt werden. So ist es bereits gelungen, ein Video zu generieren, in dem eine Person wie Barack Obama irgendetwas sagen kann, ohne dass auf den ersten Blick erkennbar ist, dass es sich um eine Fälschung handelt. Das Video ist hier zu finden.
Eine andere Form von KI in der Kunst sind Algorithmen, die aus wenigen Eingabebildern neue Bilder generieren. In diesem Fall kann der Künstler eine Reihe von Bildern in den Algorithmus eingeben, der dann versucht, diese zu imitieren und zu kombinieren. Die Website artbreeder ist ein Beispiel für eine solche KI. Ein weiterer beeindruckender Fortschritt für kreative KI im Bereich der Bildgenerierung wurde von OpenAI mit der Veröffentlichung von DALL-E 2 im Januar 2022 erzielt. Diese KI generiert nach eigenen Angaben “realistische Bilder und Kunst aus einer Beschreibung in natürlicher Sprache”. Man kann in einfacher menschlicher Sprache beschreiben, was man generieren möchte, z.B. “An astronaut riding a horse as a pencil drawing”, und die KI wird ein genaues Bild der beschriebenen Idee in dem definierten Stil zeichnen
Es können völlig neue Bilder generiert werden, die es bisher nicht gab. Es gibt bereits Ansätze, dies in Designprozesse zu integrieren. So können beispielsweise beim Design eines neuen Schuhs bestimmte Kombinationsideen einfach in natürlicher Sprache ausgedrückt werden, anstatt sie mühsam selbst skizzieren zu müssen. Die folgende Abbildung zeigt, wie eine Designbeschreibung in natürlicher Sprache aussehen könnte. Man bekommt sofort mehrere mögliche Designs des beschriebenen Stils angezeigt und kann seine Idee sofort bewerten, modifizieren oder weiterentwickeln. Dies kann langwierige Schritte beschleunigen, die sonst den kreativen Prozess eher verzögern.
Eine weitere KI, die beeindruckende kreative Artefakte erzeugt, ist auf der Website this-person-does-not-exist zu sehen. Dort werden realistische Fotos von Personen erstellt, die es gar nicht gibt.
Google hat mit einer KI namens DeepDream Kunst geschaffen, die ganz neue konzeptuelle Räume eröffnen soll. Sie erzeugt Traumkunst, die einen ganz eigenen und neuen Stil hat, der so von Menschen nicht erzeugt werden kann und bisher auch nicht erzeugt wurde. Alexander Reben, der für die Kunst von DeepDream verantwortlich ist, beschreibt die Ergebnisse als einen kurzen Einblick in die Verschmelzung von Mensch und Technik, einen “cyber-delischen Drogentrip”.
Neben der Bildgenerierung hat die KI auch in anderen kreativen Bereichen Fortschritte gemacht. Beispielsweise wurde KI bereits zum Schreiben von Geschichten eingesetzt. So wurde das gesamte Drehbuch eines Kurzfilms namens Sunspring von einer KI geschrieben. Im Jahr 2016 komponierte IBM Watson einen sechsminütigen Trailer für einen Horrorfilm namens Morgan. Die Ergebnisse dieser Skripte können jedoch immer noch verwirrend sein. Eine Firma namens Botnik hat eine KI entwickelt, die Texte aus bestehenden Büchern analysieren und neue Kapitel schreiben kann. Das Botnik-Team fütterte den Algorithmus mit allen Harry-Potter-Büchern, und die KI generierte unter anderem abstruse Sätze wie den folgenden:
“Ron was standing there and doing a kind of frenzied tap dance. He saw Harry and immediately began to eat Hermione’s family”.
Im Bereich der musikalischen Kreativität wird häufig das Album “Hello World” genannt. Dabei handelt es sich um ein ganzes Album, das von einer einzigen KI komponiert wurde. Zuvor, im Jahr 2016, hatte dasselbe Team bereits ein Lied im Stil der Beatles veröffentlicht. AIVA erlernte die Kunst der Musik, indem sie einen großen Datensatz mit Musik von den größten Komponisten der Welt wie Mozart, Beethoven oder Bach abspielte und so in der Lage war, ihre eigenen Stücke zu komponieren, die zum Teil ein ähnliches Niveau erreichten. Es wurde auch ein Album mit AIVAs Musik veröffentlicht, deren Stücke bereits in Filmen und von Werbeagenturen verwendet werden.
Im Journalismus hat KI bereits Einzug gehalten. Das Forbes-Magazin verwendet ein KI-gestütztes Content-Management-System namens Bertie, das Reportern erste Entwürfe und Vorlagen für Nachrichten liefert.
Auch im Produktdesign wird KI bereits als Teil des kreativen Generierungsprozesses eingesetzt. Es gibt Möbel, Fahrräder und sogar Drohnen, die von einer KI entworfen wurden. Airbus hat eine Trennwand für Flugzeugkabinen mittels generativer KI entworfen und damit die Effizienz erheblich gesteigert.
Die genannten Innovationen sind nur ein kleiner Ausschnitt der tatsächlichen Fortschritte, die in den letzten Jahren im Bereich der künstlichen Kreativität erzielt wurden. Der Trend zu verbesserten Innovationen ist steigend.
Kann das tatsächlich auch kreativ genannt werden?
Wenn man kreative KI als ein Medium betrachtet, werden die Artefakte, die von diesem Medium produziert werden, Teil der menschlichen Kultur, indem sie der Gesellschaft zur Wertschätzung präsentiert werden. Daher ist der Prozess der Herstellung eines solchen KI-Systems, das künstlerische Artefakte erzeugt, selbst eine soziokulturell kreative und wertvolle Tätigkeit.
Um beurteilen zu können, ob auch das von einem KI-System erzeugte Medium als solches kreativ sein kann, muss das Potenzial und die tatsächliche Kreativität bereits erzeugter künstlich-kreativer Artefakte bewertet werden. Die Frage der Bewertung von Kreativität ist eine der umstrittensten und komplexesten Herausforderungen in diesem Bereich. Es ist schwierig, Kreativität quantitativ zu messen. Um die wichtigsten wissenschaftlichen Erkenntnisse kurz zusammenzufassen, kann man sagen, dass kreative KI-Systeme viele kreative Eigenschaften besitzen. Sie können neuartige kreative Artefakte erzeugen, die sowohl neuartig als auch wertvoll sind und daher als kreativ bezeichnet werden können. Wo sie sich aber noch schwer tun, ist beispielsweise bei der so genannten transformativen Kreativität, also bei völlig neuen Ideen, die den bisherigen konzeptionellen Raum völlig verlassen. Googles DeepDream wird als eine der wenigen KIs genannt, die transformative Kreativität zumindest teilweise bereits beherrschen. Ob diese Kunst auch das Kriterium des Wertes erfüllt, bleibt jedoch umstritten und bedarf in jedem Fall noch der menschlichen Beurteilung. Die von KI erzeugten Variationen bewegen sich überwiegend noch in einem begrenzten Rahmen. Dieser Rahmen wird durch die Wahl des Modells und des Datensatzes bestimmt und unterliegt einer inhärenten Beschränkung. Auch beherrscht KI noch nicht alle kreativen Eigenschaften, die wir Menschen in kreativen Prozessen nutzen, beispielsweise das Konzept der Abstraktion.
Was sind die Grenzen künstlicher Kreativität?
Kreative künstliche Intelligenzen kommen der menschlichen Kreativität teilweise sehr nahe. Was sie jedoch grundlegend vom Menschen unterscheidet, sind physische Aspekte. Menschen lernen nicht nur geistige, sondern auch körperliche Fähigkeiten, die sie für ihre Kreativität nutzen. Eine KI, die Kunst schafft, hat noch nie den Druck eines Pinsels auf Papier gespürt und kann die Dynamik nicht so erfassen, wie es das menschliche kognitive System kann. Dies sind Erfahrungen, die die KI zu diesem Zeitpunkt nicht in den kreativen Prozess einbringen kann.
Darüber hinaus ist zu beachten, dass KI zwar wertvolle Kunstwerke erzeugen kann, aber auch solche, die entweder nicht neuartig sind oder vom Menschen als sinnlos empfunden werden. Die Sinnhaftigkeit generierter künstlerischer Artefakte ist auch bei von Menschen geschaffenen Kunstwerken oft ein umstrittenes Thema. Somit steht die KI ebenso wie der Mensch vor der Herausforderung, die Balance zwischen Neuheit und Wert zu finden. Für KI stellt dies derzeit ein noch größeres Problem dar als für menschliche Künstler.
Graham Wallas unterteilte 1926 den kreativen Prozess in folgende Phasen: preparation (Informationsbeschaffung), definition (Problemdefinition), incubation (Nachdenken über Ideen), illumination (Präsentation einer Lösung) und verification (Testen der Qualität einer Lösung). Die Fähigkeiten der KI beschränken sich derzeit auf die Prozessschritte preparation und incubation. Die anderen Schritte erfordern zumindest teilweise noch menschliches Eingreifen.
Gegenwärtig basieren die leistungsfähigsten KI-Systeme noch auf überwachtem Lernen, bei dem bereits Daten vorliegen, die von Menschen als wahrheitsgerecht etikettiert wurden. Der Lernprozess besteht darin, einen durchschnittlichen Fehler oder Verlust über die bekannten Beispiele zu berechnen und Anpassungen vorzunehmen, um diesen Verlust zu minimieren. Ungewöhnlichen Beispielen (Ausreißern) wird dabei häufig ein geringer Einfluss zugeschrieben, um eine Verzerrung des Gesamtfehlers zu vermeiden. Das Ziel, im kreativen Prozess Neuartigkeit zu erzeugen, wird jedoch konterkariert, wenn solchen ungewöhnlichen Datenpunkten ein geringes Gewicht beigemessen wird. Auch hier zeigt sich die Herausforderung einer KI, eine Balance zwischen Neuartigkeit und Wert zu finden. Darüber hinaus gibt es in echten kreativen Prozessen in der Regel keine vordefinierten Ergebnisse, die so einfach klassifiziert werden können. Obwohl viele Werke aktuellen Trends folgen und auf den Vorlieben des Publikums basieren, gibt es keine völlig autonome, quantitative Möglichkeit, die Qualität eines kreativen Artefakts zu messen. Auch hier ist also menschliches Eingreifen erforderlich.
Eine weitere, auf den ersten Blick offensichtliche Beobachtung künstlicher Kreativität ist, dass sie kreative Artefakte eher aus einer rationalen als aus einer kreativen Absicht heraus hervorbringt. Es gibt Stimmen, die behaupten, dass alle Kunstwerke Ausdruck menschlicher Erfahrungen sind und nur für menschliche Zwecke geschaffen werden. Dies macht deutlich, warum es für eine KI so schwierig ist, Kunst auf menschlicher Ebene zu schaffen.
Wie könnten kreative Prozess zukünftig aussehen?
Viele der angesprochenen Grenzen einer kreativen KI lassen sich auf die Frage zurückführen, wie eine Maschine Kreativität selbstständig messen bzw. bewerten kann. Es wurde festgestellt, dass an vielen Stellen menschliches Eingreifen erforderlich ist. Da KI-Systeme von menschlichen Programmierern initialisiert werden und mit von Menschen programmierten Algorithmen arbeiten, sind KI-Systeme immer zumindest zu einem kleinen Teil vom Menschen abhängig. Es wäre falsch, Maschine und Mensch als unverbundene Konzepte zu betrachten, und die Frage, ob Maschinen Kunst schaffen können, kann an sich als irreführend betrachtet werden. Vielmehr sollte die Frage gestellt werden, welche Rolle KI im kreativen Prozess spielt. Einerseits scheint eine ganze Reihe von Forschungsarbeiten dem Einsatz von KI als autonome Generatoren gewidmet zu sein, die versuchen, mit wenig Benutzereingabe ganze Kunstwerke zu generieren. Andererseits werden KI-Systeme auch als kreative Werkzeuge betrachtet, die es uns ermöglichen, unsere eigene Kreativität zu steigern. In dieser Hinsicht wird KI mit einer Art verbessertem Pinsel für einen Maler verglichen. Anstatt sich jedoch entweder auf die zurückhaltende Sichtweise von KI als bloßes Werkzeug oder aber auf die Sichtweise als eigenständiger Generator zu konzentrieren, sollte vielmehr wahrgenommen werden, dass die wahre Stärke kreativer KI-Systeme aus der Partnerschaft mit dem Menschen erwächst.
Kunst ist oft ein Ausdruck der individuellen Psyche, Emotion oder Erfahrung. Eine KI kann nicht über die gleiche Lebenserfahrung oder die gleichen Emotionen verfügen wie ein Mensch. In Verbindung mit dem Menschen kann die KI jedoch jene des Künstlers wirkungsvoll zum Ausdruck bringen. Sie hat das Potenzial, weit mehr als nur ein Werkzeug zu sein und könnte den Kreativsektor revolutionieren. KI ist ein hochentwickeltes Werkzeug, das erfolgreich eingesetzt werden kann, um den Künstler von zeitraubenden Aufgaben zu entlasten. Als Beispiel wurde bereits DALL-E 2 genannt, wo Designer weniger Zeit für das Skizzieren ihrer Ideen aufwenden müssen und mehr Zeit für die Entwicklung ihrer Ideen haben. Auch in den Arbeitsabläufen der Postproduktion wird KI zunehmend eingesetzt werden, unter anderem in Form verbesserter Werkzeuge für Rauschunterdrückung, Kolorierung, Segmentierung, Rendering und Tracking.
Eine Umfrage von Adobe (2018) zeigt, dass sich drei Viertel der befragten Künstler vorstellen können, KI als unterstützendes Werkzeug einzusetzen. Der kreative Prozess im Zusammenhang mit KI kann selbst als eine neue Kunstform betrachtet werden. Betrachtet man den Prozess und nicht nur die daraus resultierenden Bilder, fällt diese Form in die Kategorie der Konzeptkunst, da der Künstler die Möglichkeit hat, ähnlich wie beim Design mit DALL-E 2, in der Rolle des Kurators und Optimierers zu agieren. In Zukunft wird es immer mehr konzeptionelle Arbeiten geben, da immer mehr Künstler KI-Tools adaptieren und lernen, wie sie den kreativen Prozess der KI-Kunst beeinflussen können.
Fazit
Zusammenfassend kann festgestellt werden, dass KI grundsätzlich kreativ sein kann. KI-Kunst selbst kann als eine neue Kunstform betrachtet werden. Auch wenn eine KI selbst als Künstler betrachtet wird, kann behauptet werden, dass sie kreative Eigenschaften besitzt. Es gibt jedoch auch menschliche kreative Eigenschaften, die KI nicht beherrscht. Die Forschung hat gezeigt, dass es im Bereich der künstlichen Kreativität nie das Ziel war, den Menschen durch KI zu ersetzen. Es hat sich immer wieder gezeigt, dass der größte Nutzen dann erzielt werden kann, wenn solche kreativen KI-Systeme eine Partnerschaft mit dem Menschen eingehen und eine Co-Kreativität bilden.