Wenn KI Kunst machen kann – was bedeutet das für die Kreativität? | Künstliche Intelligenz (KI)

When der Konzeptkünstler und Illustrator RJ Palmer Als er zum ersten Mal den fein abgestimmten Fotorealismus der vom KI-Bildgenerator Dall-E 2 erzeugten Kompositionen miterlebte, war sein Gefühl unbehaglich. Das vom KI-Forschungsunternehmen OpenAI veröffentlichte Tool zeigte eine deutliche Verbesserung gegenüber dem Dall-E von 2021 und wurde schnell von Konkurrenten wie Stable Diffusion und Midjourney gefolgt. Geben Sie eine beliebige surreale Eingabeaufforderung von Kermit dem Frosch ein im Stil von Edvard Munchzu Gollum aus Der Herr der Ringe ein Stück Wassermelone schlemmen, und diese Werkzeuge werden einen Moment später eine erstaunlich genaue Darstellung liefern.

Das Internet schwelgte in den Möglichkeiten zum Erstellen von Memen, wobei ein Twitter-Account, der „seltsame Dall-E-Generationen“ dokumentiert, mehr als eine Million Anhänger anhäufte. Kosmopolitisch trompetete die Welt erstes KI-generiertes Magazin-Cover, und Technologieinvestoren überschlugen sich, um die neue Ära der „generativen KI“ einzuläuten. Die Möglichkeiten zur Bilderzeugung haben sich mit der Veröffentlichung von Googles Imagen Video und Metas Make-A-Video bereits auf Video ausgeweitet.

Aber die neuen künstlerischen Fähigkeiten von AI wurden von einigen Kreativen nicht so begeistert aufgenommen. „Mir geht es vor allem darum, was dies für die Zukunft nicht nur meiner Branche, sondern der Kreativwirtschaft im Allgemeinen bedeutet“, sagt Palmer.

Im Juni veröffentlichte Cosmopolitan das erste KI-generierte Magazin-Cover, eine Zusammenarbeit zwischen der Digitalkünstlerin Karen X Cheng und OpenAI.

Durch die Aufnahme großer Datensätze zur Analyse von Mustern und zur Erstellung von Vorhersagemodellen hat sich die KI bei einigen Aufgaben dem Menschen seit langem als überlegen erwiesen. Es ist dieser Zahlenkram, der eine KI dazu veranlasste, den Go-Weltmeister im Jahr 2016 zu schlagen, schnell die vorteilhafteste Spielstrategie zu berechnen und keine Angst davor zu haben, Züge auszuführen, die Spott ausgelöst hätten, wenn sie von einer Person gekommen wären. Aber bis vor kurzem galt das Produzieren von Originalprodukten, insbesondere kreativer Arbeit, als ausgesprochen menschliches Streben.

Jüngste Verbesserungen in der KI haben das Zifferblatt verschoben. KI-Bildgeneratoren können jetzt nicht nur geschriebene Sätze in neuartige Bilder umwandeln, sondern es wurden auch Fortschritte bei der KI-Spracherzeugung gemacht: Große Sprachmodelle wie GPT-3 haben eine Sprachkompetenz erreicht, die mindestens einen kürzlich entlassenen Google-Forscher überzeugt hat maschinelles Empfinden. Schließen Sie Bachs Oeuvre an, und eine KI kann Musik improvisieren in mehr oder weniger dem gleichen Stil – mit dem Vorbehalt, dass es für ein menschliches Orchester oft unmöglich wäre, tatsächlich zu spielen.

Diese Technologieklasse ist als generative KI bekannt und funktioniert durch einen Prozess, der als Diffusion bekannt ist. Im Wesentlichen werden riesige Datensätze zusammengekratzt, um die KI zu trainieren, und durch einen technischen Prozess ist die KI in der Lage, neue Inhalte zu entwickeln, die den Trainingsdaten ähneln, aber nicht identisch sind. Sobald es Millionen von Bildern von Hunden gesehen hat, die mit dem Wort „Hund“ gekennzeichnet sind, ist es in der Lage, Pixel in Form eines völlig neuartigen Welpen abzulegen, der dem Datensatz so ähnlich ist, dass wir kein Problem damit hätten, ihn als Hund zu bezeichnen. Es ist nicht perfekt – KI-Bildwerkzeuge haben immer noch Probleme damit, Hände zu rendern, die menschlich aussehen, Körperproportionen können abweichen, und sie haben die Angewohnheit, Unsinn zu schreiben.

Während Internetnutzer dieses aufgeladene kreative Potenzial angenommen haben – bewaffnet mit der korrekt verfeinerten Eingabeaufforderung können jetzt selbst Anfänger fesselnde digitale Leinwände erstellen – haben sich einige Künstler gegen die Fähigkeit der neuen Technologie zur Nachahmung gewehrt. Unter den Eingabeaufforderungen, die in die Bildgeneratoren Stable Diffusion und Midjourney eingegeben werden, markieren viele den Namen eines Künstlers, um einen ästhetisch ansprechenderen Stil für das resultierende Bild sicherzustellen. Etwas so Alltägliches wie eine Orangenschale kann zum Blickfang werden, wenn es im Stil von, sagen wir, Picasso gerendert wird. Da die KI mit Milliarden von Bildern trainiert wurde, von denen einige urheberrechtlich geschützte Werke lebender Künstler sind, kann sie im Allgemeinen eine ziemlich genaue Annäherung erstellen.

Eine Collage aus Bildern von Kermit dem Frosch als Gestalt auf der Brücke in Munchs Der Schrei
„Kermit der Frosch, gemalt von Munch“, erstellt von Floris Groesz mit Dall-E-Software. Foto: @SirJanosFroglez

Einige sind empört über das, was sie als Diebstahl ihres künstlerischen Markenzeichens betrachten. Greg Rutkowski, ein Konzeptkünstler und Illustrator, der für seine von goldenem Licht durchdrungenen epischen Fantasy-Szenen bekannt ist, wurde bereits in Hunderttausenden von Eingabeaufforderungen erwähnt, die in Midjourney und Stable Diffusion verwendet wurden. „Es ist nur ein Monat her. Was ist in einem Jahr? Ich werde meine Arbeit dort wahrscheinlich nicht finden können, weil [the internet] wird mit KI-Kunst überschwemmt“, sagte Rutkowski MIT Technology Review. „Das ist besorgniserregend.“

Dall-E 2 ist eine Black Box, wobei OpenAI sich weigert, den Code freizugeben oder die Daten zu teilen, auf denen die Tools trainiert wurden. Stable Diffusion hat sich jedoch dafür entschieden, seinen Code als Open Source zu veröffentlichen und Details der Datenbank mit Bildern zu teilen, die zum Trainieren seines Modells verwendet werden.

Spawning, ein Künstlerkollektiv, hat ein Tool namens entwickelt Bin ich ausgebildet worden? um Künstlern dabei zu helfen, herauszufinden, ob ihre Kunstwerke zu den 5,8 Milliarden Bildern gehörten, die zum Trainieren von Stable Diffusion verwendet wurden, und sich für oder gegen das Erscheinen in zukünftigen Trainingssets zu entscheiden. Das Unternehmen hinter Stable Diffusion, Stability AI, hat erklärt, dass es offen für die Arbeit mit dem Tool ist. Von den 1.800 Künstlern, die sich bereits angemeldet haben, um das Tool zu nutzen, sagt Matthew Dryhurst, ein Akademiker und Mitglied von Spawning, dass es eine 60/40-Aufteilung zugunsten der Abmeldung gibt.

Aber die Verein für Konzeptkunst (CAA) betont, dass der Schaden dieses Mal bereits angerichtet wurde, weil die Werkzeuge bereits ohne ihre Zustimmung auf die Arbeit der Künstler trainiert wurden. „Es ist, als ob jemand, der dich bereits ausgeraubt hat, sagt: ‚Möchtest du verhindern, dass ich dich ausraube?’“, sagt Karla Ortiz, Illustratorin und Vorstandsmitglied von CAA.

Emad Mostaque von Stability AI sagt, dass die Daten, die zum Trainieren von Stable Diffusion verwendet wurden, zwar keine Opt-out-Option boten, es aber „sehr ein Testmodell war, stark unoptimiert auf einer Momentaufnahme von Bildern im Internet“. Er sagt, dass neue Modelle normalerweise mit neuen Datensätzen trainiert werden und dass das Unternehmen dann die Wünsche der Künstler berücksichtigt.

Ein Mann in Halskrause und Wams sitzt an einem Desktop-Computer
Ein „Renaissance-Gemälde einer Person, die in einer Bürozelle sitzt und gestresst auf einer Tastatur tippt“, geschaffen von Dall-E.

Es sind nicht nur Kunstwerke: Die Analyse der Trainingsdatenbank für Stable Diffusion hat ergeben, dass sie auch privat verschlungen wurde medizinische FotografieFotos von Mitgliedern der Öffentlichkeit (manchmal neben ihren vollständigen Namen) und Pornografie.

Ortiz lehnt insbesondere die Kommerzialisierung eines Teils seines Betriebs durch Stability AI ab – DreamStudio, das Kunden benutzerdefinierte Modelle und eine verbesserte Benutzerfreundlichkeit bietet. „Diese Unternehmen haben jetzt einen Präzedenzfall dafür geschaffen, dass Sie die urheberrechtlich geschützten und privaten Daten aller verwenden, ohne dass sich jemand überhaupt dafür entscheidet“, sagt sie. „Dann sagen sie: ‚Wir können nichts dafür, der Geist ist aus der Flasche!’“

Was dagegen getan werden kann, abgesehen davon, dass man sich auf die Wohltätigkeit der Unternehmen hinter diesen Tools verlässt, ist noch fraglich.

Die CAA verweist auf die besorgniserregende britische Gesetzgebung, die KI-Unternehmen noch mehr Freiheit geben könnte, urheberrechtlich geschützte kreative Werke aufzusaugen, um Tools zu trainieren, die dann kommerziell eingesetzt werden können. In den USA hat sich die Organisation mit Regierungsbeamten getroffen, um über das Urheberrecht zu sprechen, und befindet sich derzeit in Gesprächen mit Washingtoner Lobbyisten, um zu erörtern, wie dies als Industrie zurückgedrängt werden kann.

Abgesehen von der Nachahmung gibt es ein noch größeres Problem, auf das Palmer hinweist: Gefährden diese Tools eine ganze Klasse von Kreativen? In einigen Fällen kann KI anstelle von Stock-Bildern verwendet werden – die Bildbibliothek Shutterstock hat kürzlich einen Vertrag mit OpenAI abgeschlossen, um Dall-E in ihr Produkt zu integrieren. Palmer argumentiert jedoch, dass Kunstwerke wie Illustrationen für Artikel, Bücher oder Albumcover bald der Konkurrenz durch KI ausgesetzt sein könnten, was einen blühenden Bereich der kommerziellen Kunst untergräbt.

Die Besitzer von KI-Bildgeneratoren neigen dazu zu argumentieren, dass diese Werkzeuge im Gegenteil die Kunst demokratisieren. „So viel auf der Welt ist kreativ verstopft“, der Gründer von Stability AI, Emad Mostaque, sagte bei einer kürzlichen Veranstaltung um eine 101-Millionen-Dollar-Spendenrunde zu feiern, „und wir werden es so machen, dass sie Regenbögen kacken können.“ Aber wenn jeder KI nutzen kann, um technisch meisterhafte Bilder zu erstellen, was sagt das über das Wesen der Kreativität aus?

Anna Riedler, eine Künstlerin, die für ihre Arbeit mit KI bekannt ist, sagt, dass sich Dall-E 2 bei der ersten Verwendung „wie Magie“ anfühlt, sie aber bei ihren Experimenten mit dem Tool bisher keinen Funken Inspiration gespürt hat. Sie arbeitet lieber mit einer anderen Art von KI, den sogenannten Generative Adversarial Networks (GANs). GANs fungieren als Austausch zwischen zwei Netzwerken, von denen eines neue Bilder erstellt und das andere entscheidet, wie gut das Bild ein bestimmtes Ziel erfüllt. Ein künstlerisches GAN könnte das Ziel haben, etwas zu schaffen, das sich so weit wie möglich von seinen Trainingsdaten unterscheidet, ohne die Kategorie dessen zu verlassen, was Menschen als visuelle Kunst bezeichnen würden.

Diese Fragen haben die Debatte darüber intensiviert, inwieweit wir der KI Kreativität zuschreiben können. Entsprechend Marcus du Sautoyein Mathematiker der Universität Oxford und Autor von Der Kreativitätscode: Wie KI schreiben, malen und denken lernt, Dall-E und andere Bildgeneratoren kommen der Replikation einer Art „kombinatorischer“ Kreativität wahrscheinlich am nächsten, da den Algorithmen beigebracht wird, neuartige Bilder im gleichen Stil wie Millionen anderer in den Trainingsdaten zu erstellen. GANs der Art, mit denen Ridler arbeitet, sind näher an „transformierender“ Kreativität, sagt er – sie schaffen etwas in einem völlig neuen Stil.

Ein weichgezeichnetes, verwaschenes Bild eines Corgi am Strand
Ein von Dall-E generiertes Bild von „einem Vintage-Foto eines Corgis am Strand“ – das zeigt, dass die Software auch realistisch aussehende Bilder erstellen kann.

Ridler lehnt einen solchen formelhaften Ansatz zur Definition von Kreativität ab. „Es flacht es ab, Kunst als interessante Tapete zu betrachten, anstatt etwas, das versucht, Ideen auszudrücken und nach der Wahrheit zu suchen“, sagt sie. Als Konzeptkünstlerin ist sie sich der Schwächen von KI bewusst. „KI kann mit Konzepten nicht umgehen: zusammenbrechende Momente in der Zeit, Erinnerungen, Gedanken, Emotionen – all das ist eine echte menschliche Fähigkeit, die eher ein Kunstwerk als etwas, das optisch hübsch aussieht, ausmacht.“

KI-Bildwerkzeuge weisen einige dieser Mängel auf. Während „Astronaut auf einem Pferd reitend“ ein genaues Rendering zurückgibt, liefert „Pferd auf einem Astronauten reitend“ Bilder, die ziemlich gleich aussehen – was darauf hindeutet, dass die KI nicht wirklich versteht die kausalen Beziehungen zwischen verschiedenen Akteuren in der Welt.

Dryhurst und Ridler behaupten, dass die Idee des „Künstleraustauschs“ von einer Unterschätzung des künstlerischen Prozesses herrührt. Dryhurst beklagt, was er als die Medien ansieht, die alarmistische Erzählungen aufpeitschen, und hebt eine aktuelle hervor New York Times Artikel über einen Künstler, der Midjourney nutzte, um die digitale Kategorie des jährlichen Kunstwettbewerbs der Colorado State Fair zu gewinnen. Dryhurst weist darauf hin, dass eine staatliche Messe nicht gerade ein prestigeträchtiges Forum ist. „Sie verteilten Preise für Obstkonserven“, sagt er. „Was mich ärgert, ist, dass es diesen Drang zu geben scheint, Künstler zu erschrecken.“

„Die Kunst ist tot, Alter.“ sagte der Landesausstellungssieger.

Möglicherweise überholt der Hype um diese Tools als disruptive Kräfte die Realität. Mostaque sagt, dass KI-Bildgeneratoren Teil dessen sind, was er „intelligente Medien“ nennt, was eine Chance von „einer Billion Dollar“ darstellt, unter Berufung auf Disneys Inhaltsbudget von mehr als 10 Milliarden US-Dollar (8,7 Milliarden Pfund) und den Wert der gesamten Spielebranche von mehr als 170 Mrd. $. „Jeder einzelne Inhalt von der BBC bis zu Disney wird durch diese Modelle interaktiv gemacht“, sagt er.

Neue Anwendungen sind derzeit eher prosaisch, darunter Moodboards für die Designberatung, Storyboards für Filme und Mock-ups für die Innenarchitektur, und Mark Beccue, Analyst in der KI-Abteilung von Omdia, ist skeptisch gegenüber der Zahl von 1 Billion US-Dollar. „Was sind hier die Killer-Use-Cases?“ er sagt. „Es ergibt keinen Sinn. Welches Problem lösen Sie damit?“ Ein Analyst des Beratungsunternehmens Accenture sagt, dass die Tools eines Tages verwendet werden könnten, um Inhalte zu erstellen, um maschinelle Lernalgorithmen zu trainieren, beispielsweise in selbstfahrenden Fahrzeugen, und die Erstellung von Spielen zu beschleunigen. Ob es so lukrativ wird, wie es KI-Bildgeneratoren und ihre Unterstützer vorschlagen, bleibt abzuwarten.

source site-27