Google hat gerade ein KI-Modell entwickelt, das Musik aus Texteingabeaufforderungen erstellt – aber das Unternehmen wird es in absehbarer Zeit nicht veröffentlichen

  • Google kündigte an, einen KI-Bot entwickelt zu haben, der Musik basierend auf Textbeschreibungen generiert.
  • Die Technologie wird aufgrund bestehender technischer Probleme und Risiken nicht für die Öffentlichkeit freigegeben.
  • Der Technologieriese verstärkt seine KI-Bemühungen, nachdem er nach der Explosion von ChatGPT einen „Code Red“ herausgegeben hat.

Im Rennen um künstliche Intelligenz kündigte Google an, einen Bot entwickelt zu haben, der Musik auf der Grundlage von Texteingabeaufforderungen erstellt – aber erwarten Sie nicht, ihn in absehbarer Zeit verwenden zu können.

In einem Forschungsarbeit am Donnerstag veröffentlichtbeschrieben Google-Forscher MusicLM als „ein Modell, das High-Fidelity-Musik aus Textbeschreibungen wie ‚einer beruhigenden Geigenmelodie, unterstützt von einem verzerrten Gitarrenriff‘, generiert.“

„Wir zeigen, dass MusicLM sowohl auf Text als auch auf eine Melodie konditioniert werden kann, indem es gepfiffene und gesummte Melodien gemäß dem in einer Textunterschrift beschriebenen Stil umwandeln kann“, heißt es in dem Papier.

Nutzer können laut Studie Beschreibungen wie „bezaubernder Jazzsong mit einprägsamem Saxophonsolo und Solosänger“ oder „Berliner 90er-Techno mit tiefem Bass und starkem Kick“ eingeben und erhalten entsprechende Ergebnisse. Ähnliche Beispiele, geteilt auf Googles Github-Seitedas entsprechende Audio zu solchen Eingabeaufforderungen anzeigen.

Das Debüt von MusicLM erfolgt während des kometenhaften Aufstiegs von OpenAIs lebhaftem Chatbot ChatGPT, der Google dazu veranlasste, einen „Code Red“ herauszugeben – was Die New York Times beschrieb im Dezember als “ähnlich wie das Auslösen des Feueralarms” für den Technologieriesen.

Um wettbewerbsfähig zu bleiben, beschleunigt das Unternehmen die Veröffentlichung von 20 neuen Produkten sowie einer Version der Google-Suche mit KI-Chatbot-Funktionen. pro die Zeiten.

Dennoch sagte Google, es beabsichtige nicht, MusicLM der Öffentlichkeit zugänglich zu machen, und verwies auf eine Vielzahl von Risiken, darunter Programmierfehler, die zu mangelnder Repräsentation und kultureller Aneignung, technologischen Störungen und insbesondere „der potenziellen Veruntreuung kreativer Inhalte“ führen könnten.

Laut der Studie wurden in etwa 1 % der Beispiele identifizierbare vorhandene Songs gefunden, was auf eine potenzielle Urheberrechtsverletzung hindeutet.

„Wir betonen nachdrücklich die Notwendigkeit weiterer zukünftiger Arbeiten zur Bewältigung dieser Risiken im Zusammenhang mit der Musikerzeugung – wir haben derzeit keine Pläne, Modelle herauszubringen“, heißt es in der Studie.

Die Studie weist auch auf die bestehenden Einschränkungen der Technologie hin, einschließlich der Verwendung von Negationen und der zeitlichen Reihenfolge, die in Textansagen verwendet werden, sowie der Stimmqualität. Mit Blick auf die Zukunft sagten die Forscher, sie beabsichtigen, an der „Modellierung einer Songstruktur auf hohem Niveau wie Einleitung, Strophe und Refrain“ zu arbeiten.

Lesen Sie den Originalartikel auf Business Insider

source site-19