Bewegen Sie sich, Hollywood: Das neue KI-Modell von OpenAI, Sora, erstellt aus Eingabeaufforderungen minutenlange Videos

Künstliche Intelligenz ist heutzutage in aller Munde. Die großen Technologiegiganten liefern sich einen Wettlauf um die Spitzenreiter der KI-Revolution. Google hat gerade sein neuestes und bestes KI-Modell, das Gemini Ultra 1.0, eingestellt und ein neues Google One AI Premium auf den Markt gebracht. Jetzt ist sein Hauptkonkurrent, das von Microsoft unterstützte OpenAI, bereit, zurückzuschlagen. OpenAI führt ein neues Videogenerierungsmodell namens Sora ein. Nach Angaben des Unternehmens Blogeintrag (über Reuters), Sora“kann aus Textanweisungen realistische und fantasievolle Szenen erstellen.“ Mit diesem neuen Text-zu-Video-Modell können Benutzer fotorealistische Videos mit einer Länge von bis zu einer Minute erstellen, die alle auf schriftlichen Eingabeaufforderungen basieren.

Laut OpenAI ist Sora in der Lage:

Das Modell kann sogar ein Video aus einem einzelnen Standbild erstellen und fehlende Frames in einem vorhandenen Video ergänzen oder dessen Dauer verlängern. OpenAI erkennt an, dass das Modell „Möglicherweise fällt es Ihnen schwer, die Physik einer komplexen Szene genau zu simulieren„, aber die präsentierten Ergebnisse sind ziemlich beeindruckend. Sie können sich die geteilten Videos ansehen, um sich selbst davon zu überzeugen.

Die Software ist jetzt für Red Teaming zugänglich und hilft bei der Lokalisierung von Schwachstellen im KI-System. Darüber hinaus steht es bildenden Künstlern, Designern und Filmemachern offen, die Feedback zum Modell geben möchten.

Anfang dieses Monats gab OpenAI Pläne bekannt, Wasserzeichen zu seinem Text-zu-Bild-Tool DALL-E 3 hinzuzufügen. Es wurde jedoch erwähnt, dass diese Wasserzeichen leicht entfernt werden können. Ähnlich wie seine anderen KI-Produkte muss sich OpenAI mit den möglichen Auswirkungen auseinandersetzen, wenn gefälschte, von KI generierte fotorealistische Videos mit echten Inhalten verwechselt werden.

Das Unternehmen behauptet, dass es Tools zur Identifizierung irreführender Inhalte entwickelt, darunter einen Erkennungsklassifikator, der von Sora generierte Videos erkennen kann.

Vor nicht allzu langer Zeit hat der Social-Media-Riese Meta sein Bildgenerierungsmodell Emu um zwei KI-basierte Funktionen erweitert. Mit diesen Funktionen können Sie auch Videos anhand von Textaufforderungen bearbeiten und erstellen. Es sieht so aus, als ob die Zukunft KI-generierter Reels und Kurzvideos näher rückt als erwartet.


source site-33