Künstliche Intelligenz ist heutzutage in aller Munde. Die großen Technologiegiganten liefern sich einen Wettlauf um die Spitzenreiter der KI-Revolution. Google hat gerade sein neuestes und bestes KI-Modell, das Gemini Ultra 1.0, eingestellt und ein neues Google One AI Premium auf den Markt gebracht. Jetzt ist sein Hauptkonkurrent, das von Microsoft unterstützte OpenAI, bereit, zurückzuschlagen. OpenAI führt ein neues Videogenerierungsmodell namens Sora ein. Nach Angaben des Unternehmens Blogeintrag (über Reuters), Sora“kann aus Textanweisungen realistische und fantasievolle Szenen erstellen.“ Mit diesem neuen Text-zu-Video-Modell können Benutzer fotorealistische Videos mit einer Länge von bis zu einer Minute erstellen, die alle auf schriftlichen Eingabeaufforderungen basieren.
Laut OpenAI ist Sora in der Lage:
Komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und präzisen Details zu Motiv und Hintergrund. Das Modell versteht nicht nur, wonach der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren.
Das Modell kann sogar ein Video aus einem einzelnen Standbild erstellen und fehlende Frames in einem vorhandenen Video ergänzen oder dessen Dauer verlängern. OpenAI erkennt an, dass das Modell „Möglicherweise fällt es Ihnen schwer, die Physik einer komplexen Szene genau zu simulieren„, aber die präsentierten Ergebnisse sind ziemlich beeindruckend. Sie können sich die geteilten Videos ansehen, um sich selbst davon zu überzeugen.
Aufforderung: „Ein Filmtrailer mit den Abenteuern des 30-jährigen Weltraummanns, der einen gestrickten Motorradhelm aus roter Wolle trägt, blauer Himmel, Salzwüste, filmischer Stil, aufgenommen auf 35-mm-Film, lebendige Farben.“ pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) 15. Februar 2024
Anfang dieses Monats gab OpenAI Pläne bekannt, Wasserzeichen zu seinem Text-zu-Bild-Tool DALL-E 3 hinzuzufügen. Es wurde jedoch erwähnt, dass diese Wasserzeichen leicht entfernt werden können. Ähnlich wie seine anderen KI-Produkte muss sich OpenAI mit den möglichen Auswirkungen auseinandersetzen, wenn gefälschte, von KI generierte fotorealistische Videos mit echten Inhalten verwechselt werden.
Das Unternehmen behauptet, dass es Tools zur Identifizierung irreführender Inhalte entwickelt, darunter einen Erkennungsklassifikator, der von Sora generierte Videos erkennen kann.
Vor nicht allzu langer Zeit hat der Social-Media-Riese Meta sein Bildgenerierungsmodell Emu um zwei KI-basierte Funktionen erweitert. Mit diesen Funktionen können Sie auch Videos anhand von Textaufforderungen bearbeiten und erstellen. Es sieht so aus, als ob die Zukunft KI-generierter Reels und Kurzvideos näher rückt als erwartet.