Google stellt neue KI-Tools für Kreative vor: Videogenerierung Veo, Imagen 3 und Music AI Sandbox

Google blickt mit all seinen KI-Ankündigungen während der Google I/O in die Zukunft. Doch die Verbesserungen bei Gemini sind nicht das einzig Interessante, was Google angekündigt hat. Zusätzlich, die Vorstellung des Unternehmens Veo und Imagen 3generative KI-Tools zur Verwirklichung Ihrer kreativen Vision.

Google stellt Veo vor, ein Modell der nächsten Generation zur Videogenerierung

Veo ist in der Lage, 1080p-Videos in einer Vielzahl filmischer und visueller Stile zu erstellen, und diese Videos können länger als eine Minute sein. Laut Google sollte das generierte Video Ihre kreative Vision genau widerspiegeln, indem es den Ton einer Aufforderung genau erfasst und Details in längeren Aufforderungen wiedergibt. Das Modell versteht Begriffe wie Zeitraffer oder Luftaufnahmen einer Landschaft. Das von der KI erstellte Video sollte kohärent und konsistent sein und die Motive sollten sich in den einzelnen Bildern realistisch bewegen.

Um das Modell weiter zu verfeinern, hat Google mit dem Filmemacher Donald Glover zusammengearbeitet und lädt eine Reihe von Filmemachern und Kreativen ein, mit Veo zu experimentieren.

Veo steht ausgewählten Erstellern in der privaten Vorschau in VideoFX zur Verfügung Aufnahme in die Warteliste. Google plant, die Funktionen von Veo in Zukunft auf YouTube Shorts zu übertragen.

Bild 3: Das Text-zu-Bild-Modell von Google erhält Aufschwung

Google hat daran gearbeitet, die Qualität seines Bilderzeugungsmodells zu verbessern. Imagen 3 erzeugt fotorealistische, lebensechte Bilder und weist im Vergleich zu früheren Modellen nicht so viele Artefakte auf.

Tatsächlich sind die von Imagen 3 generierten Bilder unglaublich. Hier sind einige der von Google geteilten Beispiele.

Für das erste Bild haben wir die folgende Eingabeaufforderung:

  • Eine Nahaufnahme eines schlanken Wolfes, der majestätisch vor grauem Hintergrund thront, in einem hochauflösenden Foto mit detaillierten, feinen Details, isoliert auf einem schlichten Stockfoto mit Farbkorrektur im Stil eines hyperrealistischen Stils.

Zweite Bildaufforderung:

  • Blick von oben auf die wunderschöne Flussschlucht mit Bäumen, die ihre atemberaubende Naturschönheit mit grünen Bergen und blauem Wasser zeigt. Das Foto fängt die Weite der Schöpfung der Natur im Stil ihrer Entstehung ein.

Dritte Bildaufforderung:

  • Drei Frauen stehen lachend nebeneinander, wobei eine Frau leicht unscharf im Vordergrund zu sehen ist. Die Sonne geht hinter den Frauen unter und erzeugt einen Blendenfleck und einen warmen Schimmer, der ihre Haare hervorhebt und im Hintergrund einen Bokeh-Effekt erzeugt. Der Fotostil ist offen und fängt einen echten Moment der Verbundenheit und des Glücks zwischen Freunden ein. Das warme Licht der goldenen Stunde verleiht dem Bild eine nostalgische und intime Atmosphäre.

Es kann sogar zeichnen. Es ist absolut erstaunlich, wie diese Zeichnung aussieht (sie sieht nicht aus, als wäre sie von KI erstellt worden), und sie wurde durch die folgende Eingabeaufforderung generiert:

  • Abstrakte Skizze: Eine Mischung aus ausdrucksstarken Linien und Energie fängt die dynamische Bewegung eines Tänzers in einer gestischen Kohlezeichnung ein. Skizze auf gealtertem Pergamentpapier.

Genau wie Veo steht Imagen 3 ausgewählten vertrauenswürdigen Testern zur Verfügung Aufnahme in die Warteliste.

Musiker kommen nicht zu kurz

Google arbeitet bei der Entwicklung generativer Musiktechnologien mit Musikern, Songwritern und Produzenten zusammen, darunter Lyria, das fortschrittlichste Modell von Google für die KI-Musikgenerierung.

Video-Miniaturansicht

Google arbeitet an einer Reihe von Musik-KI-Tools wie der Music AI Sandbox. Auf diese Weise können Benutzer Instrumentalabschnitte von Grund auf erstellen oder Klänge transformieren.

source site-33