Google bringt endlich Gemini auf den Markt, seine größte Chance auf OpenAI

Sundar Pichai, CEO von Google, auf der Bühne während einer Präsentation bei Google I/O in Mountain View, Kalifornien, am 10. Mai 2023.

  • Google hat Gemini vorgestellt, sein generatives KI-Modell.
  • Google hat dieses Jahr große interne Anstrengungen unternommen, um Gemini auf den Markt zu bringen.
  • Bard bekommt sofort Gemini, aber ein weiterentwickeltes Modell wird erst nächstes Jahr auf den Markt kommen.

Nachdem Google uns monatelang gehänselt hat, beginnt es mit der Einführung seines generativen künstlichen Intelligenzmodells Gemini.

Das neue Modell, das schrittweise eingeführt wird, ist Googles Chance, das Narrativ zu widerlegen, dass das Unternehmen hinter Konkurrenten wie OpenAI zurückgefallen sei.

Doch während Benutzer diesen Monat Zugriff auf Gemini haben, wird die fortschrittlichste Version des Modells erst Anfang nächsten Jahres verfügbar sein.

Gemini verfügt über drei „Größen“, die schrittweise verfügbar sein werden: Ultra, Pro und Nano – wobei die letzte für die lokale Ausführung auf Geräten wie Smartphones konzipiert ist.

Google gewährt Nutzern am Mittwoch über seinen Chatbot Bard Zugriff auf die Pro-Version und in den kommenden Tagen auch auf Cloud-Kunden. Das Ultra-Modell – das größte und technisch fortschrittlichste der drei Modelle – befindet sich jedoch noch in internen Tests und wird dies nicht tun Rollout bis Anfang 2024.

Google plant, seine beliebtesten Produkte im Laufe der Zeit mit Gemini auszustatten. Außerdem wird Gemini Ultra im nächsten Jahr mit einer neuen Version von Bard namens Bard Advanced eingeführt. Sissie Hsiao, Googles Vizepräsidentin und General Managerin von Bard and Assistant, würde nicht sagen, ob die Nutzung von Bard Advanced Geld kosten wird, bestritt aber nicht, dass dies eine Möglichkeit sei.

Derzeit steht Google unter enormem Druck, mit Gemini zu beweisen, dass es immer noch führend in der KI-Branche ist. Gemini wurde darauf trainiert, multimodal zu sein, was bedeutet, dass es verschiedene Arten von Medien wie Text, Bilder, Video und Audio verarbeiten kann. Aber Google rühmt sich, dass Gemini auch sein „flexibelstes“ Modell sei, das auf einer Reihe von Quellen laufen könne, von Rechenzentren bis hin zu Smartphones.

In einer Diskussionsrunde mit Reportern diese Woche sagten Google-Führungskräfte, dass das Ultra-Modell von Gemini das erste Modell sei, das menschliche Experten bei MMLU (Massive Multitask Language Understanding) übertrifft, einem Maß, das Themen wie Mathematik, Geschichte, Recht und Ethik testet. Das Modell erzielte eine Punktzahl von 90,0 % und übertraf damit die GPT-4 von OpenAI mit 86,4 %.

Das klingt alles großartig, aber wir werden noch nicht in der Lage sein, die vollen Fähigkeiten von Gemini zu testen (es gibt auch andere Benchmarks, anhand derer Gemini getestet werden kann). Google sagt, dass das Pro-Modell GPT-3.5 übertroffen hat, das die kostenlose Version von ChatGPT unterstützt, und Benutzer können ab Mittwoch eine fein abgestimmte Version für Bard testen (zu Beginn nur auf Englisch, sagt Google, und nicht in Großbritannien). .

Öffentlich hat Google Vorschläge zurückgewiesen, mit denen das Unternehmen versucht hatte, der Konkurrenz hinterherzujagen, aber innerhalb des Unternehmens sah es ganz anders aus, als das Unternehmen darum kämpfte, Gemini auf den Markt zu bringen und KI in alle seine Schlüsselprodukte einzubauen.

Anfang des Jahres fusionierte CEO Sundar Pichai Alphabets preisgekrönte DeepMind-Einheit mit seiner internen KI-Gruppe Brain, um die Arbeit an Gemini zu beschleunigen. Den Mitarbeitern wurde außerdem mitgeteilt, dass Google die Menge der veröffentlichten Forschungsergebnisse reduzieren werde, um die Kommerzialisierung ihrer Ideen durch Konkurrenten einzuschränken, berichtete BI.

Google geht davon aus, dass Gemini gegenüber der Konkurrenz einen Vorsprung hat, und zwar in dem, was es als „ausgeklügeltes Denken“ bezeichnet, d. h. in der Art und Weise, wie das Modell komplexe Informationen über verschiedene Arten von Medien hinweg verarbeitet.

In einer Demo, die der Presse gezeigt wurde, nutzten DeepMind-Forscher Gemini, um Hunderttausende Forschungsarbeiten zu durchsuchen, um bestimmte Arten von Daten zu extrahieren. Google sagte, Gemini sei in der Lage, zwischen für die Studie relevanten und nicht relevanten Artikeln zu unterscheiden. Noch interessanter ist, dass sie Gemini ein Diagramm mit alten Daten zeigen und eine aktualisierte Version mit den neuen Daten erstellen lassen konnten.

Während Gemini verschiedene Medientypen verarbeiten kann, sagte Eli Collins, Vizepräsident für Produkte bei DeepMind, dass die ersten Gemini-Modelle nicht in der Lage sein würden, Bilder und Videos zu generieren, deutete jedoch an, dass dies bei anderen Modellen der Fall sein würde.

Collins fügte hinzu, dass Google in Gemini einige „neuartige“ Funktionen gesehen habe, die ihm einen Vorteil gegenüber Konkurrenzmodellen verschaffen könnten, wollte aber nicht näher darauf eingehen, um welche es sich dabei handeln könnte.

Gemini wurde auf Tensor-Processing-Units (TPUs) trainiert und wird von diesen angetrieben. Google nutzt die Einführung von Gemini, um sein neues Cloud TPU v5p und einen neuen KI-Hypercomputer anzukündigen, der zur Verbesserung des KI-Trainings und der KI-Bereitstellung eingesetzt werden soll. Interessanterweise sagte Amin Vahdat, Vizepräsident bei Google Cloud AI, dass Gemini in Zukunft sowohl auf GPUs als auch auf TPUs laufen werde, ging jedoch nicht näher darauf ein.

Google sagt, dass es Gemini Pro am 13. Dezember für Unternehmenskunden über sein Vertex AI-Programm und für Entwickler in AI Studio verfügbar macht.

Was seine Verbraucherprodukte über Bard hinaus betrifft, plant Google, in den kommenden Monaten Gemini zu SGE, seiner generativen KI-gestützten Version der Suche, sowie Chrome, Duet AI und anderen Produkten hinzuzufügen.

Sind Sie ein aktueller oder ehemaliger Googler und haben Sie einen Tipp? Sie können Hugh über die verschlüsselten Messaging-Apps Signal/Telegram (+1 628-228-1836) oder per E-Mail an [email protected] erreichen.

Lesen Sie den Originalartikel auf Business Insider

source site-19