Hier finden Sie alles, was Sie über Gemini 1.5 wissen müssen, das neu aktualisierte KI-Modell von Google, das OpenAI herausfordern will

Sundar Pichai, CEO von Alphabet

  • Google entwickelt ein neues großes Sprachmodell namens Gemini 1.5.
  • Gemini 1.5 bietet Verbesserungen gegenüber seinem Vorgänger durch die Verarbeitung einer Vielzahl von Datentypen.
  • Das neue Modell nutzt aus Effizienzgründen ein „Expertenmischungsmodell“ und verfügt über ein größeres Kontextfenster.

Google hat gerade den Einsatz im KI-Krieg erhöht, was zu einem harten Wettbewerb zwischen großen Technologieunternehmen und Start-ups geführt hat.

Der Technologieriese, der der Muttergesellschaft Alphabet, Inc. gehört, gab bekannt, dass er an einem neuen großen Sprachmodell (LLM) mit dem Namen Gemini 1.5 arbeitet. Die erste Version dieser Technologie, Gemini 1.5 Pro, wird in Kürze für frühe Tests veröffentlicht. laut The Verge,

Die Neuigkeiten, die in a dargelegt wurden Unternehmensblogbeitrag Das letzte Woche von Sundar Pichai, CEO von Google und Alphabet, und Demis Hassabis, CEO von Google DeepMind, verfasste Buch kommt nur zwei Monate, nachdem Google das ursprüngliche Gemini vorgestellt hat, das eine Antwort auf OpenAIs GPT-4 und andere LLMs sein soll, die von Start-ups und großen Technologieunternehmen entwickelt werden Unternehmen gleichermaßen.

Zwillinge sind ein Multimodales KI-Modell der nächsten GenerationDas bedeutet, dass die Technologie mehr als einen Datentyp verarbeiten kann, einschließlich einer Kombination aus Bildern, Text, Audio, Video und Codierungssprachen. Die Technologie soll als Geschäftstool und persönlicher Assistent eingesetzt werden.

Gemini ist nicht Googles erster Ausflug in die KI: Vielmehr führte das Technologieunternehmen Anfang Februar eine „Bereinigung“ seiner verschiedenen KI-Tools durch und benannte sie alle in Gemini um.

In Gemini 1.5 liegen die Verbesserungen der neuen Technologie um ein Vielfaches über dem, was das ursprüngliche Gemini leisten kann. Hier ist, was wir bisher darüber wissen.

Es verwendet ein „Expertenmischungsmodell“.

Gemini 1.5 verspricht dank einer Spezialisierungstechnik namens „Expertenmischung“, auch bekannt als MoE, schneller und effizienter zu sein. Anstatt jedes Mal das gesamte Modell auszuführen, wenn eine Anfrage eingeht, kann das MoE von Gemini nur die relevanten Teile seiner Rechenleistung nutzen, um eine gute Antwort zu generieren.

Es gibt ein größeres Kontextfenster

Die Leistungsfähigkeit eines KI-Modells wird durch sein Kontextfenster bestimmt, das aus den Bausteinen besteht, die zur Verarbeitung von Informationen verwendet werden. Dazu können Wörter, Bilder, Videos, Audio oder Code gehören. In der KI-Welt werden diese Bausteine ​​als Token bezeichnet.

Der ursprüngliche Gemini konnte bis zu 32.000 Token verwalten. Die Kontextfensterkapazität von Gemini 1.5 Pro kann jedoch bis zu 1 Million Token verarbeiten. Das bedeutet, dass das neue LLM mehr Daten analysieren kann als die Vorgängerversion: 1 Stunde Video, 11 Stunden Audio, Codebasen mit über 30.000 Codezeilen oder über 700.000 Wörtern, heißt es in Googles Blogbeitrag.

Im Vergleich zu früheren Versionen weist es eine verbesserte Leistung auf

Beim Test des neuen KI-Modells im Vergleich zu seinen Vorgängern übertraf Gemini 1.5 Pro seinen Vorgänger in 87 % der von Google verwendeten Benchmark-Tests, so das Unternehmen.

Darüber hinaus war Gemini 1.5 in 99 % der Fälle in der Lage, während der Tests, die als „Nadel im Heuhaufen“ bezeichnet werden, ein kleines Textstück in Datenblöcken mit einer Länge von bis zu einer Million Token zu finden.

Gemini 1.5 wird auch besser darin, gute Antworten auf sehr lange Abfragen zu generieren, ohne dass ein Benutzer viel zusätzliche Zeit für die Feinabstimmung seiner Abfragen aufwenden muss. Laut Google gaben die Tester Gemini 1.5 ein Grammatikhandbuch für eine obskure Sprache und das LLM konnte Texte auf einem ähnlichen Niveau wie menschliches Lernen ins Englische übersetzen.

Es wurde einer erweiterten Sicherheitsprüfung unterzogen

Mit zunehmender KI wachsen auch die Bedenken hinsichtlich der Rolle der Technologie in Sicherheitsfragen, von der Bewaffnung bis zur Täuschung. Google sagt, dass es bei der Einführung von Gemini 1.5 umfangreichen Ethik- und Sicherheitstests unterzogen wurde, um grünes Licht für eine breitere Veröffentlichung zu geben. Das Technologieunternehmen hat Untersuchungen zu KI-Sicherheitsrisiken durchgeführt und Techniken zur Minderung potenzieller Schäden entwickelt.

Lesen Sie den Originalartikel auf Business Insider

source site-19