Warum Tesla Dojo, seinen Exaflop-Supercomputer und was es tun wird, entwickelt hat

Während Tesla‘s AI Day Event, das Unternehmen beschrieb die unglaublichen Anstrengungen, die es unternommen hat, um Dojo, seinen Supercomputer der Exaflop-Klasse, zu bauen, und was er in Bezug auf die Verarbeitungsleistung für Rohdaten leisten kann. Dies ist eine beeindruckende Leistung und wird Tesla sofort in der oberen Stratosphäre direkt neben und möglicherweise vor den leistungsstärksten Computern der Welt platzieren. Angesichts der Tatsache, dass Tesla ein Autohersteller und kein Computerhersteller ist, fragen sich einige vielleicht, warum dies getan wurde und was Dojo für seine Elektrofahrzeuge tun wird.

Aktuelle Supercomputer erreichen 500 Petaflops und kommende Systeme werden voraussichtlich 1 Exaflop erreichen, das dem Dojo von Tesla entspricht. Jedes Flop repräsentiert eine Gleitkommaoperation, zum Beispiel das Multiplizieren zweier Zahlen mit hoher Genauigkeit. Die in der Computertechnik bekannteren Präfixe sind “Mega”, “Giga” und “Tera”, die normalerweise der Endung “Byte” vorangehen und eine Million, eine Milliarde und eine Billion Datenbytes bedeuten. Ein Petaflop entspricht tausend Teraflops und ein Exaflop ist das größte, was einer Million Teraflops entspricht. Die Leistung dieser Computer ist überwältigend und über relative Begriffe hinaus kaum vorstellbar. Teslas Dojo könnte, wenn es fertig ist, der schnellste Computer der Welt für das Training künstlicher Intelligenz sein.

Verwandte: Teslas erster humanoider Roboter: Die Spezifikationen des Tesla-Bots

Tesla sagt, dass es seinen eigenen Supercomputer entwickelt hat, da die aktuellen Lösungen für die Verarbeitungsleistung und das Datenvolumen, die erforderlich sind, um seine Schulungsanforderungen für Full Self-Driving (FSD) zu erfüllen, nicht ausreichen. Viele werden mit “Dojo” als Name eines Kampfkunst-Trainingsstudios und des Dojo-Supercomputers, der während Teslas Liveübertragung wird Tesla seine Modelle der künstlichen Intelligenz (KI) trainieren, um verschiedene Objekte und Situationen zu verstehen, denen man auf der Straße begegnen könnte. Da die schwierigsten Situationen, auf die ein selbstfahrendes System vorbereitet werden kann, seltene und unvorhersehbare Ereignisse sind, ist es zu langsam, darauf zu warten, genügend reale Daten für das Training zu sammeln. Tesla fängt die wenigen existierenden Beispiele ein und verwendet sie in Simulationen, die der Realität sehr nahe kommen, und erstellt sogar realistische Renderings mit Raytracing, Schatten, Tag- oder Nachtbeleuchtung und dem Stroboskop von Rettungsfahrzeugen, sodass das FSD-Computermodell noch viel mehr durchlaufen kann Iterationen und lernen Situationen besser und schneller. Dies erfordert eine enorme Rechenleistung und ein riesiges Modell, das für die meisten Computersysteme zu anspruchsvoll ist. Tesla hat FSD trotz dieser Herausforderung auf ein brauchbares Niveau gebracht, aber es braucht Dojo, um es weiter voranzutreiben.

Der D1-Chip, der das Herzstück des Dojo-Supercomputers ist, wurde zunächst für maximale Bandbreite entwickelt und lag in Kommunikationskanälen vor den Gleitkomma-Multiplikatoren und anderen neuronalen Verarbeitungskomponenten, um sicherzustellen, dass sich die Informationen so schnell wie möglich bewegen konnten. Dieser Hochleistungschip wird im 7-Nanometer-Fertigungsprozess von TSMC hergestellt, was zu einer hohen Effizienz führt. Trotzdem ist dieser 362 Teraflop-Chip mit 50 Milliarden Transistoren mit einem 400-Watt-Thermodesign ausgestattet, was bedeutet, dass er ziemlich viel Strom verbraucht, was eine große Menge an Wärme erzeugt. Fünfundzwanzig dieser D1-Chips sind in einem Fünf-mal-Fünf-Raster angeordnet, um eine Trainingskachel mit 9 Petaflops Leistung zu erstellen, die 18.000 Ampere Strom zieht und 15 Kilowatt Wärme abgibt.

Das ist auch nicht das Ende der Geschichte. Tesla behauptet, dass jede Trainingskachel in sich geschlossen und modular ist, so dass mehrere Kacheln mit 120 kombiniert werden können, was die Exaflop-Fähigkeit von 1,1 ermöglicht. Dieser als ExaPOD bekannte Computerschrank kann virtuell in Dojo-Verarbeitungseinheiten (DPU) unterteilt werden, um Aufgaben jeder Größe auszuführen. Tesla behauptet die vierfache Leistung und etwa ein Viertel weniger Energie im Vergleich zu aktuellen Systemen. Mit dieser Menge an KI-Rechenleistung wird das FSD-System von Tesla in der Lage sein, sich schneller zu verbessern und ungewöhnliche Fahrszenarien eleganter zu bewältigen.

Weiter: Nein, Teslas neuer Bot wird die Roboter-Apokalypse nicht auslösen

Quelle: Tesla/YouTube