News
Google bringt Gemini AI auf den Markt - "seine bisher größte und leistungsfähigste KI".
Laut dem Tech-Giganten ist dies ein bedeutender Meilenstein in der Entwicklung von KI und der Beginn einer neuen Ära für Google, da das Unternehmen weiterhin schnell innovativ ist und die Fähigkeiten seiner Modelle verantwortungsvoll weiterentwickelt.
Gemini ist das Ergebnis umfangreicher gemeinsamer Bemühungen von Teams aus dem gesamten Google-Umfeld. Es wurde von Grund auf multimodal konzipiert, d. h. es kann verschiedene Arten von Informationen, einschließlich Text, Code, Audio, Bild und Video, verstehen und nahtlos miteinander kombinieren", so das Unternehmen.
Google sagt, dass Gemini auch das bisher flexibelste Modell ist, das von Rechenzentren bis hin zu mobilen Geräten effizient eingesetzt werden kann. Seine hochmodernen Funktionen werden die Art und Weise, wie Entwickler und Unternehmenskunden KI entwickeln und skalieren, erheblich verbessern.
Fähigkeiten der nächsten Generation
Bisher bestand der Standardansatz zur Erstellung multimodaler Modelle darin, separate Komponenten für verschiedene Modalitäten zu trainieren und sie dann zusammenzufügen, um einige dieser Funktionen grob zu imitieren, so Google. Diese Modelle können manchmal bestimmte Aufgaben, wie die Beschreibung von Bildern, gut bewältigen, haben aber Schwierigkeiten mit konzeptionellen und komplexen Schlussfolgerungen.
Der Tech-Gigant behauptet, dass Gemini anders ist, da es "nativ multimodal ist und von Anfang an auf verschiedene Modalitäten trainiert wurde" und dann mit zusätzlichen multimodalen Daten feinabgestimmt wurde, um seine Effektivität weiter zu verfeinern. Auf diese Weise kann Gemini alle Arten von Eingaben von Anfang an nahtlos verstehen und schlussfolgern, weit besser als bestehende multimodale Modelle - und seine Fähigkeiten sind in fast jedem Bereich auf dem neuesten Stand der Technik.
Leistung auf dem neuesten Stand der Technik
Google sagt, dass es seine Modelle rigoros getestet hat und dass die Leistung von Gemini Ultra bei 30 der 32 weit verbreiteten akademischen Benchmarks, die in der Forschung und Entwicklung von großen Sprachmodellen (LLM) verwendet werden, den aktuellen Stand der Technik übertrifft.
So ist Gemini Ultra mit einem Ergebnis von 90,0 % das erste Modell, das menschliche Experten bei MMLU (Massive Multitask Language Understanding) übertrifft. Bei diesem Test werden 57 Themen wie Mathematik, Physik, Geschichte, Recht, Medizin und Ethik kombiniert, um sowohl das Weltwissen als auch die Problemlösungsfähigkeiten zu testen.
Ausgefeilte Argumentation
Die hochentwickelten multimodalen Argumentationsfähigkeiten von Gemini 1.0 können laut Google helfen, komplexe schriftliche und visuelle Informationen zu verstehen. Dies soll es zu einer einzigartigen Fähigkeit machen, Wissen aufzudecken, das in riesigen Datenmengen nur schwer zu erkennen ist.
Verstehen von Text, Bildern, Audio und mehr
Gemini 1.0 wurde darauf trainiert, Text, Bilder, Audio und mehr gleichzeitig zu erkennen und zu verstehen, so dass es angeblich besser nuancierte Informationen verstehen und Fragen zu komplizierten Themen beantworten kann. Das macht ihn laut Google besonders geeignet, um Argumente in komplexen Fächern wie Mathe und Physik zu erklären.
Gemini Ultra kommt bald
Für Gemini Ultra führt Google derzeit umfangreiche Vertrauens- und Sicherheitsprüfungen durch, einschließlich Red-Teaming durch vertrauenswürdige externe Parteien, und verfeinert das Modell durch Feinabstimmung und Verstärkungslernen aus menschlichem Feedback (RLHF), bevor es auf breiter Basis verfügbar wird.
Im Rahmen dieses Prozesses wird Google Gemini Ultra ausgewählten Kunden, Entwicklern, Partnern und Sicherheits- und Verantwortungsexperten für erste Experimente und Feedback zur Verfügung stellen, bevor es Anfang nächsten Jahres an Entwickler und Unternehmenskunden ausgeliefert wird.
Anfang nächsten Jahres wird das Unternehmen auch Bard Advanced auf den Markt bringen, ein neues, innovatives KI-Erlebnis, das den Nutzern Zugang zu seinen besten Modellen und Fähigkeiten bietet, angefangen mit Gemini Ultra.
Sundar Pichai, Google und Alphabet CEO , kommentierte: "Jeder technologische Wandel ist eine Chance, wissenschaftliche Entdeckungen voranzutreiben, den menschlichen Fortschritt zu beschleunigen und das Leben zu verbessern. Ich glaube, dass der Wandel, den wir gerade mit der KI erleben, der tiefgreifendste in unserem Leben sein wird, weitaus größer als die Umstellung auf das Mobiltelefon oder auf das Internet davor. KI hat das Potenzial, den Menschen überall Möglichkeiten zu eröffnen - vom Alltäglichen bis zum Außergewöhnlichen. Sie wird neue Wellen der Innovation und des wirtschaftlichen Fortschritts auslösen und Wissen, Lernen, Kreativität und Produktivität in einem Ausmaß vorantreiben, wie wir es bisher noch nicht erlebt haben." Er betonte: "Das ist es, was mich aufregt: die Chance, KI für alle Menschen überall auf der Welt nützlich zu machen."
Demis Hassabis, CEO und Co-Founder von Google DeepMind, fügte im Namen des Gemini-Teams hinzu: "Wie für viele meiner Forscherkollegen steht auch für mich die KI im Mittelpunkt meines Lebenswerks. Seit ich als Teenager KI für Computerspiele programmiert habe und während meiner Jahre als Neurowissenschaftler, der versucht hat, die Funktionsweise des Gehirns zu verstehen, habe ich immer daran geglaubt, dass, wenn wir intelligentere Maschinen bauen könnten, wir sie nutzen könnten, um der Menschheit auf unglaubliche Weise zu helfen.
"Dieses Versprechen einer durch KI verantwortungsvoll gestärkten Welt treibt unsere Arbeit bei Google DeepMind weiter voran. Seit langem wollen wir eine neue Generation von KI-Modellen entwickeln, die sich an der Art und Weise orientiert, wie Menschen die Welt verstehen und mit ihr interagieren. KI, die sich weniger wie ein intelligentes Stück Software anfühlt, sondern eher wie etwas Nützliches und Intuitives - ein fachkundiger Helfer oder Assistent.
"Wir haben bisher große Fortschritte bei Gemini gemacht und arbeiten hart daran, seine Fähigkeiten für künftige Versionen weiter auszubauen, einschließlich Fortschritten bei der Planung und dem Speicher und der Vergrößerung des Kontextfensters, um noch mehr Informationen zu verarbeiten und bessere Antworten zu geben.
"Wir sind begeistert von den erstaunlichen Möglichkeiten einer Welt, die durch KI verantwortungsvoll gestärkt wird - eine Zukunft der Innovation, die die Kreativität steigern, das Wissen erweitern, die Wissenschaft voranbringen und die Art und Weise, wie Milliarden von Menschen auf der ganzen Welt leben und arbeiten, verändern wird."
Für weitere KI-Nachrichten, klicken Sie hier