Mit „Project Jarvis“ wird Chrome-Browser zum persönlichen Assistenten

Google entwickelt ein KI-System mit dem Namen „Project Jarvis“, das eigenständig im Chrome-Browser navigieren und Aufgaben erledigen kann. Die Präsentation ist für Dezember angesetzt.

„Project Jarvis“ von Google: Der KI-Assistent, der das Browsing unterstützt.

Foto: PantherMedia / elfachero3@gmail.com

Stellen wir uns vor, man möchte ein Buch kaufen: Man öffnet den Browser, gibt den Titel oder Autor ein, durchsucht die Suchergebnisse, klickt auf verschiedene Online-Shops, vergleicht Preise und Versandoptionen, und fügt das Buch schließlich dem Warenkorb hinzu. Klingt fast schon wie Routine, ist aber trotzdem zeitaufwändig. Oder das Buchen eines Fluges kann mühsam sein: Man muss ebenso den Browser öffnen, Suchbegriffe eingeben, ebenso durch die Ergebnisse scrollen, auswählen, vergleichen und schließlich buchen. Google möchte diesen Prozess vereinfachen und einige Aufgaben automatisieren.

Mit „Project Jarvis“ könnte Google den Chrome-Browser so erweitern, dass er eigenständig Aufgaben für die Nutzer erledigt. Das würde bedeuten, dass der Browser automatisch Aktionen ausführen kann, ohne dass der Nutzer jeden Schritt selbst machen muss. Jarvis kann blitzschnell Informationen zu verschiedenen Themen recherchieren, Flüge, Hotels und andere Dienstleistungen direkt buchen und auch das Finden und Kaufen von Produkten im Handumdrehen übernehmen.

Project Jarvis basiert auf Gemini 2

Project Jarvis basiert auf Googles neuem Sprachmodell Gemini 2, das ebenfalls im Dezember erscheinen soll, und wurde speziell für den Chrome-Browser entwickelt. Zunächst wird es nur einer kleinen Nutzergruppe zum Testen bereitgestellt, wobei der genaue Starttermin noch unsicher ist, wie The Information berichtet.

Das Ziel von Project Jarvis ist, wie bereits erwähnt – Routineaufgaben im Browser zu übernehmen – bevor der Nutzer selbst eingreift, etwa durch das Ausfüllen von Textfeldern oder das Klicken auf Buttons.

Lesen Sie auch:

Marktmacht unter Beschuss

Wird Google zerschlagen? Chrome-Browser könnte als erstes dran sein

Facebook und Instagram

Meta darf Nutzerdaten für KI nutzen – Gericht gibt grünes Licht

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs

Das Modell benötigt „Bedenkzeit“

Insider berichten von derzeitigen Einschränkungen: Der Agent arbeitet noch recht langsam, da das Modell vor jeder Aktion einige Sekunden „Bedenkzeit“ benötigt. Außerdem steht Google vor der Herausforderung, Nutzer dazu zu bringen, dem System sensible Daten wie Passwörter und Kreditkarteninformationen anzuvertrauen.

Erst vor kurzem kam die Nachricht, dass Google seinen KI-Assistenten Gemini Live nun auch auf Deutsch herausbringt. Die Software, die Gespräche mit Nutzern führen kann, soll auf Android-Smartphones in über 40 Sprachen verfügbar sein. Ursprünglich war sie im August auf Englisch gestartet. In den kommenden Wochen soll Gemini sich mit weiteren Google-Diensten wie Kalender und Erinnerungen verknüpfen lassen.

Diese Verknüpfungen sollen den Chatbot in alltäglichen Situationen hilfreicher machen. Die Vision ist, dass Gemini Aufgaben auf Sprachbefehl übernimmt: So könnte die KI beispielsweise ein per Gmail empfangenes Kochrezept finden und die Zutaten direkt auf eine Einkaufsliste setzen. Ebenso könnte man ein Konzertposter fotografieren, woraufhin Gemini überprüft, ob an diesem Tag laut Kalender noch Zeit verfügbar ist, und eine Erinnerung für den Ticketkauf anlegen lassen.

Ein Beitrag von:

Alexandra Ilina

Redakteurin beim VDI Verlag. Nach einem Journalistik-Studium an der TU-Dortmund und Volontariat ist sie seit mehreren Jahren als Social Media Managerin, Redakteurin und Buchautorin unterwegs. Sie schreibt über Karriere und Technik.