KI im Alltag 28.10.2024, 12:00 Uhr

Mit „Project Jarvis“ wird Chrome-Browser zum persönlichen Assistenten

Google entwickelt ein KI-System mit dem Namen „Project Jarvis“, das eigenständig im Chrome-Browser navigieren und Aufgaben erledigen kann. Die Präsentation ist für Dezember angesetzt.

Google

„Project Jarvis“ von Google: Der KI-Assistent, der das Browsing unterstützt.

Foto: PantherMedia / elfachero3@gmail.com

Stellen wir uns vor, man möchte ein Buch kaufen: Man öffnet den Browser, gibt den Titel oder Autor ein, durchsucht die Suchergebnisse, klickt auf verschiedene Online-Shops, vergleicht Preise und Versandoptionen, und fügt das Buch schließlich dem Warenkorb hinzu. Klingt fast schon wie Routine, ist aber trotzdem zeitaufwändig. Oder das Buchen eines Fluges kann mühsam sein: Man muss ebenso den Browser öffnen, Suchbegriffe eingeben, ebenso durch die Ergebnisse scrollen, auswählen, vergleichen und schließlich buchen. Google möchte diesen Prozess vereinfachen und einige Aufgaben automatisieren.

Mit „Project Jarvis“ könnte Google den Chrome-Browser so erweitern, dass er eigenständig Aufgaben für die Nutzer erledigt. Das würde bedeuten, dass der Browser automatisch Aktionen ausführen kann, ohne dass der Nutzer jeden Schritt selbst machen muss. Jarvis kann blitzschnell Informationen zu verschiedenen Themen recherchieren, Flüge, Hotels und andere Dienstleistungen direkt buchen und auch das Finden und Kaufen von Produkten im Handumdrehen übernehmen.

Project Jarvis basiert auf Gemini 2

Project Jarvis basiert auf Googles neuem Sprachmodell Gemini 2, das ebenfalls im Dezember erscheinen soll, und wurde speziell für den Chrome-Browser entwickelt. Zunächst wird es nur einer kleinen Nutzergruppe zum Testen bereitgestellt, wobei der genaue Starttermin noch unsicher ist, wie The Information berichtet.

Das Ziel von Project Jarvis ist, wie bereits erwähnt – Routineaufgaben im Browser zu übernehmen – bevor der Nutzer selbst eingreift, etwa durch das Ausfüllen von Textfeldern oder das Klicken auf Buttons.

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
Wirtgen GmbH-Firmenlogo
Project Manager Product Lifecycle Management (m/w/d) Wirtgen GmbH
Windhagen Zum Job 
Energie und Wasser Potsdam GmbH-Firmenlogo
Geoinformatiker (m/w/d) / Vermessungsingenieur (m/w/d) als Projektleiter (m/w/d) GIS - Fachanwendungen Energie und Wasser Potsdam GmbH
Potsdam Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Evonik Operations GmbH-Firmenlogo
Ingenieur (m/w/d) Informatik / Elektrotechnik / Automatisierungstechnik / Chemische Produktion Evonik Operations GmbH
Regierungspräsidium Freiburg-Firmenlogo
BIM-Manager (w/m/d) Regierungspräsidium Freiburg
Freiburg im Breisgau Zum Job 
Fresenius Kabi Deutschland GmbH-Firmenlogo
Projekt IT-Ingenieur (m/w/d) Fresenius Kabi Deutschland GmbH
Friedberg Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur (w/m/d) Informationssicherheit Die Autobahn GmbH des Bundes
Frankfurt Zum Job 
Fachhochschule Dortmund-Firmenlogo
Zukunftsmacher*in Fachhochschule Dortmund
Dortmund Zum Job 
Hochschule Reutlingen-Firmenlogo
Akademische:r Mitarbeiter:in (m/w/x) "SMARTE ASSISTENZSYSTEME" Hochschule Reutlingen
Reutlingen Zum Job 
Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH-Firmenlogo
Planungsingenieur:in / Projektleiter:in Fahrgastinformation (d/m/w) Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH
Frankfurt am Main Zum Job 
Wirtgen GmbH-Firmenlogo
Software-Testingenieur (m/w/d) Testautomatisierung -Steuerungssoftware für mobile Arbeitsmaschinen Wirtgen GmbH
Windhagen Zum Job 
TU Bergakademie Freiberg-Firmenlogo
W2-Professur "Deep Learning" TU Bergakademie Freiberg
Freiberg Zum Job 
Mercer Stendal GmbH-Firmenlogo
Betriebstechniker (m/w/d) Prozessleittechnik Mercer Stendal GmbH
Arneburg Zum Job 

Das Modell benötigt „Bedenkzeit“

Insider berichten von derzeitigen Einschränkungen: Der Agent arbeitet noch recht langsam, da das Modell vor jeder Aktion einige Sekunden „Bedenkzeit“ benötigt. Außerdem steht Google vor der Herausforderung, Nutzer dazu zu bringen, dem System sensible Daten wie Passwörter und Kreditkarteninformationen anzuvertrauen.

Erst vor kurzem kam die Nachricht, dass Google seinen KI-Assistenten Gemini Live nun auch auf Deutsch herausbringt. Die Software, die Gespräche mit Nutzern führen kann, soll auf Android-Smartphones in über 40 Sprachen verfügbar sein. Ursprünglich war sie im August auf Englisch gestartet. In den kommenden Wochen soll Gemini sich mit weiteren Google-Diensten wie Kalender und Erinnerungen verknüpfen lassen.

Diese Verknüpfungen sollen den Chatbot in alltäglichen Situationen hilfreicher machen. Die Vision ist, dass Gemini Aufgaben auf Sprachbefehl übernimmt: So könnte die KI beispielsweise ein per Gmail empfangenes Kochrezept finden und die Zutaten direkt auf eine Einkaufsliste setzen. Ebenso könnte man ein Konzertposter fotografieren, woraufhin Gemini überprüft, ob an diesem Tag laut Kalender noch Zeit verfügbar ist, und eine Erinnerung für den Ticketkauf anlegen lassen.

Ein Beitrag von:

  • Alexandra Ilina

    Redakteurin beim VDI-Verlag. Nach einem Journalistik-Studium an der TU-Dortmund und Volontariat ist sie seit mehreren Jahren als Social Media Managerin, Redakteurin und Buchautorin unterwegs.  Sie schreibt über Karriere und Technik.

Themen im Artikel

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.