Google bringt mit Gemini 2.5 ein KI-Modell, das selbstständig Apps und Webseiten steuern kann

Hallo Du, um keine News zu verpassen abonniere doch einfach kostenlos meine Kanäle, vielen Dank:
Google treibt die Entwicklung seiner KI-Plattform Gemini weiter voran und hat das neue „Computer Use Model“ vorgestellt. Damit präsentiert das Unternehmen erstmals ein System, das digitale Oberflächen wie Apps oder Webseiten eigenständig bedienen kann. Der Ansatz erinnert an die Agentenfunktionen, die bereits von ChatGPT bekannt sind.
Mit diesem Schritt soll Gemini künftig Tätigkeiten übernehmen, die bislang nur durch direkte Nutzerinteraktion möglich waren. Dazu zählen Aufgaben wie das Ausfüllen von Formularen, das Navigieren durch Login-Bereiche oder das strukturierte Durchsuchen von Webseiten. Ziel ist es, alltägliche Arbeitsabläufe zu automatisieren und die KI zu einem verlässlichen Assistenten im digitalen Alltag zu machen.
Laut Google kann das Gemini 2.5 Computer Use-Modell eigenständig mit grafischen Benutzeroberflächen umgehen – und das sowohl in Web- als auch in mobilen Anwendungen. Durch ein verbessertes Verständnis von Bildinhalten und Kontexten kann die KI Aktionen wie Klicken, Scrollen, Tippen oder Drag & Drop selbstständig ausführen. Im Gegensatz zu klassischen Automatisierungssystemen, die auf Schnittstellen angewiesen sind, agiert Gemini direkt auf visueller Ebene.
Die Integration erfolgt über die Gemini-API, die speziell um Funktionen wie Screenshot-Schleifen und eine Aktionshistorie erweitert wurde. Entwickler können damit Prozesse einrichten, bei denen Gemini automatisch Formulare ausfüllt, Informationen recherchiert, Inhalte sortiert oder komplexe Arbeitsabläufe übernimmt. Sicherheit spielt dabei eine zentrale Rolle: Alle Aktionen werden extern geprüft, und besonders sensible Eingriffe erfordern eine gesonderte Freigabe.
Erste Beta-Nutzer verwenden das System bereits für Oberflächentests, Workflow-Automatisierungen oder den Aufbau persönlicher Agenten. Die Testversion steht ab sofort in Google AI Studio sowie Vertex AI zur Verfügung. Einen konkreten Termin für die öffentliche Einführung hat Google noch nicht genannt.
Links mit einem * sind Partner-Links. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich eine kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!
