Google erweitert Gemini-App mit KI-gestützter Audio-Zusammenfassungen

Google Gemini
Quelle: Google

Hallo Du, um keine News zu verpassen abonniere doch einfach kostenlos meine Kanäle, vielen Dank:

Google hat sein KI-Tool Gemini um eine innovative Funktion ergänzt: Nutzer können nun Dokumente und Präsentationen in interaktive Audioformate umwandeln. Dabei simuliert die Technologie – basierend auf NotebookLM – dynamische Dialoge zwischen zwei virtuellen Moderatoren, die verschiedene Standpunkte darstellen. Aktuell ist diese Option allerdings noch nicht auf Deutsch verfügbar.

Die Handhabung ist intuitiv: Nach dem Hochladen von Dateien erscheint ein Button oberhalb des Eingabefelds. Ein Klick startet die automatische Generierung einer Audioversion, die direkt im Browser, in der App oder offline nach dem Download abspielbar ist. Interessanterweise wurde sogar dieser Artikel vom Verfasser selbst als Testmaterial verwendet – das Ergebnis lässt sich anhören.

Besonders wertvoll ist das Tool für Bildungseinrichtungen und Unternehmen: Lehrinhalte, Forschungsdaten, komplexe E-Mail-Austausche oder Meeting-Notizen lassen sich so in leicht konsumierbare Audioformate übersetzen. Dies ermöglicht beispielsweise das parallele Bearbeiten anderer Aufgaben während des Zuhörens.

Einschränkungen gibt es jedoch: Die Funktion steht ausschließlich Google-Workspace-Nutzern ab 18 Jahren zur Verfügung, darunter Business-, Enterprise- und Education-Pakete. Ein separates Freischalten durch Administratoren entfällt, allerdings ist die Sprachbarriere aktuell noch ein Hindernis für deutschsprachige Inhalte.

Gemini Audio Overview Educational Android UI Spark

Links mit einem * sind Partner-Links. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich eine kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert