Google Gemini 1.5 Pro: KI-Modell mit Audio-Erkennung

Google Gemini
Quelle: Google

Google hat ein neues KI-Modell namens Gemini 1.5 Pro vorgestellt, das Audio verstehen kann.

KI-Modelle müssen mit riesigen Datenmengen gefüttert werden, um zu lernen. Anfangs wurden sie hauptsächlich mit textbasierten Daten trainiert, was besonders für Chatbots wichtig ist. Mit der Zeit lernten sie jedoch auch Bilddaten zu verarbeiten. So können einige Chatbots inzwischen eigene Bilder hochladen, um sie zu rekonstruieren oder zu identifizieren.

Als Google Gemini erstmals vorgestellt wurde, versprach das Unternehmen, dass es eines Tages verschiedene Medienformen wie Bilder, Audio und Video erkennen können würde. Bilderkennung ist bereits seit einiger Zeit möglich, und jetzt hat Google mit Gemini 1.5 Pro einen weiteren Meilenstein erreicht.

Das neueste KI-Modell von Google befindet sich noch in der Testphase, ist aber bereits leistungsfähiger als Gemini Ultra. Google übertrifft sich also selbst! Mit dem neuen Update können Audiodateien analysiert und bearbeitet werden. Du kannst also zum Beispiel die Audiodatei einer langen Keynote, eines Gesprächs, einer Telefonkonferenz usw. direkt auf Gemini hochladen und erhältst eine Zusammenfassung.

Es gibt zwar bereits Tools, die Gespräche zusammenfassen können (sogar für Smartphones), aber die Implementierung von Gemini 1.5 Pro ist anders. Herkömmliche Tools transkribieren das Gesprochene zunächst in Text und fassen dann den Text zusammen. Gemini 1.5 hingegen kann direkt den Ton hören, ohne den Umweg über Text zu gehen. Dies könnte die Genauigkeit der Zusammenfassung verbessern.

Es gibt allerdings eine Einschränkung: Um die Audio-Funktion von Gemini 1.5 Pro nutzen zu können, benötigst du die Entwicklungsplattform Vertex AI von Google. Du kannst sie auch in Verbindung mit AI Studio verwenden. Wenn du also auf die öffentliche Veröffentlichung warten möchtest, musst du dich noch etwas gedulden.

Quelle(n):
AndroidHeadlines

Links mit einem * sind Partner-Links. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!

Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Facebook, abonniere meinen Telegram-, WhatsApp-, X/Twitter- oder Mastodon-Kanal oder RSS-Feed!

Der einzige Tech-Newsletter, den Du brauchst

Abonniere Schmidtis Blog, um tägliche Updates der neuesten Artikel direkt in Deinem Posteingang zu erhalten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert