Google Gemini 2.5 Flash: KI-Modell mit flexibler Rechenleistung senkt Kosten für Unternehmen

Hallo Du, um keine News zu verpassen abonniere doch einfach kostenlos meine Kanäle, vielen Dank:
Google hat mit Gemini 2.5 Flash ein neues KI-Modell veröffentlicht, das Entwicklern und Unternehmen erstmals ermöglicht, die „Denkleistung“ der KI individuell anzupassen. Das Update, das aktuell als Preview über Google AI Studio und Vertex AI verfügbar ist, kombiniert verbesserte Analysefähigkeiten mit einer flexiblen Preisgestaltung – ein klarer Schritt, um im wettbewerbsintensiven KI-Markt zu punkten.
Das Modell führt ein „Denk-Budget“ ein: Nutzer legen fest, wie viel Rechenpower die KI für komplexe Aufgaben aufwendet, bevor sie eine Antwort generiert. Dadurch lässt sich die Balance zwischen Kosten, Geschwindigkeit und Präzision steuern. „Entwickler erhalten so die Freiheit, die KI je nach Anforderung einzusetzen – ob für einfache Übersetzungen oder anspruchsvolle Berechnungen“, erklärt Tulsee Doshi, Produktleiterin bei Google DeepMind, im Gespräch mit VentureBeat.
Kostenkontrolle durch hybrides Reasoning
Die Preisstruktur orientiert sich am tatsächlichen Bedarf: Pro Million Eingabe-Tokens fallen 0,15 US-Dollar an. Bei deaktivierter Denkfunktion kosten Ausgaben 0,60 US-Dollar, bei aktivierter Reasoning-Funktion steigen sie auf 3,50 US-Dollar. Dieser Unterschied verdeutlicht, wie ressourcenintensiv tiefgehende Analysen sind. Das Budget lässt sich stufenlos von 0 bis 24.576 Tokens anpassen, wobei die KI automatisch entscheidet, wie viel davon sie je nach Aufgabenkomplexität nutzt.
Benchmark-Tests: Leistung trifft Effizienz
In Vergleichstests zeigt Gemini 2.5 Flash starke Ergebnisse: Im „Humanity’s Last Exam“ (12,1 %) übertrifft es Claude 3.7 Sonnet (8,9 %) und DeepSeek R1 (8,6 %), liegt aber knapp hinter OpenAI o4-mini (14,3 %). Technische Stärken beweist es mit 78,3 % im GPQA-Diamond-Test und bis zu 88 % in Mathematikprüfungen. „Das Modelliefert das beste Preis-Leistungs-Verhältnis für Mathe, multimodale Aufgaben und Langzeitkontext“, betont Doshi.
Wann lohnt sich tiefgehendes Reasoning?
Einfache Anfragen wie „Wie viele Provinzen hat Kanada?“ benötigen kaum Rechenleistung – hier sparen Nutzer Kosten. Bei komplexen Problemen, etwa physikalischen Berechnungen, aktiviert die KI automatisch intensivere Analysen. Unternehmen können so Hochleistungs-Ressourcen gezielt für kritische Aufgaben reservieren.
Google setzt auf Bildung und Video-KI
Parallel zum Launch bietet Google US-Studierenden bis 2026 kostenlosen Zugang zu Gemini Advanced – eine Strategie, um frühzeitig Bindungen aufzubauen. Zudem erhalten Abonnente:innen von Gemini Advanced Veo 2, eine KI zur Videogenerierung aus Textbefehlen. Diese Schritte unterstreichen Googles Ziel, trotz der Dominanz von ChatGPT (800 Mio. wöchentliche Nutzer) im KI-Markt Fuß zu fassen.
Quelle(n):
VentureBeat
Links mit einem * sind Partner-Links. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich eine kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!