Microsoft VASA-1: Bahnbrechende KI mit beunruhigender Tragweite
Microsoft’s neueste generative KI, VASA-1, könnte die bisher bahnbrechendste und gleichzeitig beunruhigendste Entwicklung sein.
VASA-1 ist ein Bild-zu-Video-Modell, das die Grenzen zwischen realem und erdachtem Video verwischt. Aus einem einzigen Bild und einem Audioclip kann es erschreckend realistische Aufnahmen mit lebensechten Lippenbewegungen und Gesichtsausdrücken erstellen.
Microsoft erkennt die enorme Leistungsfähigkeit dieser Technologie an. VASA-1 kann „nicht nur eine hochwertige Lippen-Audio-Synchronisierung erzeugen, sondern auch ein breites Spektrum an Emotionen und ausdrucksstarken Gesichtsnuancen sowie natürliche Kopfbewegungen erfassen, die zur realistischen Wahrnehmung der Lebendigkeit beitragen.“
Das System generiert hochauflösende (512×512) Videos mit beeindruckenden 45 FPS. Noch bemerkenswerter ist die Möglichkeit, in Echtzeit lebensechte Videos mit sprechenden Gesichtern mit 40 FPS zu erstellen.
Die Anwendungsmöglichkeiten sind vielfältig und verlockend. Gleichzeitig ist das Missbrauchspotenzial enorm. Die Technologie ermöglicht die Erstellung extrem überzeugender Deepfakes, die Fehlinformationen verbreiten und das Vertrauen untergraben können.
Microsoft ist sich dieser Risiken bewusst und betont, dass VASA-1 vorerst ein reines Forschungsprojekt ist. Erfreulicherweise plant Microsoft keine sofortige Veröffentlichung dieser Technologie. Stattdessen setzt das Unternehmen auf strenge Regulierungen, bevor VASA-1 der Öffentlichkeit zugänglich gemacht wird.
Quelle(n):
Android Authority
Links mit einem * sind Partner-Links. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich eine kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!
Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Facebook, abonniere meinen Telegram-, WhatsApp-, X/Twitter- oder Mastodon-Kanal oder RSS-Feed!