OpenAI nutzt YouTube-Videos zum Trainieren von GPT-4 – Verstoß gegen die Regeln?

ChatGPT Logo
Quelle: OpenAI

Generative KI-Modelle wie GPT-4 von OpenAI beeindrucken mit ihren Fähigkeiten, werfen aber auch Fragen nach der Ethik und den Grenzen der Datennutzung auf.

Ein Bericht der New York Times enthüllt, dass OpenAI über eine Million Stunden YouTube-Videotranskripte zum Training von GPT-4 verwendet hat. Dies verstieß gegen die Regeln der Plattform, die das Scraping von Inhalten verbieten. OpenAI argumentierte, es handele sich um eine „faire Nutzung“ von öffentlich zugänglichen Videos. YouTube widerspricht dieser Ansicht und verweist auf seine Nutzungsbedingungen, die das Herunterladen von Inhalten ohne Erlaubnis verbieten.

Der Bericht zeigt auch, dass Google ebenfalls Transkripte von YouTube-Videos verwendet, um seine KI-Modelle für Gemini zu trainieren. Google rechtfertigt dies mit Änderungen seiner Nutzungsbedingungen, die die Verwendung von Daten aus „öffentlich sichtbaren Datenpunkten“ erlauben.

Die aggressive Datensammlung durch KI-Unternehmen wie OpenAI und Google wirft Bedenken hinsichtlich der Privatsphäre und der Kontrolle über die eigenen Daten auf. Es wird erwartet, dass die Nutzung von „Grauzonen“-Datenquellen für das Training von KI-Modellen zunehmen wird, da die Menge der verfügbaren Daten abnimmt.

Quelle(n):
The New York Times

Links mit einem * sind Partner-Links. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!

Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Facebook, abonniere meinen Telegram-, WhatsApp-, X/Twitter- oder Mastodon-Kanal oder RSS-Feed!

Der einzige Tech-Newsletter, den Du brauchst

Abonniere Schmidtis Blog, um tägliche Updates der neuesten Artikel direkt in Deinem Posteingang zu erhalten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert