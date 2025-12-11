Die EU geht gegen Google vor. Die EU-Kommission untersucht, ob der Tech-Konzern Inhalte aus dem Netz für seine KI-Produkte nutzt, ohne die Urheber zu entschädigen. Wie viel Kontrolle bleibt da eigentlich noch über Daten und Inhalte, die täglich im Netz entstehen?

Wie wird eine KI trainiert und warum sind diese Daten so wertvoll? Und welche Folgen hat das EU-Verfahren für Nutzer, Medien und Plattformen? Host Helene Reiner und heute journal-Moderatorin Marietta Slomka sprechen darüber mit dem KI-Experten Gregor Schmalzried und mit Andreas Stamm, ZDF-Korrespondent in Brüssel.

Das Training eines KI-Modells hängt von seiner Aufgabe ab: Manche verarbeiten Sprache, andere Bilder oder Audio. Große Sprachmodelle wie die Basis von Chatbots Gemini (Google) oder ChatGPT (OpenAI) lernen aus riesigen Datenmengen, meist aus frei zugänglichen Quellen im Netz. Unternehmen nutzen dafür sogenannte Crawler, die Websites automatisch durchsuchen, Texte auslesen und speichern.

Aus diesen Beispielen erkennt das Modell Muster: Satzstrukturen, Bedeutungszusammenhänge und typische Reaktionen. Das Modell versteht Inhalte nicht, sondern berechnet Wahrscheinlichkeiten: Welches Wort oder welche Antwort passt am besten? Je mehr Daten das Modell erhält, desto präziser werden diese Berechnungen und desto besser die Antworten.

Außerdem: Am Wochenende hat einer der stärksten Sternschnuppenschwärme seinen Höhepunkt des Jahres. Ein Blick in den Himmel lohnt sich.

Folge verpasst? Hier gibt es jederzeit alle derzeit verfügbaren Folgen von "heute journal - der Podcast".