KI-Training: Wann Onlinedienste Privatdaten verwerten dürfen

Nutzung durch Onlinedienste:KI-Training: Wann Privatdaten einfließen dürfen

von Leon Fried
|

Der Daten-Übertragungsdienst WeTransfer stand in der Kritik, weil er Nutzerinhalte zum Training von KI verwenden wollte. Welche Regeln für das sogenannte Machine Learning gelten.

Apple App Store auf einem iPhone
Dürfen Onlinedienste Daten von Nutzern verwenden, um KI-Systeme zu trainieren?
Quelle: Imago

Wer eine Datei mit großem Datenvolumen versenden möchte, stößt bei vielen E-Mail-Diensten schnell an Grenzen. Weil Provider oft nur Anhänge von rund 20 Megabyte erlauben, greifen viele Internetnutzer auf Dienste wie WeTransfer zurück. Dort lassen sich größere Dateien hochladen und per Link mit einem oder mehreren Empfängern teilen.
Doch kürzlich sorgte eine Änderung der Nutzungsbedingungen von WeTransfer für Aufsehen. Der Dienst mit Sitz in den Niederlanden wollte sich von seinen Kunden das Recht einräumen lassen, hochgeladene Dateien für das Training Künstlicher Intelligenz (KI) zu verwenden.
Unter anderem in der Kreativwirtschaft sorgten sich einige darum, dass ihre Werke zur Entwicklung von KI-Tools verwendet würden, die ihnen Konkurrenz machen könnten. Aber dürfen Digitalunternehmen die Inhalte ihrer Kunden überhaupt nutzen, um KI zu trainieren?
Digitalminister Karsten Wildberger in Washington.
Digitalminister Karsten Wildberger hat an der Vorstellung der neuen KI-Initiative der USA teilgenommen. Im Interview teilt er seine Eindrücke und ordnet die Maßnahmen ein.24.07.2025 | 9:57 min

Was das Urheberrecht zum KI-Training mit Nutzerdaten sagt

In erster Linie müssen KI-Entwickler das Urheberrecht beachten. Das schützt davor, dass Werke wie Texte, Bilder oder Musikstücke von anderen unerlaubt kopiert, bearbeitet oder weitergegeben werden. Sogar Social-Media-Posts können urheberrechtlich geschützt sein, sofern sie eine gewisse Banalitätshürde überschreiten, erklärt Rechtsanwältin Lisa Käde, die sich schwerpunktmäßig mit Rechtsfragen aus dem Bereich Künstlicher Intelligenz befasst.
Werde ein Werk heruntergeladen, um KI-Programme damit zu trainieren, stelle dies grundsätzlich eine urheberrechtlich relevante Vervielfältigung dar. Diese Vervielfältigung ist allerdings dann zulässig, wenn sich KI-Entwickler von den Urhebern der genutzten Werke eine Erlaubnis erteilen lassen.
Das Logo der KI-Software Meta AI des Facebook-Konzern Meta wird auf dem Bildschirm eines Laptop und iPhone angezeigt.
Nutzer von Facebook und Instagram hatten bis Ende Mai die Möglichkeit, der Nutzung ihrer Daten für KI zu widersprechen. Mutterkonzern Meta will mit den Daten seine KI trainieren.26.05.2025 | 0:22 min
Genau das hat WeTransfer in seinen überarbeiteten Nutzungsbedingungen getan. Im Angesicht der Kritik vieler Nutzer ruderte das Unternehmen dann Mitte Juli allerdings zurück. WeTransfer strich die Klausel zur KI-Nutzung wieder.

Warum die Nutzung von Kunden-Daten trotzdem möglich sein könnte

Womöglich dürfen Softwareunternehmen Kundeninhalte aber auch ohne Erlaubnis der Nutzenden verwenden, um KI-Programme damit zu trainieren. Urheberrechtlich zulässig ist nämlich seit einer Reform aus dem Jahr 2021 das sogenannte Text- und Data-Mining. Dabei handelt es sich um eine automatisierte Auswertung großer Datenmengen.
Die Mehrheit der Rechtsexperten ist aktuell der Meinung, dass es sich auch bei KI-Training um Text- und Data-Mining handele, sagt Rechtsanwältin Käde. "Das hätte zur Folge, dass jedermann, auch große Plattformen, urheberrechtlich geschützte Werke auch ohne Erlaubnis der Urheberin vervielfältigen dürften, um sie dann für KI-Training zu verwenden, sofern kein ausdrückliches Opt-out erfolgt ist."
Künstliche Intelligenz
Das richtige Geburtstagsgeschenk finden, E-Mails schreiben lassen, aus dem Kühlschrankinhalt ein Kochrezept generieren: Künstliche Intelligenz kommt immer mehr im Alltag an.15.07.2025 | 3:03 min
Gerichtlich geklärt ist das aber weder in Deutschland noch in anderen EU-Ländern, wie zum Beispiel in den Niederlanden, deren urheberrechtliche Vorschriften für WeTransfer gelten. Offen ist auch, auf welchem Weg der Verwendung eigener Inhalte im Rahmen des Text- und Data-Minings widersprochen werden kann. Dieses Recht zum sogenannten Opt-out räume das Gesetz den Urhebern nämlich ein, so Käde.

Welche Regeln für US-Konzerne gelten

Während die Interpretation der dem EU-Recht entspringenden Text- und Data-Mining-Vorschriften durch die Gerichte für europäische Unternehmen von großem Interesse sein dürfte, ist sie für US-Konzerne wie Meta oder X weniger relevant.

Es gilt grundsätzlich immer das Urheberrecht des Landes, in dem die urheberrechtlich relevante Handlung stattfindet, also etwa die Vervielfältigung von Inhalten.

Lisa Käde, Rechtsanwältin und Urheberrechtsexpertin

Die maßgeblichen Regelungen unterscheiden sich andernorts teilweise erheblich von den europäischen Vorschriften. Die Verbraucherzentrale klagte deshalb unter Berufung auf das Datenschutzrecht gegen den US-Konzern Meta, der sich seit Kurzem von Nutzenden das Recht einräumen lässt, öffentliche Inhalte auf Facebook und Instagram für das Training Künstlicher Intelligenz zu nutzen.
Lesch & Co "Künstliche Intelligenz"
Neuronale Netze sind der Schlüssel für künstliche Intelligenz. Doch wie sind sie eigentlich aufgebaut? Philip Häusser hat dazu schlüssige Erklärungen parat.14.02.2018 | 7:26 min
Im Mai wies das Oberlandesgericht Köln den Eilantrag zurück. Einen Verstoß gegen datenschutzrechtliche Vorschriften konnten die Richter nicht erkennen. An der Datennutzung bestehe ein berechtigtes Interesse. Nutzende von Meta-Plattformen haben die Möglichkeit, der Nutzung ihrer Daten für KI-Trainingszwecke zu widersprechen.
Leon Fried ist Redakteur in der Fachredaktion Recht & Justiz des ZDF.

Mehr zu Künstlicher Intelligenz