Meta, BitTorrent und KI-Training: Der nächste große Urheberrechts-Stresstest
Während sich die Debatte um KI in Europa stark auf den EU AI Act und Datenschutz konzentriert, spielt sich in den USA gerade ein anderer, aber ebenso entscheidender Kampf ab: die Frage, wie weit Urheberrecht bei der Beschaffung von Trainingsdaten reicht. Meta steht wegen des Einsatzes von BitTorrent unter Beschuss – und versucht, sich mit Hilfe eines neuen Urteils des US Supreme Court aus der Affäre zu ziehen. Was wie ein technischer Nebenschauplatz wirkt, könnte sich zum Referenzfall für die gesamte KI‑Branche entwickeln.
Dieser Artikel ordnet die aktuellen Klagen gegen Meta ein, erklärt die juristische Strategie hinter dem Verweis auf das Cox-Urteil und beleuchtet, was das für europäische Rechteinhaber und Unternehmen bedeutet.
Die Nachricht in Kürze
Wie Ars Technica unter Berufung auf Gerichtsdokumente berichtet, sieht sich Meta in den USA zwei zentralen Klagen wegen des Einsatzes von BitTorrent zur Sammlung von Trainingsdaten ausgesetzt:
- Entrepreneur Media vs. Meta – eine Klage wegen urheberrechtlicher Beihilfe (contributory infringement). Meta soll beim Aufbau von Trainingsdaten rund 80 Terabyte rechtswidrig verbreiteter Werke über BitTorrent "gesät" haben.
- Kadrey vs. Meta – eine Sammelklage von Buchautorinnen und -autoren, die sich zunächst auf eine direkte Urheberrechtsverletzung durch unbefugte Verbreitung stützte.
Der direkte Verbreitungsvorwurf war prozessual schwierig, weil sich bei BitTorrent kaum nachweisen lässt, dass ein bestimmtes Werk vollständig von Meta bereitgestellt wurde. Die Klage von Entrepreneur Media zielt daher auf Beihilfe: Es genügt, wenn Meta nachweislich die Übertragung rechtswidriger Inhalte erleichtert hat.
US-Bundesrichter Vince Chhabria hat nun – widerwillig und unter deutlicher Kritik an der Prozessführung der Klägerseite – erlaubt, dass der Beihilfevorwurf auch in die Sammelklage der Autorinnen und Autoren aufgenommen wird. Meta kündigte gleichzeitig an, sich auf ein aktuelles Urteil des Supreme Court im Fall des Internetanbieters Cox zu berufen, in dem die Haftung von Intermediären für Urheberrechtsverletzungen deutlich eingeschränkt wurde.
Warum das wichtig ist
Hinter diesen Verfahren stehen zwei Grundsatzfragen, die weit über Meta hinausreichen:
- Können KI-Konzerne die rechtlichen Risiken des Datensammelns an die von ihnen genutzte Infrastruktur delegieren?
- Wird das Einsammeln von Trainingsdaten rechtlich wie "normales" Kopieren behandelt oder als Sonderfall reguliert?
Der neu zugelassene Beihilfevorwurf ist für Meta deshalb gefährlich, weil er auf ein Verhalten zielt, das sich deutlich von der Rolle eines passiven Zugangsproviders unterscheidet. Meta soll nicht lediglich ein neutrales Netz bereitgestellt, sondern aktiv massenhaft urheberrechtlich geschützte Inhalte über ein Protokoll verbreitet haben, dessen Daseinszweck in effizientem Dateitausch besteht.
Die Gegenseite kann das im Zweifel sehr simpel erzählen: "Meta hat sich wie ein Nutzer eines Piraterie-Netzwerks verhalten, zehntausende Bücher und Artikel in die Schwärme eingespeist und die Infrastruktur genutzt, um schneller weitere Daten zu ziehen." Das ist weit entfernt von der klassischen ISP‑Geschichte: "Wir betreiben nur die Leitungen."
Meta versucht, dieses Bild mit dem Verweis auf das Cox-Urteil zu überlagern. Nach Darstellung von Ars Technica hat der Supreme Court dort deutlich gemacht: Wer der Allgemeinheit einen Dienst anbietet, den einige Nutzer für Urheberrechtsverletzungen missbrauchen, haftet nicht automatisch als Beihilfetäter. In der Regel braucht es einen Nachweis aktiver Anstiftung oder sehr konkreten Wissens über einzelne Verstöße.
Für Rechteinhaber ist das ein Warnsignal. Wenn es Meta gelingt, selbst ein derart aktives Torrent‑Setup als bloße Nutzung neutraler Technologie darzustellen, würde die Hürde für Klagen gegen andere KI-Anbieter erheblich steigen. Es wäre ein Freifahrtschein, solange man einen gewissen Abstand zwischen sich und die eigentliche Vervielfältigung bringt.
Umgekehrt würde ein Erfolg der Kläger beim Beihilfevorwurf ein starkes Gegenmodell etablieren: Entscheidend wäre dann nicht mehr der Nachweis, welche Datei wohin geflossen ist, sondern ob der Einsatz bestimmter Datenpipelines – etwa BitTorrent‑Schwärme oder bekannte Schattenbibliotheken – objektiv und vorhersehbar massenhafte Rechtsverletzungen fördert.
Kurz gesagt: An diesem Fall entscheidet sich, ob das Recht sich traut, in die Blackbox der KI-Dateninfrastruktur hineinzuleuchten.
Der größere Kontext
Die Auseinandersetzung um Metas Torrent-Nutzung fügt sich in mehrere größere Entwicklungen ein:
Vom Web-Scraping zum Bulk-Import. Frühe generative Modelle wurden überwiegend durch automatisches Auslesen frei zugänglicher Webseiten trainiert – rechtlich umstritten, technisch aber fragmentiert. Der Download kuratierter Datensätze im zweistelligen Terabyte-Bereich via BitTorrent ist eine andere Kategorie: Es geht eher um den Zugriff auf konsolidierte Schattenarchive als um das "Lesen des Webs".
Urheberrechtsklagen als Verhandlungsmacht. Seit 2023 sehen wir eine Welle von Verfahren gegen OpenAI, Microsoft, Stability AI und andere – wegen Büchern, Nachrichtenartikeln oder Code als Trainingsbasis. Diese Klagen sind komplex, weil sie Neuland betreten: Ist die reine Nutzung eines Werks als Trainingssignal schon eine Vervielfältigung im Rechtssinn? Wie ähnlich muss ein KI‑Output dem Original sein, um als Verletzung zu gelten? Demgegenüber ist Torrent-Piraterie für Gerichte vertrautes Terrain – mit klaren mentalen Modellen aus Napster-, Grokster- und BitTorrent‑Zeiten.
Neujustierung der sekundären Haftung. Das Cox‑Urteil reiht sich in eine lange Linie amerikanischer Rechtsprechung ein, die Intermediäre wie ISPs und Hosting‑Anbieter schützen, solange sie nicht aktiv zur Rechtsverletzung animieren. Meta versucht, sich in diese Tradition einzureihen, obwohl es in den vorliegenden Fällen eher wie ein extrem gut ausgestatteter Endnutzer agiert.
Für andere KI‑Unternehmen – etwa in London, Berlin oder im US‑Westen – ist das ein Weckruf. Wer bisher auf Datensätze gesetzt hat, deren Herkunft man lieber nicht allzu genau dokumentiert (LAION‑ähnliche Sammlungen, fragwürdige E‑Book‑Bestände, Mirror‑Sites), sollte damit rechnen, dass sich Kläger künftig sehr gezielt die Datenwege ansehen werden.
Bemerkenswert ist zudem der Ton der richterlichen Kritik: Judge Chhabria wirft den Anwälten der Autorinnen und Autoren vor, mehr Energie ins öffentliche "Meta‑Bashing" als in saubere Prozessstrategie gesteckt zu haben. Das signalisiert: Gerichte sind bereit, auch weitreichende Ansprüche gegen KI‑Firmen zu prüfen, erwarten dafür aber hochpräzise Klageschriften – nicht bloß empörte Grundsatzreden.
Der europäische/regionaler Blick
Für den deutschsprachigen Raum ist der Fall aus mehreren Gründen relevant:
- Die EU kennt mit den Text- und Data-Mining-Ausnahmen bereits ein eigenes Regime für Trainingsdaten. Unternehmen dürfen geschützte Werke unter bestimmten Bedingungen für TDM nutzen, Rechteinhaber können dies aber explizit untersagen.
- Der EU AI Act verlangt von Anbietern großer Basismodelle künftig Transparenz über verwendete Trainingsdaten und die Einhaltung des EU-Urheberrechts.
Sollte ein Unternehmen in der EU ähnlich wie Meta über BitTorrent umfangreiche Buchbestände einsammeln – insbesondere trotz eines TDM‑Opt‑outs –, stünde es rechtlich deutlich schlechter da als im amerikanischen Cox‑Rahmen. Deutsche Verwertungsgesellschaften, starke Verlage und die politisch einflussreiche Kulturszene würden kaum akzeptieren, dass KI‑Konzerne sich hinter einer ISP‑Logik verstecken.
Für den DACH‑Markt stellt sich außerdem eine strategische Frage:
Wollen wir zulassen, dass hochwertige deutschsprachige Inhalte – von Fachbüchern über Zeitungsarchive bis hin zu TV‑Transkripten – faktisch als kostenlose Trainingsmasse genutzt werden, während die wirtschaftliche Wertschöpfung primär in den USA anfällt? Oder nutzen wir den noch vorhandenen Verhandlungsspielraum, um frühzeitig kollektive Lizenzmodelle zu etablieren?
In Berlin, München oder Zürich entstehende KI‑Startups haben dabei eine doppelte Rolle. Sie könnten von klaren europäischen Regeln profitieren, weil sie sich gegenüber international finanzierten Akteuren mit "grauen" Datenpipelines als rechtssichere Alternative positionieren können. Gleichzeitig werden sie selbst in Versuchung geraten, auf billige, rechtlich unsaubere Datensätze zurückzugreifen, solange die Konkurrenz dies ungestraft tut.
Ausblick
Was ist in den kommenden Monaten zu erwarten?
Metas Auslegung des Cox-Urteils. Entscheidend wird sein, wie weit Meta den Vergleich zwischen sich und einem klassischen Access‑Provider treibt – und ob die Gerichte bereit sind, diesen Vergleich mitzutragen. Schon eine teilweise Zurückweisung dieser Argumentation könnte der KI‑Branche signalisieren, dass aktives Torrent‑Seeding kein rechtlicher Selbstläufer ist.
Summary Judgment zur Beihilfehaftung. Übersteht der Beihilfevorwurf die Vorentscheidung, dürfte Meta mit umfangreicher Beweisaufnahme konfrontiert werden. Für die Branche wäre besonders brisant, wenn interne Diskussionen über Beschaffungswege, Risiken und Alternativen offengelegt werden müssten.
Streit um Anwaltsgeheimnis und Privilegien. Kläger haben bereits durchblicken lassen, dass sie im Erfolgsfall die Vertraulichkeit interner Kommunikation zur Torrent‑Nutzung in Frage stellen wollen. Sollte ein Gericht hier zugunsten der Kläger entscheiden, wäre das ein Fanal: Auch die internen Datenstrategien anderer KI‑Anbieter könnten dann angreifbar werden.
Signalwirkung für Regulierung. Unabhängig vom Ausgang werden europäische Gesetzgeber – insbesondere in Brüssel und Berlin – genau hinsehen. Ein zu „Meta‑freundliches" Ergebnis in den USA könnte den politischen Druck erhöhen, die europäische Regulierung nachzuschärfen, etwa durch schärfere Dokumentationspflichten oder explizite Verbote bestimmter Beschaffungspraktiken.
Meine Einschätzung: Das Cox‑Urteil wird Meta helfen, einige der weitreichendsten Beihilfe-Theorien abzuwehren, aber nicht verhindern, dass Gerichte einen Unterschied zwischen passiver Netzinfrastruktur und aktivem Torrent‑Seeding sehen. Schon ein teilweiser Erfolg der Kläger würde die Botschaft senden, dass KI‑Unternehmen ihre Datenpipelines nicht länger als rechtsfreien Raum behandeln können.
Fazit
Meta versucht, ein sehr aktives Verhalten – massives Seeding über BitTorrent – mit Rechtsfiguren zu verteidigen, die ursprünglich geschaffen wurden, um neutrale Infrastrukturanbieter wie ISPs zu schützen. Das ist juristisch wie politisch riskant. Selbst wenn das Cox‑Urteil die Haftungsschwelle für Beihilfe anhebt, bleibt die zentrale Frage: Wie lange kann sich eine milliardenschwere Branche noch darauf verlassen, dass die Herkunft ihrer Trainingsdaten niemanden interessiert? Für die europäische Digitalwirtschaft lautet die eigentliche Aufgabe, jetzt eigene, robuste Modelle für lizenzierte und transparente Datennutzung zu etablieren – bevor Gerichte die Leitplanken im Alleingang ziehen.



