Anthropic gewinnt Copyright-Klage um KI-Training – teilweise

Twitter
LinkedIn
E-Mail
WhatsApp

Im Gerichtsverfahren Bartz vs. Anthropic entschied ein US District Court, dass KI-Training mit legal gekauften und gescannten Büchern unter bestimmten Umständen als sog. „Fair Use“ zulässig ist. Trotz der Verwendung von Millionen vollständiger urheberrechtlich geschützter Werke bewertete das Gericht die Nutzung als transformativ, vernünftigerweise erforderlich und damit urheberrechtlich zulässig. Die Nutzung illegal beschaffter E-Books bleibt dagegen klar unzulässig. Das Urteil hat vorerst allerdings nur begrenzte rechtliche Wirkung – besonders außerhalb der USA.

Der Fall

Drei Buchautoren — Andrea Bartz, Charles Graeber und Kirk Wallace Johnson — reichten vor dem US-Bundesbezirksgericht (Northern District of California) im August 2024 eine Sammelklage gegen Anthropic wegen Urheberrechtsverletzung im Rahmen des KI-Trainings von Large Language Models (LLMs) ein.

Dabei warfen sie dem Unternehmen vor allem vor,

  • Bücher aus illegalen E‑Book-Datenbanken systematisch abgeschöpft zu haben;
  • zuvor erworbene, gebrauchte Printausgaben gescannt zu haben und
  • die Kopien (von a. und b.) zum Training von LLMs verwendet zu haben.

Nicht Gegenstand des Verfahrens war, dass die Trainingsdaten den Nutzern im Rahmen des Outputs präsentiert worden wären.

Das US-Gericht hat nun festgehalten, dass das vorgeworfene KI-Training unter bestimmten Umständen auch ohne Einwilligung der Autoren zulässig war.

Konkret geht das Gericht davon aus, dass das Herunterladen der Bücher – und damit auch ihre Nutzung für das Training – unzulässig war. Die Scans der erstandenen Printausgaben dagegen – und hier liegt das Bemerkenswerte des Falles – durften sehr wohl verwendet werden.

Hintergrund – Fair Use

Anthropic hat im Wesentlichen argumentiert, dass das KI-Training unter die sog. Fair Use Doctrine fallen würde.

Dabei handelt es sich um ein zentrales Konzept im US-amerikanischen Urheberrecht, das unter bestimmten Umständen die Nutzung urheberrechtlich geschützter Werke ohne die Erlaubnis des Rechteinhabers erlaubt. Ziel ist es, einen Ausgleich zwischen dem Schutz geistigen Eigentums und dem öffentlichen Interesse an Meinungsfreiheit, Bildung und Innovation zu schaffen.

Der Gesetzgeber geht also davon aus, dass es Gründe gibt, die Ausnahmen vom absoluten Schutz des Urheberrechts erforderlich machen. Klassische Beispiele sind insbesondere Parodien, Nachrichtenberichterstattungen oder auch Lehre- und Forschung.

Fair oder eben erlaubt ist der Use des urheberrechtlich geschützten Werks, wenn bei einer Abwägung im Einzelfall der nachfolgenden vier Kriterien, die Nutzung billig erscheint:

  1. Kriterium 1: Zweck und Charakter der Nutzung
    Liegt eine kommerzielle Nutzung oder eine Nutzung für gemeinnützige Zwecke vor?
    Ist die Nutzung „transformativ“? (D.h.: Wird das Originalwerk auf neue Weise verwendet, z. B. durch Kommentar, Kritik oder Parodie?)
  2. Kriterium 2: Natur des geschützten Werks
    Ist das Werk besonders schützenswert (Fachliteratur genießt bspw. geringeren Schutz als fiktionale Werke)
  3. Kriterium 3: Menge und Wesentlichkeit des verwendeten Teils
    Wurde nur ein kleiner Teil, der „Kern“ bzw. das „Herzstück“ des Werks oder das Werk vollständig verwendet?
  4. Kriterium 4: Auswirkung auf den potenziellen Markt
    Beeinträchtigt die Nutzung den Marktwert des Originals oder dessen Lizenzierungsmöglichkeiten?

War Anthropics Use Fair?

Während das Gericht keinen Zweifel daran hat, dass die raubkopierten Bücher (a.) niemals Fair Use unterfallen können (sämtliche der vier Kriterien sprechen dagegen), kam es im Übrigen zu einem anderen Ergebnis:

Scans der gekauften Bücher (b.)

Die Scans von Büchern zu erstellen, die man zuvor gekauft hatte, war im Fall von Anthropic fair:

Der Zweck der Nutzung sei transformativ (Kriterium 1), also ein anderer. Die digitale Kopie spare Platz und sei zudem digital durchsuchbar. Auch spreche die Tatsache, dass Anthropic die Scans aus kommerziellen Zwecken angefertigt hatte nicht gegen Fair Use. Die Autoren seien bereits durch den Erwerb der Bücher monetär kompensiert worden. Zudem sei keine Kopie an Dritte verkauft worden.

Zwar spreche die Art der Werke gegen Fair Use (Kriterium 2), dies wird in einer Gesamtschau aber dadurch aufgefangen, dass Anthropic die originale Version der Bücher (welche Anthropic ewig hätte speichern können) vernichtet hatte (Kriterium 3). Insofern würden keine zusätzlichen Kopien der Bücher existieren.

Schließlich sei nicht feststellbar, dass die Scans eine Auswirkung auf den potenziellen Markt hatten (Kriterium 4). Insbesondere sei nach dem US-Urheberrecht auch nicht relevant, dass die Autoren ggf. für eine digitale Kopie mehr verlangt hätten als für eine analoge Kopie.

Verwendung der Kopien zum Training der LLMs (c.)

Auch die Verwendung der Kopien zum Training von LLMs war fair. Hier spreche erneut die Art der Kopien gegen Fair Use (Kriterium 2).

Allerdings sprechen nach Argumentation des Gerichts die übrigen Kriterien für Fair Use. So sei die neue Nutzung transformativ (Kriterium 1), da es nicht Ziel gewesen sei, Kopien herzustellen, sondern der KI zu ermöglichen, anhand der Bücher neue Arbeiten zu erstellen.

Auch sei im Rahmen von Kriterium 4 klar, dass die KI nicht in direkter Konkurrenz zu den Originalbüchern steht und daher keine Auswirkung auf den Markt hätte.

Besonders überraschend sind die Ausführungen jedoch zu Kriterium 3. Schließlich hat Anthropic bis zu 7 Mio. vollständige Bücher zum Training verwendet. Das Kopieren der Bücher war zwar nicht zwingend erforderlich („strictly necessary“), aber angesichts des hohen Datenbedarfs und der Qualität der Werke eine vernünftige und gerechtfertigte Wahl („reasonably necessary“) im Sinne von Fair Use. Dies sei aber der relevante Maßstab des US-Urheberrechts.

Folgen für Anthropic

Auch wenn das Urteil für Anthropic einen Teilerfolg darstellt, könnten die finanziellen und rechtlichen Risiken weiterhin erheblich sein. Das Gericht hat festgestellt, dass beim Training der KI-Modelle Urheberrechtsverletzungen in Bezug auf potenziell sieben Millionen Bücher vorliegen. Über die konkreten rechtlichen Konsequenzen wird in einem nächsten Verfahrensschritt weiterverhandelt.

Schadensersatzansprüche könnten sich daher hier auf Milliarden summieren. Selbst bei einem moderaten Schadensersatz pro Werk stünden für Anthropic erhebliche finanzielle Belastungen im Raum. Das Urteil könnte daher nicht nur im Hinblick auf die Fair Use Doktrin eine Signalwirkung haben.

Rechtliche Einordnung der Entscheidung und internationale Relevanz

So erstaunlich und bahnbrechend die Entscheidung sein mag, ihre rechtliche Relevanz wird sich erst in Zukunft zeigen.

1. Kein Präzedenzfall – noch nicht.

Zum einen ist die Entscheidung noch nicht rechtskräftig – beide Parteien haben die Möglichkeit, Rechtsmittel einzulegen. Das Verfahren ist damit noch nicht abgeschlossen, und es bleibt abzuwarten, ob und in welcher Form ein höheres Gericht die Entscheidung bestätigt oder ändert.

Zum anderen dürfte selbst ein rechtskräftiges Urteil eines District Courts nicht einmal für den gleichen Gerichtsbezirk, geschweige denn für andere Gerichtsbezirke bindend sein. Entscheidend wird also sein, dass sich andere und höhere Gerichte dieser Auffassung anschließen.

Dass das kein Selbstläufer wird, zeigt ein weiteres Urteil, ebenfalls des Northern District Court of California (Kadrey v. Meta Platforms, Inc. (3:23-cv-03417)). Dieses liest sich deutlich kritischer im Hinblick auf die Anwendung von Fair Use bei KI-Training:

“And, as should now be clear, this ruling does not stand for the proposition that Meta’s use of copyrighted materials to train its language models is lawful. It stands only for the proposition that these plaintiffs made the wrong arguments and failed to develop a record in support of the right one.”

2. Internationale Auswirkungen: keine Fair Use doctrine.

Noch weniger Einfluss hat die Entscheidung auf andere Rechtsordnungen. In Deutschland etwa gibt es keinen allgemeinen Fair Use-Grundsatz wie im US-amerikanischen Recht. Stattdessen gelten enge, klar definierte Schrankenregelungen im Urheberrechtsgesetz, beispielsweise für wissenschaftliche Zwecke (§ 60c UrhG) oder Zitate (§ 51 UrhG).

In Bezug auf das Training von KI-Systemen wird insbesondere über die Ausnahmen des (wissenschaftlichem) Text- und Dataminings (gemäß § 60d UrhG bzw. des § 44b UrhG) diskutiert, sofern der Urheber keine ausdrücklichen Nutzungseinschränkungen erklärt hat. Doch auch hier ist die Rechtslage derzeit unsicher: Das bislang einzige Urteil in Deutschland zu dieser Frage stammt vom Landgericht Hamburg (Urt. v. 27.09.2024, Az. 310 O 227/23 – LAION), betraf lediglich eine spezifische Konstellation, ist nicht rechtskräftig und steht somit nicht für eine gefestigte Rechtsprechung.

Auch in anderen Common-Law-Staaten unterscheidet sich die rechtliche Bewertung deutlich von der US-amerikanischen Praxis. So kennt etwa das Vereinigte Königreich kein umfassendes Fair Use Prinzip. Dort verfolgt man das deutlich engere Konzept des Fair Dealings.

Dennoch dürften gerade wegen der potenziell hohen Schadensersatzforderungen viele urheberrechtliche Verfahren im Kontext von KI-Training vorrangig in den USA ausgetragen werden. Die rechtlichen Rahmenbedingungen sind streng, und die Konsequenzen oft weitreichend. Deshalb ist auch klar: Wenn KI-Anbieter in den USA über das Urheberrecht stolpern, hat das nicht nur Folgen vor Ort – sondern weltweit. Was dort entschieden wird, kann ganze Geschäftsmodelle verändern.

Anthropic gewinnt Copyright-Klage um KI-Training – teilweise 1

Tobias Weigand, LL.M. IP (UCT), ist seit mehr als einem halben Jahrzehnt als Rechtsanwalt und Syndikusrechtsanwalt tätig und berät Unternehmen im Bereich des Gewerblichen Rechtsschutzes und IT-Rechts. Seine Expertise umfasst insbesondere das Urheber-, Wettbewerbs- und Markenrecht, Design- und Patentrecht sowie das IT- und Internetrecht. Durch seine umfassende Erfahrung und fundierten Fachkenntnisse unterstützt er Unternehmen dabei, ihre geistigen Eigentumsrechte zu schützen und rechtliche Herausforderungen in der digitalen Welt und im Bereich der Künstlichen Intelligenz zu meistern.

KI-Tools & News direkt in deinem Postfach!

Du möchtest immer informiert bleiben? Melde dich für unseren Newsletter an und bleibe mit 36.000 anderen KI-Enthusiasten up-to-date!
Kostenlos

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

0 0 votes
Article Rating
Abonnieren
Benachrichtige mich bei
0 Comments
Älteste
Neuste Most Voted
Inline Feedbacks
Alle Kommentare anzeigen
Jens Polomski Portrait

Hey, ich bin Jens Polomski, Blogger, LinkedIn Top Voice (im Bereich KI), Online-Marketing Freelancer und Gründer der KI-Lernplattform snipKI (samt KI-Führerschein)Hier dreht sich alles um den Einsatz der richtigen Tools & KI für dein Marketing

Mein KI-Newsletter

In meinem kostenlosen Newsletter (35.000+ Abos) bekommst du noch mehr News und Tools zum Thema.

Blog Highlights 🚀

Dein KI-Update Newsletter 🤖

Erfahre als erster von News und Tools aus der Welt der künstlichen Intelligenz

4 gute Gründe für meinen Newsletter

Cookie Consent mit Real Cookie Banner
0
Was ist deine Meinung dazu? Hier kannst du kommentieren!x