Urheberrecht und KI-Training

„Menschliche Kreativität wird verdrängt werden“

6. September 2024
von Sabine Cronau

KI-Training ist eine Urheberrechtsverletzung – und kein Fall von Text- und Data-Mining: Zu diesem Ergebnis kommt ein interdisziplinäres Gutachten, das von der Initiative Urheberrecht beauftragt und gestern bereits im Europäischen Parlament präsentiert wurde.

eine natürliche und eine künstlicher Hand berühren sich, Motiv nach Art Michelangelos

Ein Informatiker und ein Rechtswissenschaftler haben das Tandem-Gutachten zum Thema KI-Training erstellt (Titel: „Urheberrecht und Training generativer KI-Modelle – technologische und juristische Grundlagen“).

  • Sebastian Stober ist Professor für Künstliche Intelligenz an der Otto-von-Guericke Universität Magdeburg,
  • Tim W. Dornis hat eine Professur für Bürgerliches Recht und Gewerblichen Rechtsschutz an der Leibniz Universität Hannover.

Auftraggeber ist die Initiative Urheberrecht, die die Interessen von 140.000 Urheber:innen und Künstler:innen vertritt. Zu den Mitgliedsorganisationen gehören etwa das PEN-Zentrum Deutschland und der Verband Deutscher Schriftstellerinnen und Schriftsteller, aber auch der Bundesverband Schauspiel oder der Deutsche Künstlerbund.

Wie ein genauerer Blick auf die Technologie generativer KI-Modelle offenbart, ist das Training solcher Modelle kein Fall von Text- und Data-Mining.

Aus dem Gutachten

Die zwei wichtigsten Erkenntnisse

Das Tandem-Gutachten untersucht, wie die Verarbeitung von geschütztem Material beim KI-Training urheberrechtlich zu bewerten ist – und liefert Erkenntnisse über die technisch notwendigen Zwischenschritte beim Training generativer Künstlicher Intelligenz.

„Wie ein genauerer Blick auf die Technologie generativer KI-Modelle offenbart, ist das Training solcher Modelle kein Fall von Text- und Data-Mining“, lautet das Fazit von Rechtswissenschaftler Tim Dornis: „Es handelt sich um eine Urheberrechtsverletzung – dafür ist nach deutschem und europäischem Urheberrecht keine gültige Schranke in Sicht.“

Ein expliziter Speichermechanismus sei zwar nicht angelegt, Teile der Trainingsdaten würden jedoch von den aktuellen generativen Modellen durchaus „ganz oder teilweise memorisiert“, ergänzt Informatiker Sebastian Stober – und könnten deshalb mit passenden Prompts von Endnutzern wieder generiert und somit vervielfältigt werden.

Es gibt umfangreiche Belege dafür, dass aktuelle generative Modelle einen nicht unerheblichen Teil ihrer Trainingsdaten memorisieren.

Aus dem Gutachten

Das sagt die Initiative Urheberrecht dazu

Vor allem der letzte Punkt ist für Katharina Uppenbrink, Geschäftsführerin der Initiative, „ein wegweisendes Ergebnis“ – weil sich damit belegen lasse, „dass die Nachbildung von Werken durch ein KI-Modell eine urheberrechtlich relevante Vervielfältigung darstellt.“

Das wiederum bedeutet auch: „Da wäre ein neuer, ertragreicher Lizenzmarkt am Horizont, doch es fließen keine Vergütungen, während die Generative KI sich anschickt, diejenigen, von deren Inhalten sie lebt, in deren eigenem Markt zu ersetzen“, wie Komponist Matthias Hornschuh als Sprecher der Initiative Urheberrecht zusammenfasst: „Das gefährdet professionelle Wissensarbeit und kann nicht in unser aller gesellschaftlichem, nicht im kulturellen und ausdrücklich nicht im volkswirtschaftlichen Interesse sein.“

Da wäre ein neuer, ertragreicher Lizenzmarkt am Horizont, doch es fließen keine Vergütungen, während die Generative KI sich anschickt, diejenigen, von deren Inhalten sie lebt, in deren eigenem Markt zu ersetzen.

Matthias Hornschuh, Sprecher der Initiative Urheberrecht

Anschlussfragen in Richtung Politik

Das Gutachten wurde am Donnerstag dieser Woche (5. September) bereits bei einer Veranstaltung im Europäischen Parlament vorgestellt – Gastgeber war EU-Parlamentarier Axel Voss. Ende September soll die Studie in Berlin präsentiert werden.

Der Politik schreiben die beiden Wissenschaftler dabei klare To-Dos ins Pflichtenheft. In drei interessanten „Anschlussfragen“ am Ende ihres Gutachtens blicken sie über die technischen und urheberrechtlichen Details hinaus. Aus ihrer Sicht sind vor allem drei Narrative einer kritischen Prüfung zu unterziehen, die in der Diskussion regelmäßig propagiert würden:

  1. Zunächst müsse bezweifelt werden, dass sich die natürliche Kreativität des Menschen mittel- bis langfristig gegen die zunehmend anwachsenden Kapazitäten „künstlicher Kreativität“ werde behaupten können. „Es ist vielmehr damit zu rechnen, dass menschliche Kreativität zunehmend verdrängt werden wird. Der Gesetzgeber kann sich deshalb nicht darauf beschränken, zunächst die weiteren Entwicklungen abzuwarten“, so die Wissenschaftler.
  2. Eine Steigerung der kreativen Produktion durch den Menschen werde aus dem Anwachsen „künstlicher“ Erzeugnisse, entgegen derzeit gängiger Prognosen, sehr wahrscheinlich nicht resultieren. Vielmehr sei damit zu rechnen, dass die Ergebnisse genuin menschlicher Kreativität in vielen Berufsgruppen und Branchen – insbesondere im Bereich der journalistischen Berichterstattung, der Unterhaltung und der Herstellung von Alltagsprodukten – in erheblichem Umfang durch generativen KI-Output ersetzt und verdrängt würden.
  3. Schließlich müsse sich insbesondere der europäische Gesetzgeber die Frage stellen, ob er vor dem Hintergrund der auf anderen Gebieten kompromisslosen Sicherung regulativer Mindeststandards gerade für das Urheberrecht dem bereits begonnenen, globalen „race to the bottom“ tatenlos zusehen wolle. „Es geht dabei nicht um die Verhinderung von KI-Innovationen, sondern um faire Wettbewerbsbedingungen und einen angemessenen Ausgleich für die verwerteten Ressourcen“, machen die Forscher deutlich.

Es geht dabei nicht um die Verhinderung von KI-Innovationen, sondern um faire Wettbewerbsbedingungen und einen angemessenen Ausgleich für die verwerteten Ressourcen.

Aus dem Gutachten

Abstract des Gutachtens

Das gesamte Gutachten ist hier abrufbar. Das Abstract geben wir hier im Wortlaut wider:

„Generative KI verändert die kreative Welt. Sie produziert Texte, Bilder, Musik und Videos praktisch aus dem Nichts und in Sekundenschnelle. Diese KI-Kreationen wirken oft genauso beeindruckend wie von Menschenhand geschaffene Werke, erfordern aber ein umfangreiches Training auf der Grundlage riesiger Datenmengen, von denen viele urheberrechtlich geschützt sind.

Diese Abhängigkeit von urheberrechtlich geschütztem Material und der damit verbundene Eingriff in Urheberrechte hat Debatten ausgelöst und in vielen Ländern zu gerichtlichen Auseinandersetzungen geführt. Zur Verteidigung berufen sich KI-Entwickler in den USA auf die „fair use defense“ nach section 107 des  U.S. Copyright Act. In Europa wird vor allem Artikel 4 Absatz 1 der DSM-Richtlinie angeführt, der Nutzungen urheberrechtlich geschützter Werke für „Text und Data Mining“ erlaubt.

Die vorliegende Studie stellt die im Moment vorherrschende europäische Rechtsauffassung in Frage, insbesondere in folgenden Punkten:

1. Die Ausnahme für Text und Data Mining sollte nicht für das Training generativer KI-Modelle gelten, weil sich die beiden Technologien fundamental unterscheiden – die eine verarbeitet semantische Informationen, die andere extrahiert und verwertet umfangreich die syntaktischen und damit urheberrechtlich geschützten Informationen der Werke in den Trainingsdaten.

2. Es gibt keine praktisch relevante Schranke, welche die vielfachen, während des KI-Trainings stattfindenden Eingriffe in das Urheberrecht rechtfertigen könnte. Urheberrechtlich geschützte Werke werden bei der Datenerfassung kopiert, ganz oder teilweise in den KI-Modellen repräsentiert und können schließlich auch von den Endnutzern der Modelle vervielfältigt werden.

3. Auch wenn das Training generativer KI-Modelle außerhalb Europas stattfindet, können sich die Entwickler nicht der Geltung und Durchsetzung der europäischen Regeln des Urheberrechts entziehen. Da die zum Training eingesetzten Werke jedenfalls teilweise in den Modellen repräsentiert sind, kann die Bereitstellung von KI-Dienstleistungen an Nutzer in Europa in das „Recht der öffentlichen Zugänglichmachung“ in Art. 3 InfoSoc-Richtlinie eingreifen. Die Entwickler und Anbieter sind deshalb den europäischen Urheberrechtsgesetzen unterworfen und unterliegen der Zuständigkeit der europäischen Gerichte.

Diese Studie regt an, Urheberrechtsfragen im Zusammenhang mit dem Training generativer KI-Modelle einer noch gründlicheren Betrachtung zu unterziehen. Angesichts der technischen Revolution und der sozio-ökonomischen Umwälzungen, die generative KI mit sich bringt, muss der Gesetzgeber entscheiden, wie das Gleichgewicht zwischen dem Schutz menschlicher Kreativität und der Förderung von KI-Innovationen hergestellt werden kann.

Die bestehenden Mängel der gesetzlichen Regelungen vernachlässigen die technischen Realitäten und sind daher nicht nur rechtlich zweifelhaft, sondern vor allem auch in der Sache ungerecht.“