Welt der Wunder

Nicht glauben, sondern wissen

Endloser Bilderhunger: Stehen KI-Bildgeneratoren bald vor dem Aus?

Foto: Envato / iLexx

Endloser Bilderhunger: Stehen KI-Bildgeneratoren bald vor dem Aus?

KI-Bildgeneratoren erzeugen in Sekundenschnelle professionell aussehende Bilder und Grafiken. Das Problem: Die Grundlage für das Ergebnis ist oft urheberrechtlich geschütztes Material, das ohne Zustimmung des Urhebers verwendet wird. Streng genommen sind KI-Bildgeneratoren also eine neue Form des Bilderdiebstahls.

KI-Bildgeneratoren benötigen zum Training Bildmaterial – viel Bildmaterial

Um Bilder zu generieren, müssen KI-Bildgeneratoren zuerst aufwendig trainiert werden. Die Algorithmen erwerben durch maschinelles Lernen die Fähigkeit, Merkmale in vorhandenen Bildern zu erkennen. Erst dann sind sie in der Lage, Bilder selbst zu erzeugen, die diese Eigenschaften aufweisen. Dazu müssen die KI-Bildgeneratoren mit Bildern mit den gewünschten Attributen gefüttert werden.

Für die Entwicklung eines KI-Bildgenerators ist daher zunächst eine große Menge an Bildmaterial erforderlich. In der Regel 1000 Bilder pro Merkmal. Vereinfacht ausgedrückt: Wer möchte, dass die KI Bilder von Katzen generieren kann, benötigt mindestens 1000 Katzenbilder. Soll die KI Bilder von Hunden generieren, muss sie mit mindestens 1000 Hundebildern trainiert werden.

Die künstliche Intelligenz weiß zunächst nicht, was ein Hund oder eine Katze ist. Hier muss der Mensch die KI unterstützen und den Bereich der Bilder markieren, der den Hund oder die Katze zeigt. Soll die KI zusätzlich Bilder von Perserkatzen und Schäferhunden generieren können, braucht man zusätzlich 1000 Bilder von Perserkatzen oder 1000 Bilder von Schäferhunden. Soll ein flexibler KI-Bildgenerator entstehen, der Sätze wie „Erstelle einen nebligen Park im Herbst bei Abendstimmung“ in ein automatisch generiertes Bild umsetzen kann, gehen die benötigten Bilder also in die Millionen.

Woher kommen die Bilder für das KI-Training?

Um so viel Bildmaterial zur Verfügung zu stellen, ist es unter den Entwicklern üblich, auf frei zugängliche Bilddatenbanken zurückzugreifen. Eine der beliebtesten ist die freie Datenbank ImageNet, die derzeit über 14 Millionen Bilder enthält. Das Problem: Es ist inzwischen erwiesen, dass sich darunter auch zahlreiche urheberrechtlich geschützte Bilder oder Bilder mit personenbezogenen Daten befinden.

KI-Training findet größtenteils mit illegal gesammeltem Bildmaterial statt

Die Bilder auf ImageNet wurden automatisiert aus frei zugänglichen Quellen im Internet gesammelt und in die Datenbank aufgenommen – ohne Zustimmung der Urheber. Weitere beliebte Bilddatenbanken sind Open Images, COCO und CIFAR-10. Wie ImageNet scheinen auch diese Urheberrechte überwiegend zu ignorieren.

Wer auf der Fotoplattform Flickr ein Bild hochlädt und dabei die freie Creative-Commons-Lizenz wählt, muss ebenfalls damit rechnen, dass sein Bild für KI-Training verwendet wird.

Verletzen KI-Bildgenerationen die Rechte von Millionen von Künstlern?

Inzwischen läuft ein Rechtsstreit zwischen dem KI-Anbieter Stability AI und der Fotodatenbank Getty Images. Stability AI soll ohne Erlaubnis urheberrechtlich geschützte Bilder von Getty Images‘ Fotoplattform heruntergeladen und für KI-Trainingszwecke verwendet haben.

Zudem hat eine Gruppe von Künstlern aus Kalifornien die KI-Bildgenerator-Anbieter Midjourney Inc., DeviantArt Inc. und Stability A.I. Ltd. verklagt, deren Bilder ebenso unberechtigt verwendet wurden. Der Vorwurf der Kläger: KI-Bildgeneratoren verletzen die Rechte von Millionen von Künstlern. In den USA haben die Richter des U.S. Copyright Office vor Kurzem entschieden, das die Bilder eines mit KI-Bildgeneratoren erstellten Comics keinem Urheberrecht unterliegen. Weitere wegweisende Gerichtsurteile im Zusammenhang mit KI-Bildgeneratoren werden sicherlich bald folgen.

KIs können 1:1-Kopien von bereits existierenden Bildern erstellen – sowie Bilder von real existierenden Personen

Eine weitere rechtliche Problematik von KI-Bildgeneratoren ist erst seit kurzem bekannt. Eine aktuelle Studie hat gezeigt, dass KI-Bildgeneratoren mit spezifischen Anweisungen nicht nur exakte Kopien von bereits existierenden Bildern erstellen können. Einige sind auch in der Lage, Bilder von real existierenden Personen zu erzeugen. Damit kommen zu den urheberrechtlichen auch persönlichkeitsrechtliche Komplikationen hinzu.

So könnte KI-Bilderklau verhindert werden

  1. Das Training von KI-Systemen könnte in Zukunft nur noch mit Bildern erlaubt sein, die entweder nicht urheberrechtlich geschützt sind oder unter einer offenen Lizenz stehen. Internetnutzer, die sich für eine offene Lizenz entscheiden, sollten darüber informiert werden, dass ihre Bilder für KI-Training verwendet werden können.
  2. Bilddatenbanken, die für das KI-Training verwendet werden, könnten regelmäßig auf Urheberrechtsverletzungen überprüft werden. Bilder, die gegen das Urheberrecht verstoßen, würden aus der Datenbank entfernt.
  3. Anwendungen, die Bilder ins Internet hochladen, könnten eine Opt-out-Funktion enthalten, die es den Nutzern ermöglicht, die Verwendung ihrer Bilder für KI-Training abzulehnen.
  4. Spezielle Tools wie „Fawkes“ oder „Glaze“ können bereits heute Bilddateien so verändern, dass sie für das KI-Training wertlos werden. Sie könnten in Zukunft standardmäßig in Bildverarbeitungssoftware integriert werden.

Diese Gegenmaßnahmen würden allerdings die Anzahl verfügbarer Bilder für KI-Training stark einschränken. Somit stellt sich die Frage, wie lange die aktuellen Trainingsmethoden noch realisierbar sind.

Endloser Bilderhunger: Stehen KI-Bildgeneratoren bald vor dem Aus? – Ein Beispiel für ein KI-generiertes Bild
Ein typisches Beispiel für ein KI-generiertes Bild. Zu den deutlichsten Indizien gehört die scheinbar zufällige Kombination aus scharfen und unscharfen Elementen.

Grafik: Pixabay / AlanFrijns

Hintergrund: So funktionieren KI-Bildgeneratoren

KI-Bildgeneratoren fügen Elemente aus bereits vorhandenen Bildern zu einem neuen Ganzen zusammen. KI-Bilder sind also im Grunde Hightech-Collagen.

Hierfür muss die KI zunächst mit vorhandenen Bildern trainiert werden. Dabei ist viel menschliche Hilfe nötig. Was ist auf dem Bild zu sehen? Ist es ein Baum oder ein Haus? Ist das Bild ein Foto, eine Zeichnung oder ein bekanntes Kunstwerk? Ist es ein Werk von Rembrandt, Monet oder Picasso?

All diese Merkmale müssen der KI durch Annotationen mitgeteilt werden. So lernt die KI durch langes Training, woran sie einen Baum, ein Haus, einen Rembrandt oder  einen Picasso erkennt.

Aus den Trainingsdaten extrahiert die KI die wichtigsten Merkmale der Bilder. Anschließend lernt sie, neue Bilder zu erstellen, indem sie diese Merkmale neu kombiniert. Dafür gibt es zwei gängige Verfahren:

GAN (Generative Adversarial Networks)

GANs bestehen aus zwei Netzwerken, die Hand in Hand arbeiten: einem „Generator“, der neue Bilder erzeugt, und einem „Discriminator“, der die Authentizität der Bilder bewertet.

Variational Autoencoder

Hier arbeiten ein „Encoder“ und ein „Decoder“ zusammen. Der „Encoder“ wandelt ein Bild in Daten um. Diese Daten werden mathematisch komprimiert, um die Muster und Regelmäßigkeiten in den aus dem Bild extrahierten Daten besser sichtbar zu machen. Die so strukturierten Daten werden durch den „Decoder“ wieder zu einem Bild rekonstruiert, das den gewünschten Merkmalen entspricht.

Die GAN-Methode erzeugt in der Regel bessere fotorealistische Bilder als die Variational-Autoencoder-Methode. Jedoch ist sie schwieriger zu trainieren und erfordert mehr Daten und Anpassungen. Die Variational-Autoencoder-Methode ist einfacher zu trainieren, erzeugt aber oft unscharfe oder verzerrte Bilder.

Welt der Wunder - Die App

Kostenfrei
Ansehen