Interview mit dem KI-Spezialisten Christian Müller

"Je vollständiger die Beschreibung, desto perfekter das Bild"

18. April 2023
Michael Roesler-Graichen

Künstliche Intelligenzen, die nach der Eingabe von Text Bilder generieren, könnten das Geschäft von Illustrator:innen nachhaltig verändern. Doch welche KIs gibt es überhaupt? Und wie funktionieren sie? Darüber hat boersenblatt.net mit dem KI-Spezialisten Christian Müller gesprochen.

Dr. Christian Mathias Müller studierte Physik an der Universität Heidelberg und ist seit über siebzehn Jahren in einem internationalen Softwarekonzern 2023

Wie viele massentaugliche KI-Applikationen zur Bildgenerierung gibt es derzeit?

Es sind drei große KI-Anwendungen im Einsatz: "Midjourney", "Dall-E" und "Stable Diffusion". Im Netz gibt es noch weitere Websites, die KI-Bildgenerierung anbieten, aber im Hintergrund "Midjourney" oder "Dall-E" nutzen. Häufig wird dies nicht transparent gemacht.
 

Wie funktionieren diese Tools? Gibt es Unterschiede?

Bei den Tools zur Bildgenerierung handelt es sich um Text-zu-Bild-KI. Man gibt nach einem Prompt (einer Eingabeaufforderung) die ­Beschreibung dessen ein, was man auf dem Bild sehen will. Dann greift die anhand einer riesigen Menge von Bild- und Beschreibungsdaten trainierte KI auf entsprechende Motive zu und konstruiert eine Abbildung, die den Text-Input umsetzt. Je vollständiger die eingegebene Beschreibung ist, desto perfekter ist anschließend das Bild, das die KI erzeugt. Die aktuellsten Bild-KI sind spezielle Autoencoder oder Diffusion-Modelle, künstliche neuronale Netze, die neue Daten generieren können. Ich gehe davon aus, dass alle drei gängigen Tools eine ähnliche Modellarchitektur besitzen. Als Entwickler für KI-Plattformen interessiert mich zudem auch der Programmcode. Der ist bei "Midjourney" geheim, bei "Stable Diffusion" hingegen offen.

Mit Börsenblatt Plus ins Branchengeschehen eintauchen

Sie wollen diesen Plus-Artikel weiterlesen?
Dafür benötigen Sie ein Benutzerkonto sowie ein Abonnement!

  • Zugriff auf alle Plus-Artikel (Analysen und Kommentare der Redaktion, exklusive Branchenzahlen, Interviews, Hintergrundberichte, Reportagen und Artikel aus dem gedruckten Börsenblatt)
  • Alle E-Paper-Ausgaben seit 2019, die aktuelle bereits am Mittwochabend abrufbar
  • Plus-Newsletter mit Highlights und Empfehlungen aus der Redaktion