Die Stärke von DALL-E ist es, Verbindungen zwischen Bildern und Worten zu verstehen. Es wurde mit einer riesigen Menge an Text-Bild-Paaren trainiert, um die semantische Bedeutung eines Begriffs mit seiner visuellen Darstellung zu assoziieren. DALL-E versteht aber nicht nur einzelne Konzepte und Bilder, sondern auch die Verbindung zwischen ihnen. Daher kann das Programm etwa nicht nur Bilder von Katzen und Fahrrädern generieren, sondern auch Bilder einer Katze, die Fahrrad fährt.

DALL-E kann über die Webseite von OpenAI aufgerufen werden. Das Interface umfasst ein kleines Chat-Fenster, in das der "Prompt" geschrieben werden kann. Ein Prompt ist eine kleine textliche Beschreibung des gewünschten Bildes. Je detaillierter der Auftrag, desto besser das Ergebnis. Der Fantasie sind hier keine Grenzen gesetzt. Ein Prompt könnte etwa lauten: "Ein Apfel, der einen schwarzen Umhang trägt". Besser würde es aber funktionierten, wenn auch der gewünschte Stil angegeben wird, etwa "im Stil von Vincent van Gogh". Hat das Programm ein Bild generiert, kann es weiter angepasst werden, indem ein weiterer Prompt wie "mehr Farbe" hinzugefügt wird.

Um DALL-E zu benutzen, muss ein kostenloses Konto auf der Webseite von OpenAI erstellt werden. Die Verwendung des Programms ist allerdings nicht gratis. Eine Bildgenerierung kostet einen Dall-E-Credit. Am Anfang erhält man 50 Gratis-Credits, für alle weiteren muss gezahlt werden. 115 Credits kosten 15 US-Dollar.

Die meisten Benutzer:innen verwenden DALL-E zum Spaß. Es ist spannend und lustig zu sehen, wie die Software aus den verrücktesten Prompts visuelle Darstellungen bastelt. DALL-E kann aber auch professionell eingesetzt werden, unter anderem als Werkzeug zur Bildbearbeitung. Ein bestimmter Bereich eines Bildes kann ausgewählt und mit einem Prompt verändert werden. Es können Elemente zu einem Foto hinzugefügt oder weggenommen werden. DALL-E kann auch Bilder erweitern, etwa um aus einem kleineren Foto ein großes Poster zu machen. Ähnlich wie bei Chat-GPT sind die Möglichkeiten des KI-Programms sehr weitläufig und mit den richtigen Prompts kann es für unzählige Anwendungen genutzt werden.





Welche Gefahren birgt DALL-E?

Wie bei vielen anderen Programmen auch, die mithilfe von künstlicher Intelligenz Inhalte erstellen, ist es oft schwierig zu erkennen, ob ein Bild oder ein Text von Menschen gemacht oder durch einen Computer generiert wurde. Das kann zu Problemen führen, gerade wenn es um politische Inhalte oder sehr polarisierende Themen geht.

In Deutschland hat die AfD eine Werbekampagne mit einem KI-generierten Bild von Menschen mit Migrationshintergrund gestartet, wie "Der Standard" berichtet. Die rassistische Darstellung von Männern mit dunklen Haaren und aggressiven Gesichtszügen ist zwar für ein geübtes Auge klar als Fake zu erkennen, Menschen ohne Erfahrung mit KI-generierten Bildern können jedoch getäuscht werden. Auch in den USA wurden Bilder von Donald Trumps Verhaftung millionenfach geteilt und von vielen fälschlicherweise als echt beurteilt. Diese Fälle zeigen, dass die Frage der Authentizität eines Bildes problematisch werden kann, wenn nicht klar gekennzeichnet ist, dass es sich um ein Bild aus der Feder einer künstlichen Intelligenz handelt.

Wie unterscheidet sich DALL-E 2 von DALL-E?

DALL-E 2 ist die Weiterentwicklung von DALL-E, das bereits 2021 erschienen ist. Im Wesentlichen machen beide Programme genau dasselbe, DALL-E 2 verfügt aber über ein paar neue Tricks. Es wurde mit einer größeren Menge an Daten trainiert und kann daher deutlich besser auf Prompts eingehen. Außerdem sind die Bilder deutlich hochauflösender als noch beim Vorgänger und wirken dadurch echter. Während das ältere Modell für einen bestimmten Prompt immer dasselbe Bild generiert, kann DALL-E 2 ein und denselben Input auf unendlich viele Weisen darstellen. Es muss also kein neuer Prompt geschrieben werden, um ein neues Bild zu erhalten.

Welche alternativen Programme gibt es?

Zu den bekannten Alternativen zählen die bildgenerierenden KI-Programme "Midjourney" und "Stable Diffusion". Midjourney gehört zu den stärksten Konkurrenten von DALL-E und wird von manchen Nutzern und Nutzerinnen bevorzugt, da es noch realistischere Darstellungen erstellen kann. DALL-E hingegen ist besonders gut darin, einen abstrakten Prompt richtig zu interpretieren und ein passendes Bild zu generieren.

Sind Bilder von DALL-E urheberrechtlich geschützt?

OpenAI äußert sich zu der Frage des Urheberrechts in den Nutzungsbedingungen. Sofern diese eingehalten werden, hat die Person, die mithilfe von DALL-E Bilder erstellt, alle Rechte an diesen Werken. Das bedeutet, dass die Bilder auch vervielfältigt und verkauft werden dürfen. Das deutsche Medienportal Urheberrecht.de vermerkt aber auf seiner Webseite: "Damit Bilder durch das Urheberrecht geschützt sind, müssen diese laut Gesetz aus einer persönlichen Tätigkeit hervorgehen und von Menschen erschaffen sein." Damit können Nutzer:innen eigentlich keinen Urheberrechtsanspruch auf Bilder, die mit DALL-E erstellt wurden, stellen. Die rechtliche Situation ist noch sehr unübersichtlich und auch die Europäische Kommission arbeitet an einem gesetzlichen Regulatorium für KI-generierte Werke.

Was ist DALL-E Mini?

DALL-E Mini ist eine deutlich abgespeckte Version seines großen Bruders. Der ähnliche Name ist aber trügerisch, denn DALL-E Mini ist nicht von OpenAI entwickelt worden, sondern ist ein unabhängiges Projekt des KI-Experten Boris Dayma. Um Verwechslungen zu vermeiden, heißt DALL-E Mini jetzt Craiyon. Das Programm kann ebenfalls Bilder generieren und bearbeiten, allerdings sehen die Ergebnisse weniger professionell aus. Dafür gibt es das Programm in einer gänzlich kostenfreien Version.