Midjourney: Eine Künstliche Intelligenz, die KI-Kunst erschafft

Die KI-Software Midjourney kann Bilder erstellen, die von echten kaum zu unterscheiden sind. Das ist beeindruckend, birgt aber auch Risiken.

von Midjourney © Bild: Elke Mayr

Inhaltsverzeichnis

Was ist Midjourney?

Midjourney ist eine Software zur Erstellung von Bildern mittels Künstlicher Intelligenz (KI). Das proprietäre Programm ist der bekannteste Vertreter sogenannter KI-Kunst. Mit ihr können Bilder erzeugt werden, die von "echten" Kunstwerken oft kaum zu unterscheiden sind. Schlagzeilen machte die Software im Frühjahr 2023: Ein Bild von Papst Franziskus im weißen Designer-Wintermantel machte die Runde. Das Bild war ein Fake, wurde jedoch von vielen für echt gehalten.

Auf deren Homepage bezeichnen die Macher:innen rund um den ehemaligen NASA-Mitarbeiter David Holz ihre Software als "ein unabhängiges Forschungslabor, das neue Medien des Denkens erforscht und die Vorstellungskraft der menschlichen Spezies erweitert". Derzeit hat das Unternehmen elf Mitarbeiter:innen.

Namensgebend ist das Forschungsinstitut Midjourney in San Francisco, Kalifornien (USA), in dem die KI entwickelt wurde. Seit 13. Juli 2022 ist Midjourney für Nutzer:innen in einer Beta-Version verfügbar. Bereits seit März 2022 können Nutzer:innen Fotografien zum "Training" der KI hochladen. Seither entwickelt sich Midjourney stetig weiter, 2023 wurde mit Version 5 die erste Alpha-Version online gestellt. Seit 23. Juni wird die Version 5.2. getestet, mit verbesserter Ästhetik, Kohärenz und Textverständnis sowie neuen Befehlen. Regelmäßige Updates zu neuen Funktionen liefert das Midjourney-Team auf ihrem Twitter-Account.

Um eine bessere Vorstellung der KI und deren Qualität zu bekommen, besuchen Sie die Galerie mit einer Reihe beeindruckender Beispiele.

Mitte März gab Midjourney die erste Ausgabe ihres Monatsmagazins heraus, mit den besten Bildern und den dazugehören Befehlen.

Wie nutze ich Midjourney?

Midjourney funktioniert derzeit ausschließlich über die Plattform Discord. Hierfür ist ein Account nötig. Discord ist eine kostenlose Chat-Plattform mit eigenem privatem Bereich. Mit dem Discord-Account loggen Sie sich anschließend auf midjourney.com ein.

Zur Generierung eines Bildes nutzen Sie den Befehl "/imagine" und beschreiben das Bild im Anschluss möglichst detailliert (siehe hierzu Kapitel Prompt Engineering). Hierfür sind mehrere Sprachen verfügbar, auch eine Beschreibung auf Deutsch ist möglich. Anschließend stellt Ihnen Midjourney vier Beispielentwürfe vor, die Sie gegebenenfalls geringfügig anpassen oder wieder verwerfen können.

Was ist Prompt Engineering?

Bei Midjourney kommt sogenanntes Prompt Engineering zum Einsatz. Das bedeutet, um ein Bild zu generieren, bedarf es keiner speziellen Programmiersprache, sondern die Befehle können in "natürlicher" Sprache gegeben werden. Prompt Engineering funktioniert bei Midjourney also in etwa so, als würden Sie einem oder einer Künstler:in Anweisungen geben, wie er oder sie zu arbeiten hat. Im Fall von Midjourney geben Sie die Anweisung an einen Bot, der die Information verarbeitet. Der Bot funktioniert am besten mit klaren, kurzen Anweisungen – komplizierte Schachtelsätze mag er weniger. Auch Smileys oder Emojis funktionieren.

Im Prompt enthalten sein sollten bestenfalls der Gegenstand eines Bildes (Katze, Wolkenkratzer, Vase etc.), das Medium (Fotografie, Zeichnung, Skulptur etc.), die Umgebung, die Lichtverhältnisse, Farben, Stimmung und so weiter.

Kann ich Midjourney kostenlos nutzen?

Midjourney konnte man bis März 2023 kostenlos nutzen, unregistrierte Benutzer:innen hatten 25 Minuten Rechenzeit zur Verfügung (die Erstellung eines Bildes verbraucht circa eine Minute). Seither haben die Midjourney-Macher:innen drei Abo-Modelle eingeführt: Einen "Basic Plan" für 10 US-Dollar/Monat, den "Standard Plan" für 30 US-Dollar/Monat und den "Pro Plan" für 60 US-Dollar/Monat. Der Basic Plan erlaubt etwa 200 Generierungen monatlich.

Kann ich Bilder von Midjourney verkaufen?

Zahlende Kund:innen können ihre Bilder auch kommerziell nutzen. Die Bilder von Probeaccounts und gelöschten Accounts sind als Bilder unter "Creative Commons 4.0 Non-Commercial" für alle verwendbar.

Umstritten ist die Frage über das Urheberrecht von KI-generierter Kunst. In den USA urteilte Anfang 2023 ein Gericht: Copyright-Schutz gilt nur, wenn Künstler:innen selbst Hand anlegten. Der Copyright-Schutz für ein KI-generiertes Bild gilt also nur dann, wenn der oder die Künstler:in das Bild anschließend noch selbst veränderte. Die EU-Kommission legte im März 2022 einen Entwurf für einen "AI-Act" vor, der auch Copyright-Fragen von KI-Kunst behandeln sollte. Eine Entscheidung ist noch ausstehend.

Welche Gefahren birgt das Programm?

Midjourney, sowie KI im Allgemeinen, mag beeindruckend sein, birgt aber auch Gefahren bzw. steht regelmäßig in der Kritik. In den vergangenen Monaten häuft sich die Kritik an der KI, da Künstler:innen mit Midjourney-Kunstwerken Kunstpreise einheimsten - ohne, dass die Preisrichter:innen die Schummelei bemerkt haben.

Der Fotograf Boris Eldagsen gewann voriges Jahr den ersten Preis bei den Sony World Photography Awards in der Kategorie "Kreativ". Er lehnte den Preis ab, da es sich um ein KI-generiertes Foto handelte. Eldgasen sagte im Anschluss, er wollte damit eine Diskussion über KI-Fotografie anstoßen.

Auch mit Blick auf die Umwelt ist Midjourney, sowie KI im Allgemeinen, nicht unbedenklich. Bevor eine KI in Betrieb geht, muss sie mit sehr, sehr vielen Daten gefüttert werden. Dieser Prozess braucht Strom, denn er findet in gigantischen Rechenzentren statt, die betrieben und gekühlt werden müssen. Ebenso negative Folgen für die Umwelt hat die Anwendung. 2009 errechneten Forscher:innen der Universität Harvard, dass zwei Google-Abfragen in etwa so viel Energie benötigen wie ein Wasserkocher zum Erhitzen einer Tasse Tee (Google dementiert die Studie). Forscher:innen der University of Massachusetts schätzten 2019, dass die Entwicklung aufwendiger KI-Modelle rund 284.000 Kilogramm CO2 verbraucht, so viel wie fünf herkömmliche Verbrenner-Autos in ihrem gesamten Lebenszyklus oder 300 Flüge von New York nach San Francisco.