Gibt es einen neuen Champion unter den KI-Bildgeneratoren?

Bisher galt Midjourney als führend in der KI-basierten Bilderzeugung, und das aus gutem Grund. Kürzlich jedoch hat ein neues Open-Source-Modell namens Flux. 1 von Black Forest Labs die Bühne betreten und sich rasch als beeindruckende Lösung für die Erzeugung fotorealistischer Bilder etabliert. Dieser Vergleich zwischen Flux und Midjourney untersucht, welches Tool sich besser für die Erzeugung von Bildern, die Darstellung menschlicher Züge und die Erschaffung surreal anmutender Werke eignet. Die Authentizität der generierten Fotos ist wirklich bemerkenswert.

Was ist der Flux KI-Bildgenerator?

Flux. 1 ist ein quelloffenes KI-Modell zur Bilderzeugung, das von ehemaligen Ingenieuren und Forschern von Stable Diffusion entwickelt wurde. Unter dem Dach des neuen KI-Startups Black Forest Labs wurden drei Varianten des Flux. 1-Modells veröffentlicht. Flux. 1 [pro] ist die fortschrittlichste Version und ist ausschließlich für kommerzielle Zwecke gedacht.

Unglaublich. Das sind zweifellos die realistischsten KI-Bilder, die ich je gesehen habe.

Wir sind zu 99,7 % auf dem Weg zu KI-Bildern, die von der Realität nicht mehr zu unterscheiden sind.

(Bei starkem Zoom sind noch einige Fehler sichtbar)

Dies ist mit FLUX entstanden. Unheimliches Tal. pic.twitter.com/5BIRmZey8B— Roberto Nickson (@rpnickson) 8. August 2024

Die Modelle Flux. 1 [dev] und Flux. 1 [schnell] sind Open Source, und die KI-Community hat diese bereits weiterentwickelt, um Bilder von beeindruckender fotorealistischer Qualität zu erzeugen. Mit einem Realism LoRA-Adapter kann das Flux. 1 [dev]-Modell visuell überzeugende realistische Bilder generieren, und insbesondere die Hände werden ohne Verzerrungen oder Artefakte dargestellt.

Um das Flux. 1 KI-Modell zu testen, haben wir es mit Midjourney v6.1 verglichen. Wir haben das FLUX Realism LoRA-Modell auf fal.ai (besuchen) für menschliche Motive und FLUX.1 [pro] (besuchen) für Landschaftsbilder verwendet. Hier folgt der direkte Vergleich zwischen Flux und Midjourney mit identischen Eingabeaufforderungen.

Flux vs Midjourney: Bildgenerierung im Vergleich

1. Eine Frau auf dem Weg zur Arbeit bei Sonnenaufgang

Im ersten Bildvergleich ist deutlich zu erkennen, dass das von Flux erzeugte Bild eine höhere fotorealistische Qualität aufweist. Trotz der Verwendung des Parameters –style raw in Midjourney resultierte das Bild eher in einem cartoonartigen Stil.

FluxMidjourney

2. Ein älteres Paar im Park

Auch hier ist das Ergebnis von Flux realistischer und glaubwürdiger als die Darstellung von Midjourney. Während das Bild von Midjourney wie ein Gemälde wirkt, erzeugt Flux eine lebensechte Darstellung.

FluxMidjourney

3. Ein Bild eines Kochs

In diesem Test haben beide, sowohl Flux als auch Midjourney, die Erwartungen nicht ganz erfüllt. Beide generierten Bilder wirken KI-generiert, aber das Ergebnis von Midjourney zeigt eine bessere Beherrschung von Reflexionen und Lichteffekten.

Midjourney

4. Ein Fantasieschloss

Hier würde ich das Ergebnis von Flux bevorzugen, da es Bilder zeigt, die direkt einer Fantasiewelt entsprungen sein könnten. Auch das von Midjourney erzeugte Bild ist sehr detailliert.

Midjourney

5. Eine futuristische Stadt bei Nacht

Dies wäre eine Art Punkteteilung, aber das Bild von Flux wirkt etwas klarer, während Midjourney ein visuell komplexeres Bild erzeugt hat.

Midjourney

6. Eine Zeitung mit lesbaren Buchstaben

Schließlich haben sowohl Flux als auch Midjourney gute Arbeit bei der Darstellung von Text geleistet. Dies ist ein Bereich, in dem Bildsynthesemodelle oft Schwierigkeiten haben, aber es ist ein gutes Zeichen, dass ein Open-Source-Modell mit einem kommerziellen Modell wie Midjourney mithalten kann.

Midjourney

Gewinner: Flux

Flux vs Midjourney: Kosten

Kommen wir zu den Kosten: Flux ist kostenlos und Open Source, aber um das Modell lokal auszuführen, benötigen Sie leistungsfähige Hardware mit einer dedizierten GPU. Schließlich handelt es sich um ein Modell mit 12 Milliarden Parametern. Die beste Methode, um Flux auf lokaler Hardware zu nutzen, ist über Pinokio (Website). Laden Sie die App herunter und starten Sie mit Flux.

Darüber hinaus gibt es viele Anbieter, die die Generierung von Bildern mit dem Flux-Modell kostenlos ermöglichen. Allerdings sind diese oft mit begrenzten kostenlosen Credits verbunden, oder die Bildgenerierung kann je nach Systemauslastung einige Zeit in Anspruch nehmen.

Sie können HuggingFace besuchen (Website), um das Flux. 1 [dev]-Modell kostenlos zu nutzen. Außerdem können Sie fal.ai (Website) besuchen, wo LoRA-Modelle ebenfalls verfügbar sind, aber Sie erhalten zunächst nur Credits im Wert von 1 Dollar kostenlos. Danach müssen Sie basierend auf Ihrer Nutzung weitere Credits erwerben.

Midjourney hingegen ist kostenpflichtig und veranschlagt 10 US-Dollar pro Monat bei monatlicher Abrechnung. Der Vorteil hierbei ist jedoch, dass die Bildgenerierung recht schnell erfolgt und Ihnen eine benutzerfreundliche Oberfläche geboten wird.

Gewinner: Flux

Flux vs Midjourney: Funktionsumfang

Da Flux ein neueres Modell ist, bietet es standardmäßig nicht viele Funktionen zur KI-gestützten Bildbearbeitung. Es gibt jedoch einige Dienste wie BasedLabs (Website), die es ermöglichen, Bilder hochzuskalieren und das Seitenverhältnis anzupassen. Sie können auch wählen, wie viele Bilder Sie gleichzeitig generieren möchten. Wenn Sie ein technikaffiner Benutzer sind, können Sie mit Seed-Werten, Anzahl der Schritte und Rauschunterdrückungseinstellungen experimentieren.

Midjourney hingegen ist deutlich funktionsreicher und unterstützt viele Funktionen. Sie können beispielsweise das Seitenverhältnis festlegen sowie Ihre Ästhetik und Stilrichtung wählen. Sie können sogar ältere Midjourney-Modelle nutzen und durch die Raw-Option natürlichere Bilder erzeugen.

Darüber hinaus können Sie ein Bild nach der Erstellung hochskalieren, herauszoomen, weitere Details hinzufügen, Inpainting mit dem Lasso-Werkzeug durchführen, es umrahmen und vieles mehr. Im Grunde können Sie ein Bild durch die Ausführung neuer Aufforderungen modifizieren, was sehr nützlich ist. Für Inpainting- und Outpainting-Aufgaben bietet Midjourney derzeit mehr Werkzeuge und Steuerungsmöglichkeiten als Flux.

Gewinner: Midjourney

Flux vs Midjourney: Inhaltsangaben

Wenn Sie ein Künstler sind, legen Sie Wert darauf, dass der Dienst den Standard für Inhaltsnachweise unterstützt. Dieser hilft, Informationen über die Herkunft des Bildes herauszufinden und ob es verändert wurde. Leider unterstützen weder Midjourney noch Flux den Standard für Inhaltsnachweise. Diese Dienste fügen ihren generierten KI-Bildern keine überprüfbaren Metadaten hinzu.

Gewinner: Keiner

Damit schließen wir unseren Vergleich zwischen Flux und Midjourney. Ich bin sehr beeindruckt von dem Flux-Modell, das eine leistungsfähige und kostenlose Alternative zu Midjourney darstellt. Die Open-Source-Community kann auf dieser Basis aufbauen und Funktionen wie Inpainting und Outpainting hinzufügen. Das war es von uns. Wenn Sie Fragen haben, lassen Sie es uns in den Kommentaren wissen.