Künstliche Intelligenz verändert die Kunstwelt auf bemerkenswerte Weise. Eine der faszinierenden Anwendungen von KI im Kunstsegment ist die Verwendung von deskriptiven Kunstgeneratoren. Diese Generatoren sind in der Lage, Bilder zu untersuchen und zu interpretieren und basierend auf ihrer Analyse völlig neue Kunstwerke zu generieren.
In diesem Artikel diskutieren wir drei solcher KI-Kunstgeneratoren: MidJourney, Stable Diffusion und Microsoft Bing Image Creator, und welcher von den dreien die besten Ergebnisse auf der Grundlage von Eingabeaufforderungen erzielt.
MidJourney
Mitte der Reise, gegründet von David Holz, ist ein KI-Kunstgenerator, der maschinelles Lernen verwendet, um Muster und Merkmale in bestehenden Kunstwerken zu identifizieren, die dann zur Erstellung neuer Stücke verwendet werden können.
MidJourney trat am 12. Juli 2022 in die Open Beta ein. Vor dem Start von MidJourney war Holz Mitbegründer von Leap Motion, einem Startup, das Benutzeroberflächen durch den Einsatz von Videoaufnahmen und Handgesten verändert hat. 2019 verkaufte er Leap Motion an Ultrahaptik.
Während MidJourney immer beliebter wird, hat Holz seine Erkenntnisse über Technologie und deren Einfluss auf Kunst und Gesellschaft geteilt. Holz betrachtet Künstler als Kunden von MidJourney, nicht als Konkurrenten, und glaubt, dass die Plattform mehr Kreativität und Experimente in der Ideenfindungsphase ermöglichen kann.
Es gibt jedoch Bedenken hinsichtlich einer möglichen Urheberrechtsverletzung durch das Trainingsset von MidJourney, das urheberrechtlich geschützte Werke anderer Künstler enthalten kann.
Holz betont, dass MidJourney darauf ausgelegt ist, die menschlichen Fähigkeiten zu verbessern, anstatt sie zu ersetzen. Er vergleicht es mit Autos und erklärt, dass wir uns nicht die Beine abschneiden sollten, nur weil Autos schneller sind als Menschen.
Durch die Verwendung der KI-Bildgenerierung von MidJourney können Künstler neue Möglichkeiten erkunden und zahlreiche Ideen generieren, bevor sie ihre eigenen Werke erstellen.
Stable Diffusion

Stable Diffusion ist ein Open-Source Modell des maschinellen Lernens die Bilder aus Text generieren, Bilder basierend auf Text modifizieren oder Details in Bildern mit niedriger Auflösung oder wenig Details ausfüllen können. Es wurde mit Milliarden von Bildern trainiert und kann Ergebnisse liefern, die mit denen vergleichbar sind, die Sie von DALL-E 2 und MidJourney erhalten würden.
Emad Mostaque, Gründer und Geschäftsführer von Stabilität KI, ist das Unternehmen, das für Stable Diffusion verantwortlich ist. Stable Diffusion ist ein latentes Diffusionsmodell, das von der entwickelt wurde CompVis Group an der LMU München und wurde von Patrick Esser und Robin Rombach entworfen, die zuvor die Modellarchitektur für latente Diffusion erstellt haben, die von Stable Diffusion verwendet wird.
Eine Zusammenarbeit zwischen Stability AI, CompVis LMU, Runway, EleutherAI und LAION hat Stable Diffusion der Öffentlichkeit zugänglich gemacht.
Stabile Diffusion kann auf verschiedenen Plattformen bereitgestellt werden, einschließlich Windows- und Apple-Geräten. Durch die Bereitstellung auf dem Gerät in einer App kann die Privatsphäre der Benutzer geschützt werden, was einem serverbasierten Ansatz vorzuziehen ist.
Microsoft Bing Image Creator

Microsoft enthüllte ein neues Tool namens Bing Image Creator, mit dem Benutzer ihre eigenen Bilder direkt in Microsoft Edge erstellen können. Das Unternehmen hat eine Reihe von Creator-Tools herausgebracht, die darauf ausgelegt sind, Kreativität und Selbstdarstellung zu fördern. Das Tool ermöglicht es Benutzern, personalisierte Bilder zu erstellen, um ihre Lebensaktualisierungen zu teilen oder für andere Zwecke, die sie benötigen.
Benutzer können ganz einfach über die Seitenleiste von auf den Image Creator zugreifen Microsoft Edge. Microsoft hat proaktive Maßnahmen ergriffen, um sicherzustellen, dass das Tool verantwortungsbewusst verwendet wird und die Verbreitung anstößiger Inhalte nicht erleichtert.
Das Unternehmen hat eine Inhaltsrichtlinie festgelegt, die die Verwendung von Image Creator für bestimmte Fälle verbietet, und Benutzer können Verstöße gegen diese Richtlinie melden. Darüber hinaus hat Microsoft eine Technologie implementiert, um potenzielle Verzerrungen anzugehen, die in der generativen Bildtechnologie auftreten könnten.
In diesem Artikel werden wir uns auf eine Reise begeben, um die Ergebnisse jedes beschreibenden KI-Bildgenerators zu bewerten, wenn er mit identischen Texteingabeaufforderungen aufgefordert wird.
Aufforderung 1: Moderner Weihnachtsmann auf einem Schlitten, der an einem warmen, sonnigen Tag auf einer Autobahn von Rentieren gezogen wird



Aufforderung 2: Eine Nahaufnahme eines Tieres mit großen Augen, das seine Unschuld und Niedlichkeit einfängt



Aufforderung 3: Ein menschlicher Astronaut, der die Landung eines neuen Planeten spielt, wird von feindlichen außerirdischen Kreaturen willkommen geheißen, die ihre Waffen ziehen



Aufforderung 4: Moderne abstrakte Kunst eines Buchcovers eines Romans mit Sitz in New York City in kräftigen, leuchtenden Farben



Aufforderung 5: Ein Mann entscheidet sich zwischen zwei Tellern – einem mit Pizza und einem mit Cheeseburger darauf



Aufforderung 6: Ein verwundeter Krieger, der mit einem Schwert in der Hand auf seinem Pferd auf einem schneebedeckten Berg reitet



Aufforderung 7: Ein abstraktes Bild mit verschiedenen Schattierungen, das die Bewegung und den Fluss von Wasser zeigt



Aufforderung 8: Lachs in einem Fluss mit üppigen grünen Bäumen im Hintergrund



Aufforderung 9: Ein Glas Wasser auf einem Tisch mit einer Zitrone, die von einer Hand hineingepresst wird



Aufforderung 10: Blick auf den Horizont in einer Wüste aus der Sicht von Menschen, die darin auf einem Elefanten reiten



Aufforderung 11: Ein Wald, in dem Papiergeld auf Bäumen wächst und Vögel aus Münzen bestehen



Aufforderung 12: Schüssel mit Ramen, Cel-Shading, Abendbeleuchtung, fotorealistisch



Aufforderung 13: Elon Musk ist arm und arbeitslos



Urteil
Bei der Auswertung der Ergebnisse von MidJourney, Stable Diffusion und Bing Image Creator wird deutlich, dass es keinen endgültigen Gewinner gibt.
Jeder Generator interpretiert Eingabeaufforderungen auf unterschiedliche Weise, wobei Ähnlichkeiten in den Ausgaben von Bing Image Creator und MidJourney zu finden sind. Stable Diffusion ist effizient, wenn Eingabeaufforderungen klare Beschreibungen haben, aber Wörter oft zu wörtlich nehmen. Während MidJourney und Bing Image Creator im Allgemeinen erfolgreich sind, liefern sie gelegentlich Ergebnisse, die nicht den Eingabeaufforderungen entsprechen.
Insbesondere ist Bing Image Creator vorsichtig bei der Generierung missbräuchlicher oder aufreizender Ausgaben und gibt eine Warnmeldung aus, wenn er aufgefordert wird, ein Bild eines armen und arbeitslosen Elon Musk zu erstellen. Die Übernahme solcher Schutzmaßnahmen durch Microsoft ist lobenswert.
In der Zwischenzeit erzeugte die Expertise von MidJourney über neuronale Netzwerke ein Bild eines mittellosen und verlassenen Elon Musk. Daraus kann geschlossen werden, dass jeder Generator auf seine jeweilige Benutzerbasis ausgerichtet ist.
Sie können auch die besten erkunden KI-Bildgeneratoren für erstaunliche Bilder in Sekunden.