Test: DALL-E 2 Generator – Was hat er drauf? 

Wir haben den DALL-E 2 Generator, die neue KI-Technologie von OpenAI, mit unserem exklusiven Zugang ausprobiert und getestet. In diesem Artikel zeigen wir, was der Text-zu-Bild-Generator wirklich kann.
Teile diesen Beitrag

Wir haben vor ein paar Wochen Zugang zum DALL-E 2 Generator erhalten und die Technologie seitdem ausprobiert und getestet. Wenn du nicht weißt, was DALL-E 2 ist oder wie es funktioniert, dann kannst du unseren anderen Artikel über den DALL-E 2 OpenAI Text-Bild-Generator lesen, in dem wir all das erklären, was du über die neue Technologie wissen musst. 

In diesem Artikel wollten wir mehr darüber erfahren, wie der Image Generator Sprache versteht und wie sich verschiedene Text Prompts auf die von der KI generierten Bilder auswirken. Außerdem haben wir uns gefragt, wie der DALL-E 2 Generator in verschiedenen Bereichen wie Marketing und Produktdesign eingesetzt werden könnte, und welche Stärken und Schwächen er hat. Nachdem wir das Potenzial von DALL-E 2 erforscht haben, sind wir zu folgenden Ergebnissen gekommen: 

Wie der DALL-E 2 Generator Sprache versteht - Die Enten-Toaster-Studie

Eine unserer ersten Hypothesen war, dass der DALL-E 2-Generator wahrscheinlich keine Probleme haben würde, Bilder zu generieren, die man gleichermaßen im Internet finden kann. Nehmen wir zum Beispiel an, man möchte Bilder von süßen Enten generieren. Innerhalb weniger Sekunden bietet der DALL-E 2-Generator diese KI-generierten Bilder an:

dalle 2 entenschwarm
Quelle: OpenAI

Das sind in der Tat ein paar niedliche Enten, aber man kann leicht zu denselben Ergebnissen kommen, wenn man „Bilder von Enten“ in eine Suchmaschine eingibt. Lasst uns also ein wenig abstrakter und surrealistischer mit unserem Text Prompt werden. Anstatt Bilder von Enten zu generieren, wollten wir Bilder von einem Enten-Toaster erzeugen. Bei der Visualisierung der Ergebnisse für den Text Prompt „Duck-Toaster“ stellten wir uns vor, dass der DALL-E 2 Generator Bilder erzeugen würde, die sowohl die Eigenschaften einer Ente als auch die eines Toasters vereinen. Indem wir jedoch einfach nur das Wort „Duck-Toaster“ für unsere Text Prompt verwendeten, wurden die Ergebnisse der KI generierten Bilder negativ beeinflusst.    

Die künstliche Intelligenz war nicht in der Lage zu verstehen, was ein Enten-Toaster sein soll, also nutzte sie die Wörter in dem Text Prompt, die sie erkannte, wie z. B. Ente und Toast, um eine breite Palette verschiedener Bilder zu erzeugen. Hier zum Beispiel hat der DALL-E 2 Generator ein Bild von einer Ente mit zwei Stücken Toast erzeugt:

dalle 2 ente mit stück toast
Quelle: OpenAI

Und hier, in einer für die Ente unglücklichen Wendung des Schicksals, hat der Bildgenerator ein Bild von einer Ente erzeugt, die im Ofen gegrillt wird:

dalle 2 gerösteter hähnchenbraten
Quelle: OpenAI

Es wurde schnell klar, dass das Wort „Enten-Toaster“ nicht ausreichte, um die Bilder zu erzeugen, die wir im Sinn hatten. Daher wurden wir im nächsten Schritt etwas konkreter mit unserem Text Prompt und sagten der künstlichen Intelligenz, sie solle Bilder von einer Ente in Form eines Toasters (a duck shaped like a toaster) erzeugen. Mit dieser Aufforderung kam der DALL-E 2 Generator unseren Erwartungen ein wenig näher:

dalle 2 toaster mit entenkopf
Quelle: OpenAI

Der Bildgenerator hatte jedoch immer noch Probleme damit, die Eigenschaften einer Ente mit den Eigenschaften eines Toasters in Verbindung zu bringen. Dies führte zu einigen Fehlschlägen bei den von der KI generierten Bildern. Es wurden Bilder erzeugt, die einen normalen Toaster mit einem entenförmigen Stück Toast zeigten oder eine Entenmonstrosität, der einige maschinenähnliche Gliedmaßen gewachsen sind:

dalle 2 entenförmiger toast in toaster
Quelle: OpenAI
dalle 2 entenfigur mit toaster teilen
Quelle: OpenAI

Als Nächstes haben wir die Wörter in dem Text Prompt ausgetauscht, um zu prüfen, ob dies Auswirkungen auf die Ergebnisse hat. Statt „eine Ente, die wie ein Toaster geformt ist“ haben wir „ein Toaster, der wie eine Ente geformt ist“ (a toaster shaped like a duck) eingegeben, was zu folgenden Ergebnissen führte:

dalle 2 toaster mit entengesicht
Quelle: OpenAI
dalle 2 toaster mit entenkopf
Quelle: OpenAI

Mit dem Text Prompt „ein Toaster in Form einer Ente“ konnte der DALL-E 2 Generator Bilder erstellen, die die Attribute einer Ente und eines Toasters besser miteinander kombinierten, was bedeutet, dass die Reihenfolge der Wörter in dem Text Prompt wichtig ist. Wenn man dem Text Prompt außerdem einen bevorzugten künstlerischen Stil hinzufügte, wie z. B. „ein Toaster, der wie eine Ente geformt ist, japanische Farbkunst“ oder „ein Toaster, der wie eine Ente geformt ist, Ölmalerei“, konnte der DALL-E 2-Generator diese Stile problemlos einbinden: 

dalle 2 toaster mit entenkopf
Quelle: OpenAI
dalle 2 toaster mit entenkopf
Quelle: OpenAI

In einem letzten Schritt beschlossen wir, den Text Prompt noch weiter zu verkomplizieren, indem wir weitere Details wie Aktionen hinzufügten. Wir fügten zum Beispiel „fliegende Ente“ (flying duck) oder „ein Stück Toast halten“ (holding a piece of toast) zum bestehenden Prompt hinzu und der DALL-E 2 Generator begann, Attribute wie Flügel oder Toast in die Bilder einzubauen: 

dalle 2 flliegender toaster mit entengesicht und flügeln
Quelle: OpenAI
dalle 2 toaster mit entenkopf
Quelle: OpenAI
dalle 2 toaster mit entengesicht und flügeln
Quelle: OpenAI
dalle 2 ente hält stück toast
Quelle: OpenAI

Schließlich konnten wir dem Bild sogar Emotionen hinzufügen und den Enten-Toaster glücklich machen oder ihn weinen lassen:

dalle 2 toaster mit entengesicht
Quelle: OpenAI
dalle 2 entenförmiger toast in toaster
Quelle: OpenAI

Zusammenfassend lässt sich also sagen, dass der DALL-E 2 Generator, genau wie künstliche Intelligenz im Allgemeinen, nicht wirklich versteht, was er tut. Wir als Menschen müssen die KI in die gewünschte Richtung lenken. Bei dem DALL-E 2 Generator haben wir festgestellt, dass die Ergebnisse umso besser sind, je detaillierter der Text Prompt ist. Es kann hilfreich sein, die Reihenfolge der Wörter zu wechseln, um die Ergebnisse zu verbessern, und man kann Aktionen und Emotionen hinzufügen, um die Bilder dynamischer zu gestalten. Wenn man einen bestimmten Kunststil hinzufügen möchten, sollte man ihn am besten ganz am Ende des Text Prompts einfügen und durch ein Komma vom Rest des Satzes trennen. Das Schöne am DALL-E 2 Generator ist, dass man so lange damit herumspielen kann, bis man das gewünschte Ergebnis erzielt. 

Die Zukunft des DALL-E 2 Generators - Mögliche Anwendungsbeispiele

Nachdem wir gesehen haben, wozu der DALL-E 2 Generator imstande ist, haben wir uns gefragt, welche Einsatzmöglichkeiten die Technologie haben könnte und welches Potenzial sie für die Zukunft verschiedener Branchen birgt. Mit der Fähigkeit, Bilder aus Textbeschreibungen in verschiedenen Stilen zu generieren (einschließlich 3D-Modellen und fotorealistischen Bildern), könnte der DALL-E 2 Generator neue Ideen für eine Reihe von Produkten oder Dienstleistungen liefern:

Der DALL-E 2 Generator schafft Assoziationen im Sales Marketing.

Manche würden sagen, dass der wichtigste Aspekt des Sales Marketings darin besteht, seine Zielgruppe zu verstehen. Andere würden sagen, dass das Wichtigste das Etablieren einer starken Marke ist. Und wieder andere würden sagen, dass das Wichtigste die Generierung von Leads ist. Ein Aspekt, der jedoch auch nicht übersehen werden sollte, ist die Macht, die Bilder in der Marketingwelt haben.

Bilder sind im Sales Marketing wichtig, weil sie das Produkt oder die Dienstleistung visuell darstellen. Sie können dazu beitragen, den Umsatz zu steigern, indem sie bei der Zielgruppe Emotionen hervorrufen und bestimmte Assoziationen wecken, die die Menschen mit der Marke verbinden. Eine gute Marketingkampagne lebt von einzigartigem Bildmaterial. Hier sind zwei hypothetische Beispiele, wie der DALL-E 2 Generator für diesen Zweck genutzt werden könnte:

  • Wenn es sich bei dem Produkt, was verkauft werden soll, um eine Süßigkeit handelt, dann könnte der DALL-E 2 Generator verwendet werden, um eine bildhafte Werbung zu erstellen. Dies könnte beispielsweise ein mutiger Entdecker sein, der einen weiten Weg zurückgelegt hat, um die köstliche Süßigkeit zu probieren, und sie wie einen wertvollen Besitz für alle sichtbar hochhält:
dalle 2 siedler isst stück schokolade
Quelle: OpenAI
  • Wenn man einen Copywriting-Service anbietet, dann möchte man die Marke eventuell mit Werten wie Intelligenz, Kraft und Stolz assoziieren. In diesem Fall könnte man den DALL-E 2 Generator verwenden, um ein Werbeposter mit einer Löwin zu erstellen, die einen Schreibauftrag erledigt:  
dalle 2 löwin schreibt ein buch
Quelle: OpenAI

Fakt ist, dass man mit dem DALL-E 2 Generator eine Vielzahl kreativer und einzigartiger Bilder für Marketingkampagnen erstellen kann, die es einem ermöglichen, die Marke mit bestimmten Assoziationen zu verbinden und sie für potenzielle Nutzer und Kunden attraktiver zu machen. 

Der DALL-E 2 Generator sorgt für einen Vorteil im Content Marketing.

Es gibt viele wichtige Aspekte des Content Marketings, aber einige der wichtigsten sind die Erstellung hochwertiger Inhalte, die Anpassung der Inhalte an eine Zielgruppe und die Werbung für die Inhalte über verschiedene Kanäle. Durch die Erstellung hochwertiger Inhalte, die auf eine gewünschte Zielgruppe zugeschnitten sind, kann man das Unternehmen oder Produkt effektiv vermarkten und eine größere Anzahl von Menschen erreichen. Darüber hinaus kann man die Inhalte über soziale Medien, E-Mail-Marketing und andere Kanäle bewerben, um die Reichweite zu erhöhen und potenzielle Kunden oder Klienten weiter anzusprechen.

Das Schlüsselwort für Content Marketing ist definitiv „hochwertige Inhalte“, was verdeutlicht, dass die Inhalte sowohl einzigartig als auch ansprechend sein müssen. Ein wichtiger Vorteil bei der Erstellung einzigartiger und ansprechender Inhalte sind die visuellen Elemente, die die Menschen sehen, noch bevor sie den eigentlichen Inhalt gelesen haben.

Nehmen wir zum Beispiel an, wir haben einen Blog, in dem wir unserer Zielgruppe Inhalte über KI-Technologie anbieten möchten. Wenn wir Bilder einfügen wollen, die die Beziehung zwischen Menschen und KI-Technologie zeigen, sind die Möglichkeiten begrenzt. Man müsste entweder für einen Digital Artist bezahlen, Stockfotografie kaufen oder urheberrechtsfreie Bilder finden, die bereits in vielen anderen Artikeln verwendet wurden. Mit dem DALL-E 2 Generator könnte man jedoch kreativ werden und eine große Anzahl unverwechselbarer und einzigartiger Bilder erstellen, die zu jedem Inhalt passen. Hier sind einige Beispiele, die die Beziehung zwischen Menschen und KI-Technologie widerspiegeln:

dalle 2 roboter schreibt in buch
Quelle: OpenAI
dalle 2 roboter unterrichtet mensch mit buch
Quelle: OpenAI
dalle 2 kleiner robotor mit stift als arme
Quelle: OpenAI
dalle 2 kleiner roboter schreibt mit großem stift
Quelle: OpenAI

Auf diese Weise gehen einem die kreativen und originellen Bilder nie aus. Man kann zu allen Inhalten immer neue Bilder generieren und hinzufügen, um die Qualität des Contents zu steigern und außerdem eine Menge Zeit zu sparen. 

Der DALL-E 2 Generator revolutioniert das Produktdesign.

Bei der Produktgestaltung ist es wichtig, das Kundenerlebnis und die Art der Nutzung des Produkts zu berücksichtigen. Es ist auch wichtig, die Herstellbarkeit des Produkts zu prüfen und festzulegen, wie es produziert werden soll. Darüber hinaus sollte man nicht vergessen, dass das Aussehen des Produkts ebenfalls eine große Rolle spielt, denn das Design ist der allererste Aspekt, der den Kunden auffällt und welchen sie beurteilen.

Um ein kreatives Produktdesign zu entwerfen und es für die Produktion zu visualisieren, benötigen Designteams oft die Arbeit talentierter Digital Artists. Diese Künstler benötigen Ressourcen und Zeit für ihre Arbeit und können jeweils nur eine begrenzte Anzahl von möglichen Designvarianten vorzeigen. Der DALL-E 2 Generator könnte diesen Prozess jedoch revolutionieren, indem er Designteams die Möglichkeit gibt, verschiedene Designoptionen zu testen, indem sie sie einfach von der DALL-E 2 Technologie generieren lassen. 

Die Nachfrage für Sportschuhe ist zum Beispiel unglaublich hoch, aber dafür auch extrem umkämpft. Um die Kunden zu überzeugen, müssen die Schuhe nicht nur von hoher Qualität sein, sondern auch ein interessantes Design haben. Mit dem DALL-E 2 Generator kann man ganz einfach einen Text Prompt für ein bestimmtes Design eintippen und realistische Bilder erstellen. Hier sind einige Beispiele für den Prompt „Basketballschuhe im Stil des Maximalismus, Produktfoto“ (basketball shoes in the style of maximalism, product photo):

dalle 2 schwarzer sportschuh mit rotem design
Quelle: OpenAI
dalle 2 weißer sportschuh mit schwarzen design
Quelle: OpenAI

Das Produktdesign kann aber auch spezifischer sein, z. B. ein Regenbogenmuster auf einem Paar Turnschuhe:

dalle 2 sneakers mit regenbogen sohle
Quelle: OpenAI
dalle 2 sneakers mit regenbogen design
Quelle: OpenAI

Tatsächlich kann der DALL-E 2 Generator Bilder von Produkten erstellen, die nicht nur mögliche Designs visualisieren, sondern auch so realistisch sind, dass man sie als Produktfotos auf der Website des Unternehmens verwenden kann.  

Die Grenzen des DALL-E 2 Generators

Bei all den potenziellen Vorteilen, die der DALL-E 2 Generator zu bieten hat, haben wir uns schließlich gefragt, wo der Bildgenerator an seine Grenzen stößt. Eine der ersten Grenzen ist uns aufgefallen, als wir versucht haben, realistische Bilder von Menschen zu generieren, wie zum Beispiel im Rahmen eines Stockfotos. Da der DALL-E 2 Generator Bilder aus mehreren vorhandenen Quellen erstellt, sehen die Gesichter der Personen in den von der KI generierten Bildern oft verzerrt oder plastisch aus. 

dalle 2 eltern und sohn im auto
Quelle: OpenAI

Ein weiterer Aspekt, der uns sehr schnell auffiel, war, dass der DALL-E 2 Generator noch nicht gelernt hat, richtig zu schreiben. Statt der Wörter „Copywriting“ und „Kaffee“ generiert die KI lediglich ein Wirrwarr von Buchstaben: 

dalle 2 copywriterin trinkt kaffee am laptop
Quelle: OpenAI

Dies macht es auch unmöglich, Bilder mit Infografiken oder Markennamen zu erstellen. Wenn man zum Beispiel versucht, eine Infografik über Gemüse und gesunde Ernährung zu erstellen, sieht das Design an sich gut aus, aber der Text ist unlesbar. Dasselbe gilt für den Versuch, einen Markennamen einzubinden. Wenn man versucht, eine Werbung für die Credit Suisse Bank zu erstellen, sieht das Design zwar gut aus, aber der Name der Marke ist unleserlich:

dalle 2 gemüse schema
Quelle: OpenAI
dalle 2 poster alpenschokolade
Quelle: OpenAI

Letztendlich haben wir festgestellt, dass man bei der Verwendung des DALL-E 2 Generators vorsichtig sein muss, da die Richtlinien und Regeln sehr streng sind. Wenn man ein Wort eintippt, das gegen den Inhalt verstößt, selbst in einem anderen Kontext, wird es von OpenAI als Verstoß wahrgenommen. Als wir zum Beispiel versuchten, die Mario-Figur „Bullet-Bill“ zu erzeugen, meldete der Bildgenerator das Wort „Bullet“ als Verstoß gegen die Richtlinien. Wenn zu viele dieser Verstöße auftreten, wird das Konto automatisch gesperrt. 

Wie geht es mit dem DALL-E 2 Generator weiter?

Bislang hat nur eine begrenzte Anzahl von Nutzern Zugang zum DALL-E 2 Generator, da sich dieser noch im Stadium einer geschlossenen Betaversion befindet. Es gibt jedoch auch kostenlose Versionen wie DALL-E Mini, die versuchen, den Erfolg von DALL-E 2 mit einem Open-Source-Modell der Technologie zu replizieren, das für jeden zugänglich ist. Die Qualität von DALL-E Mini ist vielleicht nicht so gut wie die von DALL-E 2, aber es befindet sich noch im Training und wird ständig verbessert. 

Interessanterweise fordern Konkurrenten wie Imagen, Googles Text-zu-Bild-Verarbeitungsmodell, den Bildgenerator von OpenAI heraus, indem sie ein „beispielloses Maß an Fotorealismus und ein tiefes Sprachverständnis“ versprechen. Ein weiterer Konkurrent ist wohl MidJourney, welches sich wie DALL-E 2 und Imagen noch in der closed Beta befindet und dazu auch noch kostenpflichtig ist.  Dalle-Flow ist hingegen eine weitere öffentliche und kostenlose Alternative und wurde von den Machern von JinaAI programmiert. Der Wettbewerb zwischen verschiedenen Marken von Text-zu-Bild-Generatoren könnte die Entwicklung dieser Technologie beschleunigen und Unternehmen dazu veranlassen, früher auf eine Open-Access-Software umzusteigen.

Alles in allem kann man sagen, dass der DALL-E 2 Generator eine vielversprechende Zukunft vor sich hat, da OpenAI plant, die DALL-E 2 Technologie weiter zu verbessern und zu entwickeln. Der DALL-E 2 Generator könnte in naher Zukunft in der Lage sein, noch realistischere und präzisere Bilder zu erstellen. Dabei muss man erwähnen, dass er ausgebildete Digital Artists wahrscheinlich nicht vollständig ersetzen wird, da diese sich auf spezifische technische Begriffe und kunsthistorische Wörter beziehen können. Dies macht ihre Ergebnisse spezifischer und verleiht ihnen mehr Kontrolle als jemand, der nur versucht, etwas „Cooles“ mit dem DALL-E 2 Generator zu kreieren.

Letztendlich könnte eine interessante zukünftige Entwicklung die Verschmelzung von Text-Bild-Generatoren wie DALL-E 2 und anderen KI-Technologien wie GPT-3 Textgeneratoren sein, die bereits weit verbreitet sind. GPT-3 Textgeneratoren können eine Menge. Sie können Menschen beim Schreiben helfen, indem sie Vorschläge und Ideen liefern. Sie können uns auch bei unserer Recherchen unterstützen, indem sie Informationen finden und strukturieren. Durch die Verbindung dieser Textgeneratoren mit der DALL-E 2 Technologie wäre die KI zukünftig in der Lage, ganze Texte zusammen mit einzigartigen, von der KI generierten Bildern zu erstellen. Was ein GPT-3 Textgenerator an sich schon alles kann, kannst du mit neuroflash herausfinden. Mit unserem kostenlosen Textgenerator kannst du über 80 verschiedene Textarten in verschiedenen Sprachen und erstellen, ohne dafür ein Abo abschließen zu müssen. 

Generiere einzigartige KI Bilder mit neuroflash

Durch die Möglichkeit, Bilder aus Text zu generieren, wird das Potenzial der künstlichen Intelligenz als Ressource deutlich. Dies ist ein großartiger Fortschritt, der dank der modernen Technologie erzielt wurde. Deshalb verbindet neuroflash nun den Nr. 1 deutschsprachigen Textgenerator mit einer neuen Funktion, der Text zu Bild Generation. Damit ist neuroflash die erste Firma im DACH-Raum, die ihren Kunden die Möglichkeit bietet, KI Bildgenerierung selbst kostenlos auszuprobieren. 

Wie kannst du mit den KI-generierten Bildern von neuroflash Geld verdienen und sie für dein Unternehmen nutzen? Ganz einfach:

 

  • Bücher mit geringem Inhalt
  • Covers für Bücher, Lieder, Comics, E-Books, …
  • Illustrationen für Gute-Nacht-Geschichten, Bücher, Comics…
  • Print-on-Demand-Bilder oder Postkarten
  • Einfache Stockbilder für Blogs (z. B. Food-Blogs)
  • NFTs
  • Präsentationen & Foliendateien
  • Bilder für Social-Media-Posts, Newsletters
  • Inspirationen für Landingpage-Designs, Produktdesigns

Tipp: Kombiniere neuroflash mit Photoshop oder anderen Programmen:


  • Verwende Photoshop und vergrößere unsere Bilder mit Preserve Details 2.0 von 72 dpi auf 300 dpi.
  • In der neuesten Version von Photoshop (Beta) gibt es die Funktion „Fotowiederherstellung“ unter „Neuronale Filter“, die in der Regel verbessern sie die Darstellung denr Augen und anderen seltsamen Gesichtszügen.
  • Führe dann noch einige grundlegende Kurven- und Farbkorrekturen durch und helle die Augen ein wenig auf.

Schreibe effektive Marketingtexte mit neuroflash's KI.
10x schneller.

Generiere auch lange Texte mit Leichtigkeit.

Mehr kostenlose Ressourcen

Content Strategie

Beherrscht ChatGPT Deutsch? 

In diesem Artikel werden wir uns mit der Frage beschäftigen, ob ChatGPT Deutsch beherrscht. Dafür werden wir zunächst einmal klären, was ChatGPT ist und ob es für die deutsche Sprache überhaupt geeignet ist. Danach zeigen wir die Funktionsweise und die Nachteile von ChatGPT Deutsch auf. Zum Schluss stellen wir eine Alternative zu ChatGPT Deutsch vor.

Content Strategie

Neuer Professional Plan – ChatGPT Preis

Was ist der neue ChatGPT Preis und was bringt er? Wie geht es mit dem beliebten Chatbot weiter? In diesem Artikel erfährst du, was sich mit dem neuen Preis ändert und wie du auf diese Änderungen reagieren kannst.

Deine magische Feder in Aktion

Schritt 1: Wähle einen Texttyp aus
Schritt 2: Briefing eingeben
?

Die besten deutschen Textinspirationen - geschrieben von KI

Gutes Schreiben war noch nie leichter

KI-Tester-neuroflash-popup

Nutze unsere «magische Feder», um zeitlich
unbegrenzt neue Werbetexte zu generieren.