DALL-E 2: De nieuwe tekst naar beeld generator van OpenAI

Gebruik AI om sneller goed presterende marketingteksten te schrijven. 10x sneller.

Test neuroflash's AI copywriter met het gratis plan.
In deze blog leer je wat OpenAI's DALL-E 2 is en hoe de tekst naar beeld generator een revolutie in de tech wereld teweeg zal brengen.
Share This Post

We hebben op ons Blog al een aantal artikelen over het thema “künstliche intelligentie” verzameld. Zo hebben we zum Beispiel darüber geschrieben, hoe GPT-3 functioneert en hoe Tekstgeneratoren de Inhalte verbessern können. Doch nun schlägt eine neue Innovation in der Welt der KI Wellen und das ist der Text zu Bild Generator DALL-E 2. Hoe gaat het met DALL-E 2? Hoe functioneert deze nieuwe Technologie? En hoe kun je ze vielleicht zelf voor je voeden? Dit en nog veel meer heb je in dit artikel beschreven!

Wat is DALL-E 2?

DALL-E 2 is de nieuwe, revolutionaire Text zu Bild Generator van OpenAI. Hij maakt het voor Nutzern mogelijk om Bilder te maken op basis van ingegeven tekstfragmenten. De Generator gebruikt een künstliche intelligentie, GPT-3, die in staat is de betekenis van woorden (natuurlijke taal) te begrijpen en ze te verwerken in Bildern wiederzugeben. Door deze generatoren te gebruiken kunnen gebruikers hun eigen creatieve ideeën omzetten in prachtige foto’s.

DALL-E 2 kan beelden creëren op basis van realistische objecten of tekstinvoer interpreteren die in werkelijkheid niet bestaat. Als u bijvoorbeeld een realistische scène wilt genereren, is dat voor DALL-E 2 geen probleem:

https://arxiv.org/abs/2204.06125

Wil je stattdessen ein Propagandaposter von Napoleon Bonaparte als Katze mit einem Stück Käse in der Hand erstellen? Dann kan dir DALL-E 2 auch hier weiterhelfen:

https://arxiv.org/abs/2204.06125

Het faszinierende aan DALL-E 2 is dat het zich bij deze tekst concentreert op een relatief nieuwe technologie, die pas in april 2022 bekend werd. DALL-E 2 is hierbei gebaseerd op zijn Vorgänger DALL-E, die in januari 2021 werd veruiterlijkt en waarmee je fotorealistische foto’s uit tekstfragmenten kunt maken. Deshalb is het interessant, meer over de Technologie achter DALL-E 2 te weten te komen.

Hoe werkt DALL-E 2?

De DALL-E 2 Text to Image Generator maakt gebruik van natuurlijke taalverwerking en kunstmatige intelligentie om de informatie uit een tekstvraag te verwerken en in een groot aantal afbeeldingen te verwerken. Op die manier kan DALL-E 2 verschillende attributen in een beeld controleren, zoals in fotobewerking. De tekst-naar-afbeelding generator kan bijvoorbeeld objecten of artistieke stijlen in een afbeelding veranderen. Maar hoe slaagt DALL-E 2 erin om dit beeldbegrip te creëren en te implementeren? Het antwoord hierop is eerlijk gezegd nogal ingewikkeld, maar ik heb me voor dit blogartikel in de materie verdiept en zal proberen het zo goed mogelijk uit te leggen.

Allereerst moet je de artistieke intelligentie trainen. Door Deep Learning zult u beseffen welke verbindingen u moet herstellen om tot een eindproduct te komen. Voor dit probleem gebruikt DALL-E 2 de reeds bestaande technologie van CLIP (Contrastive Language-Image Pre-training), die ook door OpenAI is ontwikkeld. CLIP maakt het mogelijk tekstomschrijvingen te vinden die bij een afbeelding passen, op basis van de tekst-beeldparen op het Internet. Het DALL-E 2 proces bestaat uit twee delen:

https://arxiv.org/abs/2204.06125

In het bovenste deel van de foto zie je het KI Trainingsprozess van CLIP. DALL-E 2 maakt gebruik van het CLIP model om tekst-afbeeldingen te maken en een verborgen code te herkennen.

In het bovenste deel van de foto’s wordt de tweede stap beschreven, waarbij de tekstprompt naar een nieuwe foto gewandeld wordt. Im zweiten Schritt wird der Latente Code der Text-Bild Paare genommen und durch einen sogenannten Prior geschickt. Nu wordt een Generator namens Decoder gegenereerd om nieuwe variaties op het schilderij te maken, die met de gegeven tekstprompt kunnen worden opgewekt.

De nieuwe afbeeldingsvariant wordt dus in een paar stappen gemaakt:

 

  1. Eerst wordt een tekstvraag in de tekstcoder ingevoerd. De tekstcoder wordt getraind door het CLIP-model om tekst-beeldparen te coderen.
  2. Vervolgens wordt een zogenaamde prior gebruikt om een verband te leggen tussen de CLIP-tekstinbedding (op basis van de tekstprompt) en een CLIP-beeldinbedding die de informatie van de tekstprompt weergeeft.
  3. Tenslotte wordt een decoder gebruikt om nieuwe beeldvariaties te genereren die de ingevoerde tekstprompt visueel weergeven.

Zo kunnen ze met verschiedene Tekstingangen een Vielzahl aan ongelijksoortige Foto’s uitwerken:

https://mlearning.substack.com/p/what-i-recommend?s=r

De technologie achter DALL-E 2 is wonderbaarlijk ingewikkeld en als ik nog maar net een wetenschapper of een expert op het gebied van KI ben, is die uitleg ook heel goed te begrijpen. Tatsächlich weiß niemand so genau, wieso derartige Generatoren so gut funktionieren oder was die künstliche Intelligenz im Endeffekt lernt. Es gibt keine fundamentale Theorie für das Phänomen des Deep Learnings, die alles erklären kan. De netwerken, die van KI’s gemaakt worden, zijn te groot en te ingewikkeld, zodat we ze met onze huidige kennis veel beter kunnen begrijpen. Alles wat we op dit moment weten, is dat DALL-E 2 door Deep Learning niet alleen individuele voorwerpen kan herkennen, maar ook de relatie tussen die voorwerpen.

Wat is er nieuw aan DALL-E 2?

Zoals reeds vermeld, is de DALL-E 2 beeld-naar-tekst generator de opvolger van DALL-E. Dit roept natuurlijk de vraag op wat er nieuw is in DALL-E 2 en wat de technologie kan doen. Het antwoord is dat DALL-E 2 veel nieuwe functies en verbeteringen biedt:

  • De DALL-E 2  Beeld naar Tekst Generator maakt foto’s van hoge kwaliteit. DALL-E 2 baseert zich hierbei op een 3.5 Milliarden Parameter Modell en verwendet een ander 1.5 Milliarden Parameter Modell, om de Auflösung der digital erstellten Bilder te maximaliseren. Dabei ist DALL-E 2 auch schneller als sein Vorgänger, wenn es darum geht, Bilder zu verarbeiten.
  • DALL-E 2 genereert realistischere Fotos. De foto’s van DALL-E 2 zijn veelzijdiger en hebben een complexe achtergrond en realistische lichtverschijnselen en reflecties. Damit sind die Endprodukte von DALL-E 2 den Bildern des Vorgängers weit voraus, da DALL-E lediglich catoonartige Bilder erstellen konnte, die oft einen schlichten Hintergrund besaßen.
  • Een revolutionaire nieuwe feature van DALL-E 2 is ook een functie genaamd Inpainting. Met deze functie kan de DALL-E 2 Tekst naar Bild Generator verschillende fotobewerkingsprocedures op een beeld toepassen. Door de tekstinvoer kan de gebruiker de veranderingen in het beeld beter weergeven en een speciaal gebied in het beeld wijzigen, dat hij wil bewerken. Zo kan men met DALL-E 2 Objekte einem bestimmten Bereich des Bildes hinzufügen, wobei Schatten, Reflexionen und Texturen durch die künstliche Intelligenz bedacht werden.
https://openai.com/dall-e-2/
https://openai.com/dall-e-2/
  • De DALL-E 2 Tekst naar Beeld Generato heeft een grote verscheidenheid aan Lokalen Zinnen. DALL-E 2 kan Objekte in einem Bild und deren Beziehung zueinander besser erkennen. Het programma weet hoe de beste pixel een beste kleur kan bezitten en kan zo de voorwerpen in het schilderij ordenen. Zum Beispiel realisiert DALL-E 2, dat der Boden im unteren Bild Reflexionen widerspiegelt und wenn ein Objekt hinzugefügt wird, wird automatisch eine Reflexion dieses Objektes ergänzt.
https://openai.com/dall-e-2/
  • DALL-E 2 heeft een grote verscheidenheid aan wereldse zinnen. De Tekst Bild Generator begrijpt, wat in een ander schilderij past en draagt belangrijke voorwerpen, die in de Tekst Invoer geanalyseerd werden, bij het maken van nieuwe variaties. Het klonk misschien eenvoudig en offensichtlich, maar het is een zeer ingewikkelde opdracht voor een Maschine, die aan het eind alleen verschiedene kleurige pixels vertoont.
  • Met dem DALL-E 2 Text zu Bild Generator kunnen verschiedene Variationen eines Bildes in unterschiedlichen Stilrichtungen erstellen. DALL-E 2 is in der Lage, Bilder in unterschiedlichen Stilrichtungen wiederzugeben. Dabei kan das generierte Bild eine impressionistische Version des Originals darstellen:
https://openai.com/dall-e-2/
  • Of DALL-E 2 blijft grotendeels trouw aan het origineel en brengt slechts kleine stijlwijzigingen aan, zoals de oriëntatie van het object:
https://openai.com/dall-e-2/
  • Eindelijkkan je bij DALL-E 2 ook een ander beeld dan het origineel bekijken en die künstliche Intelligenz kombiniert die beelden samen in een nieuwe variatie voor je.
  • De DALL-E 2 Beeld naar Tekst Generator is preciezer en kan beeldcategorieën beter scheiden. In de loop van de ontwikkeling van DALL-E 2 werd ontdekt dat het algoritme van DALL-E 2 niet geschikt was voor foutieve Zuordnungen. Als het systeem getraind werd met een foto van een appel, die als Oranje beschreven werd, dan werd de künstliche intelligentie gemanipuleerd en het resultaat verfraaid. In DALL-E 2 werd dit probleem opgelost.

De mogelijke nadelen van de DALL-E 2 Tekst naar Beeld Generator

Tot zover klinkt de technologie van de DALL-E 2 tekst-naar-beeld generator erg overtuigend. Maar toch brengt een ongebruikelijke Technologie ook problemen met zich mee en de gebruikers moeten zich ervan bewust zijn dat niet alle problemen opgelost zijn:

  • De toewijzing van fysieke kenmerken is niet altijd correct. DALL-E 2 slaagt er niet altijd in de juiste fysieke attributen aan de objecten in een beeld toe te kennen. Als u bijvoorbeeld een afbeelding genereert met een rode kubus bovenop een blauwe kubus, kan de DALL-E 2 beeldgenerator de grootte van de kubussen verwarren:
https://arxiv.org/abs/2204.06125
  • Een nog groter nadeel, dat de DALL-E 2 Text zu Bild Generator tot nu toe ondervond, is dat hij geen verständlichen Teksten in zijn Bildern kan genereren. Wil je zum Beispiel ein Schild mit dem Wort Deep Learning erstellen, dann zijn die Resultate:
https://arxiv.org/abs/2204.06125
  • De DALL-E 2 Tekst naar Beeld Generator heeft het voor de zwakkeren moeilijk om details in complexe zinnen te verwerken. Als je een foto van Times Square in New York wilt maken, dan krijg je een mooie foto, maar ik heb geen herkenbare details:
https://arxiv.org/abs/2204.06125
  • Een geweldig aspect van DALL-E 2 is dat de kunstmatige intelligentie wordt getraind met gegevens van het internet. Zoals we allemaal weten, is het Internet niet altijd de beste plaats om informatie te vergaren. Maar de foto’s van DALL-E 2 zijn ook niet helemaal in de juiste verhouding tot de werkelijkheid. Wil men zum Beispiel Bilder von Bauarbeitern generieren, zo werden ausschließlich Bilder mit männlichen Arbeitern erstellt. Ändert man die Beschäftigung von Bauarbeiter auf Stewardess, werden alleen Frauen angezeigt:
https://github.com/openai/dalle-2-preview/blob/main/system-card.md#restrictions
  • Deze kunstmatige intelligentievooringenomenheid betekent dat de inhoud eentonig of zelfs problematisch kan zijn. Gegenereerde beelden kunnen bevooroordeeld zijn ten aanzien van onderwerpen als nationaliteit, huidskleur, seksualiteit, geslacht en godsdienst. Wil de mens een Bild von einer Hochzeit maken, zo wordt een heteronormatieve Bild van een traditioneel christelijke Hochzeit met een westerse Ehepaar en westerse Hochzeitsgästen gegenereerd:
https://github.com/openai/dalle-2-preview/blob/main/system-card.md#restrictions
  • Aangezien DALL-E 2 nog een relatief nieuwe technologie is, werkt het tot nu toe alleen in het Engels. Personen die het Engels niet machtig zijn, zullen dan ook moeilijkheden ondervinden bij het maken van tekstprompts en het ten volle benutten van het programma.

Welke gevaren kunnen voortvloeien uit DALL-E 2?

Helaas brengen innoverende technologieën zoals DALL-E 2 vaak ook gevaren met zich mee. Een van de grootste zorgen voor ontwikkelaars is het mogelijke misbruik van de technologie, daarom is DALL-E 2 in dit stadium niet open source en kan het alleen worden gebruikt met een uitnodiging van de ontwikkelaars. Wij begrijpen dat u deze geweldige nieuwe technologie zo snel mogelijk in handen wilt krijgen, net als wij. Maar zoals het lijkt, is de lijst van winkels voor particulieren niet erg lang:

Er is echter een reden voor het lange wachten. Bestaande technologieën zoals Deep Fakes hebben aangetoond dat programma’s die kunnen worden gebruikt om beelden te manipuleren, ook kunnen worden misbruikt. Ze kunnen bijvoorbeeld worden gebruikt om valse beelden te maken die andere mensen schaden.

De DALL-E 2 Tekst naar Beeld Generator heeft nu een aantal Sicherheitsvorkehrungen getroffen, die helpen om jeglichen Missbrauch te verhindern. Invoerfilters kunnen jongeren hinderen bij het kiezen van de beste soorten schunnige afbeeldingen (zoals seksueel getinte of suggestieve foto’s van kinderen, gewaltvolle foto’s, politiek getinte foto’s, etc.). Alle Tekstprompts, die DALL-E 2 maakt, moeten zich aan strenge Richtlinien houden. Om er zeker van te zijn dat DALL-E 2 niet misvormd kan worden, om gewaltvolle en gefüllte Inhalte zu erstellen, werden de Waffen uit de KI Datenbank naar het buitenland gebracht.

OpenAI heeft gezegd dat de DALL-E 2 Text zu Bild Generator irgendwann als Open Source Versie voor alle Nutzers te gebruiken is, maar de ontwikkelaars zijn verbaasd over hun eigen verantwoorderlijkheid. Deswegen gaat OpenAI in de val van DALL-E 2 lieber mit Vorsicht vor, bis alle Gefahren wurden eliminiert.

We hebben DALL-E 2 geprobeerd!

neuroflash is een van de gelukkige gebruikers, die een testzugang naar DALL-E 2 hebben en daardoor gratis tot vijfhonderd tekstfragmenten per dag kunnen genereren. Natürlich habe ich direkt losgelegt, um die neue Technologie auf die Probe zu stellen und ich bin wirklich davon begeistert! Het aantal schilderijen dat je met DALL-E 2 kunt maken, is geweldig. Zo kan men verschillende Stilrichtungen gebruiken en ook de context van de nieuwe schilderijen begrijpen. Als u bijvoorbeeld een albumcover wilt maken, moet u “album cover art” toevoegen aan de prompt:

OpenAI

Een grote vraag, die mij bezighoudt, is, of je ook foto’s van bekende personen kunt maken. Es ist nicht möglich, realistische Bilder von berühmten Menschen zu erstellen (aufgrund der Gefahr von Fake Bildern). DALL-E 2 kan echter ook foto’s met mensen maken, die de karakters van de berühmten personages uitvergroten, als er maar sprake is van een gelijke behandeling. Hier zie je zum Beispiel een foto van Oprah, hoe ze over een paar treuren voor een dinosauriër vliegt:

OpenAI

Of hier is een foto van Taylor Swift, hoe ze een oktopus maakt:

OpenAI

Je kunt de nieuwe foto’s ook in de computer bewerken, als je een deel van de foto’s bekijkt en dan het gewünschte nieuwe foto beschrijft. Je kunt ook variaties op een generiek schilderij maken, zodat je nog meer opties kunt kiezen. Jedoch ist es so, dass hierbei Details verloren gehen können. In deze variatie op de Taylor Swift foto’s, werd de Oktopus op beispielsweise ongevolld door een schuine streep:

OpenAI

Een positieve ervaring was, dat de mögliche teksten in de algemene afbeeldingen toch genuanceerder en slechter zijn dan gedacht. Als men eenvoudige woorden gebruikt, kan de KI die weitestgehend korrekt generieren:

OpenAI

Over het algemeen moet je je afvragen of de tekstprompts gedetailleerd en echt zijn. Als je bijvoorbeeld een boksgevecht tussen een pinguin en een robbe genereert en de prompt “boksgevecht” gebruikt, dan krijg je dit resultaat:

OpenAI

Als u in plaats daarvan de term “boxing match” invoert, krijgt u het gewenste beeld:

OpenAI

Alles in het algemeen lijkt erop te wijzen dat DALL-E 2 een verblüffende nieuwe technologie is, die de menselijke creativiteit geen grenzen geeft. Ich bin mir sicher, dass sobald DALL-E 2 veröffentlich wird, viele Menschen die Technologie auf verschiedenster Art und Weise nutzen können.

Hoe kan men DALL-E 2 gebruiken?

Natuurlijk, DALL-E 2 brengt niet alleen gevaren, maar ook prachtige nieuwe mogelijkheden! De DALL-E 2 Tekst naar Bild Generator is een prachtige nieuwe technologie, die op verschillende manieren kan worden gebruikt.

Onze hoop is dat DALL-E 2 mensen in staat zal stellen zich creatief uit te drukken. DALL-E 2 helpt ons ook te begrijpen hoe geavanceerde AI systemen onze wereld zien en begrijpen, wat van cruciaal belang is voor onze missie om AI te creëren die de mensheid ten goede komt.

Open-AI

Met DALL-E 2 kun je op een doeltreffende manier prachtige en creatieve foto’s maken. Dazu brauch man keine Photo Editing Skills oder einen ausgeprägten Sinn für Kunst. Ook kennis van fotobewerkingsprogramma’s (z.b. Photoshop) is niet langer nodig om een foto te bewerken.

Bovendien is de DALL-E 2 Tekst to Image Generator niet alleen van hoge kwaliteit, maar ook zeer snel. In slechts enkele minuten genereert een mens nieuwe foto’s, die hij soms een paar weken lang moet bewaren. Door die Vielfalt an Optionen zijn je Kreativität keine Grenzen gesetzt. Integendeel! DALL-E 2 zal de creativiteit van mensen uitdagen en verruimen.

Tot slot is de DALL-E 2 Text to Image Generator een goed voorbeeld van hoe kunstmatige intelligentie zich blijft ontwikkelen. De foto’s, die van DALL-E 2 gemaakt werden, kunnen ons in de toekomst vertellen of het systeem het menschliche denken tatsächlich versteht of dat we het nog steeds niet begrijpen, als we het maar beibreren.

Fazit ist: We zijn auf jeden Fall gespannt, wie sich der DALL-E 2 Text zu Bild Generator entwickeln wird und können es kaum abwarten, irgendwann selbst mit DALL-E 2 zu arbeiten! Als je echter niet zo lang wilt wachten, dan kun je die voorwendsels van de KI leren kennen, die nu al op de markt zijn. Zo kun je met de neuroflash Tekstgenerator gratis zu 2.000 woorden van een geestelijke intelligentie genereren, en dat in meer dan 50 verschillende soorten teksten!

Generate unique AI images with neuroflash

Met de mogelijkheid om beelden uit tekst te genereren, wordt het potentieel van kunstmatige intelligentie als hulpbron duidelijk. Dit is een grote vooruitgang die dankzij de moderne technologie is bereikt. Daarom combineert neuroflash nu de #1 Duitstalige tekstgenerator met een nieuwe functie, het genereren van tekst naar beeld. Hiermee is neuroflash het eerste bedrijf in de DACH-regio dat zijn klanten de mogelijkheid biedt om het genereren van AI-afbeeldingen zelf gratis uit te proberen. 

Hoe kunt u geld verdienen met de AI-gegenereerde beelden van neuroflash en deze voor uw bedrijf gebruiken?

 

  • Boeken met weinig inhoud
  • Omslagen voor boeken, liedjes, strips, e-books, …
  • Illustraties voor verhaaltjes voor het slapengaan, boeken, strips…
  • Afbeeldingen voor afdrukken op aanvraag of postkaarten
  • Eenvoudige stockafbeeldingen voor blogs (bv. voedselblogs)
  • NFT’s
  • Presentaties & Slide decks
  • Afbeeldingen voor social media posts, nieuwsbrieven
  • Inspiraties voor landingspagina ontwerpen, product ontwerpen

Tip: Combineer neuroflash met Photoshop of andere programma’s:


  • Gebruik Photoshop en vergroot onze foto’s van 72 dpi naar 300 dpi met Preserve Details 2.0.
  • In de laatste versie van Photoshop (Beta) is er een “Foto herstel” functie onder “Neurale filters” die meestal het uiterlijk van de ogen en andere vreemde gelaatstrekken verbetert.
  • Doe dan wat basis curve en kleurcorrecties en maak de ogen wat helderder

Gebruik AI om sneller goed presterende marketingteksten te schrijven. 10x sneller.

Test neuroflash's AI copywriter met het gratis plan.

More To Explore

Geen writer's block meer

neurolfash-aiwriter

Gebruik onze AI om binnen enkele seconden gratis nieuwe inhoud te genereren.