We kregen een paar weken geleden toegang tot de DALL-E 2 generator en hebben sindsdien de technologie uitgeprobeerd en getest. Als je niet weet wat DALL-E 2 is of hoe het werkt, bekijk dan ons vorige artikel over de DALL-E 2 OpenAI tekst naar beeld generator, waarin we alles uitleggen wat je over de nieuwe technologie moet weten.
Voor dit artikel was ons doel meer inzicht te krijgen in hoe de beeldgenerator taal begrijpt en hoe verschillende tekstaanwijzingen de door AI gegenereerde beelden beïnvloeden. We vroegen ons ook af hoe de DALL-E 2 generator eventueel gebruikt zou kunnen worden op verschillende gebieden zoals marketing en produktontwerp, inclusief zijn sterke en zwakke punten. Na onderzoek van de mogelijkheden van DALL-E 2, is dit wat we vonden:
Hoe de DALL-E 2 generator taal begrijpt - De eendenbroodrooster studie
Een van onze eerste hypotheses was dat de DALL-E 2 generator waarschijnlijk geen moeite zou hebben om beelden te genereren die je ook gewoon op het internet kon vinden door even te zoeken. Bijvoorbeeld, stel dat je foto’s van schattige eenden wilt genereren. Binnen een paar seconden biedt de DALL-E 2 generator je deze AI gegenereerde beelden:
Nu zijn dit inderdaad een paar schattige eenden, maar je kunt gemakkelijk tot dezelfde resultaten komen door “foto’s van eenden” in een zoekmachine in te typen. Laten we dus een beetje abstracter en surrealistischer worden met onze tekst prompt. In plaats van afbeeldingen van eenden te genereren, wilden we afbeeldingen van een eenden broodrooster genereren. Bij het visualiseren van de resultaten voor de prompt “eendenbroodrooster” stelden we ons voor dat de DALL-E 2 generator beelden zou maken die de kenmerken van zowel een eend als een broodrooster zouden samenvoegen. Maar door gewoon het woord “eendenbroodrooster” te gebruiken voor onze prompt, werden de resultaten van de door AI gegenereerde beelden scheefgetrokken.
De kunstmatige intelligentie kon niet bevatten wat een eendenbroodrooster moet voorstellen, dus gebruikte het de woorden in de prompt die het herkende, zoals eend en toast, om een hele reeks verschillende beelden te genereren. Hier bijvoorbeeld maakte de DALL-E 2 generator een beeld van een eend met twee stukken toast:
En hier, in een vreselijke speling van het lot voor de eend, maakte de beeldgenerator een foto van een eend die in de oven geroosterd wordt:
Het werd al snel duidelijk dat het woord “eendenbroodrooster” niet voldoende was om de beelden op te wekken die we in gedachten hadden. In de volgende stap werden we dus specifieker met onze tekstprompt en vertelden we de kunstmatige intelligentie om beelden te genereren van “een eend in de vorm van een broodrooster”. Met deze prompt kwam de DALL-E 2 generator een beetje dichter bij onze verwachtingen:
De beeldgenerator had echter nog steeds moeite om de eigenschappen van een eend te relateren aan de eigenschappen van een broodrooster. Dit leidde tot enkele misvattingen binnen de door AI gegenereerde beelden en creëerde beelden als een gewone broodrooster met een eendvormig stuk toast en een eendenmonstrum dat een paar gruwelijke machine-achtige aanhangsels heeft gegroeid
Vervolgens verwisselden we de woorden in de prompt om te zien of dat de resultaten beïnvloedt. In plaats van “een eend in de vorm van een broodrooster”, typten we “een broodrooster in de vorm van een eend” in, met de volgende resultaten:
Met de vraag “een broodrooster in de vorm van een eend” kon de DALL-E 2 generator beelden maken die de eigenschappen van een eend en een broodrooster naadlozer in elkaar lieten overgaan, wat impliceert dat de volgorde van de woorden in de tekstvraag er toe doet. Bovendien kon de DALL-E 2 generator, wanneer hij een voorkeur voor een artistieke stijl aan de prompt toevoegde, zoals “een broodrooster in de vorm van een eend, Japanse kleurkunst” of “een broodrooster in de vorm van een eend, olieverfschilderij”, de stijlen zonder probleem verwerken:
In een laatste stap besloten we de prompt nog ingewikkelder te maken door meer details toe te voegen, zoals acties. We voegden bijvoorbeeld “vliegende eend” of “die een stuk toast vasthoudt” toe aan de bestaande prompt en de DALL-E 2 generator begon attributen als vleugels of stukken toast in de plaatjes op te nemen:
Tenslotte konden we zelfs emoties aan de foto toevoegen, zoals de eendenbroodrooster blij maken of laten huilen:
Samenvattend: de DALL-E 2 generator begrijpt, net als kunstmatige intelligentie in het algemeen, niet echt wat hij doet. Wij als mensen moeten de AI in de gewenste richting sturen. Met de DALL-E 2 generator concludeerden we dat hoe gedetailleerder de prompt, hoe beter de resultaten. Het kan helpen om woorden om te wisselen om de resultaten te verbeteren, en je kunt acties en emoties toevoegen om de beelden dynamischer te laten lijken. Tenslotte, als je een bepaalde kunststijl wilt toevoegen, kun je die het beste helemaal aan het eind van de prompt zetten en met een komma van de rest van de zin scheiden. Uiteindelijk is het leuke van DALL-E 2 dat je ermee kunt spelen tot je het gewenste resultaat bereikt.
De toekomst van de DALL-E 2 generator - Mogelijke gebruikssituaties
Nadat we de DALL-E 2 generator getest hadden en gezien hadden wat hij kan maken, begonnen we ons af te vragen welke mogelijke toepassingen de technologie zou kunnen hebben en hoe hij de toekomst van verschillende industrieën vorm zou kunnen geven. Met zijn vermogen om uit tekstuele beschrijvingen beelden te genereren in verschillende stijlen, waaronder 3D modellen en fotorealistische beelden, zou de DALL-E 2 generator nieuwe ideeën kunnen genereren voor een hele reeks producten of diensten:
DALL-E 2 generator die associaties schept in verkoopmarketing:
Sommigen zouden zeggen dat het belangrijkste aspect van verkoopmarketing het begrijpen van je doelgroep is. Anderen zeggen misschien dat het belangrijkste is dat je een sterk merk creëert. En weer anderen zeggen misschien dat het belangrijkste is dat je leads genereert. Maar één aspect dat zeker ook niet over het hoofd gezien mag worden is de kracht die visuals in de marketingwereld bezitten.
Afbeeldingen zijn belangrijk in verkoopmarketing omdat ze een visuele voorstelling geven van je product of dienst. Ze kunnen helpen je verkoop te stimuleren door emoties op te roepen bij je doelpubliek en bepaalde associaties op te wekken die mensen met je merk verbinden. Een goede marketingcampagne gedijt bij unieke visuals. Hier zijn twee hypothetische voorbeelden van hoe DALL-E 2 voor dit doel gebruikt zou kunnen worden:
- Als het product dat je wilt verkopen snoep is, zou je DALL-E 2 kunnen gebruiken om een visuele advertentie te genereren van een dappere ontdekkingsreiziger die helemaal gereisd is om je heerlijke snoep te proeven en het als een geprijsd bezit voor iedereen omhoog houdt om te zien:
- Als je een copywriting service aanbiedt, dan wil je je merk misschien associëren met intelligentie, kracht, en trots. In dit geval zou je de DALL-E 2 generator kunnen gebruiken om een visuele advertentie te maken van een leeuwin die een schrijfopdracht doet:
Feit is dat je met DALL-E 2 allerlei creatieve en unieke visuals voor je marketing campagnes kunt genereren waarmee je je merk aan bepaalde associaties kunt koppelen en het aantrekkelijker kunt maken voor potentiële gebruikers en klanten.
DALL-E 2 generator zorgt voor een voorsprong in inhoudsmarketing:
Er zijn veel belangrijke facetten aan inhoudmarketing, maar enkele van de belangrijkste zijn het maken van kwaliteitsinhoud, het afstemmen van je inhoud op je doelpubliek, en het promoten van je inhoud via verschillende kanalen. Door kwaliteitsvolle inhoud te maken die gericht is op je gewenste publiek, kun je je bedrijf of product effectief op de markt brengen en een grotere groep mensen bereiken. Bovendien kan het promoten van je inhoud via sociale media, e-mailmarketing en andere kanalen helpen om het bereik ervan te vergroten en potentiële klanten of cliënten er verder bij te betrekken.
Nu het sleutelwoord voor inhoudsmarketing “kwaliteitsinhoud” is, wordt het duidelijk dat de inhoud zowel uniek als aantrekkelijk moet zijn. Een groot aspect van het maken van unieke en aantrekkelijke inhoud zijn de visuals die mensen zien nog voor ze de inhoud zelf hebben doorgelezen.
Stel dat je bijvoorbeeld een blog hebt waarop je inhoud over AI technologie aan je doelgroep wilt slijten. Als je van plan bent beelden op te nemen die de relatie tussen mens en AI technologie laten zien, dan zijn je mogelijkheden beperkt. Je moet òf betalen voor een digitale kunstenaar of voor stockfotografie, òf rechtenvrije beelden vinden die een heleboel andere artikelen van concurrenten ook al gebruikt hebben. Maar met de DALL-E 2 generator kun je creatief aan de slag en een enorm aantal kenmerkende en eenmalige foto’s genereren die bij je inhoud passen. Hier zijn een paar voorbeelden die alleen met een eenvoudige tekstvraag en een paar seconden te genereren waren:
Zo kom je nooit zonder creatieve en originele foto’s te zitten die je aan je inhoud kunt toevoegen om de kwaliteit ervan te verhogen, plus het bespaart je veel tijd.
DALL-E 2 generator brengt een revolutie teweeg in het ontwerpen van producten:
Bij het ontwerpen van producten is het belangrijk rekening te houden met de ervaring van de klant en met de manier waarop het product gebruikt zal worden. Ook de maakbaarheid van het product en de manier waarop het geassembleerd zal worden zijn belangrijk. Maar daar komt nog bij dat het er ook toe doet hoe het produkt eruit zal zien, want het ontwerp is het allereerste aspect van het produkt dat de klanten tegenkomen en beoordelen.
Om een creatief productontwerp te schetsen en het voor productie te visualiseren, hebben ontwerpteams het werk nodig van getalenteerde digitale kunstenaars. Zulke kunstenaars hebben middelen en tijd nodig om hun werk te doen en ze zijn slechts in staat om een beperkte hoeveelheid mogelijke ontwerpkeuzes tegelijk te maken. De DALL-E 2 generator zou dit proces revolutionair kunnen veranderen door ontwerpteams in staat te stellen verschillende ontwerpkeuzes uit te testen door ze eenvoudigweg met de DALL-E 2 technologie te genereren.
Zo is de markt voor sportschoenen ongelooflijk winstgevend, maar ook uiterst concurrerend. Om klanten voor je te winnen moeten de schoenen niet alleen van hoge kwaliteit zijn, maar ook een interessant ontwerp hebben. Met de DALL-E 2 generator kon men gemakkelijk een tekstopdracht intypen van een ontwerp dat hij in gedachten heeft en realistische beelden scheppen. Hier zijn enkele voorbeelden voor de prompt “basketbalschoenen in de stijl van het maximalisme, productfoto”:
Maar het productontwerp kan ook specifieker zijn, zoals het aanbrengen van een regenboogpatroon op een paar gympen:
Feit is dat de DALL-E 2 generator foto’s van producten kan maken om mogelijke ontwerpen te visualiseren. Deze foto’s kunnen ook realistisch genoeg zijn om als productfoto’s op de website van de zaak gebruikt te worden.
De grenzen van de DALL-E 2 generator
Met alle potentiële voordelen die de DALL-E 2 generator te bieden heeft, vroegen we ons tenslotte af waar de beeldgenerator zijn zwakke punten had. Zeker genoeg was een van de eerste grenzen die we tegenkwamen toen we probeerden realistische foto’s van mensen te genereren, zoals in de context van een stockfoto. Omdat de DALL-E 2 generator beelden creëert uit meerdere bestaande bronnen, zullen de gezichten van de mensen in de door AI gegenereerde beelden er vaak vervormd of plastisch uitzien.
Een ander aspect dat heel snel duidelijk werd was dat de DALL-E 2 generator nog niet goed heeft leren spellen. In plaats van de woorden “copywriting” en “koffie”, komt de AI met een wirwar van woorden:
Dit maakt het ook onmogelijk om afbeeldingen met infographics of merknamen te maken. Bijvoorbeeld, wanneer je een inforafiek over groenten en gezond eten probeert te genereren, ziet het ontwerp er op zich goed uit, maar de tekst is onleesbaar. Hetzelfde geldt voor pogingen om een merknaam op te nemen. Wanneer je een visuele advertentie probeert te maken voor de Credit Suisse bank, ziet het ontwerp er weer goed uit, maar de naam van het merk is onsamenhangend:
Uiteindelijk hebben we ontdekt dat je voorzichtig moet zijn met het gebruik van de DALL-E 2 generator, want de richtlijnen en regels zijn erg streng. Als je een woord intypt dat een inhoudsschending is, ook in een andere context, dan markeert OpenAI het als een treffer. Toen we bijvoorbeeld probeerden het Mario personage “Bullet-Bill” te genereren, markeerde de beeldgenerator het woord “kogel” als een overtreding van de richtlijnen. Als te veel van deze overtredingen voorkomen, wordt het account automatisch geband.
De toekomst van de DALL-E 2 generator
Tot nu toe biedt de DALL-E 2 generator slechts beperkte toegang aan een aantal gebruikers, want hij is nog in het stadium van een gesloten beta-versie. Er zijn echter ook gratis versies, zoals DALL-E Mini, dat een poging is om het succes van DALL-E 2 te evenaren met een open-source model van de technologie dat voor iedereen toegankelijk is. De kwaliteit van DALL-E Mini is misschien niet zo goed als die van DALL-E 2, maar hij is nog in opleiding en verbetert gestaag.
Interessant is dat concurrenten als Imagen, Google’s tekst-naar-beeld verspreidingsmodel, OpenAI’s beeldgenerator uitdagen door een “ongekende mate van fotorealisme en een diep niveau van taalbegrip” te beloven. De concurrentie tussen verschillende merken van tekst-naar-beeld generatoren belooft wellicht een snellere ontwikkeling van zulke technologie en kan de bedrijven ertoe aanzetten eerder op open access software over te schakelen.
Al met al kan gezegd worden dat de DALL-E 2 generator een veelbelovende toekomst voor zich heeft, want OpenAI is van plan de DALL-E 2 technologie verder te verbeteren en te ontwikkelen. De DALL-E 2 generator zal in de nabije toekomst misschien nog realistischer en nauwkeuriger afbeeldingen kunnen maken, al kan gezegd worden dat hij digitale kunstenaars waarschijnlijk niet helemaal zal vervangen, want die kunnen verwijzen naar specifieke technische termen en kunsthistorische woorden, wat hun resultaten meer specificiteit en controle geeft dan iemand die alleen maar iets “cools” probeert te maken met de DALL-E 2 generator.
Tenslotte zou een interessante toekomstige ontwikkeling de samensmelting kunnen zijn van tekst naar beeld generatoren zoals DALL-E 2 en andere AI technologieën zoals GPT-3 tekstgeneratoren, die al op grote schaal beschikbaar zijn. GPT-3 tekstgeneratoren kunnen heel veel dingen. Ze kunnen je helpen met je schrijven, door suggesties en ideeën aan te reiken. Ze kunnen je ook helpen met je onderzoek, door informatie voor je te zoeken en te ordenen. Door deze tekstgeneratoren te versmelten met de DALL-E 2 technologie, zou AI in staat zijn hele teksten te maken, samen met unieke door AI gegenereerde beelden. Je kunt met neuroflash nagaan waartoe een GPT-3 tekstgenerator uit zichzelf al in staat is. Je kunt onze tekstgenerator gebruiken om meer dan 80 verschillende tekstsoorten te maken in verschillende talen en tot 2.000 woorden gratis per maand, geen abonnement nodig.
Genereer unieke AI-beelden met neuroflits
Met de mogelijkheid om beelden uit tekst te genereren, wordt het potentieel van kunstmatige intelligentie als hulpbron duidelijk. Dit is een grote vooruitgang die dankzij de moderne technologie is bereikt. Daarom combineert neuroflash nu de #1 Duitstalige tekstgenerator met een nieuwe functie, het genereren van tekst naar beeld. Hiermee is neuroflash het eerste bedrijf in de DACH-regio dat zijn klanten de mogelijkheid biedt om het genereren van AI-afbeeldingen zelf gratis uit te proberen.
Hoe kunt u geld verdienen met de AI-gegenereerde beelden van neuroflash en deze voor uw bedrijf gebruiken?
- Boeken met weinig inhoud
- Omslagen voor boeken, liedjes, strips, e-books, …
- Illustraties voor verhaaltjes voor het slapengaan, boeken, strips…
- Afbeeldingen voor afdrukken op aanvraag of postkaarten
- Eenvoudige stockafbeeldingen voor blogs (bv. voedselblogs)
- NFT’s
- Presentaties & Slide decks
- Afbeeldingen voor social media posts, nieuwsbrieven
- Inspiraties voor landingspagina ontwerpen, product ontwerpen
Tip: Combineer neuroflash met Photoshop of andere programma’s:
- Gebruik Photoshop en vergroot onze foto’s van 72 dpi naar 300 dpi met Preserve Details 2.0.
- In de laatste versie van Photoshop (Beta) is er een “Foto herstel” functie onder “Neurale filters” die meestal het uiterlijk van de ogen en andere vreemde gelaatstrekken verbetert.
- Doe dan wat basis curve en kleurcorrecties en maak de ogen wat helderder.