Abbiamo pubblicato sul nostro blog alcuni articoli sul tema dell’intelligenza artistica. Per questo motivo abbiamo scritto, ad esempio, come funziona il GPT-3 e come è possibile migliorare le informazioni generate dai testi. Tuttavia, questa volta si tratta di una nuova innovazione nel mondo dei KI Wellen e si tratta del testo del generatore di immagini DALL-E 2. Cosa c’entra DALL-E 2? Come funziona questa nuova tecnologia? E come puoi usarli da solo? Imparerete questo e molto altro in questo articolo!
Che cos'è DALL-E 2?
DALL-E 2 è il nuovo e rivoluzionario Text zu Bild Generator di OpenAI. Permette agli utenti di creare Bilder sulla base di suggerimenti di testo. Questo generatore utilizza un’intelligenza artificiale chiamata GPT-3, che ha lo scopo di comprendere il significato dei testi in linguaggio naturale (input) e di inserirli nelle immagini. Grazie all’utilizzo di questi generatori, i clienti possono trasformare le loro idee creative in splendide immagini.
In questo modo, DALL-E 2 può creare immagini basate su oggetti realistici o interpretare input di testo che non esistono nella realtà. Se vuoi generare una scena realistica, allora il problema è che per DALL-E 2 non c’è alcun problema:
Vuoi forse realizzare un poster di Napoleone Bonaparte in versione Katze con un pezzo di carne in mano? Allora DALL-E 2 può aiutarvi anche in questo caso:
La cosa più sorprendente di DALL-E 2 è che si tratta di una tecnologia relativamente nuova, che è stata resa nota nell’aprile del 2022. DALL-E 2 si rifà al suo predecessore DALL-E, che è stato pubblicato nel gennaio del 2021 e con il quale l’uomo può generare immagini fotorealistiche da suggerimenti di testo. È interessante sapere di più sulla tecnologia di DALL-E 2.
Come funziona DALL-E 2?
Il DALL-E 2 Text to Image Generator utilizza l’elaborazione del linguaggio naturale e l’intelligenza artificiale per inserire le informazioni contenute in una richiesta di testo in una varietà di immagini. Qui può DALL-E 2 controllare diversi attributi in un filmato come nel fotoritocco. Ad esempio, il generatore di testo per immagini può modificare gli oggetti o gli stili artistici di un’immagine. Ma come fa DALL-E 2 a far funzionare questo Bildverständnis? La risposta è onestamente piuttosto complicata, tuttavia mi sono documentato sull’argomento per questo articolo del blog e cercherò di spiegarlo al meglio.
Prima di tutto, l’intelligenza artificiale deve essere addestrata. Con l’Apprendimento Profondo, ihr si è accorta di quali legami può creare, per generare un prodotto finale. DALL-E 2 utilizza per questo processo la tecnologia già esistente CLIP (Contrastive Language-Image Pre-training), che è stata sviluppata da OpenAI. CLIP permette di trovare le descrizioni testuali più adatte per un disegno, basandosi su pagine di testo su Internet. Il processo di DALL-E 2 si basa su due parti:
Nell’ultima parte della figura puoi vedere il programma di formazione KI di CLIP. DALL-E 2 utilizza il modello CLIP, per codificare i testi e creare un codice latente sogenannte.
Nell’ultima parte del disegno si trova la seconda parte, in cui il testo viene modificato in un nuovo disegno. In un secondo momento, il codice latente del testo-bilda è stato generato e modificato con l’aggiunta di un priore sogenannte. In seguito è stato creato un generatore, chiamato Decoder, che permette di creare nuove variazioni di immagini, che vengono visualizzate con un promemoria di testo.
Anche la nuova Bildvariation è stata realizzata in pochi caratteri:
- Per prima cosa, inserire una richiesta di testo nel codificatore di testo. Il Codifica del testo è stato addestrato dal modello CLIP, che consente di scambiare il testo con un altro.
- Successivamente, viene utilizzato un cosiddetto priore per stabilire una connessione tra l’incorporazione del testo CLIP (basata sulla richiesta di testo) e l’incorporazione dell’immagine CLIP, che riflette le informazioni della richiesta di testo.
- Finalmente è stato creato un decodificatore per generare nuove Variazioni di immagine, che rappresentano visivamente il Prompt di testo.
In questo modo è possibile creare, con diversi input di testo, una serie di immagini diverse:
La tecnologia di DALL-E 2 è molto complessa e, dato che non sono un esperto o un esperto in materia di KI, questa descrizione è ancora più chiara. In effetti, nessuno sa come funzionano i generatori di energia così efficienti, o come funziona l’intelligenza artistica alla fine del processo. Non esiste una teoria fondamentale per il fenomeno dell’Apprendimento Profondo, che possa far capire tutto. Le reti, che sono state create da KI, sono molto grandi e molto complesse, tanto che noi uomini, con le nostre attuali conoscenze, possiamo considerarle molto importanti. Tutto ciò che sappiamo in questo momento è che DALL-E 2, grazie al Deep Learning, non solo può comprendere gli oggetti individuali, ma anche la loro relazione con gli oggetti stessi.
Cosa c'è di nuovo in DALL-E 2?
Come già detto, il film DALL-E 2 è un generatore di testi per il nuovo arrivato DALL-E. In questo caso la domanda è: “Cosa c’è di nuovo in DALL-E 2?” e “Cosa può fare la tecnologia?”. La risposta è che DALL-E 2 offre molte nuove funzioni e miglioramenti:
- Il DALL-E 2 Generatore di immagini a testo genera immagini di qualità superiore. DALL-E 2 si basa su un modello da 3,5 milioni di parametri e utilizza un ulteriore modello da 1,5 milioni di parametri per massimizzare l’ingrandimento delle immagini digitali. Dabei è DALL-E 2 anche più veloce rispetto al suo predecessore, quando si tratta di elaborare immagini.
- DALL-E 2 genera Bilder realistici. Le immagini, prodotte da DALL-E 2, sono più sfaccettate e sono caratterizzate da un’intelaiatura complessa e da riflessi e luci realistici. I prodotti finali di DALL-E 2, i disegni dei veggenti, sono stati un po’ troppo difficili da realizzare, dato che DALL-E ha creato dei disegni molto particolari, che spesso hanno un aspetto più delicato.
- Una nuova e rivoluzionaria caratteristica di DALL-E 2 è una funzione chiamata Inpainting. Con questa funzione il DALL-E 2 Text zu Generatore di immagini può eseguire diverse procedure di fotoritocco su un filmato. Tramite l’inserimento di testo, l’utente può migliorare le modifiche e, in un secondo momento, può modificare un determinato elemento del disegno. In particolare, con DALL-E 2 l’uomo può scegliere tra due oggetti in una zona diversa del filmato, in modo da ottenere effetti di luce, riflessi e texture grazie all’intelligenza künstliche.
- Il generatore di testi e immagini di DALL-E 2 ha una migliore distribuzione di scene di film. DALL-E 2 può far capire meglio gli oggetti in un film e la loro relazione. Il programma è in grado di capire perché ogni Pixel ha un’immagine migliore e può decidere quali oggetti del disegno deve avere. Ad esempio, DALL-E 2 si rende conto che il pavimento nell’immagine inferiore si riflette e quando si aggiunge un oggetto, viene automaticamente aggiunto un riflesso di quell’oggetto.
- DALL-E 2 ha un’ottima percentuale di scene globali. Il Generatore di immagini di testo riconosce ciò che passa in un disegno e considera gli oggetti più importanti, che vengono inseriti nell’input di testo, per la creazione di nuove varianti. Questo è un gioco semplice e semplice, ma si tratta di una soluzione molto complessa per una macchina che, alla fine, non può contare solo su pixel diversi.
- Con il DALL-E 2 Generatore di immagini di testo è possibile creare diverse varianti di un’immagine in diverse forme. DALL-E 2 è in dirittura d’arrivo, i filmati in diverse ambientazioni vengono visualizzati in modo diverso. L’immagine generata può rappresentare una versione impressionistica dell’originale:
- O DALL-E 2 è un’opera che ha un valore superiore rispetto all’originale e che presenta piccole modifiche allo stile, come ad esempio l’allestimento dell’oggetto:
- Con DALL-E 2 puoi anche avere un altro disegno rispetto all’originale e la künstliche Intelligenz combina i disegni in una nuova variante per te.
- Il generatore di immagini DALL-E 2 è più preciso e permette di migliorare la qualità delle immagini. Durante l’elaborazione di DALL-E 2 è stato diagnosticato che l’algoritmo è stato particolarmente efficace per quanto riguarda i risultati non corretti. Se il sistema è stato addestrato, ad esempio, con un’immagine di un animale, che è stato trattato come un’arancia, la sua intelligenza è stata manipolata e il risultato è stato verificato. Con DALL-E 2 questo problema è stato risolto.
I migliori esempi di Nachteile di DALL-E 2 Testo e generatori di immagini
Prima di questo, la tecnologia dei generatori di immagini DALL-E 2 Text zu Bild è davvero straordinaria. Tuttavia, una tecnologia innovativa porta con sé anche degli inconvenienti e gli utenti devono essere consapevoli del fatto che non tutti i problemi sono stati risolti:
- L’attribuzione fisica non è sempre corretta. DALL-E 2 non è sempre in grado di mostrare gli oggetti in un film con gli attributi fisici giusti. Se si desidera creare un disegno, ad esempio mostrare un cubo rosso su un cubo blu, si noterà che DALL-E 2 Text to Image Generator ha cambiato i colori del cubo:
- Un altro grave inconveniente, che il DALL-E 2 Generatore di testo a immagine ha già da ora, è il fatto che non può generare alcun testo contraddittorio nei suoi mmagine. Se vuoi che tu faccia un esempio di un disegno con la parola Deep Learning, allora i risultati sono questi:
- Il generatore di testi e immagini di DALL-E 2 ha un’ulteriore difficoltà, quella di creare dettagli all’interno di scene complesse. Se l’uomo vuole ottenere un’immagine di Times Square a New York City, allora avrà un’immagine perfetta, ma non ha bisogno di dettagli precisi:
- L’aspetto più importante di DALL-E 2 è che l’intelligenza artistica viene allenata con i dati di Internet. Come tutti sappiamo, Internet non è sempre il miglior posto dove reperire informazioni. Pertanto, le immagini generate da DALL-E 2 sono soggette a un certo pregiudizio e diffondono in parte degli stereotipi. Se l’uomo vuole generare immagini di operai edili, allora sono state create anche immagini con operai edili. Se si cambia la professione da operaio edile a hostess, vengono visualizzate solo le donne:
- Questo pregiudizio dell’intelligenza artificiale porta a ritenere che gli invariati siano monotoni o addirittura problematici. Le immagini più recenti possono essere realizzate in base a temi come la nazionalità, l’odio, la sessualità, il geschlecht e la religione. Se l’uomo vuole fare un disegno di un addio al nubilato, può fare un disegno eteronormativo di un addio al nubilato tradizionalmente cristiano, con un pastore bianco e dei fiori bianchi:
- Da DALL-E 2 non è una tecnologia relativamente nuova, ma funziona solo in inglese. Chi non è un esperto di lingua inglese, dovrà fare i conti con i Prompt di testo da creare e con il programma da utilizzare.
Quali sono i vantaggi che possono derivare da DALL-E 2?
Ma spesso è così, perché le tecnologie innovative come DALL-E 2 comportano anche alcuni problemi. Inoltre, l’eventuale perdita della tecnologia è una delle maggiori fonti di preoccupazione per gli sviluppatori, visto che DALL-E 2 fino a oggi non è una tecnologia open source e non può essere realizzata se non con un’autorizzazione da parte degli sviluppatori. Siamo lieti che tu sia riuscito ad ottenere questa nuova tecnologia così veloce da poter essere utilizzata in tutte le case, proprio come noi. Tuttavia, così come si presenta, la lista dei clienti privati è molto lunga:
Tuttavia, c’è un motivo per questa lunga attesa. Le tecnologie già esistenti, come Deep Fakes, hanno dimostrato che i programmi, con i quali l’uomo può manipolare le immagini, possono anche essere mal interpretati. Le foto possono essere utilizzate per creare delle immagini che siano di qualità e che possano essere visualizzate da altre persone.
Il generatore di DALL-E 2 Text zu Bild ha quindi ottenuto alcune garanzie di sicurezza, che contribuiscono a evitare il verificarsi di un errore di sicurezza. I filtri d’ingresso impediscono alle ragazze di inserire qualsiasi tipo di contenuto (ad esempio, immagini sessuali o suggestive di bambini, immagini di violenza, immagini politiche esplicite, ecc.) Tutti i prompt di testo, che DALL-E 2 ha creato, possono essere modificati in base a criteri di precisione. Per essere sicuri di poter affermare che DALL-E 2 non può essere mal interpretato e che si possono creare delle inalazioni gewaltvolle e assurde, sono state introdotte le Waffen della KI Datenbank.
OpenAI ha già comunicato che DALL-E 2 Text zu Bild Generator è una versione open source per tutti gli utenti, ma gli sviluppatori sono preoccupati per il loro comportamento. Per questo motivo, OpenAI, nel caso di DALL-E 2, è stato eliminato con un voto, in modo che tutti i problemi siano stati eliminati.
Abbiamo provato DALL-E 2!
neuroflash è uno degli utenti più brillanti, che hanno ottenuto un testzugang su DALL-E 2 e che hanno generato gratuitamente fino a 55 suggerimenti di testo ogni giorno. Naturalmente ho perso il controllo, per far sì che la nuova tecnologia venga applicata alla sonda, e sono davvero entusiasta! La qualità dei Bildern che l’uomo può generare con DALL-E 2 è straordinaria. In questo modo l’uomo può scegliere tra diverse tipologie di stili e anche il contesto in cui si inseriscono le immagini. Se l’uomo vuole realizzare una copertina di un album, deve scegliere il comando “copertina dell’album”:
Una grande domanda, che mi ha colpito, è se anche l’uomo possa scegliere Bilder von bekannten Personen erstellen. Non è possibile realizzare Bilder realistici su persone di alto livello (a causa della paura di Bilder falsi). DALL-E 2 può anche generare immagini con uomini che si distinguono per i loro caratteri e per la loro natura, a patto che ci sia un’affinità. Qui trovi un esempio di un disegno di Oprah, che mostra come lei, durante un’ondata di fuoco, vola su un dinosauriere:
Oppure c’è un’immagine di Taylor Swift, come lei si diverte con un Oktopus:
L’uomo può anche lavorare con i Bilder generati in Nachhinein, in modo che l’uomo possa modificare un elemento dei Bildes e quindi scegliere il nuovo Bild desiderato. L’uomo può anche creare delle varianti di alcuni modelli generici, in modo da ottenere un numero maggiore di opzioni. Ma è proprio così, perché i dettagli sono ancora più difficili da capire. In questa variante delle immagini di Taylor Swift, l’Oktopus è stato modificato in un’unica soluzione con un’unica scanalatura:
Un’altra cosa positiva è stata che i testi più comuni nei Bildern generati sono più belli e più difficili da leggere rispetto a quelli che sono stati pubblicati. Se l’uomo ha bisogno di parole semplici, il KI può generarle in modo semplice:
In generale, l’uomo deve sapere che i suggerimenti di testo sono molto dettagliati e semplici. Se l’uomo vuole fare un esempio di un combattimento di box tra un pinguino e un robot, può generare un prompt “combattimento di box” e ottenere il risultato desiderato:
Se l’uomo non ha mai pensato di usare il termine “incontro di boxe”, allora può scegliere il disegno che preferisce:
Tutto sommato si può dire che DALL-E 2 è una nuova tecnologia vertiginosa, che non ha nulla da invidiare alla creatività umana. Sono sicuro che, una volta uscito DALL-E 2, molte persone saranno in grado di utilizzare la tecnologia in molti modi diversi.
Come può l'uomo nutrire DALL-E 2?
Naturalmente porta DALL-E 2 non solo pericoli con sich, ma anche nuove e fantastiche possibilità! Il DALL-E 2 Generatore di testo a immagine è una nuova tecnologia molto interessante, che può essere utilizzata in diversi modi e forme.
La nostra speranza è che DALL-E 2 dia alle persone la possibilità di esprimersi in modo creativo. DALL-E 2 ci aiuta anche a capire come i sistemi di IA avanzati vedono e comprendono il nostro mondo, il che è fondamentale per la nostra missione di creare IA a beneficio dell'umanità.
Open-AI
Con DALL-E 2 puoi creare in modo efficace dei disegni originali e creativi. Non è necessario avere competenze di fotoritocco o uno spiccato senso artistico. Anche le conoscenze nel settore dei software di fotoritocco (ad esempio Photoshop) non sono indispensabili per poter realizzare un disegno.
Dazu kommt, dass der DALL-E 2 Text zu Bild Generator nicht nur qualitative hochwertig arbeitet, sondern auch sehr schnell ist. In soli pochi minuti si possono generare nuove immagini, per le quali un uomo può essere distrutto per qualche minuto. Per via della Vielfalt an Optionen, la tua creatività non ha bisogno di essere gestita. Al contrario! DALL-E 2 è in grado di rafforzare e migliorare la creatività degli uomini.
Infine, il generatore di testo-immagine di DALL-E 2 è un ottimo esempio di come l’intelligenza artificiale continui a evolversi. Le immagini, generate da DALL-E 2, ci permetteranno di capire se il sistema di comunicazione maschile è sempre stato in grado di funzionare o se invece è solo un problema di sicurezza.
Fazit è: Siamo sempre preoccupati di come il testo di DALL-E 2 sul generatore di immagini sia stato creato e non possiamo fare a meno di lavorare con DALL-E 2! Se non vuoi aspettare così a lungo, puoi anche scegliere i modelli di KI che sono già sul mercato. In questo modo, con il generatore di testi neuroflash, puoi generare gratuitamente fino a 2.000 parole da un’intelligenza naturale e in oltre 50 lingue diverse!
Generare immagini AI uniche con neuroflash
Con la capacità di generare immagini dal testo, il potenziale dell’intelligenza artificiale come risorsa diventa chiaro. Si tratta di un grande progresso raggiunto grazie alla tecnologia moderna. Per questo motivo neuroflash combina ora il generatore di testi numero 1 in lingua tedesca con una nuova funzione, la generazione di testi da immagini. In questo modo neuroflash è la prima azienda nella regione DACH a offrire ai propri clienti la possibilità di provare gratuitamentela generazione di immagini AI.
Come si può guadagnare con le immagini generate dall’intelligenza artificiale di neuroflash e utilizzarle per la propria attività?
- Libri a basso contenuto
- Copertine per libri, canzoni, fumetti, e-book, …
- Illustrazioni per storie della buonanotte, libri, fumetti…
- Immagini per la stampa su richiesta o cartoline
- Immagini stock facili da usare per i blog (ad es. blog di cucina)
- NFT
- Presentazioni e slide decks
- Immagini per post sui social media, newsletter
- Ispirazioni per il design di landingpage, design di prodotti
Suggerimento: Combinare neuroflash con Photoshop o altri programmi:
- Usare Photoshop e ingrandire le nostre immagini da 72 dpi a 300 dpi con Preserve Details 2.0.
- Nell’ultima versione di Photoshop (Beta) c’è una funzione “Recupero foto” sotto “Filtri neurali” che di solito migliora l’aspetto degli occhi e di altri strani tratti del viso.
- Quindi eseguire alcune correzioni di base delle curve e del colore e schiarire un po’ gli occhi.