Probando el generador DALL-E 2 – ¿De qué es capaz?

Utiliza IA para escribir tus textos de marketing de manera más rápida - hasta 10 veces más rápido.

Prueba el escritor de IA de neuroflash con nuestro plan gratuito.
Probamos el generador DALL-E 2, la nueva tecnología de IA de OpenAI, con nuestro acceso exclusivo. En este artículo, presentaremos nuestras conclusiones sobre lo que el generador de texto a imagen es realmente capaz de hacer.
Share This Post

Tuvimos acceso al generador DALL-E 2 hace un par de semanas y desde entonces hemos probado la tecnología. Si no sabes qué es DALL-E 2 o cómo funciona, consulta nuestro artículo anterior sobre el generador de texto a imagen DALL-E 2 OpenAI, donde explicamos todo lo que necesitas saber sobre la nueva tecnología.

Para este artículo, nuestro objetivo era obtener más información sobre cómo el generador de imágenes entiende el lenguaje y cómo las diferentes indicaciones de texto afectan a las imágenes generadas por la IA. También nos preguntamos cómo podría utilizarse el generador DALL-E 2 en diversos campos como el marketing y el diseño de productos, incluyendo sus puntos fuertes y débiles. Tras explorar el potencial de DALL-E 2, esto es lo que hemos encontrado:

Cómo entiende el lenguaje el generador de DALL-E 2 - El estudio de la tostadora de patos

Una de nuestras primeras hipótesis fue que el generador de DALL-E 2 probablemente no tendría ningún problema en generar imágenes que también podrías encontrar simplemente en Internet haciendo una búsqueda rápida. Por ejemplo, digamos que quieres generar fotos de patos bonitos. En sólo un par de segundos, el generador DALL-E 2 te ofrece estas imágenes generadas por la IA:

dalle 2 entenschwarm
Fuente: OpenAI

En efecto, estos son unos patos muy bonitos, pero puedes llegar fácilmente a los mismos resultados escribiendo «fotos de patos» en un motor de búsqueda. Así que vamos a ponernos un poco más abstractos y surrealistas con nuestro texto. En lugar de generar imágenes de patos, queríamos generar imágenes de una tostadora de patos. Al visualizar los resultados de la pregunta «pato tostador», imaginamos que el generador de DALL-E 2 crearía imágenes que fusionaran las características de un pato y de una tostadora. Sin embargo, al utilizar simplemente la palabra «tostadora de pato» para nuestra indicación, los resultados de las imágenes generadas por la IA estaban sesgados.

La inteligencia artificial no fue capaz de comprender qué se supone que es una tostadora de pato, así que utilizó las palabras del aviso que reconoció, como pato y tostada, para generar una amplia gama de imágenes diferentes. Aquí, por ejemplo, el generador de DALL-E 2 creó una imagen de un pato con dos tostadas:

dalle 2 ente mit stück toast
Fuente: OpenAI

Y aquí, en un terrible giro del destino para el pato, el generador de imágenes creó una imagen de un pato que se está tostando en el horno:

dalle 2 gerösteter hähnchenbraten
Fuente: OpenAI

Pronto quedó claro que la palabra «tostadora de patos» no era suficiente para generar las imágenes que teníamos en mente. Así que, en el siguiente paso, fuimos más específicos con nuestro texto y le dijimos a la inteligencia artificial que generara imágenes de «un pato con forma de tostadora». Con esta indicación, el generador de DALL-E 2 se acercó un poco más a nuestras expectativas:

dalle 2 toaster mit entenkopf
Fuente: OpenAI

Sin embargo, el generador de imágenes seguía teniendo problemas para relacionar los atributos de un pato con los de una tostadora. Esto provocó algunos fallos en las imágenes generadas por la IA y creó imágenes como una tostadora normal con una tostada en forma de pato y una monstruosidad de pato al que le han crecido unos apéndices horribles parecidos a los de una máquina

dalle 2 entenförmiger toast in toaster
Fuente: OpenAI
dalle 2 entenfigur mit toaster teilen
Fuente: OpenAI

A continuación, cambiamos las palabras de la pregunta para comprobar si esto influye en los resultados. En lugar de «un pato con forma de tostadora», escribimos «una tostadora con forma de pato» con los siguientes resultados:

dalle 2 toaster mit entengesicht
Fuente: OpenAI
dalle 2 toaster mit entenkopf
Fuente: OpenAI

Con la indicación «una tostadora con forma de pato», el generador de DALL-E 2 pudo crear imágenes que fusionaban los atributos de un pato y una tostadora de forma más fluida, lo que implica que el orden de las palabras en la indicación de texto importa. Además, al añadir un estilo artístico preferido a la indicación, como «una tostadora con forma de pato, arte japonés en color» o «una tostadora con forma de pato, pintura al óleo», el generador de DALL-E 2 pudo incorporar los estilos sin problemas:

dalle 2 toaster mit entenkopf
Fuente: OpenAI
dalle 2 toaster mit entenkopf
Fuente: OpenAI

En un último paso, decidimos complicar aún más el aviso añadiendo más detalles como las acciones. Por ejemplo, añadimos «pato volador» o «sosteniendo una tostada» a la indicación existente y el generador de DALL-E 2 empezó a incluir atributos como alas o trozos de tostada en las imágenes:

dalle 2 flliegender toaster mit entengesicht und flügeln
Fuente: OpenAI
dalle 2 toaster mit entenkopf
Fuente: OpenAI
dalle 2 toaster mit entengesicht und flügeln
Fuente: OpenAI
dalle 2 ente hält stück toast
Fuente: OpenAI

Por último, incluso pudimos añadir emociones a la imagen, como alegrar al pato tostador o hacerlo llorar:

dalle 2 toaster mit entengesicht
Fuente: OpenAI
dalle 2 entenförmiger toast in toaster
Fuente: OpenAI

En resumen, el generador de DALL-E 2, al igual que la inteligencia artificial en general, no entiende realmente lo que está haciendo. Nosotros, como humanos, tenemos que guiar a la IA en la dirección deseada. Con el generador DALL-E 2, llegamos a la conclusión de que cuanto más detallada sea la indicación, mejores serán los resultados. Puede ser útil cambiar las palabras para mejorar los resultados, y puedes añadir acciones y emociones para que las imágenes parezcan más dinámicas. Por último, si quieres añadir un estilo artístico determinado, es mejor incluirlo al final de la frase y separarlo del resto con una coma. Al fin y al cabo, lo divertido de DALL-E 2 es que puedes jugar con él hasta conseguir los resultados deseados.

El futuro del generador DALL-E 2 - Posibles casos de uso

Después de probar el generador DALL-E 2 y ser testigos de lo que es capaz de crear, empezamos a preguntarnos qué posibles usos podría tener la tecnología y cómo podría dar forma al futuro de varias industrias. Con su capacidad para generar imágenes a partir de descripciones textuales en diferentes estilos, incluidos modelos 3D e imágenes fotorrealistas, el generador DALL-E 2 podría generar nuevas ideas para una serie de productos o servicios:

Generador DALL-E 2 creando asociaciones en el marketing de ventas:

Algunos dirían que el aspecto más importante del marketing de ventas es comprender a tu público objetivo. Otros dirán que lo más importante es crear una marca fuerte. Y otros dirán que lo más importante es generar clientes potenciales. Sin embargo, un aspecto que tampoco debe pasarse por alto es el poder que tiene lo visual en el mundo del marketing.

Las imágenes son importantes en el marketing de ventas porque proporcionan una representación visual de tu producto o servicio. Pueden ayudar a impulsar tus ventas evocando emociones en tu público objetivo y creando ciertas asociaciones que la gente conecta con tu marca. Una buena campaña de marketing se nutre de elementos visuales únicos. He aquí dos ejemplos hipotéticos de cómo podría utilizarse DALL-E 2 para este fin:

  • Si el producto que quieres vender es un caramelo, podrías utilizar DALL-E 2 para generar un anuncio visual de un valiente explorador que ha viajado hasta allí para probar tu delicioso caramelo y lo sostiene como una posesión preciada para que todo el mundo lo vea:
dalle 2 siedler isst stück schokolade
Fuente: OpenAI
  • Si ofreces un servicio de redacción, quizá quieras asociar tu marca con la inteligencia, el poder y el orgullo. En este caso, podrías utilizar el generador de DALL-E 2 para crear un anuncio visual de una leona haciendo un trabajo de escritura:
dalle 2 löwin schreibt ein buch
Fuente: OpenAI

El hecho es que con DALL-E 2 puedes generar una variedad de visuales creativos y únicos para tus campañas de marketing que te permiten vincular tu marca a determinadas asociaciones y hacerla más atractiva para los usuarios y clientes potenciales.

El generador de DALL-E 2 proporciona una ventaja en el marketing de contenidos:

Hay muchas facetas importantes en el marketing de contenidos, pero algunas de las más importantes son la creación de contenidos de calidad, la adaptación de tus contenidos a tu público objetivo y la promoción de tus contenidos a través de varios canales. Si creas contenido de calidad dirigido a tu audiencia deseada, puedes comercializar eficazmente tu negocio o producto y llegar a una mayor base de personas. Además, promocionar tu contenido a través de las redes sociales, el marketing por correo electrónico y otros canales puede ayudar a aumentar su alcance y a captar más clientes potenciales.

Como la palabra clave del marketing de contenidos es «contenido de calidad», está claro que el contenido debe ser único y atractivo. Un gran aspecto de la creación de un contenido único y atractivo son los elementos visuales que la gente ve incluso antes de haber leído el contenido en sí.

Digamos, por ejemplo, que tienes un blog en el que quieres comercializar contenidos sobre tecnología de IA para tu público objetivo. Si piensas incluir imágenes que muestren la relación entre los seres humanos y la tecnología de IA, tus opciones son limitadas. O bien tienes que pagar a un artista digital o a un fotógrafo de stock, o bien encontrar imágenes libres de derechos de autor que muchos otros artículos de la competencia ya han utilizado también. Sin embargo, con el generador DALL-E 2, puedes ser creativo y generar un gran número de imágenes distintivas y únicas que se ajusten a tu contenido. Aquí tienes algunos ejemplos que sólo requirieron una simple consulta de texto y un par de segundos para generarse:

dalle 2 roboter schreibt in buch
Fuente: OpenAI
dalle 2 roboter unterrichtet mensch mit buch
Fuente: OpenAI
dalle 2 kleiner robotor mit stift als arme
Fuente: OpenAI
dalle 2 kleiner roboter schreibt mit großem stift
Fuente: OpenAI

De este modo, nunca te quedarás sin imágenes creativas y originales que puedas añadir a tu contenido para aumentar su calidad, además de que te ahorrará mucho tiempo.

El generador DALL-E 2 revoluciona el diseño de los productos:

En el diseño de productos, es importante tener en cuenta la experiencia del cliente y cómo se utilizará el producto. También es importante tener en cuenta la fabricabilidad del producto y cómo se va a montar. Sin embargo, además de todo esto, también importa el aspecto del producto, porque el diseño es el primer aspecto del producto que los clientes encuentran y juzgan.

Para esbozar el diseño de un producto creativo y visualizarlo para su producción, los equipos de diseño necesitan el trabajo de artistas digitales con talento. Estos artistas necesitan recursos y tiempo para hacer su trabajo y sólo son capaces de crear una cantidad limitada de posibles opciones de diseño a la vez. El generador DALL-E 2 podría revolucionar este proceso al permitir a los equipos de diseño probar varias opciones de diseño simplemente generándolas con la tecnología DALL-E 2.

Por ejemplo, el mercado del calzado deportivo es increíblemente rentable, pero también extremadamente competitivo. Para ganarse a los clientes, los zapatos no sólo tienen que ser de alta calidad, sino que también tienen que tener un diseño interesante. Con el generador DALL-E 2 se puede escribir fácilmente un texto de un diseño que se tenga en mente y crear imágenes realistas. Aquí tienes algunos ejemplos para la pregunta «zapatillas de baloncesto al estilo del maximalismo, foto de producto»:

dalle 2 schwarzer sportschuh mit rotem design
Fuente: OpenAI
dalle 2 weißer sportschuh mit schwarzen design
Fuente: OpenAI

Sin embargo, el diseño del producto también puede ser más específico, como añadir un estampado de arco iris a un par de zapatillas:

dalle 2 sneakers mit regenbogen sohle
Fuente: OpenAI
dalle 2 sneakers mit regenbogen design
Fuente: OpenAI

El hecho es que el generador DALL-E 2 puede crear imágenes de productos para visualizar posibles diseños. Estas imágenes también pueden ser lo suficientemente realistas como para utilizarlas como fotos de productos en el sitio web de la empresa.

Los límites del generador DALL-E 2

Con todas las ventajas potenciales que ofrece el generador DALL-E 2, finalmente nos preguntamos dónde tiene sus puntos débiles el generador de imágenes. Efectivamente, uno de los primeros límites que encontramos fue cuando intentamos generar imágenes realistas de personas, como en el contexto de una foto de archivo. Dado que el generador de DALL-E 2 crea imágenes a partir de múltiples fuentes existentes, los rostros de las personas suelen aparecer distorsionados o con aspecto de plástico en las imágenes generadas por la IA.

dalle 2 eltern und sohn im auto
Fuente: OpenAI

Otro aspecto que se puso de manifiesto muy rápidamente fue que el generador de DALL-E 2 aún no ha aprendido a deletrear correctamente. En lugar de las palabras «redacción» y «café», la IA propone un revoltijo de palabras:

dalle 2 copywriterin trinkt kaffee am laptop
Fuente: OpenAI

Esto también imposibilita la creación de imágenes con infografías o nombres de marcas. Por ejemplo, al tratar de generar un informativo sobre las verduras y la alimentación saludable, el diseño en sí se ve bien, pero el texto es ilegible. Lo mismo ocurre cuando se trata de incluir una marca. Al intentar generar un anuncio visual para el banco Credit Suisse, el diseño vuelve a ser bueno, pero el nombre de la marca es incoherente:

dalle 2 gemüse schema
Fuente: OpenAI
dalle 2 poster alpenschokolade
Fuente: OpenAI

Al final, hemos comprobado que hay que tener cuidado al utilizar el generador de DALL-E 2, ya que las directrices y normas son muy estrictas. Si escribes una palabra que es una violación del contenido, incluso en un contexto diferente, OpenAI la marcará como un strike. Por ejemplo, cuando intentamos generar el personaje de Mario «Bullet-Bill», el generador de imágenes marcó la palabra «bullet» como una violación de las directrices. Si se producen demasiadas infracciones de este tipo, la cuenta se bloqueará automáticamente.

El futuro del generador DALL-E 2

Hasta ahora, el generador de DALL-E 2 sólo ofrece un acceso limitado a un número de usuarios, ya que todavía se encuentra en la fase de una versión beta cerrada. Sin embargo, también hay versiones gratuitas como DALL-E Mini, que es un intento de recrear el éxito de DALL-E 2 con un modelo de código abierto de la tecnología que es accesible para todos. Puede que la calidad de DALL-E Mini no sea tan buena como la de DALL-E 2, pero sigue en formación y mejora constantemente.

Curiosamente, competidores como Imagen, el modelo de difusión de texto a imagen de Google, desafían al generador de imágenes de OpenAI prometiendo un «grado de fotorrealismo sin precedentes y un profundo nivel de comprensión del lenguaje». La competencia entre las diferentes marcas de generadores de texto a imagen podría prometer un ritmo más rápido en el desarrollo de dicha tecnología y podría impulsar a las empresas a pasar antes al software de acceso abierto.

En definitiva, se puede decir que el generador DALL-E 2 tiene un futuro prometedor por delante, ya que OpenAI tiene previsto seguir mejorando y desarrollando la tecnología DALL-E 2. El generador DALL-E 2 podría crear pronto imágenes aún más realistas y precisas en un futuro próximo, aunque puede decirse que probablemente no sustituirá por completo a los artistas digitales, ya que éstos pueden hacer referencia a términos técnicos específicos y a palabras históricas del arte, lo que da a sus resultados más especificidad y control que alguien que sólo intenta hacer algo «guay» con el generador DALL-E 2.

Por último, un desarrollo futuro interesante podría ser la fusión de generadores de texto a imagen como DALL-E 2 y otras tecnologías de IA como los generadores de texto GPT-3, que ya están ampliamente disponibles. Los generadores de texto GPT-3 pueden hacer muchas cosas. Pueden ayudarte con tu escritura, aportando sugerencias e ideas. También pueden ayudarte con tu investigación, buscando y organizando la información por ti. Al fusionar estos generadores de texto con la tecnología DALL-E 2, la IA sería capaz de crear textos completos junto con imágenes únicas generadas por la IA. Puedes comprobar lo que un generador de texto GPT-3 ya es capaz de hacer por sí mismo con neuroflash. Puedes utilizar nuestro generador de texto para crear más de 80 tipos de texto diferentes en distintos idiomas y hasta 2.000 palabras de forma gratuita cada mes, sin necesidad de suscripción.

Generar imágenes únicas de IA con neuroflash

Con la capacidad de generar imágenes a partir de un texto, queda claro el potencial de la inteligencia artificial como recurso. Se trata de un gran progreso logrado gracias a la tecnología moderna. Por ello, neuroflash combina ahora el generador de texto número uno en lengua alemana con una nueva función, la generación de texto a imagen. Esto convierte a neuroflash en la primera empresa de la región DACH que ofrece a sus clientes la oportunidad de probar gratuitamente la generación de imágenes mediante IA

¿Cómo puede ganar dinero con las imágenes generadas por la IA de neuroflash y utilizarlas para su negocio?

 

  • Libros de bajo contenido
  • Portadas para libros, canciones, cómics, libros electrónicos, …
  • Ilustraciones para cuentos, libros, cómics…
  • Imágenes de impresión bajo demanda o tarjetas postales
  • Imágenes de stock sencillas para blogs (por ejemplo, blogs de comida)
  • NFTs
  • Presentaciones y diapositivas
  • Imágenes para publicaciones en redes sociales, boletines de noticias
  • Inspiraciones para diseños de páginas de aterrizaje, diseños de productos

Consejo: Combine neuroflash con Photoshop u otros programas:


  • Utilice Photoshop y amplíe nuestras imágenes de 72 ppp a 300 ppp con Preserve Details 2.0.
  • En la última versión de Photoshop (Beta) hay una función de «Recuperación de fotos» en «Filtros neuronales» que suele mejorar el aspecto de los ojos y otros rasgos faciales extraños.
  • A continuación, haz algunas correcciones básicas de curvas y colores y aclara un poco los ojos.

Utiliza IA para escribir tus textos de marketing de manera más rápida - hasta 10 veces más rápido.

Prueba el escritor de IA de neuroflash con nuestro plan gratuito.

More To Explore

Se acabó el bloqueo del escritor

neurolfash-aiwriter

Utiliza nuestra IA para generar nuevos contenidos en segundos de forma gratuita.