Sistemas para hacer imágenes de inteligencia artificial

Para demostrar esto cada una generará un logo de WhatsApp tomando café.

Esta instrucción pone a prueba la inteligencia de estos sistemas porque elaborar un producto coherente bajo esa premisa demanda abstracción y creatividad. Veamos cómo le fue a Dall-E 2, Stable Diffusion, Craiyon, Jasper y Neural Love.

Lee también: 5 formas creativas de usar ChatGPT para tus estrategias de marketing

Dall-E 2

Dall-E 2 es el servicio ofrecido por OpenAI. Cuando te registras, la plataforma te ofrece 50 créditos gratuitos para probar. Cada consulta que hagas, gastará un crédito. También puedes subir imágenes a la plataforma y pedirle que le haga ajustes o variaciones. Este tipo de uso también consume créditos.

La opción más poderosa es la de generación de imágenes a partir de texto. El sistema entenderá tanto tus consultas en inglés como en español. Mientras lo usas, Dall-E te dará ejemplos de uso y trucos para aprovechar su potencial al máximo. Si añades ciertas palabras clave a tu consulta, los resultados serán más pulcros o tendrán un estilo gráfico o un tono específicos. Las imágenes que vayas solicitando se guardarán en la pestaña “History”.

Dentro de las palabras clave recomendadas encontramos:

  • Digital Art (o arte digital), para generar imágenes con un acabado más profesional
  • Illustration (o ilustración), para generar ilustraciones
  • Expressive illustration (o ilustración expresiva), para un estilo explosivo y ochentero.
  • Photorealist, para un estilo fotorealista.
  • Cyberpunk illustration, para un estilo futurista.
  • Painting, para que luzca como una pintura
  • Y muchas más opciones. Revisa con atención las sugerencias de la plataforma.

Si quieres que las imágenes tengan un estilo similar al de un artista específico, solo lo debes indicar en la descripción.

Limitaciones

  • Si le pides incluir un texto dentro la imagen casi nunca va a incluir la palabra exacta. A cambio, incluirá un texto que luce similar. Lo mismo ocurre con los números. Por ejemplo, si le pides incluir el número 2023, obtendrás una imagen con cualquier número parecido, menos el 2023. No sé por qué ocurre esto, pero así funciona.
  • No reproduce logos de empresas reconocidas. No le puedes pedir, por ejemplo, crear una modificación del logo de WhatsApp.
  • Es mejor cuando le brindas una descripción muy detallada y específica de la imagen que requieres.
  • Todas las imágenes que genera son en formato 1024 x 1024.
  • Los 50 créditos gratuitos se esfumarán pronto. Si quieres comprar más créditos, son un poco costosos: 15 dólares por cada 115 créditos.
  • No recomiendo el uso de la herramienta “Variaciones”. Rara vez, estas modificaciones superan la imagen original.
  • Por cada solicitud genera un máximo de 4 imágenes.

Prueba: dibuja un logo de WhatsApp tomando café

Dall-E produce una aproximación a lo requerido sin reproducir de forma evidente el logo de WhatsApp. Ninguna de las imágenes es llamativa, pero logró hacer una interpretación aproximada de lo requerido uniendo los dos conceptos principales, “WhatsApp” y “café”. Las imágenes generadas parecen ser originales.

Imagen que muestra resultados de imágenes en Dall-E 2.

Stable Diffusion

Stable Diffusion fue lanzado, de forma oficial, en agosto de 2022. Esta herramienta es gratuita. Esto deriva en que, como ocurre con ChatGPT en la actualidad, a veces no esté disponible o que existe una fila de espera para procesar tu solicitud.

Stable Diffusion afirma que la plataforma será gratuita por siempre. Manejan una licencia CreativeML Open RAIL-M. “Los autores no reclaman ningún derecho sobre los productos que genera la plataforma”, indica el sitio. “Eres libre de usarlos y eres responsable de su uso, que no debe ir en contra de las disposiciones establecidas en esta licencia”.

Stable Diffusion entiende textos tanto en inglés como en español y también es capaz de generar imágenes con el estilo que defina el usuario. La plataforma, en principio, se asemeja a Dall-E 2, con una gran salvedad: hay que tener cuidado con los productos que genera porque pueden ser copiados, sin autorización, de otros artistas.

En el caso de Dall-E, la plataforma nunca reproduce logos de marcas reconocidas. Stable Diffusion no parece tener problema con ello. Al parecer la plataforma funciona bajo parámetros de originalidad menos restrictivos. Las imágenes se producen en, más o menos, 12 segundos.

El método de financiación de este plataforma son los anuncios de Google Adsense. Por cada solicitud genera 4 imágenes.

Resultados de la prueba

Imagen que muestra resultados de imágenes en Stable Diffusion.

Stable diffusion genera una mezcla de imágenes de poco valor. Parece hacer una modificación del logo de WhatsApp. El resultado tiene mucho menos sentido, y menor atractivo estético, que aquellos ofrecidos por Dall-E 2.

Craiyon

Craiyon antes era conocido como Dall-E mini. Resulta evidente que se trata de una plataforma que usa una versión menos avanzada de Dall-E. Las imágenes que arroja suelen ser de muy baja calidad y se demora entre un minuto y dos generando cualquier solicitud. Este proyecto también se financia con Google Adsense y, en consecuencia, es gratuito.

El sitio fue fundado por dos exintegrantes del proyecto Dall-E mini. Aseguran que las imágenes están libres de derechos aunque se deben revisar los términos de uso si se quiere hacer uso comercial de las mismas. Por cada solicitud genera un máximo de 9 imágenes.

Resultados de la prueba

Imagen que muestra resultados de imágenes en Craiyon.

Resulta claro que Craiyon es un servicio con un modelo de inteligencia artificial menos avanzado que el de Dall-E 2 y Stable Diffusion.

El sistema no fue capaz de interpretar correctamente la instrucción. Lo más llamativo es que copió el logo de WhatsApp de forma integra y le adicionó unas semillas de café.

Este resultado invita a evitar su uso. Si reprodujo el logo, también cabe esperar que haga reproducciones exactas de imágenes con derechos de autor.

Lee también: Wikipedia: la odisea para que tu empresa sea incluida

Jasper Art

Jasper es uno de los servicios de generación de contenidos por inteligencia artificial más maduros. Ofrece un periodo de prueba por 5 días. La compañía soporta varios servicios, uno de ellos es para generar contenidos escritos como ChatGPT. En este artículo nos centramos en su división Jasper Art, enfocada en generación de imágenes por inteligencia artificial.

¿Cuánto cuesta? 20 dólares mensuales o 200 dólares anuales.

Con la suscripción, se ofrece lo siguiente:

  • Generación ilimitada de imágenes
  • Escalamiento de imágenes
  • Soporte para 27 idiomas
  • Se guarda tu histórico de imágenes.
  • Prometen mejoras continuas en el sistema de inteligencia artificial

Para empezar el periodo de prueba debes añadir una tarjeta de crédito. Si dejas pasar 5 días y no cancelas tu suscripción, se te cobrará un mes de forma automática. Esto ya pasa en otras plataformas con un modelo similar, tenlo en cuenta. Jasper dispone de una extensión de Chrome, otro punto a favor.

Resultados de la prueba

Prueba de generador de imágenes por inteligencia artificial Jasper Art.

El resultado de la prueba demuestra que este modelo de inteligencia artificial es mejor que el que Craiyon o el de Stable Diffusion. La última imagen generada resulta ser una aproximación mucho más certera de lo solicitado. La plataforma también evita replicar logos de marcas reconocidas. Esto nos lleva a pensar que no incurren en la copia flagrante de arte original.

La interfaz de Jasper Art es superior a la de Dall-E 2. Me gustó que incluyan una seria de menús desplegables con opciones para el tono, el formato, la inspiración, el estilo, las palabras clave y el idioma deseado.

Además, Jasper incorpora un servicio que no vemos en otras plataformas: puedes subir una imagen y agregarle elementos gráficos mediante una instrucción en texto. Sin embargo, parece ser que este modelo aún se encuentra en ciernes porque nunca nos arrojó un resultado coherente.

Este mismo fenómeno ocurre cuando solicitamos imágenes a partir de texto. El sistema logra bonitas imágenes pero rara vez cumple con lo que le solicitamos con precisión.

Prueba de generador de imágenes por inteligencia artificial Jasper Art.
¿Pero qué hiciste ahí, Jasper?

Neural.love

Neural.love ofrece una modalidad de servicio gratuito que arroja imágenes de baja resolución (no superan los 100 kb de peso). Si se quiere mejorar los 

  • Entre otros
Share:

No hay comentarios:

Publicar un comentario

Buscar este blog

Archivo del blog

Con la tecnología de Blogger.

Los peligros de la inteligencia artificial

La inteligencia artificial ofrece muchas promesas para la humanidad, pero también podría representar una amenaza  más peligrosa que la bomba...

Wikipedia

Resultados de la búsqueda

Recent Posts