La inteligencia artificial está cambiando el mundo del arte de forma notable. Una de las fascinantes aplicaciones de la IA en el segmento del arte es mediante la utilización de generadores de arte descriptivo. Estos generadores tienen la capacidad de examinar e interpretar imágenes y generar piezas de arte completamente nuevas basadas en su análisis.
En este artículo, analizamos tres de estos generadores de arte de IA: MidJourney, Difusión estable y Microsoft Bing Image Creator, y cuál de los tres sale mejor parado a la hora de generar los mejores resultados basados en indicaciones.
A mitad de viaje
A mitad de viaje, fundada por David Holz, es un generador de arte por IA que utiliza el aprendizaje automático para identificar patrones y características en obras de arte existentes, que luego pueden utilizarse para crear nuevas piezas.
MidJourney entró en fase beta abierta el 12 de julio de 2022. Antes de lanzar MidJourney, Holz cofinanció Leap Motion, una startup que transformaba las interfaces de usuario utilizando la captura de vídeo y los gestos de las manos. En 2019, vendió Leap Motion a Ultrahápticos.
Con MidJourney ganando popularidad, Holz ha compartido sus ideas sobre la tecnología y su influencia en el arte y la sociedad. Holz considera a los artistas clientes de MidJourney, no competidores, y cree que la plataforma puede facilitar una mayor creatividad y experimentación en la fase de ideación.
Sin embargo, existe preocupación por la posible infracción de los derechos de autor por parte del conjunto de formación de MidJourney, que puede incluir obras protegidas por derechos de autor de otros artistas.
Holz hace hincapié en que MidJourney está diseñado para mejorar las capacidades humanas en lugar de sustituirlas. Lo compara con los coches, explicando que el hecho de que los coches sean más rápidos que los humanos no significa que debamos cortarnos las piernas.
Al utilizar la generación de imágenes mediante IA de MidJourney, los artistas pueden explorar nuevas posibilidades y generar numerosas ideas antes de crear sus propias obras.
Difusión estable

EstableDifusión es un modelo de aprendizaje automático de código abierto que puede generar imágenes a partir de texto, modificar imágenes basándose en texto o rellenar detalles en imágenes de baja resolución o poco detalladas. Se ha entrenado con miles de millones de imágenes y puede producir resultados comparables a los que se obtendrían con DALL-E 2 y MidJourney.
Emad Mostaque, fundador y director general de Estabilidad AI, es la empresa responsable de Stable Diffusion. Stable Diffusion es un modelo de difusión latente desarrollado por el grupo CompVis de la LMU de Múnich, y fue diseñado por Patrick Esser y Robin Rombach, que previamente crearon la arquitectura del modelo de difusión latente utilizado por Stable Diffusion.
Una colaboración entre Stability AI, CompVis LMU, Runway, EleutherAI y LAION ha puesto Stable Diffusion a disposición del público.
La difusión estable puede desplegarse en varias plataformas, incluidos los dispositivos Windows y Apple. Utilizar el despliegue en el dispositivo en una aplicación puede salvaguardar la privacidad del usuario, lo que es preferible a un enfoque basado en servidor.
Creador de imágenes Bing de Microsoft

Microsoft dio a conocer una nueva herramienta llamada Imagen Bing Creator, que permite a los usuarios crear sus propias imágenes directamente dentro de Microsoft Edge. La empresa ha lanzado un conjunto de herramientas de creación diseñadas para avivar la creatividad y la autoexpresión. La herramienta permite a los usuarios crear imágenes personalizadas para compartir sus actualizaciones de vida o para cualquier otro propósito que puedan necesitar.
Los usuarios pueden acceder fácilmente al Creador de imágenes desde la barra lateral de Microsoft Edge. Microsoft ha tomado medidas proactivas para garantizar que la herramienta se utilice de forma responsable y no facilite la difusión de contenidos ofensivos.
La empresa ha establecido una política de contenidos que prohíbe el uso del Creador de imágenes en determinados casos, y los usuarios pueden denunciar cualquier infracción de esta política. Además, Microsoft ha implementado una tecnología para abordar los posibles sesgos que podrían surgir en la tecnología de generación de imágenes.
En este artículo, nos embarcaremos en un viaje para evaluar los resultados de cada generador de imágenes de IA descriptiva cuando se le solicitan idénticas indicaciones de texto.
Pregunta 1: Un Papá Noel moderno en un trineo tirado por renos en un día cálido y soleado en una carretera



Consigna 2: Un primer plano de un animal de grandes ojos, capturando su inocencia y ternura



Pregunte a 3: Un astronauta humano que juega a aterrizar en un nuevo planeta es recibido por criaturas alienígenas hostiles que sacan sus armas



Pregunte a 4: Arte abstracto moderno de la cubierta de un libro de una novela basada en la ciudad de Nueva York en atrevidos colores brillantes



Pregunte a 5: Un hombre decidiendo entre dos platos - uno con pizza y otro con una hamburguesa con queso encima



Pregunte a 6: Un guerrero herido montando su caballo en una montaña nevada con una espada en la mano



Pregunte a 7: Una imagen abstracta utilizando diferentes tonos que muestra el movimiento y el flujo del agua



Pregunte a 8: Salmón en un río con frondosos árboles verdes de fondo



Pregunte a 9: Un vaso de agua sobre una mesa con un limón siendo exprimido en él por una mano



Pregunte a 10: Vista del horizonte en un desierto desde el punto de vista de unas personas montadas en un elefante en él



Pregunte a 11: Un bosque donde el papel moneda crece en los árboles y los pájaros están hechos de monedas



Pregunte a 12: Tazón de ramen, cel shading, iluminación nocturna, fotorrealista



Pregunte a 13: Elon Musk es pobre y está en paro



Veredicto
Al evaluar los resultados de MidJourney, Stable Diffusion y Bing Image Creator, es evidente que no hay un ganador definitivo.
Cada generador interpreta las prompts de forma distinta, encontrándose similitudes en las salidas de Bing Image Creator y MidJourney. Stable Diffusion es eficaz cuando las prompts tienen descripciones claras, pero a menudo toma las palabras demasiado literalmente. Aunque MidJourney y Bing Image Creator suelen tener éxito, en ocasiones producen resultados que no se corresponden con las prompts.
En particular, Bing Image Creator emplea la cautela a la hora de generar resultados abusivos o incitadores, emitiendo un mensaje de advertencia cuando se le pide que cree una imagen de un Elon Musk pobre y desempleado. La adopción de estas medidas de protección por parte de Microsoft es digna de elogio.
Mientras tanto, la pericia de la red neuronal de MidJourney generó una imagen de un Elon Musk indígena y desamparado. Por lo tanto, se puede concluir que cada generador atenderá a su respectiva base de usuarios.
También puede explorar los mejores generadores de imágenes por IA para obtener imágenes asombrosas en cuestión de segundos.