¿Has oído hablar de las fotografías generadas automáticamente por inteligencia artificial (IA)? Elena me ha invitado a su web para que te hable de su potencial y te presente más de 10 herramientas que podrás probar hoy mismo.
En un rato estarás generando por ti mismo imágenes únicas (de momento libres de derechos) que podrás incorporar a tu blog, a tu próxima presentación, sesión clínica, charla, documentación para pacientes…
Con tu palabra (escrita) podrás “crear” bocetos, logos, ilustraciones y otros recursos gráficos (y sus variaciones) de una manera extraordinariamente sencilla.
El funcionamiento de la mayoría de las plataformas que te enlazo en el post es muy simple: solo tienes que acceder online a sus webs y “describir” lo que quieres que “te dibuje” su IA casi como si estuvieras utilizando un buscador. Son los Prompts que funcionan como una Query (un término de búsqueda) cuando utilizas Google.
Ya te habrás dado cuenta de que no soy Elena. Hoy os acerco a un invitado muy especial Eduardo Tornos, especialista en marketing sanitario.
Edu, no lo sabe, pero algún consejo que me ha dado me ha cambiado la vida. Y tampoco sabe que me tuvo alucinando un par de días con lo que me descubrió: algoritmos de inteligencia artificial que dibujan lo que tú quieras.
Hay dos momentos en mi vida en la que las cosas digitales marcaron un antes y un después en mí. El primero: el día que con mi Blackberry me metí en Internet con el móvil. Tenía internet en la palma de mi mano. Cierro los ojos y revivo el momento. No me lo creía. El segundo momento fue el otro día cuando Edu me descubrió lo de inteligencia artificial que dibuja cosas.
Os lo juro, estuve un par de días flipando. Y alguna compi de trabajo también.
Así que tengo la suerte de que nos cuente de qué va esto.
Os dejo con su post
Elena
Estas IAs están cambiando las reglas de juego en Internet.
Con estas herramientas los bancos de imagen (Shutterstock por ejemplo) solo tienen un camino: añadir una nueva funcionalidad que permita que sus clientes generen la imagen que necesitan si no encuentran en su stock exactamente lo que buscan…
A los creadores de contenido nos abren un universo de posibilidades porque son (pueden llegar a ser) motores de búsqueda “generativos” muy útiles: herramientas que tras “estudiar” nuestra huella digital en internet (imágenes y texto) responden a nuestras consultas (Prompts) creando resultados basados en nuestro patrimonio visual y escrito.
El sector salud no es ajeno a esta (r)evolución en la que los algoritmos nos ayudan a generar automáticamente imágenes (O textos de divulgación… ya te hablaré otro día de esto).
Estoy convencido de que recordaremos este 2022 como el año en el que la inteligencia artificial (IA) cambió radicalmente nuestra forma de generar contenido. (Nota: desde que Elena publicó este post el pasado 18 de septiembre he tenido que pasar a actualizarlo no menos de 9 veces en 10 días).
Estas IAs simplifican al máximo el proceso de creación de imágenes o ilustraciones. No necesitas hacer un master de diseño gráfico; no necesitas hacer un curso avanzado de Illustrator, Photoshop o Canva…
Nota del autor: no voy a valorar en este post los problemas y debates que las IA generadoras están ya planteando. Suponen una disrupción que supondrá una más que segura redefinición de algunos puestos de trabajo creativos (fotógrafos, diseñadores e ilustradores por ejemplo) y complicarán la distinción entre lo verdadero y falso cuando se generalice su uso en campañas de desinformación, odio o difusión de deepfakes por Internet. Daría para “un libro” todo esto…
Empleadas “para hacer el mal” las AI Text to Image Editors tienen un potencial inquietante…
Tampoco voy a valorar el follón que se abre con los derechos de autor de los millones de imágenes colgadas en Internet que estos algoritmos están utilizando gratuitamente para entrenar sus habilidades.
La tecnología que está detrás de ellas es alucinante. Sus redes neuronales son capaces de interpretar (bastante bien) nuestras indicaciones (ahora por escrito, mañana por voz) traduciéndolas en imágenes (píxeles).
(Voy a intentar explicar algo muy complejo de una manera sencilla) Ojo, estas AI no entienden las cosas a la “manera humana”. No saben realmente lo que les pedimos…
Correlacionan signos (nuestra escritura) e imágenes.
Y aprenden y mejoran sobre la marcha cuando establecen patrones (asociaciones) de signos parecidos (que, insisto, no saben que significan) con millones de imágenes que han visto antes en Internet. Así opera CLIP, la red neuronal que está detrás de Dall·E 2
No te haces una idea de lo rápido que va esto…
En abril 2022 OpenAI presentó DALL·E 2, la segunda versión de su IA en la que estaban trabajando desde apenas un año antes a la que ya puedes acceder gratuitamente desde este link. Aunque también es de pago, para probarla te regalan 50 créditos + 15 mensuales.
DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.
Presentación de Dall-e 2 en su web
Poco después apareció DALL-E mini (ahora Craiyon) que se hizo superpopular en pocas semanas. En mayo Google hizo público su último desarrollo (todavía no es accesible al público en general) y en verano se abrió Midjourney en Discord y se liberó el modelo Stable Diffusion que está desarrollando la comunidad de programadores de Stability AI. Es open source. Puedes descargarlo para usarlo en tu ordenador o puedes probarlo en su web o en otros proyectos que ya lo han integrado como Artbreeder o Pixelz.ai. Luego te hablaré de ellos.
Hace un par de semanas se presentó el primer bloque de Gutenberg que permite generar imágenes con estas IA sin salir de WordPress (Imajinn) y puedes encontrar apps plenamente funcionales para tu smartphone que utilizan estas tecnologías (Starryai.com, Wombo art o Lightrics)…
Y ya está integrada en Canva o Wepik, el editor online de Freepik.
Esto es solo el principio.
Hoy mismo -28 de septiembre- actualizo la publicación para contarte que OpenAI ha dado por fin acceso a DALL·E 2 a todo el mundo sin lista de espera.
El 29 de septiembre Meta presentó su modelo Make a Video entrenado para generar vídeos desde texto. Google no ha tardado tampoco en mover ficha y el día 5 de octubre presentó #ImagenVideo, su IA entrenada para generar vídeos en HD (1280×768). En paralelo están entrenando Plenaki, otra IA que ya es capaz de generar vídeos más largos -de menos calidad de momento- resolviendo indicaciones más complejas de los usuarios.
Y ayer día 30 se presentó DreamFusion, una IA capaz de generar 3D desde texto: text -> image -> 3D. Te dejo por aquí enlazada más información del proyecto.
Epic Games (Unreal) está trabajando en tecnologías que sean capaces de generar entornos 3D digitales completos (metaverso) y tengo noticias que también se están entrenando IAs que, desde texto, modelizan productos para su posterior impresión 3D.
Ya hay quién sueña con una IA capaz de crear una película completa con solo indicarle el argumento, contexto y protagonistas…
Lo dejo por aquí…
La clave para conseguir una imagen genial es que trabajes bien el texto de pedido (Prompt)
Todos las herramientas mejoran su rendimiento si incorporas detalles en el texto de tu encargo -la descripción- (Prompt). No funcionan demasiado bien (de momento) si abusas de conceptos abstractos, generalidades o términos ambiguos.
Compruébalo tu mismo.
Verás cómo mejora el resultado según vas incorporando información en el prompt sobre el tipo de imagen que quieres que “pinte” (foto, pintura, ilustración etc.), colores, estilo (realista, foto realista o imitación de un artista… por ejemplo), elementos que quieres que aparezcan en la creación (objetos, personas, animales), una descripción de la acción y le das un poco de contexto (paisaje/fondo).
Te recomiendo que utilices inicialmente un Prompt Builder como pueden ser Phaser.tech, Typestitch o Promtomania.
También puedes “inspirarte” en lo que están haciendo usuarios más avanzados consultando Lexica.art -un buscador de creaciones generadas con Stable Diffusion (Gracias UBC) o Promptbase.com, un marketplace en el que se compran y venden Prompts escritos por artistas que no pintan, no diseñan, no fotografían, no dibujan: DESCRIBEN.
Empiezo mencionándote las 4 iniciativas que considero más avanzadas: Imagen y Parti de Google, Nuwa Infinity de Microsoft y Dalle E 2 de OpenAI’s de la que ya te he hablado (Ya puedes probarla desde aquí) Acércate a sus webs para conocerlas. No las pierdas de vista.
Más pronto que tarde estarán disponibles para todos los usuarios.
A partir de aquí encontrarás 8 desarrollos de AI generadoras de imagen desde texto que ofrecen distintas prestaciones en cuanto a calidad de la imagen, acabado, resolución y tamaño. Salvo indicación expresa (GRATUITA), las soluciones que te presento te pedirán que te registres para probarlas. Si quieres hacer un uso más intensivo tendrás que comprar “créditos” que irás consumiendo según vayas generando tus imágenes.
¡Ah! En la comparación de rendimiento de todas ellas voy a utilizar un prompt muy sencillo para ver cómo lo resuelven de bien: x-ray of a realistic broken leg
DALL·E 2
Puedes acceder directamente y sin listas de espera dándote de alta en OpenAI desde aquí.
Craiyon
100% Gratuita. Hasta hace unos meses se llamaba Dalle-Mini.
Midjourney
Gratuita. Corre sobre Discord. Aquí te dejo más información sobre su uso. Si quieres saber un poco más sobre ella acércate a leer esta entrevista a David Holz (fundador de MidJourney) en The Verge.
Stable Diffusion Demo
Gratuita. Utiliza para generar las imágenes una versión limitada en prestaciones de Stability AI.
DreamStudio
Su motor de creación es también Stability iA. El código es open source. Podrías descargártelo en tu ordenador para jugar con él.
Las siguientes herramientas no proporcionan -de momento- la misma calidad que las primeras.
Promptbase
Te he hablado hace unos párrafos de ella. Es el marketplace que te permite además generar imágenes.
Pixelz
PhotoSonic – WriteSonic
PixRay
Termino el post enlazándote el programa 174 de Un billete a Chattanooga en el que Ana Cirujano y Pablo Moratinos repasaron algunas de las herramientas que te he mencionado en este artículo.
Super interesante.
Si te interesa profundizar en el tema te recomiendo que te acerques a leer 4 Hot Takes About The Wild New World Of Generative AI de Rob Toews (Forbes).
Increíble, me ha encantado el artículo, es flipante lo que viene, muy interesante, no tenía ni idea. Gracias a los dos por la info y las recomendaciones.
Gracias Verónica ! Increible el cambio que se viene ! sigue escribiendo!