Herramientas (AI) con las que ya puedes crear gratis imágenes sobre salud

¿Has oído hablar de las fotografías generadas automáticamente por inteligencia artificial (IA)? Elena me ha invitado a su web para que te hable de su potencial y te presente más de 10 herramientas que podrás probar hoy mismo.

En un rato estarás generando por ti mismo imágenes únicas (de momento libres de derechos) que podrás incorporar a tu blog, a tu próxima presentación, sesión clínica, charla, documentación para pacientes…

Con tu palabra (escrita) podrás «crear» bocetos, logos, ilustraciones y otros recursos gráficos (y sus variaciones) de una manera extraordinariamente sencilla.

Células tumorales – Midjourney

El funcionamiento de la mayoría de las plataformas que te enlazo en el post es muy simple: solo tienes que acceder online a sus webs y «describir» lo que quieres que «te dibuje» su IA casi como si estuvieras utilizando un buscador. Son los Prompts.

Ya te habrás dado cuenta de que no soy Elena. Hoy os acerco a un invitado muy especial Eduardo Tornos, especialista en marketing sanitario.

Edu, no lo sabe, pero algún consejo que me ha dado me ha cambiado la vida. Y tampoco sabe que me tuvo alucinando un par de días con lo que me descubrió: algoritmos de inteligencia artificial que dibujan lo que tú quieras.

Hay dos momentos en mi vida en la que las cosas digitales marcaron un antes y un después en mí. El primero: el día que con mi Blackberry me metí en Internet con el móvil. Tenía internet en la palma de mi mano. Cierro los ojos y revivo el momento. No me lo creía. El segundo momento fue el otro día cuando Edu me descubrió lo de inteligencia artificial que dibuja cosas.

Os lo juro, estuve un par de días flipando. Y alguna compi de trabajo también.

Así que tengo la suerte de que nos cuente de qué va esto.
Os dejo con su post

Elena

Estas IAs están cambiando las reglas de juego en Internet.

A los creadores de contenido nos abren un universo de posibilidades porque son (pueden llegar a ser) motores de búsqueda «generativos» muy útiles: herramientas que tras «estudiar» nuestra huella digital en internet (imágenes y texto) responden a nuestras consultas (Prompts) creando resultados basados en nuestro patrimonio visual y escrito.

El sector salud no es ajeno a esta (r)evolución en la que los algoritmos nos ayudan a generar automáticamente imágenes (O textos de divulgación… ya te hablaré otro día de esto).

Multicolor photo future hospital with feeling of love – imagen generada con Dream Studio Lite

Estoy convencido de que recordaremos este 2022 como el año en el que la inteligencia artificial (IA) cambió radicalmente nuestra forma de generar contenido.

Estas IAs simplifican al máximo el proceso de creación de imágenes o ilustraciones. No necesitas hacer un master de diseño gráfico; no necesitas hacer un curso avanzado de Illustrator, Photoshop o Canva…

Nota del autor: no voy a valorar en este post los problemas y debates que las IA generadoras están ya planteando. Suponen una disrupción que supondrá una más que segura redefinición de algunos puestos de trabajo creativos (fotógrafos, diseñadores e ilustradores por ejemplo) y complicarán la distinción entre lo verdadero y falso cuando se generalice su uso en campañas de desinformación, odio o difusión de deepfakes por Internet. Daría para «un libro» todo esto…

Empleadas «para hacer el mal» las AI Text to Image Editors tienen un potencial inquietante…

Tampoco voy a valorar el follón que se abre con los derechos de autor de los millones de imágenes colgadas en Internet que estos algoritmos están utilizando gratuitamente para entrenar sus habilidades.

La tecnología que está detrás de ellas es alucinante. Sus redes neuronales son capaces de interpretar (bastante bien) nuestras indicaciones (ahora por escrito, mañana por voz) traduciéndolas en imágenes (píxeles).

(Voy a intentar explicar algo muy complejo de una manera sencilla) Ojo, estas AI no entienden las cosas a la «manera humana». No saben realmente lo que les pedimos…

Correlacionan signos (nuestra escritura) e imágenes.

Y aprenden y mejoran sobre la marcha cuando establecen patrones (asociaciones) de signos parecidos (que, insisto, no saben que significan) con millones de imágenes que han visto antes en Internet. Así opera CLIP, la red neuronal que está detrás de Dalle e 2.

No te haces una idea de lo rápido que va esto…

En abril 2022 OpenAI presentó DALL-E 2, la segunda versión de su IA en la que estaban trabajando desde apenas un año antes.

Imagen de una mujer generada por Dalle E2 a la venta en Oromptbase

DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.

Presentación de Dall-e 2 en su web

Poco después apareció DALL-E mini (ahora Craiyon) que se hizo superpopular en pocas semanas. En mayo Google hizo público su último desarrollo (todavía no es accesible al público en general) y en verano se abrió Midjourney en Discord y se liberó el código Stable Diffusion de la comunidad de programadores de Stability AI. Es open source. Puedes descargarlo para usarlo en tu ordenador o puedes probarlo en su web o en otros proyectos que ya lo han integrado como Artbreeder o Pixelz.ai. Luego te hablaré de ellos.

x-ray of a realistic leg – Dalle E mini (Craiyon)

Hace un par de semanas se presentó el primer bloque de Gutenberg que permite generar imágenes con estas IA sin salir de WordPress (Imajinn) y puedes encontrar apps plenamente funcionales para tu smartphone que utilizan estas tecnologías (Starryai.com, Wombo art o Lightrics)…

Y ya está integrada en Canva o  Wepik, el editor online de Freepik.

Esto es solo el principio.

Estas IAs son capaces de «crear» partiendo de conceptos no relacionados como puede ser una silla y un aguacate.

Disco Diffusion, Runway –desde aquí puedes solicitar el acceso a su beta– o CogVideo están entrenando IAs generadoras de vídeo desde texto (text to video). Meta y Epic Games (Unreal) están trabajando en tecnologías que sean capaces de generar entornos 3D digitales completos (metaverso) y tengo noticias que también se están entrenando IAs que, desde texto, modelizan productos para su posterior impresión 3D.

Ya hay quién sueña con una IA capaz de crear una película completa con solo indicarle el argumento, contexto y protagonistas

Lo dejo por aquí…

La clave para conseguir una imagen genial es que trabajes bien el texto de pedido (Prompt)

Todos las herramientas mejoran su rendimiento si incorporas detalles en el texto de tu encargo -la descripción- (Prompt). No funcionan demasiado bien (de momento) si abusas de conceptos abstractos, generalidades o términos ambiguos.

Compruébalo tu mismo.

Verás cómo mejora el resultado según vas incorporando información en el prompt sobre el tipo de imagen que quieres que «pinte» (foto, pintura, ilustración etc.), colores, estilo (realista, foto realista o imitación de un artista… por ejemplo), elementos que quieres que aparezcan en la creación (objetos, personas, animales), una descripción de la acción y le das un poco de contexto (paisaje/fondo).

Pasillo interior bien iluminado de una farmacia. Sin gente. Luz artificial

Te recomiendo que utilices inicialmente un Prompt Builder como pueden ser Phaser.tech, Typestitch o Promtomania.

También puedes «inspirarte» en lo que están haciendo usuarios más avanzados consultando Lexica.art -un buscador de creaciones generadas con Stable Diffusion (Gracias UBC) o Promptbase.com, un marketplace en el que se compran y venden Prompts escritos por artistas que no pintan, no diseñan, no fotografían, no dibujan: DESCRIBEN.

Empiezo mencionándote las 4 iniciativas que considero más avanzadas: Imagen y Parti de Google, Nuwa Infinity de Microsoft y Dalle – E 2 de OpenAI’s de la que ya te he hablado (Puedes apuntarte desde aquí su lista de espera). Acércate a sus webs para conocerlas. No las pierdas de vista.

Más pronto que tarde estarán disponibles para todos los usuarios.

A partir de aquí encontrarás 8 desarrollos de AI generadoras de imagen desde texto que ofrecen distintas prestaciones en cuanto a calidad de la imagen, acabado, resolución y tamaño. Salvo indicación expresa (GRATUITA), las soluciones que te presento te pedirán que te registres para probarlas. Si quieres hacer un uso más intensivo tendrás que comprar «créditos» que irás consumiendo según vayas generando tus imágenes.

¡Ah! En la comparación de rendimiento de todas ellas voy a utilizar un prompt muy sencillo para ver cómo lo resuelven de bien: x-ray of a realistic broken leg

Craiyon

100% Gratuita. Hasta hace unos meses se llamaba Dalle-Mini.

Midjourney

Gratuita. Corre sobre Discord. Aquí te dejo más información sobre su uso. Si quieres saber un poco más sobre ella acércate a leer esta entrevista a David Holz (fundador de MidJourney) en The Verge.

Stable Diffusion Demo

Gratuita. Utiliza para generar las imágenes una versión limitada en prestaciones de Stability AI.

DreamStudio

Su motor de creación es también Stability iA. El código es open source. Podrías descargártelo en tu ordenador para jugar con él.

Las siguientes herramientas no proporcionan -de momento- la misma calidad que las primeras.

Promptbase

Te he hablado hace unos párrafos de ella. Es el marketplace que te permite además generar imágenes.

Pixelz

PhotoSonic – WriteSonic

PixRay

Termino el post enlazándote el programa 174 de Un billete a Chattanooga en el que Ana Cirujano y Pablo Moratinos repasaron algunas de las herramientas que te he mencionado en este artículo.

Super interesante.

Si te interesa profundizar en el tema te recomiendo que te acerques a leer 4 Hot Takes About The Wild New World Of Generative AI de Rob Toews (Forbes).

Deja un comentario