DALL-E: Creando imágenes a partir del texto

septiembre 02, 2021

DALL · E [1] es una versión de 12 mil millones de parámetros de GPT-3 entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares texto-imagen. Descubrimos que tiene un conjunto diverso de capacidades, incluida la creación de versiones antropomorfizadas de animales y objetos, la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes.

GPT-3 demostró que el lenguaje se puede utilizar para instruir a una gran red neuronal para que realice una variedad de tareas de generación de texto. Imagen GPT mostró que el mismo tipo de red neuronal también se puede utilizar para generar imágenes con alta fidelidad. Extendemos estos hallazgos para mostrar que la manipulación de conceptos visuales a través del lenguaje está ahora al alcance.

Ejemplo del DALL · E con algunos textos:

Fuente:

https://openai.com/blog/dall-e/

Buscar este blog

Blog Inteligencia Artificial - Semillero IA, Universidad Autónoma de Occidente

DALL-E: Creando imágenes a partir del texto

Comentarios

Publicar un comentario

Entradas populares de este blog

Crea modelos de Deep Learning con Teachable Machine

ChatGPT Atlas: El Navegador que Cambia las Reglas del Juego

MODELOS DE IA ULTRACOMPACTOS PERMITEN LLEVAR EL RAZONAMIENTO A DISPOSITIVOS COTIDIANOS