DALL-E: Creando imágenes a partir del texto

 

DALL · E [1] es una versión de 12 mil millones de parámetros de GPT-3 entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares texto-imagen. Descubrimos que tiene un conjunto diverso de capacidades, incluida la creación de versiones antropomorfizadas de animales y objetos, la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes.

GPT-3 demostró que el lenguaje se puede utilizar para instruir a una gran red neuronal para que realice una variedad de tareas de generación de texto. Imagen GPT mostró que el mismo tipo de red neuronal también se puede utilizar para generar imágenes con alta fidelidad. Extendemos estos hallazgos para mostrar que la manipulación de conceptos visuales a través del lenguaje está ahora al alcance.

Ejemplo del DALL · E con algunos textos:


Comentarios

Entradas populares de este blog

Crea modelos de Deep Learning con Teachable Machine

Inteligencia Artificial: ¿ Cómo hacer un programa de clasificación de imágenes ?

¡¡¡ Estudiante Autónoma, realiza propuesta de Arte Generativo Usando Redes Neuronales Convolucionales y Redes Generativas Adversas !!!