GPT 3 la IA que revoluciona el Natural Language Processing

marzo 14, 2022

El texto en negrilla es escrito por un humano, el resto es autocompletado por una IA

En junio de 2020 la empresa OPENAI presentó su más reciente modelo API hasta esa fecha, que es la tercera versión de GPT una familia de modelos de Procesamiento del Lenguaje Natural (“NLP”), GPT-3 que es el sucesor directo de GPT-2 que tenía 1.500 millones de parámetros, en cambio este modelo tiene 175 billones de parámetros determinándolo como la red neuronal más larga en el momento de su publicación, el tamaño de este modelo fue producto de su entrenamiento con todos los libros públicos que se hayan escrito y estén disponibles, toda la Wikipedia, millones de páginas web y documentos científicos disponibles en Internet; con este “dataset” creó conexiones en un modelo de 700 GB ubicado en 48 GPUs de 16 GB cada una de ellos, en comparación de GPT-2 tuvo un peso de 40 GB y analizando 45 millones de páginas web.

Esta API proporciona a propósitos generales una interfaz "texto de entrada, texto de salida" (“text in, text out”), que significa que ante cualquier texto de entrada como una oración o frase que se le de, la API devolverá un texto nuevo y completo, intentando coincidir la coherencia y gramática con el texto de entrada que se le fue asignado. También permite realizar otras tareas como traducción, respuesta a preguntas, descifrar palabras, usara una palabra nueva en una oración, o realizar aritmética de 3 dígitos. Todo esto le permite a los usuarios probarla con cualquier tarea que incluya el idioma inglés en un entorno virtual.

El texto en negrilla es escrito por un humano, el resto es autocompletado por la API

La variedad de tareas permite demostrar la gran capacidad que tiene este programa, no solo para devolver un texto coherente, sino porque para realizar esto, previamente debe comprender el texto de entrada y su coherencia, y además luego de forma aleatoria crear un nuevo texto que sea coherente y verificar la relación entre ambos; incluso ahora en la aplicación “Viable” que utiliza GPT-3, este modelo es capaz de identificar los temas del lenguaje natural, sentimientos y emociones en un texto, que es utilizado por usuarios y empresas para analizar sus encuestas, registros de chat en vivo y reseñas, para identificar la percepción del público respecto a sus productos y servicios o los problemas o disconformidades que tienen y donde se originan; por ejemplo, si se le pregunta "¿Qué es lo que frustra a nuestros clientes sobre la experiencia de pago?", esta IA respondería: "Los clientes están frustrados con el flujo de pago porque tarda demasiado en cargarse. También quieren una forma de editar su dirección al finalizar la compra y guardar múltiples métodos de pago”.

También puede ser "programado" mostrándole solo algunos ejemplos de lo que le gustaría que hiciera, o asignándole las indicaciones en forma de texto, permitiéndole incluso programar; Aunque su éxito generalmente varía según la complejidad de la tarea asignada. Sin embargo, la API puede seguir siendo perfeccionada en el rendimiento en tareas específicas a medida que siga siendo entrenada con un “dataset” (pequeño o grande) de ejemplos que se le proporcione, o aprendiendo de los comentarios humanos que son proporcionados por usuarios o etiquetadores cuando utilizan este modelo.

Esta IA supone un peligro al permitir la generación automática de texto y además que sea coherente, o que se puede considerar como un texto escrito por un humano, por lo cual este modelo puede ser usado con propósitos dañinos como acoso, spam, radicalización o astroturfing (Comentarios positivos respecto a un producto, que son falsos y se hacen pasar como comentarios de consumidores satisfechos), ante esto la empresa cuando lanzó su modelo en 2020, solo permitió el acceso a una versión beta privada, en lugar de la disponibilidad pública como hace con todos sus modelos de IA, de ahí su nombre OPENAI (IA’s abiertas, o sea de libre acceso al público), y comunicó que estaba dispuesta a compartir a los usuarios y la comunidad lo que descubran mediante el análisis e investigación de este modelo para construir más sistemas de IA con objetivos positivos. Aunque desde noviembre de 2021 permitieron el acceso libre a todo el público después de implementar distintas medidas de seguridad.

Buscar este blog

Blog Inteligencia Artificial - Semillero IA, Universidad Autónoma de Occidente

GPT 3 la IA que revoluciona el Natural Language Processing

Referencias:

https://openai.com/blog/openai-api/

https://openai.com/blog/gpt-3-apps/

https://www.theregister.com/2022/03/03/language_model_gpt3/

https://www.xataka.com/robotica-e-ia/gpt-3-nuevo-modelo-lenguaje-openai-capaz-programar-disenar-conversar-politica-economia

https://developer.nvidia.com/blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/

https://hipertextual.com/2021/11/api-openai-acceso-sin-lista-espera

Comentarios

Publicar un comentario

Entradas populares de este blog

Crea modelos de Deep Learning con Teachable Machine

ChatGPT Atlas: El Navegador que Cambia las Reglas del Juego

MODELOS DE IA ULTRACOMPACTOS PERMITEN LLEVAR EL RAZONAMIENTO A DISPOSITIVOS COTIDIANOS