OpenAI acaba de presentar GPT-4o, un nuevo modelo multimodal avanzado que integra procesamiento de texto, visión y audio, estableciendo nuevos puntos de referencia para el rendimiento, junto con una serie de características nuevas.
El nuevo modelo:
GPT-4o proporciona un rendimiento mejorado en texto, visión, audio, codificación y generaciones no inglesas, superando el rendimiento de GPT-4T.
El nuevo modelo es un 50% más barato de usar, tiene límites de velocidad 5 veces más altos que GPT-4T y cuenta con el doble de velocidad de generación que los modelos anteriores.
También se reveló que el nuevo modelo es el misterioso ‘soy-también-un-buen-chatbot-gpt2’ encontrado en Lmsys Arena la semana pasada.
Voz y otras actualizaciones:
Las nuevas capacidades de voz incluyen respuestas en tiempo real, detección y respuesta con emoción y combinación de voz con texto y visión.
La demostración mostró hazañas como la traducción en tiempo real, dos modelos de IA que analizan un video en vivo y el uso de voz y visión para tutoría y asistencia en codificación.
El blog de OpenAI también detalló avances como generación 3D, creación de fuentes, grandes mejoras en la generación de texto dentro de imágenes, síntesis de efectos de sonido y más.
OpenAI también anunció una nueva aplicación de escritorio ChatGPT para macOS con una interfaz de usuario actualizada, que se integra directamente en los flujos de trabajo de la computadora.
Gratis para todos:
GPT-4o, GPT y funciones como memoria y análisis de datos ahora están disponibles para todos los usuarios, lo que trae capacidades avanzadas al nivel gratuito por primera vez.
El modelo GPT-4o se está implementando actualmente para todos los usuarios en ChatGPT y a través de la API, y se espera que las nuevas capacidades de voz lleguen en las próximas semanas.
Por qué es importante: Las capacidades multimodales y de voz en tiempo real están transformando la IA de una herramienta a una inteligencia con la que colaboramos, aprendemos y crecemos. Además, un grupo completamente nuevo de usuarios gratuitos (que podrían haberse quedado atrapados con un GPT 3.5 mediocre) están a punto de obtener la mayor actualización de sus vidas en forma de GPT-4o.
Si te lo perdiste, puedes volver a ver la demostración completa de OpenAI aquí .