Por: Renato Olmos, Diario Financiero
OpenAI lo ha hecho otra vez. Si hace un año fue ChatGPT-4 y en febrero un modelo para crear videos de hasta un minuto llamado Sora,
este lunes la startup presentó GPT-4o, un nuevo modelo que ofrecerá el mismo nivel de capacidad que GPT-4, pero “mucho más rápido” y con mejoras en capacidades de texto, voz y visión.
En una presentación transmitida a través de YouTube este lunes,
la firma estadounidense dio a conocer el nuevo modelo, además de anunciar que será gratis y con una aplicación para escritorios. Los usuarios de pago accederán a mejores funciones.
"Estamos mirando al futuro de la interacción entre nosotros y las máquinas", dijo la
CTO de OpenAI, Mira Murati, durante la presentación.
El anuncio de la tecnológica se da en medio de la desatada carrera de startups y empresas alrededor del mundo por acelerar la adopción de la IA generativa para tareas cotidianas, así como para desarrollos industriales.
Dos desarrolladores de OpenAI, junto a Murati, hicieron demostraciones en vivo del nuevo modelo, el cual fue capaz de responder a preguntas de manera instantánea como si se tratara de una persona, como resolver una ecuación lineal, narrar una historia con distintas tonalidades y emociones, e incluso traducir una conversación de italiano a inglés.
En un blog, OpenAI aseguró que GPT-4o es “mucho mejor” que cualquier modelo de IA existente, capaz de comprender y comentar imágenes.
Quienes accedan gratuitamente a GPT-4o -que funcionará con más de 50 idiomas- podrán analizar datos, crear gráficos, subir archivos para resumirlos o analizarlos y utilizar otros modelos GPT desde la tienda, es decir, funcionalidades que hasta ahora solo estaban disponibles para suscriptores.
“En el futuro, las mejoras permitirán una conversación de voz más natural y en tiempo real, así como la posibilidad de conversar con ChatGPT a través de vídeo en tiempo real.
Por ejemplo, podrías mostrar a ChatGPT un partido deportivo en directo y pedirle que te explique las reglas”, señalaron en su blog.
Si bien Murati no dio a conocer la fecha exacta del lanzamiento del nuevo modelo, dijo que estará disponible en las próximas semanas.
"Una parte clave de nuestra misión es poner en manos de la gente herramientas de IA muy capaces de forma gratuita o a muy buen precio", dijo en un blog el
CEO de OpenAI, Sam Altman. "El nuevo modo de voz (y video) es la mejor interfaz informática que he utilizado nunca. Parece la IA de las películas; y todavía me sorprende un poco que sea real", agregó.