El CEO de Open AI, Sam Altman, confirmó el lanzamiento de GPT-4o y dijo a través de sus redes sociales que estará disponible en el sitio oficial en las próximas semanas. La nueva versión del modelo permite procesar y crear textos, audios y videos. Además, el director de la empresa anunció un nuevo modo de voz y video.

Desde el primer lanzamiento de ChatGPT en julio de 2018, fueron presentadas seis versiones diferentes del chatbot. Se trata de un sistema de chat basado en el modelo de lenguaje por Inteligencia Artificial.

Según Open AI, la nueva versión representa una transición hacia una interacción persona-computadora mucho más fluida y natural. GPT-4o ("o" de "omni") aceptará como entrada cualquier combinación de texto, audio e imagen, y es capaz de generar cualquier combinación de salidas de texto, audio e imagen a gran velocidad.

Su velocidad de respuesta puede ser de tan solo 232 milisegundos, alcanzando un promedio de 320 milisegundos, tiempo similar a lo que tarda un humano para responder en una conversación normal frente a frente con otra persona.

/Inicio Código Embebido/

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN



Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx