OpenAI lanza nuevas funciones de inteligencia vocal en su API

La nueva API de OpenAI incluye funciones de voz que permiten a las aplicaciones hablar, transcribir y traducir conversaciones en tiempo real. Ideal para atención al cliente y otros sectores.

07/05/2026 | 21:56Redacción Cadena 3

FOTO: OpenAI presenta nuevas funciones de voz en su API

Mirá las notas de Cadena 3 en Google News

Mirá las notas de Cadena 3 en WhatsApp

OpenAI anunció el jueves que su API incorporará nuevas funciones de inteligencia vocal diseñadas para ayudar a los desarrolladores a crear aplicaciones que puedan hablar, transcribir y traducir conversaciones con los usuarios.

La compañía lanzó el nuevo modelo GPT-Realtime-2, un modelo de voz que simula la conversación con los usuarios de manera realista. A diferencia de su predecesor (GPT-Realtime-1.5), este nuevo modelo se basa en la clase de razonamiento GPT-5, creado para manejar solicitudes más complejas de los usuarios.

Además, la empresa lanzó GPT-Realtime-Translate, que proporciona servicios de traducción en tiempo real que "mantienen el ritmo" de la conversación. Esta función incluye más de 70 idiomas de entrada (idiomas que puede comprender) y 13 idiomas de salida (idiomas que se relatan al hablante).

Por último, se presentó la nueva capacidad de transcripción, GPT-Realtime-Whisper, que ofrece a los usuarios capacidades de voz a texto en vivo, capturando las interacciones a medida que ocurren.

La compañía destacó: "Juntas, los modelos que estamos lanzando mueven el audio en tiempo real de una simple respuesta a interfaces de voz que realmente pueden trabajar: escuchar, razonar, traducir, transcribir y tomar acción a medida que se desarrolla la conversación".

¿A quién beneficiarán estas actualizaciones? Las empresas que buscan expandir sus capacidades de atención al cliente son un objetivo obvio. Sin embargo, OpenAI también señala que sus nuevas funciones ayudarán en una amplia variedad de áreas, incluyendo educación, medios, eventos y plataformas para creadores, entre otros.

A pesar de la utilidad de estas herramientas desde una perspectiva empresarial, también es plausible que puedan ser mal utilizadas. La empresa afirmó que ha implementado salvaguardias para evitar que sus nuevas funciones se utilicen para crear spam, fraude u otras formas de abuso en línea. Se han incorporado ciertos disparadores en el sistema para que "las conversaciones puedan ser detenidas si se detecta que violan nuestras pautas de contenido dañino", afirmó OpenAI.

Todos los nuevos modelos de voz están incluidos en la API Realtime de OpenAI. Translate y Whisper se facturan por minuto, mientras que GPT-Realtime-2 se factura por consumo de tokens.

Lectura rápida

¿Qué anunció OpenAI?
OpenAI anunció nuevas funciones de inteligencia vocal en su API, incluyendo modelos para conversación, traducción y transcripción en tiempo real.

¿Quién es el autor del artículo?
El artículo fue escrito por Lucas Ropek, un periodista de TechCrunch especializado en tecnología y AI.

¿Cuándo se lanzó esta nueva API?
La nueva API se anunció el 7 de mayo de 2026.

¿Dónde se pueden utilizar estas funciones?
Estas funciones están dirigidas a empresas que buscan mejorar la atención al cliente, pero también tienen aplicaciones en educación y otros sectores.

¿Qué medidas de seguridad implementó OpenAI?
OpenAI incorporó salvaguardias para evitar el uso indebido de sus funciones, impidiendo el spam y el fraude.

Temas

Lo último

10:24 La Popu

Solidaridad internacional tras la tragedia. Trump ofrece ayuda a Venezuela tras devastadores terremotos y lamenta víctimas

10:08 Mundo

Audio. El bloque radical en el Senado no apoyará interpelación al Jefe de Gabinete
Panorama Federal
Episodios
Audio. Claudia Sheinbaum anuncia apoyo a Venezuela tras terremotos devastadores
Panorama Federal
Episodios
Audio. México historia en Mundial 2026: nueve puntos y arcos invictos en fase de grupos
Panorama Federal
Episodios
Audio. Héctor Pablo Bidoglio, DT rosarino en Venezuela.
Noticias Rosario
Episodios
Audio. Continúa el juicio por la tragedia del ARA San Juan en Río Gallegos
Panorama Federal
Episodios
Audio. Continúa el juicio por la tragedia del ARA San Juan en Río Gallegos
Panorama Federal
Episodios
Audio. Venezuela enfrenta devastación con 164 muertos por terremotos, búsqueda sigue activa
Noticias
Episodios
Audio. Ecuador se juega el todo por el todo ante Alemania en Nueva York
Noticias
Episodios
Audio. Imputan a madre y pareja por la muerte de Tiago, un niño de dos años
Panorama Federal
Episodios
Audio. Hallazgo de uranio empobrecido en planta de reciclaje de Río Cuarto
Noticias
Episodios
Audio. Homicidio en la muerte de Tiago: imputan a su madre y su pareja por violencia familiar
Panorama Federal
Episodios
Audio. Continúan los reclamos en la Administración Pública de Santa Cruz por aumentos salariales
Panorama Federal
Episodios
Audio. Desesperado pedido de una venezolana tras el derrumbe por el sismo en Caracas
La Mesa de Café
Episodios
Audio. Congreso de Pastoral de Adicciones se realiza en Córdoba con distintos disertantes
Panorama Federal
Episodios
Audio. Trabajadores judiciales de Tierra del Fuego inician paro por aumento salarial
Panorama Federal
Episodios
Audio. Escuela Paul Harris sin clases tras ataque violento con arma blanca
Panorama Federal
Episodios
Audio. La muestra fotográfica sobre Lionel Messi se inaugura en Rafaela con acceso gratuito
Panorama Federal
Episodios
Audio. Cae 'viuda negra' policía que robaba a sus víctimas en aplicaciones de citas
Panorama Federal
Episodios
Audio. El nuevo concesionario de la Ruta 34 llevará conectividad a la región con 14 km de obra
Panorama Federal
Episodios
Audio. La vida en Texas
La otra mirada
Episodios