¡Se acabó lo de escribir como robots! OpenAI por fin se ha puesto las pilas y está liberando el modo voz de ChatGPT, una función más esperada que el aguinaldo y que nos teletransporta directito a la peli ‘Her’. Sí, señores, hablar con las máquinas como si fueran compas ya no es cosa de ciencia ficción. 🤯
Recordemos que en mayo, OpenAI nos dejó con la boca abierta (y los dedos descansando) al anunciar esta joyita. Prometieron que llegaría “en las próximas semanas”, pero ya sabemos cómo son estas cosas… ¡Necesitaban pulir algunos detalles para que no se les fuera de las manos la IA parlanchina!
El caso es que la espera ha valido la pena. Eso sí, la cosa va por partes: de momento, solo algunos usuarios de ChatGPT Plus (los VIP) tienen acceso a la versión alfa, que irá llegando a todos los mortales con suscripción a lo largo de agosto.
Si eres uno de los afortunados, te llegará un mensajito a la app avisándote. Una vez activado, podrás chismear con ChatGPT, ahora con motor GPT-4o, de una forma mucho más natural. Lo mejor de todo es que puedes interrumpirlo cuando te dé la gana (algo es algo) y hasta es capaz de pillar tus cambios de humor. ¡Adiós a las respuestas robóticas! 👋
A nivel técnico, la cosa se pone interesante. El antiguo modo voz era como traducir del español al klingon: convertía la voz a texto, GPT-4 lo procesaba y la respuesta volvía a ser voz. Un rollo, vamos. Ahora, con GPT-4o, todo se procesa al instante, lo que significa que la conversación fluye que da gusto.
Y agárrate, porque la cosa no se queda solo en inglés. OpenAI ha confirmado que el modo voz funciona con más de 45 idiomas. Lo que sí cambia un poco es el tema de las voces: por ahora solo hay cuatro disponibles (Juniper, Breeze, Cove y Ember), así que olvídate de hablar con la voz de Scarlett Johansson. Parece que la actriz no estaba muy por la labor de prestar su voz al chatbot, ¡quién la habrá visto en ‘Her’! 😂
En la demo que vimos hace un tiempo, ChatGPT ayudaba a unos niños con la tarea y hasta describía lo que veía en una habitación. Estas funciones, que utilizan la visión de GPT-4o, estarán disponibles más adelante.
En resumen, que hablar con las máquinas ya no es cosa del futuro, ¡es el presente! Y con OpenAI a la cabeza, quién sabe las locuras que nos esperan… 😜