Casi a la par de las reseñas que destrozaron a dispositivos con asistentes con inteligencia artificial que prometían desterrar al celular, la empresa OpenAI no sólo no abandona a los teléfonos móviles sino que refuerza su presencia para seguir creciendo. Al menos eso se deduce de la impactante presentación que hicieron este lunes para presentar GPT-4o, una IA más “inteligente y rápida” que sus versiones anteriores, según señaló la propia empresa.
Cómo es GPT-4o
La principal característica de GPT-4o es su capacidad multimodal integrada y esto significa que mejorará el rendimiento en las aplicaciones que la utilicen. Pero lo más atractivo es que Open AI anunció que el servicio estará disponible para todos los usuarios de ChatGPT, incluyendo aquellos que utilizan la versión gratuita.
Muri Murati, CTO de OpenAI, explicó durante el evento que el último modelo de la IA alcanza un nivel de inteligencia similar al de GPT-4 -la última versión disponible a la que se accede por suscripción paga- pero con la particularidad de que tiene capacidades de generar texto, audio y contar visión a través de las cámaras del teléfono o computadoras. Desde la empresa que dirige Sam Altman prometen además que se baja la latencia en las respuestas, o sea que la interacción entre el usuario y la IA será más rápida.
Para dar un ejemplo, la empresa señala que el modo de voz de ChatGPT tenía una latencia promedio de 2.8 segundos en en la versión GPT-3.5 y 5.4 segundos en GPT-4, pero que ahora se ha logrado disminuir este tiempo a un promedio de 320 milisegundos en GPT-4o.
El principal objetivo de esta nueva versión, según Open AI, es que la interacción entre el usuario y GPT-4o se sienta más natural. Eso quedó palpable en la presentación al mostrar que es posible conversar con el modelo mediante voz e incluso interrumpirlo mientras responde, algo habitual en la dinámica de una conversación humana.
Lo más impactante de la nueva versión
Los videos de la presentación fueron la demostración de lo que promete Opean AI. Varios se hicieron virales rápidamente principalmente porque la apuesta es fuerte y si cumple lo que promete, estaremos ante una nueva revolución de la inteligencia artificial.
Una de las funciones más sorprendentes compartidas en vivo fue no solo que el nuevo modelo ofreciera respuestas rápidas en tiempo real, sino que lo hiciera con entonaciones de voz y detección del estado de ánimo del usuario para establecer el tono de la conversación.
También compartieron una versión mejorada de la traducción simultánea que pasará a ser “traducción instantánea”.
Según OpenAI, se busca simplificar el proceso de pedido al chatbot para que el usuario pueda expresarse en lenguaje natural sin necesidad de prompts o comandos específicos. Solo bastará decirle a ChatGPT que se está hablando con alguien que habla en otro idioma y se activa la traducción.
Pero el apartado visual fue lo que más llamó la atención. El usuario podrá enviarle una foto o una captura de pantalla al modelo GPT-4o para que le diga que ve y brinde información. Lo mismo se le podrá pedir que haga lo mismo utilizando las cámaras del teléfono si se utiliza la app. En la demo se le pidió al modelo describir lo que veía en una habitación para que la describiera.
Cómo probar gratis el nuevo GPT-4o
Tras el anuncio la princial pregunta fue ¿cuándo podremos probarlo?. Open AI afirmó que el modelo ya comenzó hoy su despliegue en todo el mundo pero se hará de forma gradual. O sea que a algunos usuarios se les permitirá usarlo antes que a otros pero que eventualmente llegará a todos en breve.
Lo interesante es que GPT-4o estará disponible tanto para los usuarios que pagan ChatGPT Plus como para los que utilizan la versión gratuita de ChatGPT. La única diferencia será la que ya existe actualmente, es decir, que los que pagan la suscripción mensual a ChatGPT siguen con los beneficios extras como uso ilimitado del servicio y también serán los primeros en recibir las nuevas funciones del renovado modo de voz que llegará “en las próximas semanas”, según informó Open AI.
Vale recordar que a pesar de que existe una versión gratuita de ChatGPT, los usuarios también pueden utilizar sin costo el servicio a través de las opciones que ofrece Microsoft a través de su buscar Bing o de las funcionalidades de Copilot, que ya tiene un app gratuita tanto para Android como para iOS.