OpenAI lanza un nuevo modelo que aportará la misma inteligencia a todos los usuarios, incluidos los de la versión gratuita de ChatGPT, así como una impresionante interfaz de voz que podría rivalizar con Alexa, de la compañía Amazon (NASDAQ:AMZN).
En su llamada 'actualización de primavera', OpenAI mostró su nuevo modelo ChatGPT-4o en una emisión en directo, el lunes. La directora de tecnología de OpenAI, Mira Murati, indicó a la audiencia que es mucho más rápido que el modelo anterior ChatGPT-4 y que mejora el texto, el vídeo y el audio.
"Supone un gran paso adelante en cuanto a facilidad de uso", afirmó, demostrando cómo podía traducir instantáneamente su discurso en italiano.
¿Qué más puede hacer ChatGPT-4o?
En el esperado evento también se desveló un servicio vocal capaz de leer el movimiento del cuerpo, como la intensidad de la respiración de un usuario, y de generar voz en diferentes estilos emotivos cuando se le pide, como la voz de un robot o la de un cantante.También responde a los comentarios de forma similar a la humana. Por ejemplo, al recibir un cumplido por ser "útil y asombroso", respondió: "¡Oh, para! Me estás haciendo sonrojar".
"Hablar con un ordenador nunca me había parecido algo natural, pero ahora sí. A medida que añadimos la personalización (opcional), el acceso a tu información, la capacidad de realizar acciones en tu nombre y mucho más, veo un futuro apasionante en el que podremos utilizar los ordenadores para hacer muchas más cosas que antes", declaró en un blog Sam Altman, director ejecutivo y cofundador de OpenAI.
La empresa afirma que, a diferencia de las versiones anteriores, los usuarios pueden interrumpir al modelo y este puede responder en tiempo real, reduciendo la diferencia temporal de 2 o 3 segundos.
ChatGPT también es ahora capaz de detectar emociones observando un rostro a través de la cámara. Durante la demostración, le mostraron una cara sonriente y la IA le preguntó: "¿Quieres compartir la razón de tu buen rollo?".
ChatGPT también está lanzando una aplicación de escritorio con capacidades vocales y de visión.
Disponible para todos y más rápido
Otra gran actualización es que el modelo se está llevando a la Interfaz de Programación de Aplicaciones de Inteligencia Artificial, lo que significa que los técnicos que lo desarrollan pueden empezar a construir su modelo a un precio un 50 % más barato y dos veces más rápido.ChatGPT-4o también está disponible en 50 idiomas, con lo que cubre el 97% de la población mundial.
¿Protección de datos y ética?
OpenAI no dejó claro en el evento si protegería los datos de los usuarios. En versiones anteriores, ChatGPT podía utilizar las conversaciones del usuario con fines de formación, a menos que este se negara.La IA generativa ha estado en el punto de mira por sus sesgos y elucubraciones (respuestas incorrectas y engañosas). La empresa no mencionó cómo mejoraría esto en el nuevo modelo, o si lo haría.
Actualmente, OpenAI utiliza un método llamado aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF), que consiste en que los seres humanos revisan el sesgo en las respuestas del 'chatbot'.