OpenAI no lanzará GPT-5 este año, pero «algunas versiones muy buenas están por llegar», dice el CEO Sam Altman

El director ejecutivo de OpenAI, Sam Altman, y varios otros ejecutivos de la empresa organizaron una sesión de preguntas (AMA) el jueves. La sesión se celebró en la plataforma de redes sociales Reddit y se pidió a los usuarios que hicieran preguntas sobre los productos de la empresa de inteligencia artificial, como ChatGPT, o preguntas generales sobre inteligencia artificial (IA) e inteligencia artificial general (AGI). Durante la sesión, Altman dijo que GPT-5 no se lanzará este año, sin embargo, la compañía planea presentar «algunas versiones muy buenas» antes de finales de 2024.

El personal de OpenAI organiza AMA en Reddit

La sesión de AMA se realizó en el subreddit ChatGPT. Llamándolo «nuestro lanzamiento en Reddit», varios ejecutivos, incluidos Altman, el CPO de OpenAI Kevin Weil, el vicepresidente senior de investigación Mark Chen, el vicepresidente de ingeniería Srinivas Narayanan y el científico jefe Jakub Pachocki participaron en la publicación de preguntas y respuestas. El identificador X oficial de OpenAI (anteriormente conocido como Twitter) también publicó información en Reddit AMA.

Respondiendo a una pregunta sobre el cronograma para el lanzamiento de GPT-5 o su equivalente, Altman dijo: “¡Tenemos algunos lanzamientos excelentes a finales de este año! Sin embargo, nada que llamaremos gpt-5″. Esto parece estar a la par con lo que han confirmado numerosos informes, y la mayoría espera que OpenAI lance el próximo modelo insignia en 2025.

Otro usuario preguntó sobre el valor que aporta SearchGPT o la función de búsqueda ChatGPT, Altman dijo que cree que es una forma más rápida y sencilla de obtener información. También señaló que la funcionalidad de búsqueda web será más útil para búsquedas complejas. «Espero con ansias un futuro en el que una consulta de búsqueda pueda mostrar dinámicamente una página web personalizada como respuesta», añadió.

Weil también respondió a varias preguntas de los usuarios. Alguien preguntó sobre el retraso en Sora, a lo que el CPO de OpenAI dijo que el retraso se debía al tiempo adicional dedicado a refinar el modelo, a conseguir la confianza y la imitación correctas, y a la necesidad de escalar el cálculo. Sin embargo, no reveló una fecha para su lanzamiento.

Weil también enfatizó que los modelos de IA de la serie «o», como el GPT-4o y el o1-preview, se convertirán en un pilar de la línea de la compañía y aparecerán incluso después del lanzamiento del GPT-5. Además, también reveló que el modo de voz avanzado ChatGPT podría optimizarse para agregar una voz cantada a la IA.

Un usuario sugirió: «¿Podemos tener una forma de manos libres para finalizar una conversación de voz con ChatGPT? Usando el acceso directo del botón de acción en el iPhone, pero el chat de voz debe desactivarse manualmente cada vez. Weil pareció impresionado por la idea y dijo: “¡Me encanta esta idea que estoy compartiendo con el equipo ahora!”

Mike Chen, vicepresidente senior o investigador de OpenAI, también respondió una importante pregunta de un usuario sobre las alucinaciones de la IA. Al explicar por qué las alucinaciones que surgen de los modelos de IA no han desaparecido por completo, lo calificó como un problema fundamentalmente difícil. Esto se debe a que los modelos de IA aprenden de texto escrito por humanos, y los humanos a menudo pueden cometer errores, que luego se agregan al conjunto de datos principal de los modelos de lenguaje grandes (LLM).

«Nuestros modelos están mejorando en cuanto a citas, lo que basa sus respuestas en fuentes confiables, y también creemos que RL también ayudará con las alucinaciones: cuando podemos verificar mediante programación si los modelos están alucinando, podemos recompensarlos por no hacerlo», Chen agregado.