En un anuncio muy esperado hoy, Operai lanzó GPT-5el modelo de inteligencia synthetic más reciente de la compañía que supera a los modelos anteriores sobre puntos de referencia de inteligencia y responde preguntas que alta precisión.
“GPT-5 es una actualización importante sobre GPT-4O y un paso significativo en nuestro camino hacia AGI”, dijo Sam Altman, director ejecutivo y cofundador de OpenAI. “GPT-3 fue como hablar con un estudiante de secundaria. Hubo destellos de brillo mucha molestia, pero la gente comienza a usarlo y obtiene algo de valor”.
Operai enfatizó el salto significativo de GPT-5 en las capacidades, particularmente en la codificación, el diseño frontal y la depuración de grandes bases de código. El modelo también ofrece una comprensión contextual más profunda y una profundidad expresiva para la escritura y la generación de informes, áreas donde los modelos anteriores ocasionalmente vacilaban.
Debajo del capó, GPT-5 es un sistema híbrido. Enruta entre un modelo estándar para respuestas directas y un modelo de “pensamiento” para un razonamiento más profundo. Dependiendo de la complejidad del aviso del usuario, GPT-5 resolve automáticamente qué modelo se involucra, con una opción para que los usuarios habiliten manualmente el modo de “pensamiento” a través del selector de modelo o escribiendo instrucciones como “pensar mucho en esto”.
En evaluaciones, OpenAI dijo que GPT-5 muestra un aumento significativo en la inteligencia sobre los modelos anteriores en los puntos de referencia de rendimiento, especialmente en matemáticas, codificación, percepción visible y salud.
En el rendimiento de las matemáticas, la compañía señaló que establece una nueva barra de última generación con 94.6% en AIME 2025 sin herramientas, para codificar el 74.9% en SWE-Bench verificado y 88% en Polyglot de auxilio, para una comprensión multimodal 84.2% en MMMU y para la salud del 46.2% en la salud de la salud. La compañía dijo que estos puntajes aparecen durante el uso diario no solo en la competencia.
Es bueno ver en comparación con los modelos anteriores, pero ¿cómo se mantiene contra la competencia? El reciente modelo Claude Opus 4.1 de Anthrope obtuvo un puntaje 74.5% en el bancos SWE verificado, ligeramente por debajo de GPT-5, y Gemini 2.5 Professional de Google LLC obtuvo un puntaje 59.6%.
“GPT-5 como modelo de lenguaje muestra un progreso continuo para hacer que la IA sea más útil para el trabajo actual”, Arvind Jain, fundador y CEO de Glean Technologies Inc. le dijo a Siliconangle en un correo electrónico. “Lo notable es que el razonamiento sobre los datos, no solo la planificación, es lo que impulsa la precisión del modelo”.
Relativamente, en El último examen de la humanidad -Un punto de referencia que prueba la inteligencia normal en todas las disciplinas: una versión de GPT-5 con razonamiento superior, GPT-5 Professional, obtuvo un 42% con herramientas, justo detrás de Grok 4 de Xai Inc. pesado en alrededor del 44%.
Sin embargo, los usuarios pueden estar más interesados en lo que Operai ha hecho sobre temas críticos que los afectan más directamente, como las alucinaciones, o la probabilidad del modelo de confabular y compensar completamente falsedades. Según la compañía, con la búsqueda internet habilitada GPT-5, aproximadamente un 45% menos de probabilidades de generar errores objetivos que GPT-4O, y cuando el pensamiento se habilita aún más en aproximadamente un 80% menos que O3.
La compañía también dijo que abordó el “problema de skicancia“, Un problema que golpeó a GPT-4O a principios de este año, donde estaría de acuerdo excesivamente y demasiado con los usuarios (a veces en detrimento). Esto incluía hacerlo menos agradable y usar menos emojis innecesarios, a menos que los usuarios lo soliciten, por supuesto.
GPT-5 se está implementando hoy como el nuevo modelo predeterminado para usuarios de CHATGPT firmados, reemplazando a GPT-4O. Se interrupe automáticamente entre los modos de razonamiento y no razonamiento, mientras que los usuarios pagos pueden habilitar manualmente un razonamiento más profundo.
Codificación de agente y el surgimiento del desarrollo ambiente
El equipo de Operai señaló que los modelos de IA están comenzando a saturar puntos de referencia y que no todo puede mostrarse mediante números pueros. Para mostrar cómo GPT-5 se ha convertido en un mejor “cerebro” para Codificación de agente y desarrollo de aplicacioneslo demostraron en una situación del mundo actual en la que se le encargó la depuración de un problema de audio de software program.
Después de solo un minuto de trabajo y pensamiento en el problema, el modelo regresó con una solución de trabajo y sin errores, completa con cambios en el código.
“GPT-5 es el modelo de codificación más inteligente que hemos utilizado. Nuestro equipo ha encontrado que GPT-5 es notablemente inteligente, fácil de dirigir e incluso tener una personalidad que no hayamos visto en ningún otro modelo”, dijo Michael Truell, cofundador y director ejecutivo de AnySphere Inc., el fabricante de Cursor, una plataforma de codificación basada en agentes de AI. “No solo atrapa errores difíciles y profundamente ocultos, sino que también puede ejecutar agentes de fondo de múltiples vueltas para ver tareas complejas hasta el remaining”.
Según OpenAI, GPT-5 ha sido diseñado para convertirse en un mejor colaborador, particularmente en productos de codificación de agente como Cursor, Windsurf, GitHub Copilot y Codexcli. Estas son plataformas en las que los usuarios indican un modelo de IA con una descripción de lo que quieren que haga y luego lo suelte en su base de código, o una pizarra en blanco, y permitan que se ejecute por su cuenta.
Los agentes de IA son capaces de realizar tareas de forma autónoma al desglosar flujos de trabajo complejos para lograr objetivos descomponiéndolos en planes paso a paso y luego ejecutarlas con poca o ninguna intervención humana. También pueden colaborar con un desarrollador humano comparable a un programador de pares para ayudarlos a producir un producto para manejar una tarea compleja.
GPT-5 En explicit, dijeron los investigadores de OpenAI, ha sido diseñado para mejorar las llamadas de herramientas y seguir las instrucciones para realizar rápidamente tareas de codificación de acuerdo con las indicaciones del lenguaje pure. Esto lo hace perfect para lo que se conoce como “codificación de ambientes”, una tendencia emergente de desarrollo de software program donde los desarrolladores usan IA para ayudarlos generando código a partir de indicaciones, en lugar de escribirlo manualmente.
Con los cambios recientes en el modelo y las capacidades adicionales han mejorado el modelo para razonar el rendimiento creativo. Esto incluye comprender el shade, el diseño de la interfaz de usuario e intención del usuario.
“GPT-5 realmente aporta el poder del código hermoso y efectivo a todos”. dijo Yan DuBois, investigador de Operai.
Para los desarrolladores, GPT-5 viene en tres niveles: GPT-5, GPT-5-Mini y GPT-5-Nano, ofrecido a través de la interfaz de programación de aplicaciones con opciones de costo, latencia y profundidad de razonamiento. Los preámbulos de llamadas de herramientas, los controles de verbosidad y las salidas encargadas de Regex ahora son parte del paquete, lo que lo hace aún más confiable y sintonizable que los modelos anteriores.
“Para mí es la primera vez que confío en un modelo para hacer mi trabajo más importante”, dijo Yan Dubois, Arquitecto de Options en OpenAI. “Esto está más allá de la codificación de ambientes”.
Imágenes: OpenAI
Apoye nuestra misión de mantener el contenido abierto y gratuito comprometiéndose con la comunidad de Thecube. Únase a la purple de Alumni Belief de Thecubedonde los líderes tecnológicos se conectan, comparten inteligencia y crean oportunidades.
- 15m+ movies de espectadores de thecubeimpulsando conversaciones a través de IA, nubes, ciberseguridad y más
- 11.4k+ alumnos de thecube -Conéctese con más de 11,400 líderes tecnológicos y empresariales que configuran el futuro a través de una purple única basada en confianza.
Acerca de Siliconangle Media
Fundada por los visionarios tecnológicos John Furrier y Dave Vellante, Siliconangle Media ha construido un ecosistema dinámico de marcas de medios digitales líderes en la industria que alcanzan más de 15 millones de profesionales de la tecnología de élite. Nuestra nueva nube de video de IA de THECUBE está abriendo firme en la interacción de la audiencia, aprovechando la purple neuronal de thecubeai.com para ayudar a las empresas de tecnología a tomar decisiones basadas en datos y mantenerse a la vanguardia de las conversaciones de la industria.