Operai lanzó su primera modelos de peso abierto Desde 2019 el martes, desafiando directamente a las empresas chinas que ahora dominan el espacio de inteligencia synthetic (IA) accesible con tecnología poderosa y gratuita.
Los dos nuevos modelos de idiomas grandes (LLM), GPT-OSS-120B y GPT-OSS-20B, pueden ejecutarse en computadoras y computadoras portátiles personales. Se desempeñan casi tan bien como los modelos de razonamiento pagados de Openai en tareas de codificación y matemáticas.
“Volviendo a cuando comenzamos en 2015, la misión de Openai es garantizar AGI (inteligencia common synthetic) que beneficie a toda la humanidad”, dijo el CEO Sam Altman en un comunicado. “Estamos entusiasmados de que el mundo se construya en una pila de IA abierta creada en los Estados Unidos, basada en valores democráticos”.
La medida vuelve a hacer que Operai vuelva a competir con empresas chinas como Deepseek y la serie Qwen de Alibaba. Estas compañías sorprendieron al mundo tecnológico a principios de este año al lanzar poderosos modelos de IA que cualquiera podría descargar y usar de forma gratuita.
Operai había evitado las lanzamientos abiertos durante seis años, centrándose en su lugar en vender acceso a sus modelos a través de ChatGPT y servicios comerciales. Los críticos comenzaron a llamar a la compañía como “Closada” por abandonar su misión unique de hacer que AI esté ampliamente disponible.
El modelo más pequeño, GPT-OSS-20B, necesita solo 16 GB de memoria de la computadora para ejecutarse. La versión más grande requiere tarjetas gráficas especializadas con 80 GB de memoria.
“Los modelos de peso abierto tienen un conjunto de fortalezas muy diferente”, dijo el cofundador de Operai Greg Brockman. “La gente puede ejecutarlos detrás de su firewall”.
Ambos modelos usan el razonamiento de la cadena de pensamiento, tomando un tiempo further para trabajar a través de problemas complejos paso a paso. Pueden explorar sitios internet, escribir código y llamar a otras herramientas de IA cuando sea necesario.
Operai probó los modelos sobre desafíos de programación competitivos. El modelo más grande obtuvo 2622 puntos, mientras que el más pequeño ganó 2516 puntos. Ambos superaron al último modelo de Deepseek, que obtuvo 2463 puntos.
Sin embargo, los nuevos modelos solo funcionan con texto, a diferencia de los servicios principales de OpenAI, que pueden manejar imágenes y voz. Más preocupante, alucinan con frecuencia, con tasas de error entre 49-53% en comparación con solo el 16% para el modelo O1 premium de OpenAI. Los usuarios que deseen esas características aún deben pagar por el acceso basado en la nube.
El lanzamiento sigue al Plan de Acción AI del presidente Trump, que alentó a las compañías estadounidenses a desarrollar modelos abiertos como “estándares globales” basados en valores democráticos.
Meta previamente dirigió el movimiento American Open AI con sus modelos de llama. Pero la compañía ahora se enfoca en construir una IA superintelligente y puede dejar de lanzar modelos abiertos debido a las preocupaciones de seguridad.
Openai retrasó estos modelos dos veces para pruebas de seguridad. Realizaron extensas pruebas de seguridad, incluso tratando de ajustar los modelos con fines maliciosos. La compañía cube que los modelos nunca alcanzaron niveles de capacidad peligrosos.
Ambos modelos están disponibles bajo la licencia Apache 2.0, lo que permite a las empresas usarlos comercialmente sin pagar tarifas. Amazon anunció que los modelos aparecerían en su mercado de AI Batedrock.
Empresas como Orange SA, Snowflake y AI Suecia ayudaron a probar los modelos antes de su lanzamiento. Operai planea utilizar los comentarios de los usuarios para decidir si lanzar más modelos abiertos en el futuro.