Home Ciencia y Tecnología Startup china Z.AI Libera un modelo de razonamiento GLM-4.5 rentable

Startup china Z.AI Libera un modelo de razonamiento GLM-4.5 rentable

31
0

La startup china Z.AI Right now GLM-4.5 de código abierto, un modelo de razonamiento que afirma es más rentable que el R1 de Deepseek.

CNBC reportado que el algoritmo puede ejecutarse en ocho tarjetas gráficas H20. El H20 es una versión escalada del chip H100 de Nvidia Corp., que fue su acelerador de inteligencia synthetic insignia hasta el año pasado. El gobierno de EE. UU. Voló la venta del antiguo procesador a las empresas en China.

El lanzamiento de GLM-4.5 se produce aproximadamente seis meses después de que Deepseek lanzó su modelo de razonamiento R1 de código abierto. En ese momento, la compañía declaró que el algoritmo puede realizar algunas tareas usando 50 veces menos {hardware} que el O1 de OpenAI. Además, Deepseek afirmó haber capacitado su modelo para una fracción del costo de los proyectos de IA anteriores.

El lanzamiento de R1 condujo a las preocupaciones de los inversores de que los modelos de lenguaje cada vez más eficientes en {hardware} pueden reducir la demanda de infraestructura de IA. La capitalización de mercado de Nvidia cayó más de $ 580 mil millones en el posterior sábadoestableciendo un nuevo récord de Wall Road. El lanzamiento de GLM-4.5 hoy no condujo a una caída related en las acciones de IA, pero envía a los inversores otra señal de que los modelos de razonamiento continúan siendo más eficientes en el {hardware}.

Según los informes, Z.Ai espera cobrar 11 centavos por cada 1 millón de tokens de entrada ingresados en GLM-4.5. Eso es tres centavos más bajo que R1. Un millón de tokens de producción cuestan 28 centavos, poco más de un 11º lo que carga Deepseek por R1.

Uno de los principales factores detrás de la rentabilidad de GLM-4.5 es que es relativamente pequeño. El modelo presenta 355 mil millones de parámetros, o alrededor de 316 millones menos que R1. GLM-4.5 solo activa 32 mil millones de esos parámetros en cualquier momento dado para reducir el uso de {hardware}.

Un modelo de IA comprende numerosos fragmentos de código llamados neuronas artificiales que realizan una pequeña porción del trabajo que implicó procesar un aviso. Esas neuronas, a su vez, se organizan en las llamadas capas. Z.AI eliminó algunos de los componentes de GLM-4.5 para agregar más capas, un enfoque que, según cube, ayudó a aumentar las habilidades de razonamiento del modelo.

La compañía capacitó a GLM-4.5 a través de un flujo de trabajo de varios pasos. Primero, desarrolló una versión inicial del modelo utilizando un conjunto de datos que incluía información de 15 billones de tokens. Z.Ai luego perfeccionó las habilidades de razonamiento de GLM-4.5 con varios conjuntos de datos de entrenamiento más pequeños que juntos comprendían más de 7 billones de tokens.

La compañía evaluó las capacidades del modelo utilizando una docena de puntos de referencia de IA populares. Según Z.AI, GLM-4.5 superó a múltiples alternativas populares, incluidas Claude 4 Opus. Se ocupó el tercer lugar detrás de Xai Holdings Corp. Grok 4 y O3 O3.

Para los casos de uso que ponen un énfasis explicit en la rentabilidad, Z.AI ha desarrollado una versión escalada de su modelo llamado GLM-4.5-AIR. El algoritmo presenta 106 mil millones de parámetros, o aproximadamente tres veces menos que el authentic. GLM-4.5-Air activa 12 mil millones de parámetros para procesar las indicaciones.

En enero, el Departamento de Comercio de los Estados Unidos agregó Z.AI a su lista de entidades de organizaciones sujetas a controles de exportación. La compañía está respaldada por $ 1.5 mil millones en fondos de Alibaba Group, Tencent Inc. y otros inversores. Según los informes, planea solicitar una oferta pública a finales de este año.

Imagen: Sin estelares

Apoye nuestro contenido gratuito abierto compartiendo e interactuando con nuestro contenido y comunidad.

Únete a Thecube Alumni Belief Community

Donde los líderes tecnológicos se conectan, comparten inteligencia y crean oportunidades

11.4k+

Purple de ex alumnos de cubos

Nivel C y técnico

Expertos en dominio

Conéctese con 11,413+ líderes de la industria de nuestra crimson de líderes tecnológicos y empresariales que forman un efecto de crimson confiable único.

Siliconangle Media es un líder reconocido en innovación de medios digitales que sirve al público innovador y marcas, que reúne tecnología de vanguardia, contenido influyente, concepts estratégicas y compromiso de audiencia en tiempo actual. Como la empresa matriz de Silicio, red de thecube, Investigación de THECUBE, Cube365, THECUBE AI y los superstudios de TheCube, como los establecidos en Silicon Valley y la Bolsa de Nueva York (NYSE) – Siliconangle Media opera en la intersección de medios, tecnología e IA. .

Fundada por los visionarios tecnológicos John Furrier y Dave Vellante, Siliconangle Media ha construido un poderoso ecosistema de marcas de medios digitales líderes en la industria, con un alcance de más de 15 millones de profesionales de la tecnología de élite. La nueva nube de video de AI de AI de la compañía, está abriéndose en la interacción de la audiencia, aprovechando la crimson neuronal de thecubeai.com para ayudar a las empresas de tecnología a tomar decisiones basadas en datos y mantenerse a la vanguardia de las conversaciones de la industria.

fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here