Home Ciencia y Tecnología Ecosistemas de IA en pleno apogeo en Elevate Summit

Ecosistemas de IA en pleno apogeo en Elevate Summit

44
0

He estado en varias conferencias centradas en la IA desde que me mudé a Europa en 2023. La mayoría de ellas sufren de intentarse demasiado, impulsando la exageración en torno a la IA más allá de su utilidad precise.

Esta semana Subir de la cumbre En París fue una excepción refrescante. Hablé con varios expositores en esta conferencia llena, y el zumbido common se centró en la maduración del ecosistema de IA.

A diferencia de otras conferencias, ninguno de los vendedores se molestaba en convencer a los asistentes de que la IA period buena para este o aquel propósito. Todos ahora entienden su valor. En cambio, el enfoque estaba en proporcionar todas las diversas tecnologías habilitadoras necesarias para lograr ese valor a escala. En otras palabras, el ecosistema de IA está madurando, y cada proveedor innovador contribuye con sus esfuerzos a estrategias empresariales de IA de todo tipo.

Nueve proveedores en specific subieron a la cima de la espuma, ejemplifican este ecosistema en tres áreas: neocloudas de IA, rendimiento de IA y soporte para el ecosistema de software program de IA.

Aquí están mis elecciones:

El floreciente mercado de AI Neocloud

La implementación de estrategias de IA a escala requiere una inversión masiva en infraestructura: unidades de procesamiento de gráficos o GPU con todos sus recortes de centros de datos.

Varias compañías están construyendo ofertas de centros de datos de nubes centrados en la nube (o hiperscalador) centrados en la IA, también conocido como “Neoclouds”, que proporcionan dicha infraestructura en el modelo elástico, de pago por uso de las nubes de propósito más common.

Las tres neocloudas que entrevisté son CoreWeave Inc., Nscale Global Holdings Ltd. y Neevai Supercloud Non-public Restricted DBA Núcleo (con un agradecimiento a Nebius bvque cubrí en Una conferencia el año pasado).

De estos tres, CoreWeave tiene la mayoría de los centros de datos (38 en el último recuento). Su diferenciador está construyendo estantes de nuevos modelos de GPU para satisfacer las necesidades de los primeros clientes de los usuarios, a pesar de que las GPU frescas a menudo sufren un firmware inmaduro y otros dolores de crecimiento. CoreWeave ha construido su pila para ofrecer una capacidad resistente a pesar de estas limitaciones.

NSCALE está aumentando sus centros de datos para un mercado europeo interesado en la soberanía de los datos y otros requisitos de cumplimiento específicos de Europa.

El enfoque diferenciado de NSCALE para construir su Neocloud es organizar contratos de energía eléctrica antes de la demanda para garantizar la disponibilidad y administrar los costos de energía futuros. En otras palabras, NScale está haciendo sus apuestas en la energía, el principal cuello de botella para construir una infraestructura de Neocloud.

Si bien NScale se centra en Europa, el enfoque de Neevcloud está en la India. La compañía espera ayudar a sus clientes globales a construir soluciones de IA para el mercado indio masivo. Aporta experiencia navegando por el entorno regulatorio specific de la India al tiempo que aprovecha los créditos fiscales gubernamentales sustanciales. También obtiene {hardware}, ancho de banda, energía y talento localmente para mantener bajos los costos.

Soping Up AI Efficiency

Dados los sustanciales requisitos de procesamiento y datos de la IA, un foco central del ecosistema de IA explosivo precise está resolviendo cuellos de botella para aumentar el rendimiento.

Tres proveedores de Elevate se destacaron por sus estrategias diferenciadas para aumentar el rendimiento de la IA. Ori Industries 1 Ltd Ofrece un plano de management de IA de alto rendimiento que resume los recursos de calculación de IA (en la nube, en las instalaciones o el aire expulsado) y admite los modelos de idiomas grandes o los modelos personalizados y los modelos personalizados que sus clientes desean ejecutar.

Este plano de management proporciona virtualización de GPU, multitenancia, autoscalado y aislamiento, además de la orquestación nativa de la nube y las operaciones de aprendizaje automático o los MLOP para los requisitos estrictos de gobernanza y cumplimiento. Como resultado, los clientes pueden servir modelos de producción con el rendimiento, el management y la seguridad que requieren.

Apretar cada nanosegundo del rendimiento de la infraestructura de almacenamiento subyacente también requiere enfoques innovadores para administrar y entregar el almacenamiento. Wekaio Inc., que hace negocios como Wekaestá aprovechando su experiencia en el mercado de almacenamiento definido por software program de alto rendimiento para ofrecer NeuralMesh, un sistema de almacenamiento que está diseñado para acelerar la IA a escala.

Weka aprovecha la purple de cómputo dedicada que se conecta las GPU entre sí para entregar el rendimiento de la velocidad del cable, esencialmente ofreciendo velocidades comparables a acceder a la memoria a través de una tecnología de almacenamiento de memoria no volátil o NVME.

Sin embargo, el dólar de rendimiento de la IA se detiene en los chips mismos, los procesadores que hacen que la magia suceda. Mientras que las GPU obtienen la atención, un proveedor que está innovando a nivel de chips es Sambanova Inc.

Sambanova ofrece IA de alto rendimiento con su estrategia de ‘chips to modelos’. A diferencia de los otros proveedores en esta lista, Sambanova ofrece su propia unidad de flujo de datos reconfigurable de alta potencia y de alta potencia o chips RDU como alternativa a las GPU.

Sambanova diseñó sus chips RDU para los requisitos de procesamiento específicos de las redes neuronales, eliminando los cuellos de botella de procesamiento que limitan el rendimiento de la GPU.

La compañía coloca estos chips en bastidores con su propio sistema operativo y software program de purple. Estos bastidores admiten todos los LLM de código abierto a través de API compatibles con OpenAI. El resultado: pilas de IA integradas verticalmente que admiten iniciativas de IA de alta gama.

En Elevate, Sambanova también anunció Sambamanage, su nuevo centro de datos optimizado de inferencia que ofreció que diseñó para una implementación rápida.

Ecosistema de IA que apoya a los jugadores

Tres proveedores adicionales en Rae trajeron a casa esta historia del ecosistema de IA, ya que cada uno resuelve un conjunto specific de problemas dentro del paisaje más amplio de las soluciones de IA.

Tratar con las ineficiencias de los LLM es uno de esos problemas. El mayor problema con LLM es el hecho de que son grandes y, por lo tanto, consumen cantidades masivas de procesadores, redes y recursos de energía, lo que aumenta rápidamente los costos.

Los modelos de idiomas pequeños o SLM pueden reducir esta sobrecarga, pero ¿cómo sabe una organización cuándo SLMS puede reemplazar las LLM más generales?

Datawizz Inc. Resuelve este problema especificar y ajustar SLM que construye para satisfacer la necesidad del cliente en specific. La plataforma Datawizz se entiende a los casos de uso y entrena SLM en consecuencia.

Cada SLM hace bien una cosa. La plataforma luego actúa como un enrutador de enrutamiento de transferencia de las solicitudes del usuario remaining o del desarrollador que construye soluciones basadas en IA al modelo apropiado. El SLM que los trenes de Datawizz pueden manejar las indicaciones más comunes, mientras que la plataforma enruta las solicitudes inusuales a un LLM.

Este enfoque funciona bien con casos de uso como el procesamiento de reclamos de seguros, donde el modelo AI ve los mismos formularios de reclamos con datos similares una y otra vez.

La prueba de LLMS, que garantiza que entreguen resultados de alta calidad que cumplan con los requisitos comerciales, es otro problema para las iniciativas de IA.

El comportamiento de LLM no es determinista: el mismo aviso y otras condiciones iniciales que proporcionan el contexto para la interacción pueden producir diferentes resultados en diferentes ocasiones. Como resultado, los enfoques de pruebas de software program tradicionales no funcionan bien en LLM.

Ragmetrics Inc Aborda este problema de las pruebas de LLM a través de bucles de evaluación automatizados que aprovechan los datos sintéticos, así como las LLM especializadas que pueden juzgar el comportamiento de los LLM que se están probando.

Ragmetrics también puede ayudar a los clientes a seleccionar el mejor modelo de idioma para sus propósitos al permitir comparaciones en función de la calidad de las respuestas, la latencia, el costo y muchas otras métricas.

Finalmente, ninguna historia de IA hoy estaría completa sin un guiño a la IA de agente. Los agentes de IA son rutinas adaptables y autónomas que aprovechan la IA para completar las tareas. Bajo las portadas, esta adaptabilidad requiere que los agentes generen el código necesario para completar sus tareas, qué Daytona Platform Inc. Llama ‘Código de pegamento’.

La compañía ofrece una infraestructura elástica para que los agentes ejecuten este código de pegamento, esencialmente proporcionando una ‘computadora digital’ con la que los agentes pueden interactuar para lograr sus objetivos, análogos a una computadora actual que un humano usaría.

Los agentes pueden necesitar llamar a API, obtener datos, ver archivos, interactuar con otros agentes o realizar muchas otras subasinas. Daytona proporciona la infraestructura segura para ejecutar estas subasinas, así como una caja de area y herramientas para agentes en desarrollo.

La toma intellyx

En mi Artículo de AI de la Cumbre Mundial En octubre pasado, señalé que las ofertas de IA centradas en el caso de uso comercial fueron una mala excusa para una conferencia de IA. Después de todo, cada industria tiene sus propias conferencias, por lo que las soluciones dentro de esas industrias encontrarían una audiencia más receptiva en una de ellas que en una conferencia common de IA.

El Buzz en Elevate Summit demostró mi punto, ya que las soluciones de IA específicas de la industria eran escasas. En cambio, el enfoque de la mayoría de los proveedores en la conferencia fue cómo apoyaron el ecosistema de IA, desde chips hasta centros de datos y software program de infraestructura para modelar el rendimiento.

También asisto a conferencias específicas de la industria, de la telecomunicación del mes pasado. TM Kind DTW Ignite a los medios de comunicación y al IBC centrado en el entretenimiento en otoño. Puede estar seguro de que habrá muchas historias de IA centradas en la industria para que yo lo cuente en tales eventos. ¡Manténganse al tanto!

Jason Bloomberg es fundador y director gerente de Intellyx BV, Lo que asesora a los líderes empresariales y a los proveedores de tecnología sobre sus estrategias de transformación digital. Escribió este artículo para Siliconangle. Nebius es un cliente intellyx. Ninguno de los otros proveedores mencionados en este artículo es un cliente intellyx. No se usó AI para escribir este artículo.

Foto: Sambanova/X

Apoye nuestro contenido gratuito abierto compartiendo e interactuando con nuestro contenido y comunidad.

Únete a Thecube Alumni Belief Community

Donde los líderes tecnológicos se conectan, comparten inteligencia y crean oportunidades

11.4k+

Crimson de ex alumnos de cubos

Nivel C y técnico

Expertos en dominio

Conéctese con 11,413+ líderes de la industria de nuestra purple de líderes tecnológicos y empresariales que forman un efecto de purple confiable único.

Siliconangle Media es un líder reconocido en innovación de medios digitales que sirve al público innovador y marcas, que reúne tecnología de vanguardia, contenido influyente, concepts estratégicas y compromiso de audiencia en tiempo actual. Como la empresa matriz de Silicio, red de thecube, Investigación de THECUBE, Cube365, THECUBE AI y los superstudios de TheCube, como los establecidos en Silicon Valley y la Bolsa de Nueva York (NYSE) – Siliconangle Media opera en la intersección de medios, tecnología e IA. .

Fundada por los visionarios tecnológicos John Furrier y Dave Vellante, Siliconangle Media ha construido un poderoso ecosistema de marcas de medios digitales líderes en la industria, con un alcance de más de 15 millones de profesionales de la tecnología de élite. La nueva nube de video de AI de AI de la compañía, está abriéndose en la interacción de la audiencia, aprovechando la purple neuronal de thecubeai.com para ayudar a las empresas de tecnología a tomar decisiones basadas en datos y mantenerse a la vanguardia de las conversaciones de la industria.

fuente