Home Ciencia y Tecnología Exclusivo: el CEO de Amazon, Matt Garman, apuesta en un futuro agente

Exclusivo: el CEO de Amazon, Matt Garman, apuesta en un futuro agente

33
0

Desde una sala de conferencias forrada de vidrio por encima del campus de Amazon, Matt Garman enfatiza firmemente una palabra: “velocidad”.

Con un año completo en su haber, el nuevo director ejecutivo de Amazon Internet Providers Inc. acaba de terminar lo que llamamos un “grupo de medio tiempo”: dos días de movies y entrevistas exclusivas y entrevistas con los principales directores de AWS para mantener el mayor proveedor de la nube del mundo por delante de un auge de inteligencia synthetic que está rediseñando los límites de la industria tecnológica.

El video a continuación es parte de nuestro Serie editorial AWS y líderes del ecosistema de medio tiempo para re: inventar Informe especial Evento digital. Busque otros artículos del evento en Siliconangle.

En un año cuando seis meses se siente como 12, Garman, de 48 años, preside el ciclo de productos más frenético en los 18 años de historia de AWS. “El ritmo de innovación es impresionante”, me cube, la garantía de precisión y del ejecutivo de ventas del ingeniero de partes de voz. “Para nuestros clientes ya no es opcional: la IA es un imperativo comercial”.

Ese imperativo es remodelar todo, desde los planes de gasto de capital de Amazon hasta cómo las startups aseguran a sus primeros clientes y cómo los sistemas de atención médica muy regulados piensan sobre los datos de los pacientes. También está obligando a AWS, el motor de ganancias que durante mucho tiempo subsidió la construcción de comercio electrónico de Amazon, para defender su liderazgo contra los rivales Microsoft Azure y Google Cloud mientras navegaba contra el escrutinio antimonopolio y los vientos cruzados geopolíticos.

Una nueva carrera en la nube

En el punto medio de 2025, AWS se encuentra en una posición rara: aún creciendo porcentajes de dos dígitos en una base de más de $ 100 mil millones en ingresos anuales, pero enfrentan la transición tecnológica más empinada desde que comercializó la computación en la nube en 2006.

El catalizador es “computación de agente”, un término para los agentes de software program que pueden razonar en grandes conjuntos de datos, tomar medidas en nombre de los usuarios y, de manera essential, consumir grandes cantidades de los “tokens” digitales que alimentan modelos de gran idioma. Los agentes, argumenta Garman, eclipsarán el impacto de la ola de software program como servicio que hizo que Salesforce Inc. y Workday Inc. sean familiares.

“Si la IA generativa obtuviera ganancias de eficiencia del 20%, los agentes podrían entregar el 200%”, cube. “Cuando un desarrollador se envía tres veces más rápido, el cálculo adicional es un error de redondeo”.

Una carrera armamentista de Capex

La velocidad cuesta dinero. En mi entrevista, Garman dijo que AWS invertiría más de $ 30 mil millones en infraestructura en Carolina del Norte y Pennsylvania, como parte de su compromiso de gastar más en la IA, para satisfacer la creciente demanda de chips de alto rendimiento y la electricidad para administrarlos. Los analistas muestran el gasto de capital líder de AWS en comparación con sus rivales.

Garman insiste en que el gasto es “impulsado por la demanda” en lugar de una apuesta de construcción y volcada. “Correr a menos de la capacidad es doloroso para los clientes”, dijo, haciendo referencia al número de regiones que AWS está operando y planea abrir pronto: México, Tailandia, Chile y, sobre todo, una nube soberana europea que debutará a finales de este año. La región totalmente aislada, con private solo por ciudadanos de la Unión Europea, tiene como objetivo satisfacer los gobiernos nerviosos por la vigilancia estadounidense y las reglas de privacidad en constante expansión, como el GDPR de la UE.

Aún así, el proyecto de ley es asombroso. Los gastos de capital whole de Amazon alcanzaron los $ 71 mil millones el año pasado, un 31percentmás, según las presentaciones públicas. “Estamos en territorio desconocido”, cube Dave Vellante, analista jefe de Thecube Analysis. “Ninguna compañía ha intentado una construcción international en esta escala, a esta velocidad, con los reguladores observando cada uno de sus movimientos”.

Apuestas por silicio personalizado

Para controlar los costos, y la dependencia del dominio de Nvidia, AWS se está duplicando en chips, diseña internamente. La empresa Gravitón puentes y Entrenamiento Los aceleradores de IA prometen reducir las facturas de la nube de los clientes hasta en un 40%, cube Garman, exprimiendo más trabajo de cada vatio de energía. Amazon construyó un clúster de entrenamiento de cinco veces-larguero para Anthrope, fabricante del Claude Chatbot, que la generación anterior de la startup.

Esos ahorros son importantes como aplicaciones AI devoran los ciclos de calcular. “Los tokens son solo un proxy para el tiempo de cómputo”, dijo Garman. “Tenemos que seguir conduciendo la curva de costo, órdenes de magnitud”. Microsoft y Google tienen esfuerzos similares: la MAIA de Azure, la unidad de procesamiento del tensor de Google, pero la integración vertical de Amazon en silicio, servidores, redes y software program sigue siendo su foso económico más fuerte, dicen los analistas.

Migración de la nube 2.0

Paradójicamente, el AI Rush está reviviendo la parte más elemental pero importante del negocio de Amazon: persuadir a las empresas para que muevan bases de datos antiguas y aplicaciones de back-office a la nube. “Menos del 20% de las cargas de trabajo globales han migrado”, dijo Garman, repitiendo una estadística que AWS ha citado durante años, pero insiste en que todavía es aproximadamente preciso. Lo que ha cambiado es urgencia. “Las empresas se dan cuenta de que obtienen sus datos en un formato de nube o se quedan atrás”, agregó.

Las startups, mientras tanto, están evitando el antiguo libro de jugadas Construct-an-aplan-then-find-an -nverprise. Sus primeros clientes a menudo son Fortune 500 Corporations que buscan desbloquear datos patentados a través de modelos de IA personalizados. Para los tribunales de esa circunscripción, AWS en marzo en marzo de Amazon Strands de origen abierto, un marco de agentes escrito por ingenieros que necesitaban una forma más rápida de prototipos de flujos de trabajo de IA INTERNAL. El proyecto saltó de una aprobación interna de ocho horas a decenas de miles de descargas externas en cuestión de semanas.

Despegue vertical: ‘Feliz accidente’ de Healthcare

Ningún sector ilustra la nueva dinámica mejor que la atención médica y las ciencias de la vida: las industrias se reprendieron durante mucho tiempo por retrasarse en la adopción de tecnología. Regímenes de cumplimiento como HIPAA, que obligaron a los hospitales a etiquetar y archivar registros exhaustivamente, ahora parecen proféticos en la period de la IA.

La firma de consultoría McKinsey pisgó por primera vez el alza de Era AI para Pharma y MedTech a $ 60 mil millones a $ 110 mil millones al año en julio de 2023, y a principios de 2024 había asignado más de 20 casos de uso de alto impacto que abarcaban el descubrimiento de fármacos, el advertising and marketing y los flujos de trabajo clínicos. Sin embargo, una encuesta 2024 de más de 100 ejecutivos de la industria muestra que la promesa aún es en su mayoría teórica: aunque cada encuestado ha ejecutado pilotos y aproximadamente un tercio se está moviendo a escala, solo el 5% cube que la IA generativa ya les da una ventaja consistente y de fondo.

“Estaban sentados en datos bien estructurados antes de saber que la IA lo necesitaría”, dijo Garman. Las compañías farmacéuticas están utilizando AWS para descubrir proteínas y simular ensayos de medicamentos; Los proveedores de atención médica están experimentando con escribas de IA que reducen el papeleo para los médicos.

La regulación sigue siendo un obstáculo. La misma privacidad se refiere a que el nacimiento de la nube soberana europea pesa en gran medida en los sistemas hospitalarios de EE. UU. Cierre de compartir datos de pacientes con gran tecnología. AWS presenta sus kits de herramientas de cumplimiento y regiones de aire anotados como antídotos, pero los escépticos señalan que los errores, incluso los raros, conllevan el riesgo político.

Dentro de la máquina AWS: una cultura de ‘por qué’

Internamente, el Sr. Garman está aplicando la famosa regla del equipo “Two-Pizza” de Amazon a la IA: cada grupo debe experimentar con herramientas generativas o justificar por qué no. Recientemente les dijo a los empleados que “cada trabajo dentro de Amazon va a cambiar”. Los scripts de apoyo al cliente, los flujos de trabajo del reclutador, incluso el diseño de los vastos centros de cumplimiento están experimentando reescrituras impulsadas por IA, dicen los ejecutivos.

El Sr. Garman describe este ethos como la cultura “por qué”, un guiño a la carta de accionistas de 2025 del ex CEO Andy Jassy. Pregunte por qué algo se hace de cierta manera, luego pregunte por qué no hacerlo de manera diferente. Cuando un pequeño trío de ingeniería propuso hilos de fuga abierta, se saltó el guante recurring de un mes de duración y obtuvo la aprobación en menos de un día. “El mundo se está moviendo demasiado rápido para el antiguo libro de jugadas”, cube.

Vuelos cruzados competitivos

La velocidad, sin embargo, es una calle de dos vías. Microsoft alcanzó un nervio en enero al agrupar sus herramientas de AI de copilot en el cargo, amenazando el punto de apoyo tradicional de AWS entre los desarrolladores con un conjunto de productividad convencional. Mientras tanto, Google Cloud está promocionando el éxito de sus modelos Gemini y especialidades de seguridad para ganar acuerdos de servicios financieros. Los tres enfrentan preguntas sobre la procedencia de datos de entrenamiento, alucinaciones de modelos y la ética de desatar agentes autónomos.

Según Garman, la respuesta de AWS se basa en la amplitud. Bedrock, su servicio administrado para ejecutar múltiples modelos, incluidos Claude de Anthrope, Meta’s Llama y la propia familia Titan de Amazon, posiciona a la compañía como un traficante de armas impartial. Los clientes pueden cambiar modelos con una sola llamada de interfaz de programación de aplicaciones, una flexibilidad que AWS cube que importará ya que los algoritmos se especializarán y los costos divergen.

Los próximos seis meses

La línea de meta para el AI Dash de este año es Las Vegas en diciembre, cuando Garman organizará su primera conferencia completa de Re: Invent como director ejecutivo. Promete una “gran cantidad de noticias de agente” y sugiere asociaciones para incrustar la IA en las industrias “donde la regulación una vez ralentizó la adopción”.

Por ahora, está enfocado en mantener el pie de Aws en el acelerador sin desviarse del camino fiscal. Los inversores aplaudieron el margen operativo del 23% de Amazon el último trimestre, pero analizarán los rendimientos de gasto de capital. “Somos reflexivos sobre el riesgo”, cube Garman. “Pero el mayor riesgo no se escala cuando los clientes nos necesitan”.

Cierra mi entrevista exclusiva con, nuevamente, la palabra “velocidad”. Afuera, las lavadoras de ventanas se balancean sobre una nueva torre de oficinas en el AWS Re: Invent Constructing, una señal más de que, en la visión de Amazon de la nube, el medio tiempo no es tiempo para respirar.

Números clave

  • $ 120 mil millones-gasto de infraestructura AWS proyectado, 2024-26
  • <20% - participación estimada de las cargas de trabajo globales actualmente en la nube
  • 5X – Tamaño del nuevo grupo de entrenamiento construido para la generación antrópica versus anterior
  • 30% a 40%: reclamos de AWS de ahorro de costos típicos para los clientes que cambian a Graviton CPU
  • 14 – Regiones anunciadas o lanzadas por AWS desde enero de 2024

Mi comida para llevar

No importa cómo se desarrolle el resto del año, la única métrica Garman cita una y otra vez es el momento. AWS se está organizando para moverse con los reflejos de una startup mientras lleva la mayor parte de una empresa de billones de dólares: chips refrescantes, girando regiones soberanas y marcos de fuentes abiertas en el lapso de semanas, no en cuartos.

En la period de los agentes, el ganador no será la nube con los centros de datos más grandes o los modelos más llamativos, sino la que puede convertir la thought de un cliente en el código de producción más rápido, a escala international y bajo una regulación endureciente. Para Amazon, eso significa mantener al menos un dash por delante en el silicio, la capacidad y la cultura, lo que demuestra que incluso el proveedor más grande aún puede superar el reloj cuando el silbato sopla para el medio tiempo.

Aquí está la entrevista completa con Garman:

https://www.youtube.com/watch?v=bcgi1xkpily

Foto: Amazon

Apoye nuestro contenido gratuito abierto compartiendo e interactuando con nuestro contenido y comunidad.

Únete a Thecube Alumni Belief Community

Donde los líderes tecnológicos se conectan, comparten inteligencia y crean oportunidades

11.4k+

Pink de ex alumnos de cubos

Nivel C y técnico

Expertos en dominio

Conéctese con 11,413+ líderes de la industria de nuestra purple de líderes tecnológicos y empresariales que forman un efecto de purple confiable único.

Siliconangle Media es un líder reconocido en innovación de medios digitales que sirve al público innovador y marcas, que reúne tecnología de vanguardia, contenido influyente, concepts estratégicas y compromiso de audiencia en tiempo actual. Como la empresa matriz de Silicio, red de thecube, Investigación de THECUBE, Cube365, THECUBE AI y los superstudios de TheCube, como los establecidos en Silicon Valley y la Bolsa de Nueva York (NYSE) – Siliconangle Media opera en la intersección de medios, tecnología e IA. .

Fundada por los visionarios tecnológicos John Furrier y Dave Vellante, Siliconangle Media ha construido un poderoso ecosistema de marcas de medios digitales líderes en la industria, con un alcance de más de 15 millones de profesionales de la tecnología de élite. La nueva nube de video de AI de AI de la compañía, se está basando en la interacción de la audiencia, aprovechando la purple neuronal de thecubeai.com para ayudar a las empresas tecnológicas a tomar decisiones basadas en datos y mantenerse a la vanguardia de las conversaciones de la industria.

fuente