En una jugada estratégica para sus planes con la IA para centros de datos, Intel anunció que gastará US$ 2.000 millones para adquirir Habana Labs, una startup israelí que fabrica chips.
Intel había reafirmado sus planes de producir sus chips Nervana el mes pasado, pero la adquisición de Habana da a entender que las primeras cuentas que probaron los chips prefirieron el enfoque de la startup a probar de nuevo con Nervana. Cuesta imaginar cómo podrían seguir teniendo protagonismo los chips Nervana, pero Intel se tomará unos meses para evaluar sus opciones.
No obstante, creo que remodelarán el stack de software muy optimizado de Nervana para que funcione con la arquitectura de Habana. Veamos qué pudo haber motivado la decisión y qué significa para Intel y la industria de IA, cuyo mercado, según proyecciones de Intel, superará los US$ 25.000 millones en ingresos anuales para 2024.
¿Qué es Habana y por qué Intel gastaría US$ 2.000 millones en comprarlá
Entre las muchísimas startups que preparan hardware para la IA, Habana Labs se destaca por ser una de las primeras en proveer hardware que funciona y por afirmar un rendimiento notable para el entrenamiento y el proceso inferencial por igual. Habana Labs lanzó Goya, su chip para proceso inferencial, en septiembre de 2018 y afirmó que era el aproximadamente el triple de rápido que NVIDIA y tenía menos latencia. Después, en junio de 2019, la empresa anunció el lanzamiento de Gaudi, su chip de entrenamiento, y afirmó que tenía un rendimiento récord y una malla integrada basada en estándares de la industria que brinda escalabilidad para procesar modelos de IA muy grandes.
Sospecho que la malla de red de Habana es uno de los motivos principales por los que Intel decidió abandonar Nervana y adoptar la tecnología de Habana. El Neural Network Processor de Nervana (NNP-T) usa una interconexión de patente propia para escalar, mientras que Gaudi puede escalar a miles de nodos con un Ethernet estándar de 100 GB. Además, Gaudi es compatible hasta con Remote Direct Memory Access (RDMA), lo que permite que el software acceda a la memoria por toda la malla sin consumir recursos del CPU remoto. La malla puede aumentar exponencialmente el rendimiento del entrenamiento de modelos de redes neuronales de gran tamaño, redes que duplican su tamaño cada tres meses y medio para procesar tareas de IA cada vez más complejas.
Conclusiones
Hasta ahora, sabemos que 1) la tecnología de Habana es superior a Nervana, opinión probablemente compartida por los principales clientes de Intel, 2) la tecnología de Habana probablemente es superior a la de Graphcore y otras startups, si no Intel habría comprado a uno de esos, y 3) Intel ve una oportunidad de aventajar a NVIDIA en los chips de entrenamiento de IA conectados por mallas, la próxima gran innovación.
La tecnología de Habana pinta prometedora, pero para los grandes centros de datos que podrían adoptarla será mucho más cómodo tratar con Intel que depender de una pequeña startup. Además, para construir un ecosistema en torno a Habana, Intel dispone de recursos fuera del alcance hasta de una startup bien financiada.
Como dije al comenzar el año, la explosión cámbrica de los chips de IA acaba de comenzar. Pronto más empresas lanzarán sus chips al mercado; veremos si esta vez Intel eligió bien.
Por Karl Freund