Hugging Face: la historia del emoji que vale 2.000 millones de dólares
Se originó como un chatbot para adolescentes. Ahora tiene aspiraciones y 100 millones de dólares para ser el GitHub del aprendizaje automático.

Cuando Hugging Face se anunció por primera vez al mundo hace cinco años, llegó en forma de una aplicación de chatbot de iPhone para adolescentes aburridos. Servía para compartir selfies, hacía bromas y contaba chismes sobre su amor por Siri. Apenas ganó dinero.

El momento viral llegó en 2018, no entre los adolescentes, sino entre los desarrolladores. Los fundadores de Hugging Face habían comenzado a compartir fragmentos del código subyacente de la aplicación en línea de forma gratuita. Casi de inmediato, los investigadores de algunos de los nombres tecnológicos más importantes en el negocio, incluidos Google y Microsoft, comenzaron a usarlo para aplicaciones de IA. Hoy, el chatbot desapareció hace mucho tiempo de la App Store, pero Hugging Face se ha convertido en el depósito central de modelos de aprendizaje automático listos para usar, el punto de partida desde el cual más de 10.000 organizaciones han creado herramientas impulsadas por IA para sus negocios.

Emojis

Hugging Face anunció el lunes, junto con su debut en la lista AI 50 de Forbes, que recaudó una ronda de financiamiento de riesgo de 100 millones de dólares, valorando a la compañía en 2.000 millones de dólares. Las firmas de capital de riesgo de primer nivel, Coatue y Sequoia, ganaron espacios como nuevos patrocinadores en la muy disputada Serie C, uniéndose a A.Capital Ventures, Addition Capital y al inversionista principal Lux Capital como principales interesados en la puesta en marcha con sede en Brooklyn.

“El aprendizaje automático se está convirtiendo en la nueva forma de construir tecnología, reemplazando al software”, dice Clément Delangue, cofundador y director ejecutivo de Hugging Face, que lleva el nombre del emoji que parece una cara sonriente con manos de jazz. “La vieja escuela de tecnología de construcción estaba escribiendo un millón de líneas de código. El aprendizaje automático está empezando a hacer eso, pero mucho mejor y mucho más rápido”.

Hablando desde su casa en Miami, donde se mudó durante la pandemia (clima, no web3, explica), Delangue, de 33 años, dice que cree que lo que GitHub es para software, Hugging Face se ha convertido en aprendizaje automático. Esa es una comparación confiable, considerando la popularidad generalizada de GitHub, que es utilizado por más de 70 millones de desarrolladores para compartir y colaborar en el código y se registró por última vez generando 300 millones de dólares en ingresos en el momento de su venta de 7,5 mil millones de dólares a Microsoft en 2018.

Face, por el contrario, generó menos de 10 millones de dólares el año pasado, según tres personas familiarizadas con sus finanzas. Delangue se niega a comentar sobre el número, pero él y los inversores creen que el aprendizaje automático ya se está convirtiendo en la tecnología más importante de la década de 2020, y que Hugging Face puede eventualmente generar miles de millones en ingresos con su propio ejército de desarrolladores con mentalidad de IA.

“Las empresas que supondría que son competidores a primera vista, ya sea Google, Amazon o Facebook, casi todas son proponentes”, dice Brandon Reeves, de Lux Capital, quien invirtió por primera vez en Hugging Face en 2019. “Realmente se siente esto como Suiza -como una pieza de bienes raíces en el ecosistema”.

Al crecer en La Bassée, una pequeña ciudad de 6.000 habitantes en el norte de Francia, Delangue recuerda una infancia ociosa hasta que consiguió su primera computadora a los 12 años. A los 17, se había convertido en uno de los principales comerciantes franceses en eBay, vendiendo vehículos todoterreno. y motos de cross que importó de China y almacenó en la tienda de equipos de jardinería de su padre. Esa destreza impresionó a eBay, que le ofreció una pasantía una vez que comenzó la universidad en ESCP Business School en París. Mientras representaba a la compañía en una feria comercial de comercio electrónico, Delangue fue abordado por otro asistente que destrozó la reciente adquisición de eBay de una aplicación de escaneo de códigos de barras; los códigos de barras, dijo el hombre, pronto quedarían obsoletos debido a los avances en IA.

El hombre resultó ser cofundador de Moodstocks, una empresa emergente que crea software de reconocimiento de imágenes mediante aprendizaje automático. “Con un equipo muy pequeño, estaban logrando hacer cosas a la par de lo que Google estaba haciendo con 100 veces más personas”, dice.

Impresionado por la agilidad de las nuevas empresas, Delangue nunca miró hacia atrás. Rechazó la oferta de eBay de extender su pasantía para poder pasar su tiempo libre en Moodstocks. Después de graduarse en 2012, rechazó un trabajo de Google para dirigir su propia startup. La idea de Delangue de una aplicación colaborativa para tomar notas no fue muy lejos, pero en el muy unido escenario europeo de empresas emergentes conoció a Julien Chaumond, un compañero emprendedor que estaba construyendo un lector de libros electrónicos colaborativo. La pareja habló sobre su interés mutuo en la tecnología abierta y habló sobre iniciar una empresa juntos.

Ese momento llegó en 2016, después de que ambas empresas se detuvieran. Se reclutó a un tercer cofundador en Thomas Wolf, un amigo de la universidad de Chaumond que había recibido un doctorado en física y trabajos de investigación escritos sobre aprendizaje automático. Para la idea de negocio, se decidieron por la «IA conversacional de dominio abierto», en otras palabras, un chatbot que pudiera entender cualquier tipo de tema de conversación. “Existe este sueño en el que todos tenemos que hablar con una IA sobre todo, como se ve en la ciencia ficción”, dice Delangue.

inteligencia artificial

Hugging Face comenzó como un amigo personalizado, similar a Tamagotchi, impulsado por una forma de IA conocida como procesamiento de lenguaje natural (NLP). Para entrenar las capacidades de lenguaje natural del chatbot, el equipo también creó una biblioteca subyacente para albergar varios modelos de aprendizaje automático, por ejemplo, uno para detectar las emociones detrás de un mensaje de texto y otro para poder generar una respuesta coherente, y los muchos conjuntos de datos para comprender diferentes tipos de temas de conversación, como deportes o chismes en el aula. 

Volviendo a los valores de los fundadores para la colaboración abierta, lanzaron piezas gratuitas de la biblioteca como un proyecto de código abierto en GitHub. La compañía participó en un programa de aceleración específico para bots dirigido por el estudio de inicio Betaworks con sede en Nueva York y recaudó fondos iniciales de capitalistas de riesgo, así como de la estrella de la NBA Kevin Durant. Pero dos años después, su chatbot no había ganado mucho dinero y estaba perdiendo la capacidad de atención de sus usuarios jóvenes.

Casi al mismo tiempo, los investigadores de Google y OpenAI anunciaron el desarrollo de “transformadores”, un nuevo tipo de modelo de PNL que demolió las habilidades de comprensión de lectura tanto de los humanos como del mejor titular de IA en ese momento. En 2019, Google potenciaba sus resultados de búsqueda con este modelo. La biblioteca de código abierto de Hugging Face apareció en el momento perfecto para las organizaciones que querían aprovechar estos avances de PNL, pero que no tenían la misma maquinaria que Google para crearlos desde cero. Se convirtió en un éxito casi instantáneo cuando la comunidad de aprendizaje automático convergió en torno a él como la base central para implementar modelos de transformadores. “Lanzamos cosas sin pensar demasiado en ello y la comunidad explotó, como una sorpresa incluso para nosotros”, dice Delangue.

Reeves, el inversionista de Lux, conoció a Delangue por primera vez en una cafetería en el centro de San Francisco un viernes a fines de 2019. Asustado de perder la oportunidad de invertir, ofreció una hoja de términos el lunes siguiente con una valoración de 80 millones de dólares. 

“El 90% de las empresas en las que he invertido, las conozco desde hace muchas semanas, meses o años”, dice. “No creo que ninguno haya venido durante un fin de semana”. Desde que Delangue aceptó el cheque de Lux, el uso se ha disparado. La comunidad de desarrolladores ha creado más de 100.000 modelos de aprendizaje automático en Hugging Face, lo que permite a otros, a su vez, usar esos modelos previamente entrenados para sus propios proyectos de IA en lugar de tener que crear modelos desde cero. En GitHub, Hugging Face ha acumulado “estrellas”, una métrica de vanidad que mide la popularidad de un proyecto de código abierto, a un ritmo más rápido que los proyectos detrás de Confluent (ingresos anuales de 388 millones de dólares), Databricks (más de 800 millones de dólares) y MongoDB (874 millones de dólares).

Aunque las rondas de financiación para empresas con una estatura similar fueron abundantes en 2021, el mercado de capital de riesgo en etapa de crecimiento se ha desacelerado desde entonces. El último financiamiento de Hugging Face indica un voto de confianza de los inversores más enrarecido, pero algunos en el ecosistema de inicio de datos han expresado en privado su curiosidad sobre cómo Delangue puede aumentar los ingresos de Hugging Face lo suficiente como para validar su fuerte valoración. Delangue cree que si suficientes usuarios gratuitos se enganchan a Hugging Face, el dinero seguirá con el tiempo de algunas de las empresas que emplean a los usuarios. “Dado lo valioso que es el aprendizaje automático y lo generalizado que se está volviendo, el uso es un ingreso diferido”, dice Delangue. “Realmente no veo un mundo en el que el aprendizaje automático se convierta en la forma predeterminada de desarrollar tecnología y donde Hugging Face sea la plataforma número uno para esto, y no logremos generar varios miles de millones de dólares en ingresos”.

Hugging Face solo comenzó a ofrecer funciones pagas el año pasado y cuenta con más de 1.000 empresas como clientes, según Delangue, incluidas Intel y su antiguo territorio eBay. Los gigantes farmacéuticos Pfizer y Roche pagan por características de seguridad de nivel empresarial, mientras que Bloomberg paga para ejecutar el aprendizaje automático para su terminal en tiempo real a través de Hugging Face en lugar de tener que construir su propia infraestructura. Microsoft no es un cliente, pero utiliza de forma destacada Hugging Face como base para entrenar su motor de búsqueda Bing para comprender mejor las consultas en lenguaje natural.

“Dieron prioridad a la adopción sobre la monetización, lo que creo que fue correcto”, dice Pat Grady, socio de Sequoia, uno de los nuevos inversores. “Vieron que los modelos basados en transformadores funcionaban fuera de la PNL y vieron la oportunidad de ser el GitHub no solo para la PNL, sino para todos los dominios del aprendizaje automático”. 

De hecho, en el transcurso del año pasado, Hugging Face comenzó a convertirse en un centro de modelos de aprendizaje automático para una variedad de usos, como visión artificial para entrenar el reconocimiento de imágenes en automóviles autónomos y sistemas de recomendación para ayudar a las compañías farmacéuticas a predecir el eficacia de las nuevas terapias farmacológicas.

Si sus suposiciones de la supremacía del aprendizaje automático son incorrectas, Delangue dice que Hugging Face está cerca del punto de equilibrio y tiene los 40 millones de dólares de su recaudación de fondos anterior todavía en el banco para reorientarse. “Uno de mis aprendizajes personales como emprendedor es no pensar demasiado estratégicamente con un gran plan de negocios de 10 años, sino experimentar y seguir la validación de la comunidad y lo que te están diciendo”, dice. Si la visión se cumple, Reeves cree que el premio podría ser una capitalización de mercado de 50 mil millones de dólares o 100 mil millones de dólares en el mercado de valores. No es de extrañar que Delangue diga que ha rechazado múltiples “ofertas de adquisición significativas” y que no venderá su negocio, como hizo GitHub con Microsoft.

“Queremos ser la primera empresa en salir a bolsa con un emoji, en lugar de un ticker de tres letras”, dice con una sonrisa similar a un emoji. “Tenemos que comenzar a hacer cabildeo en el Nasdaq para asegurarnos de que pueda suceder”.