Cómo es Photoroom, la app que genera imágenes de IA en un segundo y ahora vale US$ 500 millones
La startup con sede en París recaudó 43 millones de dólares en financiación de serie B y anunció un nuevo modelo fundacional más rápido que otros modelos de IA a la hora de generar imágenes.

En 2018, Matthieu Rouif, jefe de producto de GoPro, se topó con un muro. Necesitaba crear elementos visuales para la última aplicación de edición de video del fabricante de cámaras y su diseñador estaba de baja. Se pasó la tarde, frustrado, haciendo clic en Photoshop. Al mismo tiempo, al otro lado del pasillo, el equipo de IA de la empresa estaba automatizando partes de la edición fotográfica como parte de una investigación interna.

Surgió una idea: "Me dije: deberíamos ofrecérselo a todos los que editan fotos en su smartphone", declaró Rouif a Forbes.

La experiencia inspiró a Rouif a dejar GoPro y fundar Photoroom, que ofrece software de edición fotográfica basado en IA. Los 30 millones de usuarios activos de la startup van desde fabricantes de joyas en Kenia hasta revendedores de moda en Poshmark, pasando por propietarios de restaurantes en DoorDash y Wolt. Rouif explicó a Forbes que, desde su fundación en 2019, sus usuarios modificaron más de 5.000 millones de imágenes con Photoroom, utilizando la aplicación para mejorar sus fotos de productos añadiendo fondos generados por IA, mejorar la resolución de sus fotos y generar fotos de productos desde cero con IA de texto a imagen.

"De lo que nos dimos cuenta es de que éste no es un problema de los jefes de producto de GoPro. Es como un problema de 500 millones de personas, como gente que vende todos los días o todas las semanas y necesita una buena fotografía para vender", dijo Rouif, que vendió su última startup a GoPro en 2016.

Photoroom anunció el martes que recaudó 43 millones de dólares en financiación de serie B a una valoración de 500 millones de dólares. La empresa de capital riesgo Balderton Capital, con sede en Londres, y Aglaé Ventures, una firma de inversión respaldada por el CEO de LVMH, Bernard Arnault, y su familia, lideraron la ronda, con la participación de Y Combinator. La nueva ronda eleva la financiación total de Photoroom a 64 millones de dólares. Con más de 150 millones de descargas de la aplicación y un modelo de negocio basado en suscripciones, la startup con sede en París superó los 50 millones de dólares de ingresos recurrentes anuales, según Rouif.

Photoroom también captó la atención de marcas como Netflix, Lionsgate y Warner Bros, que utilizaron la API de la startup para promocionar películas y programas como Barbie y Black Mirror. En octubre de 2023, Photoroom se asoció con el sello discográfico Republic Records, propiedad de Universal Music Group, para crear un generador de selfies personalizados del álbum 1989 de Taylor Swift que millones de fans utilizaron para crear una portada del álbum con sus propios rostros.

Photoroom ganó tracción por primera vez en 2020, el mismo año en que fue aceptada en Y Combinator. Durante la pandemia, los empresarios se apresuraron a producir catálogos online de sus productos y, sin acceso a fotógrafos ni a estudios fotográficos profesionales, recurrieron a herramientas de edición fotográfica como Photoroom.

 Antes de que las herramientas de IA generativa se convirtieran en la corriente dominante, las herramientas más populares de la startup eran un eliminador de fondos, una herramienta llamada "retoque mágico", que eliminaba los objetos no deseados de una foto, así como una función que podía difuminar los fondos en dos segundos. Cuando en 2023 empezaron a estar disponibles herramientas de IA más avanzadas, la startup amplió su oferta para incluir fondos generados totalmente por IA, en los que los usuarios podían crear visuales de fondo desde cero a través de indicaciones de texto, lo que hoy en día es la función más utilizada de Photoroom.

Para ello, la startup también lanzó su propio modelo fundacional, Photoroom Instant Diffusion, cuya velocidad aumentó en un 40% y es más rápida generando imágenes y fondos que otros modelos de IA de texto a imagen, dijo la empresa. (Midjourney tarda 30 segundos y Dall-e 15 segundos, mientras que Photoroom necesita un segundo para generar una imagen desde cero, dijo Rouif). El modelo se entrena en una base de datos curada de millones de imágenes, algunas procedentes de proveedores de imágenes y otras compradas directamente a artistas. Es capaz de crear imágenes más rápidamente gracias a una "arquitectura personalizada" que acumula más computación en un determinado periodo de tiempo y está optimizada para las últimas GPU de Nvidia, según explicó Eliot Andres, cofundador y director técnico.

"El principal diferenciador clave de este modelo es la velocidad. Nuestros usuarios quieren ahorrar tiempo, tienen una vida agitada, tienen negocios y nosotros les permitimos generar fondos e imágenes con extrema rapidez", afirma Andres.

El dúo, que fue presentado por antiguos colegas, dijo que al principio se enfrentaron a algunos desafíos técnicos mientras intentaban mejorar la calidad y la precisión de su modelo de IA. En su mayoría, los empresarios no quieren que los detalles de su producto cambien durante la edición. Sólo quieren que se actualice el decorado de fondo, dijo Andrés. Pero a veces la IA no era capaz de diferenciar correctamente entre el primer plano y el fondo y acababa cambiando pequeños detalles del propio objeto.

"La gente estaba decepcionada porque no se correspondía con los productos. Así que trabajamos duro para mantenerlo", dijo Andres. "Lo más difícil fue mantener los contornos del objeto".

Rouif dijo que planea utilizar la nueva financiación para mejorar la tecnología invirtiendo en más GPU y datos para entrenar el modelo de IA, así como para ampliar su equipo de 60 personas.

"Nuestra misión es hacer que las fotos de nivel Nike y LVMH sean accesibles a cualquier persona del mundo", afirmó Rouif.


Nota publicada por Forbes US