Cansada de recibir mensajes que no podía escuchar, creó un bot de IA que traduce audios a textos por Whatsapp
María Jimena López Morillo es la primera salteña en graduarse como ingeniera mecánica y una de las creadoras de esta aplicación que ya tiene más de un millón de usuarios.

Un día dijo basta. Ya no quería recibir más audios por whatsapp de sus amigos, colegas o familiares. “A veces me llegaban en momentos donde no podía escucharlos, o simplemente prefería leer un texto en lugar de recibir un mensaje de voz de dos minutos”, dice la ingeniera mecánica salteña María Jimena López Morillo, que en pocos meses pasó de trabajar en relación de dependencia a ser la owner de su propia empresa: TranscribeMe, el chatbot que traduce notas de voz en textos y que desde su lanzamiento, en marzo pasado, no para de sumar nuevos usuarios alrededor del mundo. 

Gracias a este traductor de Inteligencia Artificial que creó junto con el ingeniero nuclear Ignacio Fabre, que hoy tiene 1.300.000 usuarios de distintos países, López Morillo cumplió con su meta emprendedora. Todo un desafío que hoy la obliga a trabajar sin horarios y a toda marcha, pero con una satisfacción que jamás había experimentado. En apenas seis meses sucedió de todo. “Fue una locura. Nunca pensamos que esto iba a escalar de la manera que lo hizo”, cuenta López Morillo, que además recibió un reconocimiento del gobierno de Salta por ser la primera mujer oriunda de esa provincia en convertirse en ingeniera mecánica. 

A fines de febrero pasado se lanzó el prototipo de TranscribeMe, y los primeros que recibieron el contacto en sus teléfonos celulares fueron los familiares y amigos de ambos ingenieros, a quienes les pedían que por favor utilizaran el chatbot y les dieran su opinión. De manera orgánica, y de boca en boca en boca, este contacto cuyo número es +549 11 5349-5987 fue enviado miles de veces, hasta llegar al millón de usuarios en solo dos meses.

“Ayer estaba chequeando las métricas para tener un detalle más exacto. En junio habíamos llegado al medio millón de usuarios. Hoy ya somos 1.300.000. Y unos 100.000 son los que lo usan todos los días. Después están los suscriptores, es decir, los que usan el chatbot con fines laborales, que son unas 5500 personas. Y la mitad son de afuera”, resume Morillo. 
 

-¿Cuál fue la inversión inicial?


Al principio fue bastante a riesgo de tiempo y dinero invertido sin saber qué podía pasar.  Tuvimos que mantener mucho tiempo el acceso totalmente free para que la aplicación tuviera un buen alcance. Esa sí fue una gran inversión para nosotros porque tuvimos que pagar la API de WhatsApp, que más o menos nos costaba un dólar por cada persona que lo usaba todos los días. Alrededor de 80.000 dólares para poder soportar toda la base de usuarios free. Por suerte, hoy en día ya estamos empezando a recuperar un poco la inversión con la cantidad de suscriptores que tenemos. De los 5500, la mitad son de afuera, principalmente de Chile, Uruguay y España. Todos ellos pagan 2,80 dólares por suscripción. Acá, en Argentina, es de 800 pesos, y el uso es ilimitado.

 


-¿Cómo funciona el sistema?


Su funcionamiento es sencillo. Una vez agendado el contacto, como cualquier otro, el usuario debe reenviar el audio que quiere traducir. En pocos segundos, el chatbot de IA dirá que está “transcribiendo”, y pasará a formato de texto toda esa conversación. La precisión con que trabaja es una de las claves del chatbot. Detecta las palabras correctamente, las preguntas, las pausas y puntuaciones. Incluso, es capaz de identificar emociones, como el llanto. Además, si el texto es muy largo, te ofrece un resumen. Desde que lanzamos el prototipo, que traducía solo en español, las mejoras son constantes. Los usuarios crecieron de golpe y el traductor comenzó a ir más lento, entonces había que trabajar en eso. Al poco tiempo agregamos otros idiomas, como inglés y portugués, y hoy traduce a unos 30 idiomas. En todo interviene la Inteligencia Artificial.
 


-¿Qué limitaciones tiene la versión free?


Hemos tenido que iterar bastante sobre el modelo de negocio. Al principio eran 20 minutos free todos los meses. Después mutamos a diez días gratis todos los meses. Hoy lo bajamos a cinco días, impulsados por la necesidad de sostener toda la base de usuario free. De otra forma, no nos cerraban los números.
 

 

-¿Cuáles son las últimas innovaciones de la aplicación?


Además de trabajar todos los días para hacer un poco más ágil el modelo, también le integramos GPT de OpenAI dentro del chat. Es un modelo de inteligencia artificial que saca respuestas por medio de Internet y te responde. Entonces, uno en vez de googlear y tener que buscar una respuesta, el chat ya te la da. Por ejemplo, vos estás en una cena con amigos y de repente surge en la conversación, “Che, ¿qué altura tiene el Everest? En vez de entrar a buscar en Google y tener un montón de respuestas, en WhatsApp mismo, sin consumir datos, hacés la pregunta en el chat de TranscribeMe. Y así con cualquier cosa. También le podés pedir que redacte algo. Podés crear contenido. Por ejemplo, le podés pedir que escriba un cuento para un nene de 3 años que le tiene miedo a los monstruos. Y lo que hace es buscar en Internet el promedio de respuestas.
 

-¿Está patentado TranscribeMe?


Detrás de TranscribeMe aparecieron otros contactos muy similares para traducir audios a textos y utilizando Whatsapp como plataforma, pero como todavía no existe la posibilidad de patentar códigos, no se puede hacer nada. Es decir, se puede patentar una idea, pero como la de un transcriptor es algo muy general, no pudimos hacerlo. Lo malo del software es que no deja patentar códigos, entonces no podemos hacer otra cosa más que ocultar el nuestro. 

Jimena López Morillo.


-¿Qué pasa con la privacidad de los audios?
 

Sobre todo en época de elecciones y campañas políticas, mucha gente y también funcionarios tienen miedo de utilizar el bot, porque desconfían del destino que pueden llegar a tener todas esas traducciones. Suele ser la mayor preocupación cuando se comparte información personal con herramientas que utilizan inteligencia artificial y tienen un creador humano detrás. Pero nosotros explicamos que no guardamos el contenido de los audios. Se procesa y pasa. Es decir, no tenemos una base de datos con toda esa información. Si me hackean esa base de datos no tenemos esa información. Pasa por acá pero no guardamos nada. Por eso enviamos la política de seguridad siempre que la solicitan. 
 

-¿Los hipoacúsicos tienen uso libre y gratuito?

Fue un beneficio que surgió de manera colateral. Inicialmente no habíamos pensado en su uso para personas hipoacúsicas o con dificultades en la compresión de audios, pero se transformó en una herramienta clave para este público y que, además, fue muy bien recibida. Nos llegaron muchos mensajes de distintas escuelas, asociaciones y comunidades. Por eso, si nos hacen llegar un certificado, todos estos usuarios tienen un pack gratis para usar el transcriptor sin límite, y gratis.