Personal AI, la startup que pone en relevancia la persistencia de la memoria en los modelos de Gen AI

Los usuarios no lo saben.  Y los fabricantes de IA Generativa no lo dicen. Pero al interactuar con Chat GPT o Gemini no se habla con una Inteligencia Artificial única. Quizá algunos uusarios noten que de pronto la IA parece "olvidarse" de lo que se estaba hablando y hay que repetirselo, o aclararle unos puntos que ya se habían dicho antes. 

La realidad es que no se habla contra un LLM (large language model o gran modelo de lenguaje) sino contra una copia virtual del mismo que se denomina instancia. De esta forma el usuario interacciona con esa instancia que va creando en su red neuronal patrones nuevos a partir de su interacción con el mismo. Al cabo de unos 15 minutos ya puede sentir que no esta hablando con "la misma" IA, algo cambió aunque no se sepa a veces distinguir por qué. 

Las instancias de IA se separan del nucleo principal porque los fabricantes simplemente no quieren que se degrade el nucleo principal. Como se sabe su entrenamiento es muy costoso tanto en términos monetarios como computacionales. Y no es nada claro que esos patrones nuevos aprendidos en la interacción con el usuario sean útiles. Hay un tema de seguridad informática que se tiene en cuenta para proteger al núcleo.

Las instancias también se renuevan por temas de infraestructura. A medida que la IA chatea mas con el usuario requiere mas memoria y capacidad de cómputo para mantener vigente los nuevos patrones generados en la red neuronal. 

Karl Eshwer Senior Investment Associate de BDev Ventures
 

Una de las empresas que desde BDev Ventures estamos impulsando se llama Personal AI. Se trata de tener un asistente inteligente que nos acompañe para ayudarnos con nuestras tareas laborales. Por supuesto estos asistentes no solo requieren tener la semántica que da un modelo general sino que también deben aprender de los datos de la empresa. 

A medida que interaccionan con nosotros el asistente nos conoce más y se vuelve más útil. Por eso que la instancia simplemente desaparezca es un problema al que Personal AI le buscó una solución con su nuevo Model 3. 

Se trata de un sistema multimemoria que recuerda interacciones relevantes de sesiones anteriores (por ejemplo, visitas de pacientes), lo que permite una toma de decisiones integral; y a eso se agregan capacidades de recuperación multimodal mejoradas que interpretan y recuerdan información visual acorde con las respuestas de texto. Todo eso se hace manteniendo la integridad de los datos de origen originales (por ejemplo, gráficos, tablas).  Además, nuestro nuevo sistema multi-IA permite la colaboración entre múltiples humanos, agentes de IA y flujos de trabajo verticales de extremo a extremo.

Cómo funciona la multi-memoria 

Imagina ir a tu restaurante favorito y que el maître no solo recuerde tu nombre, sino también los últimos platos que pediste durante esa ocasión especial del año pasado. Las relaciones humanas se construyen a partir de recuerdos compartidos y recopilados a través de múltiples interacciones. 

‍En un sistema de IA único típico (por ejemplo, ChatGPT, Claude), el sistema tiene acceso a la memoria de largo plazo de la IA, encapsulada en la memoria de largo plazo. El sistema también tiene acceso a la memoria de conversación de corto plazo entre él mismo y el historial de conversación actual con el usuario, aunque limitado a una única sesión. Este "olvido" entre sesiones limita la utilidad de la IA a una sola sesión de interacciones. 

En MODEL-3, presentamos un sistema de memoria mejorado capaz de mantener la memoria a lo largo de múltiples sesiones de conversación entre la IA y el usuario: una memoria multiconversacional. El contexto de memoria de la IA se extiende a lo largo de una vista longitudinal de cada sesión, capaz de hacer referencia a conversaciones anteriores en las que se produjo un contexto similar. 

El sistema de memoria múltiple codifica todo el historial de conversaciones de los usuarios compartido con la IA y se accede a él durante cada sesión del usuario. El historial de conversaciones es consciente del tiempo y del contexto, las respuestas de la IA se refieren a conversaciones pasadas relacionadas con el mensaje del usuario y construyen respuestas consolidadas. 

‍Poder "recordar" entre sesiones amplía la utilidad de la IA en casos de uso e industrias críticas como la atención médica , el coaching y el servicio al cliente, donde la información de la relación que se transmite de una sesión a otra es pertinente para la toma de decisiones en curso. 

El siguiente ejemplo muestra la interacción de un paciente con su médico y la personalidad de IA del médico en tres visitas separadas. En el caso de la memoria de una sola sesión, la IA solo recuerda los valores de laboratorio (por ejemplo, el colesterol) discutidos en la misma sesión, mientras que en el caso de la memoria de varias sesiones, la IA recuerda las visitas anteriores y recuerda valores de laboratorio similares de sesiones anteriores y analiza las tendencias longitudinales del paciente en su progreso. 

De esta forma las posibilidades de los asistentes se amplian. Se convierten en verdaderamente útiles. Y es esta visión centrada en casos de uso prácticos los que nos decidió a incorporar a Personal AI a nuestro portafolio. Buscamos soluciones en que vemos una estrategia clara de impacto. Por supuesto a veces el camino no es sencillo, pero cuando la startup tiene clara su meta siempre contará con nosotros para dar el siguiente paso.