Los modelos de IA Generativa se extienden a las proteínas y prometen acelerar la creación de medicamentos

Ambas empresas crearon un modelo de IA para acelerar el descubrimiento de medicamentos y una API para facilitar el acceso a modelos biológicos avanzados.

Sai Balasubramanian

Google Cloud expande su asociación con Ginkgo Bioworks con dos nuevos lanzamientos El primero consiste en el lanzamiento de un modelo de lenguaje grande (LLM) especializado en proteínas, que permitirá a organizaciones y empresas acelerar su proceso de descubrimiento de medicamentos utilizando los conocimientos y datos propietarios de Ginkgo. El segundo es una API de modelos que la compañía biotecnológica lanzará para ayudar a ingenieros de aprendizaje automático y científicos a acceder a modelos de IA especializados en biología.

En una entrevista exclusiva con Forbes, Chris Sakalosky, Vicepresidente de Industrias Estratégicas en Google Cloud, y Ankit Gupta, Gerente General de Ginkgo AI, comentaron las novedades. Según Gupta, la biología dejó de ser una disciplina puramente física para convertirse en una disciplina computacional. Aquellos que tengan los métodos y medios para comprender, aprovechar y obtener conocimientos valiosos de grandes volúmenes de datos serán los que tengan éxito.

Ginkgo Bioworks proporciona herramientas computacionales que facilitan la ingeniería biológica.

Aquí es donde el ecosistema de Ginkgo se destaca, al proporcionar herramientas computacionales que facilitan la ingeniería biológica. Sakalosky recordó cuando conoció a Jason Kelly, fundador de Ginkgo Bioworks, y discutió cómo el ADN puede entenderse como un lenguaje o código. Si los innovadores pueden entrenar a la IA para entender el lenguaje hablado, la conversación y el código informático, no hay razón para que la IA no pueda trabajar y comprender el ADN de la misma manera. Ahí reside la clave de este campo en auge.

El potencial detrás del nuevo LLM especializado en proteínas es emocionante, ya que se construye sobre la plataforma Vertex AI de Google Cloud y se entrena con los modelos de datos propietarios de Ginkgo. Permitirá a los investigadores y empresas comprender rápidamente sus datos y ponerlos a trabajar, lo que será un gran impulso para el descubrimiento de medicamentos.

Además, la nueva API que la empresa pondrá a disposición ofrecerá acceso a modelos sofisticados entrenados en datos de proteínas y ADN. El primero será el ginkgo-AA-0-650m, "un modelo a gran escala entrenado con más de 2.000 millones de secuencias de proteínas propietarias de Ginkgo".

Una de las novedades consiste en el lanzamiento de un modelo de lenguaje grande (LLM) especializado en proteínas, que permitirá a organizaciones y empresas acelerar su proceso de descubrimiento de medicamentos utilizando los conocimientos y datos propietarios de Ginkgo.

¿Por qué es importante todo esto? La confluencia entre biología, descubrimiento de medicamentos, inteligencia artificial e ingeniería avanzada nunca fue más relevante, ya que todos estos sectores tienen innumerables oportunidades de crecimiento al nutrirse entre sí. Por eso las empresas aumentan rápidamente sus inversiones en este campo, donde la competencia es feroz. Un ejemplo es el Atlas Metagenómico de Meta ESM, que busca "representar cada proteína en el conjunto de datos como un solo punto y revelar la estructura proteica real al acercarse o pasar el cursor sobre ella".

Aunque el proyecto se pausó, en marzo de 2023 el modelo había escalado a casi 772 millones de estructuras proteicas disponibles. De manera similar, Isomorphic Labs, de Alphabet, en asociación con Google DeepMind, desarrolló uno de los modelos proteicos líderes de la industria, AlphaFold. Su última iteración, AlphaFold 3, menciona "una mejora de al menos el 50% en comparación con los métodos de predicción existentes".

En un estudio publicado en la revista Frontiers in Bioinformatics, se describió enfáticamente el vasto potencial del uso de los LLMs en biología e ingeniería de proteínas: "con capacidades de modelado mejoradas, se espera que resuelvan una amplia gama de problemas complejos en medicina y biología molecular... aprovechando su 'conocimiento conexionista', incrustado en los parámetros del modelo de red neuronal profunda".

*Con información de Forbes US.

Te puede interesar