Investigadoras del CSIC desarrollan una herramienta de IA capaz de predecir funciones desconocidas de proteínas

La tecnología, denominada FANTASIA, permite desvelar en cuestión de horas la función de millones de genes sin necesidad de referencias previas, abriendo nuevas posibilidades en biología, medicina y biotecnología.

Estructura proteica de una pequeña proteina (stannin)

Estructura proteica de una pequeña proteina (stannin) Sinc

Irene Marín
Publicado:

Un equipo científico liderado por Rosa Fernández, del Instituto de Biología Evolutiva (IBE, CSIC-UPF), y Ana Rojas, del Centro Andaluz de Biología del Desarrollo (CABD-CSIC-UPO), ha desarrollado una herramienta basada en inteligencia artificial capaz de predecir la función de proteínas desconocidas a partir de secuencias genómicas. El avance, publicado este martes, supone un paso decisivo en la exploración del denominado proteoma oscuro, el conjunto de proteínas cuya función aún se desconoce.

La herramienta, bautizada como FANTASIA (Functional ANnoTAtion based on embedding space SImilArity), puede analizar genomas completos con una precisión cercana al 100%. En sus primeras pruebas, los investigadores han asignado funciones a 24 millones de genes codificantes de proteínas pertenecientes a casi un millar de especies animales.

Inteligencia artificial al servicio de la biología

FANTASIA emplea modelos de lenguaje similares a los utilizados por sistemas como ChatGPT, pero aplicados a la lectura de secuencias genéticas. En lugar de comparar genes con otros ya conocidos, la herramienta interpreta el ADN como si fuera un texto, identificando patrones y deduciendo el posible papel biológico de cada proteína.

“Comprender la función de estos genes abre una nueva ventana al conocimiento de la biología animal y de la evolución”, destaca Fernández. Su compañera Ana Rojas subraya que el método “va más allá de la homología clásica”, ya que los modelos de lenguaje permiten inferir funciones incluso en genes sin equivalentes conocidos.

Gracias a esta metodología, FANTASIA puede procesar un genoma completo en apenas unas horas en un ordenador estándar o en 30 minutos en equipos especializados. Además, su código abierto y facilidad de uso la convierten en una herramienta accesible para laboratorios de todo el mundo.

Un recurso clave para la investigación y la salud

Todo esto tiene un impacto directo en el ámbito de la salud. Al identificar qué hacen estas proteínas y en qué procesos biológicos participan, los investigadores pueden descubrir nuevas dianas terapéuticas, es decir, proteínas clave que podrían servir como objetivo para desarrollar medicamentos más precisos y eficaces. Además, facilita el estudio de enfermedades genéticas o metabólicas al revelar funciones biológicas antes ocultas, lo que acelera el desarrollo de tratamientos innovadores y la comprensión de patologías complejas.

“Es impensable estudiar uno a uno todos los genes de cada organismo. FANTASIA actúa como un generador de hipótesis que orienta las futuras investigaciones”, explica Fernández.“Estamos viendo que FANTASIA también funciona en plantas, virus, hongos y protistas. Su potencial para ampliar el conocimiento sobre la vida es prácticamente ilimitado”, concluye Rojas.

