Innovación en genética
29/10/2025 | 15:23
Redacción Cadena 3
La detección de enfermedades genéticas raras y la identificación de mutaciones específicas en tumores se han vuelto más accesibles gracias a los avances en la secuenciación de ADN. En este contexto, un equipo de científicos de ETH Zurich presentó recientemente un innovador motor de búsqueda de ADN llamado MetaGraph, que promete acelerar significativamente el descubrimiento genético.
La herramienta, que funciona de manera similar a un motor de búsqueda en Internet, permite a los investigadores buscar trillones de secuencias de ADN y ARN en cuestión de segundos, sin necesidad de descargar grandes archivos de datos. Este avance se logró al comprimir conjuntos de datos genómicos globales en un factor de 300, facilitando el acceso a información que antes requería enormes recursos computacionales.
Durante los años 2020 y 2021, la introducción de nuevas tecnologías de secuenciación, como la secuenciación de próxima generación, permitió la rápida decodificación y monitoreo del genoma del SARS-CoV-2. Sin embargo, el creciente volumen de datos generados ha llevado a la creación de bases de datos masivas, como el American SRA y el European ENA, que ahora almacenan aproximadamente 100 petabytes de información.
Hasta ahora, los científicos biomédicos enfrentaron el desafío de buscar en estos vastos repositorios genéticos, lo que hacía que las búsquedas exhaustivas fueran casi imposibles. Con MetaGraph, los investigadores pueden realizar búsquedas directas dentro de los datos de ADN o ARN crudos, ingresando simplemente una secuencia genética de interés en un campo de búsqueda. En cuestión de segundos o minutos, dependiendo de la consulta, pueden ver dónde aparece esa secuencia en las bases de datos globales.
El profesor Gunnar Rätsch, científico de datos en el Departamento de Ciencias de la Computación de ETH Zurich, describió la herramienta como "una especie de Google para el ADN". Anteriormente, los investigadores solo podían buscar metadatos descriptivos y debían descargar conjuntos de datos completos para acceder a las secuencias crudas, un proceso que resultaba lento y costoso.
Además, MetaGraph se destacó por su eficiencia en costos. Representar todas las secuencias biológicas disponibles públicamente requeriría solo unos pocos discos duros, y las consultas grandes no costarían más de 0.74 dólares por megabase. Esto podría acelerar significativamente la investigación, especialmente en la identificación de patógenos emergentes o en el análisis de factores genéticos relacionados con la resistencia a los antibióticos.
La herramienta organiza y comprime los datos genéticos utilizando gráficos matemáticos avanzados que estructuran la información de manera más eficiente. Según el estudio publicado el 8 de octubre en Nature, MetaGraph logra una tasa de compresión extraordinaria de aproximadamente 300 veces, eliminando redundancias mientras preserva la narrativa y las relaciones esenciales de los datos.
Desde su introducción en 2020, MetaGraph ha sido refinado y ahora está disponible públicamente para búsquedas. Actualmente, indexa millones de secuencias de ADN, ARN y proteínas de virus, bacterias, hongos, plantas, animales y humanos, abarcando casi la mitad de todos los conjuntos de datos de secuencias disponibles a nivel global. Se espera que el resto se incluya para finales de año.
El doctor André Kahles, miembro del grupo de Informática Biomédica en ETH Zurich, sugirió que en el futuro, incluso individuos privados podrían utilizar este motor de búsqueda de ADN. "En los primeros días, incluso Google no sabía exactamente para qué servía un motor de búsqueda. Si el desarrollo rápido en la secuenciación de ADN continúa, podría volverse común identificar tus plantas de balcón con mayor precisión", concluyó.
¿Qué es MetaGraph?
Es un motor de búsqueda de ADN desarrollado por ETH Zurich que permite acceder a trillones de secuencias genéticas rápidamente.
¿Quiénes lo desarrollaron?
Científicos de ETH Zurich liderados por el profesor Gunnar Rätsch.
¿Cuándo fue presentado?
Se introdujo en 2020 y ha sido refinado hasta su disponibilidad pública actual.
¿Dónde se puede utilizar?
Está disponible en línea para búsquedas de secuencias de ADN, ARN y proteínas.
¿Por qué es importante?
Revoluciona la investigación biomédica al permitir búsquedas rápidas y económicas en grandes bases de datos genéticas.
Te puede Interesar