Home/Wie Google – nur für Gene
imageRiesige DNA-Datensätze können mithilfe des neuen Tools «MetaGraph» schnell durchsucht werden. Symboldbild: Unsplash.

Wie Google – nur für Gene

Forschende der ETH-Zürich haben eine Suchmaschine entwickelt, die Millionen DNA-Sequenzen blitzschnell analysiert. Das Tool «MetaGraph» könnte die Erforschung von Antibiotikaresistenzen, seltenen Krankheiten und neuen Erregern revolutionieren.

Sarah Bourdely14.10.20253"
Sequenzierte DNA bildet das Fundament der modernen Biomedizin – ob bei der Erforschung von Tumoren, genetischen Erkrankungen oder Viren wie SARS-CoV-2.

Doch die riesigen Mengen an Sequenzdaten stellen Forschende vor ein massives Problem: Rund 100 Petabyte an Rohdaten – so viel wie der gesamte Textinhalt des Internets – müssen bislang mit enormem Rechenaufwand durchsucht werden.

ETH-Forschende um Gunnar Rätsch und André Kahles haben nun eine Lösung vorgestellt. Ihr digitales Tool «MetaGraph» macht diese Daten durchsuchbar wie Webseiten bei Google. Forschende können eine DNA-Sequenz direkt als Volltext eingeben und erhalten innert Sekunden Treffer – ohne zuvor riesige Datensätze herunterladen zu müssen.
«Es handelt sich um eine Art Google für DNA.» Gunnar Rätsch, ETH Zürich.
Die in «Nature» publizierte Studie beschreibt, wie «MetaGraph» die Sequenzdaten in mathematische Graphen umwandelt und so bis zu 300-fach komprimiert. Dadurch wird das Suchsystem nicht nur extrem schnell, sondern auch ressourcenschonend.

«Mathematisch gesehen handelt es sich um eine riesige Matrix mit Millionen von Spalten und Billionen von Zeilen», erklärt Gunnar Rätsch, Datenwissenschaftler am Institut für Informatik an der ETH.

Der Clou: Das Tool verknüpft Roh- und Metadaten und bleibt dabei Open Source. Schon jetzt sind rund die Hälfte aller weltweit verfügbaren Sequenzsätze indexiert; bis Ende Jahr soll die vollständige Integration folgen. Grössere Abfragen kosten laut den Forschenden weniger als einen US-Dollar pro Megabase – ein Bruchteil bisheriger Methoden.
Neue Chancen für Forschung und Diagnostik
Mit «MetaGraph» könnten künftig etwa Resistenzgene, neue Bakteriophagen oder seltene Mutationen in Tumoren rascher identifiziert werden. Auch die Überwachung neu auftretender Erreger – etwa bei zukünftigen Pandemien – liesse sich massiv beschleunigen, so die ETH in einer Mitteilung.

Laut Mitautor André Kahles könnten langfristig sogar Privatpersonen vom Konzept profitieren – etwa zur genetischen Analyse von Pflanzen oder Haustieren: «In den Anfängen wusste man auch bei Google noch nicht genau, wofür eine Suchmaschine gut sein soll».

Zur Originalpublikation:
  • Karasikov, M., Mustafa, H., Danciu, D. et al.: «Efficient and accurate search in petabase-scale sequence repositories», in: «Nature», Oktober 2025.
  • DOI: 10.1038/s41586-025-09603-w

just-medical!
Blegistrasse 5
6340 Baar
Schweiz

www.just-medical.com

Kontakt
info@docinside.ch
+41 41 766 11 55