Wissen

Daten von 885 MenschenGenome im Internet veröffentlicht

26.06.2010, 17:55 Uhr
dns
Sich kreuzende DNA-Stränge, aufgenommen mit einem Rasterkraft-Mikroskop. (Foto: picture-alliance / dpa)

Mit dem 1000-Genom-Projekt sind Genetiker den tausendfachen Unterschieden in der menschlichen Erbsubstanz auf der Spur. Die Daten von 885 Menschen haben sie jetzt veröffentlicht - und das ist nur ein Zwischenschritt.

Das internationale 1000-Genom-Projekt hat genetische Daten von 885 Menschen gelesen und frei zugänglich ins Internet gestellt. Das teilten die Forscher am Wellcome Trust Genome Campus im britischen Hinxton mit. Dabei entstand eine Datenmenge von rund 50.000 Gigabyte - und dennoch ist das Resultat nur ein Zwischenstand. Nun wollen die Forscher weitere 2500 Genome aus 27 ethnischen Gruppen aus aller Welt zusammentragen, um ihre öffentliche Datenbank weiter aufzustocken. Die Arbeit dafür hat bereits begonnen, hieß es bei den Genetikern. Selbstverständlich sind alle Daten anonymisiert. Die Forscher wollten ursprünglich das Erbgut von 1000 Menschen sequenzieren.

Am 26. Juni 2010 - also fast auf den Tag genau vor zehn Jahren - hatten sowohl das öffentliche Humangenomprojekt als auch der private Genforscher Craig Venter ihre Fassungen der 3,2 Milliarden genetischen Bausteine des Menschen präsentiert. Seither gab es große technische Fortschritte, die das Lesen eines Genoms binnen Wochen und zum Preis einiger tausend Dollar möglich machen. Dies ist die Voraussetzung für das privat und öffentlich finanzierte 1000-Genom-Projekt.

Auf der Suche nach den indels

Es liefert Daten, in denen Forscher und Mediziner nach den Unterschieden in der Erbsubstanz suchen. Zwischen zwei beliebigen Individuen gibt es hunderttausende Unterschiede in der Sequenz - manche bleiben ohne Folgen, andere sind gefährliche Mutationen. Je mehr Varianten bekannt sind, umso klarer wird das Bild von der Funktion des Genoms. Vorläufer der aktuellen Sequenzierungen war das internationale HapMap-Project, das allein in 270 DNA-Proben drei Millionen Unterschiede aufgedeckte.

Das 1000-Genom-Projekt sucht unter anderem nach SNPs (single nucleotide polymorphism oder Einzelnukleotid-Polymorphismen), dabei sind einzelne Buchstaben innerhalb der Abfolge der genetischen Bausteine ausgetauscht. Weiterhin möchten die Genetiker mehr über "indels" lernen - kurze Bereiche, in denen Erbsubstanz eingefügt oder entfernt sind ("insertions" und "deletions"). Das Genom eines Menschen wird von vielen dieser Eigenarten geprägt.

Die nun präsentierten 885 Datensätze zerfallen in drei Gruppen: Die Genome von sechs Menschen (zwei Elternpaare mit ihren Töchtern) wurden vollständig sequenziert. Im Unterschied zu bisherigen Genomen wurde die Arbeit dreimal mit verschiedenen Sequenzierungstechnologien wiederholt, um Vor- und Nachteile der Maschinen von 454 Life Sciences, Applied Biosystems und Illumina zu erkennen. Diese sechs Genome wurden mehr als 50 Mal gelesen, um höchste Genauigkeit zu erreichen. Diese höchste Qualitätsstufe ist nach wie vor teuer.

"In der Biomedizin ohne Beispiel"

Gruppe zwei besteht aus 179 Genomen, die lediglich dreimal sequenziert wurden. Aber auch mit diesen Daten lassen sich viele Unterschiede erkennen, heißt es in Hinxton. Von weiteren 700 Menschen lasen die Maschinen einen vergleichsweise winzigen DNA-Anteil, nämlich jeweils 1000 Gene. Die mehr als 20.000 Gene des Menschen machen insgesamt nur rund zwei Prozent des gesamten Genoms aus – für viele Anwendungen reicht es daher, nur diesen kleinen Teil zu kennen.

"Die Datenmenge dieses Projektes ist in der Biomedizin ohne Beispiel" schreiben die Forscher. Derzeit umfassen die Datensätze 50 Terabyte, umgerechnet 50.000 Gigabyte – oder mehr als 10.000 vollbeschriebene DVDs. Diese Menge entspricht 8 Billionen genetischen Bausteinen. Die Resultate zu den 885 Probanden sollen in einem Fachjournal veröffentlicht werden.

Quelle: dpa