DNA
Die Desoxyribonukleinsäure (englisch: desoxyribonucleic acid; daher DNA) ist ein komplexes Molekül, das als Träger der Erbinformation aller Lebewesen dient. Die DNA befindet sich im Zellkern jeder Körperzelle (atDNA, yDNA) und in den Mitochondrien, kleinen Körperchen in den Zellen (mtDNA).
Ein DNA-Molekül ist eine lange Kette aus vielen Millionen kleineren "Bausteinen", den sogenannten Nukleotiden. Jeweils zwei DNA-Ketten bilden eine sogenannte Doppelhelix (vereinfacht: zwei ineinander verschränkte Spiralen). Eine solche Doppelhelix aus zwei DNA-Ketten wird Chromosom genannt. Der Zellkern einer Körperzelle enthält insgesamt 46 Chromosomen (22 Paare von je zwei gleichen Chromosomen und zwei Geschlechtschromosomen).
Die kleinen "Bausteine" der DNA, die Nukleotiden, gibt es in vier Formen, nämlich mit den sogenannten Basen Adenin, Thymin, Guanin und Cytosin (oft abgekürzt mit A, T, G und C). In der Doppelhelix ist jede Base des einen Stranges mit einer Base des anderen Stranges verbunden; dabei ist immer Adenin im einen Strang mit Thymin im anderen Strang verbunden und Guanin mit Cytosin. Wegen dieser Verbindung von jeweils zwei Basen wird auch von Basenpaaren gesprochen.
Die menschliche DNA besteht aus insgesamt etwa 3,4 Milliarden Basenpaaren, die sich auf die 23 Chromosomen verteilen. Das längste Chromosom ist Chromosom 1; es besteht aus etwa 247 Millionen Basenpaaren; Chromosom 22 als das kürzeste Chromosom hat rund 50 Millionen Basenpaare.
Nur ein Teil der DNA codiert die eigentliche Erbinformation; diese Abschnitte mit der Erbinformation bilden die Gene. Die Funktion der anderen Abschnitte, in denen keine Erbinformation gespeichert ist, ist bislang nur teilweise bekannt. Die Codierung der Erbinformation ergibt sich vereinfacht gesprochen aus der spezifischen Abfolge der vier Basen A, C, G und T zu einem langen "Text".
Die DNA der Menschen (und aller höheren Lebewesen) stimmt in fast allen Positionen überein, weil nur so die Funktionsfähigkeit des Organismus gewährleistet ist. Auf diese sehr weitgehende grundsätzliche Übereinstimmung beziehen sich Aussagen wie jene, dass Menschen und Schimpasen in 98,5 % der DNA übereinstimmen.
Nur an wenigen Stellen der DNA lassen sich punktuelle Unterschiede zwischen verschiedenen Menschen feststellen, indem beispielsweise ein A durch ein C ersetzt ist. Solche punktuellen Abweichungen können Folgen für die Wirkung oder Funktion einzelner Gene haben, können aber auch folgenlos sein (soweit man bislang weiß). Eine solche punktuelle Abweichung wird als SNP (Single Nucleotid Polymorphism) bezeichnet.
Bei der DNA-Analyse im Rahmen der DNA-Genealogie wird für einen kleinen Bruchteil der Nukleotiden überprüft, welche der vier Basen Adenin, Thymin, Guanin oder Cytosin an der jeweiligen Position vorhanden ist. Das Analyseergebnis sieht in den Rohdaten dann etwa so aus:
rsid chromosome position genotype rs12564807 1 734462 AA rs3131972 1 752721 GG rs148828841 1 760998 CC rs12124819 1 776546 AG rs115093905 1 787173 GG rs11240777 1 798959 GG rs7538305 1 824398 AA rs4970383 1 838555 AC rs4475691 1 846808 CC rs7537756 1 854250 AG
rsid ist die eindeutige Bezeichnung für den SNP und die entsprechende Position in der DNA. Unter chromosome ist angegeben, auf welchem Chromosom sich der SNP befindet. Die position ist die Nummer des Basenpaares, gezählt vom Anfang des Chromosoms an. Unter genotype schließlich ist angegeben, welche Basen auf den beiden Chromosomen an der entsprechenden Position vorliegen. Wichtig: Die beiden Buchstaben (beispielsweise AG) geben nicht ein Basenpaar auf einem Chromosom an, sondern geben jeweils eine Base von jedem der beiden Chromosomen an. Die jeweils zweite Base des Basenpaares wird nicht genannt, weil sie sich aus den Verbindungsmöglichkeiten automatisch ergibt.
Im vorliegenden Beispiel befindet sich SNP rs12124819 auf Chromosom 1; es handelt sich um das Basenpaar 776.546. Der Genotyp lautet AG, das heißt, auf dem einem Chromosom befindet sich an der genannten Position die Base A (Adenin), auf dem anderen Chromosom G (Guanin). Der Bindungspartner im Basenpaar wird nicht genannt: Auf dem einen Chromosom ist A mit T verbunden, auf dem anderen Chromosom G mit C.
Dabei kann aus der Angabe in der Spalte genotype abgelesen werden, auf welchem der beiden Chromosomen welchen Basen vorliegen; es ist nicht so, dass sich der erstgenannte Buchstabe jeweils auf das eine, der zweite Buchstabe auf das andere Chromosom bezieht. Die Unterscheidung der DNA der beiden Chromosomen ist durch das Phasing möglich.
Literatur
- Artikel DNA. In: Wikipedia, Die freie Enzyklopädie.
- Artikel "DNA". In: ISOGG-Wiki
Anmerkungen