- Point Accepted Mutation Matrix
-
Dieser Artikel wurde aufgrund von formalen und/oder inhaltlichen Mängeln in der Qualitätssicherung Biologie zur Verbesserung eingetragen. Dies geschieht, um die Qualität der Biologie-Artikel auf ein akzeptables Niveau zu bringen. Bitte hilf mit, diesen Artikel zu verbessern! Artikel, die nicht signifikant verbessert werden, können gegebenenfalls gelöscht werden.
Lies dazu auch die näheren Informationen in den Mindestanforderungen an Biologie-Artikel.
Eine Point Accepted Mutation Matrix (kurz: PAM-Matrix) ist eine mit PAM-Werten gefüllte Substitutionsmatrix, die in der Bioinformatik dazu verwendet wird, die Wahrscheinlichkeit einer Veränderung einer Sequenz zu bestimmen. Grundlage zur Erstellung einer PAM-Matrix sind statistisch erfasste Werte über Sequenzunterschiede. In der Praxis wird die so genannte PAM250-Matrix am häufigsten verwendet. Sie weist eine Sequenzübereinstimmung von etwa 20% auf, was bedeutet, dass man allein durch die Sequenzanalyse mit einem richtigen Alignment rechnen kann. Erstmals beschrieben wurde sie von Margaret Oakley Dayhoff, die sie 1978 im „Atlas of Protein Sequence and Structure“ publizierte.[1]
Motivation & Erstellung
Je weiter sich Sequenzen auseinander entwickeln, desto mehr Mutationen sammeln sich an. Margaret Oakley Dayhoff versuchte als Erste zu erfassen, welche Aminosäuren mit welcher Wahrscheinlichkeit zu einer anderen Aminosäure mutieren. Basis für diese Beobachtung ist, dass die chemischen Eigenschaften eines Aminosäurerestes meist unangetastet bleiben, eine saure Aminosäure wird also mit vergleichsweise hoher Wahrscheinlichkeit mit einer ebenfalls sauren ausgetauscht. Ein wichtiger Faktor der in Hinblick auf die Verwendung dieser beobachteten Änderungswahscheinlichkeiten zu tragen kommt ist die Frage, wie sehr sich zwei Sequenzen generell unterscheiden. Die Sequenzfolge
AGSTVAVREA
| |||||| |
ATSTVAVRSAhat einen Abstand von 2 und damit einen Unterschied von 20%. Je nachdem also, wie sehr Alignments zweier oder mehrerer Sequenzen übereinstimmen, unterscheidet man zwischen 1-PAM-Matrizen (entspricht 1% akzeptierte Mutation) oder 250-PAM-Matrizen (entspricht etwa 80% akzeptierte Mutationen). Die Einträge der PAM-Matrix sind als log-odds-Werte angegeben und mit einem gewissen Faktor (meist 10) multipliziert was rein dazu dient, Kommazahlen zu vermeiden.
Um von einem Score der Matrix zurück auf die Mutationswahrscheinlichkeit zu schließen, wird der Wert mit 10 dividiert und danach zur Basis 10 potenziert. Ein Wert von +2 in einer PAM-Matrix bedeutet damit, dass Aminosäure A 1,6 mal häufiger zu B mutiert als erwartet (2/10 = 0,2 und 10^(0,2) = 1,6). Um auch für Sequenzen sehr geringer Ähnlichkeit zuverlässige Ergebnisse zu erhalten, entwickelten S. Henikoff und J.G. Henikoff die Familie der BLOSUM-Matrizen.
Literatur
- http://web.archive.org/web/20071113063158/http://helix.mcmaster.ca/721/distance/node9.html
- Arthur M. Lesk: Bioinformatik - Eine Einführung. Heidelberg; Berlin: Spektrum, Akad. Verlag, 2003, ISBN 3-8274-1371-0
Einzelnachweise
- ↑ M.O. Dayhoff, R. Schwartz, B.C. Orcutt: A model of Evolutionary Change in Proteins. In: Atlas of protein sequence and structure, 5. Auflage, 3. Ergänzungsband, 1978, Nat. Biomed. Res. Found., ISBN 0-912466-07-3, S. 345–358
Wikimedia Foundation.