- Consensus-Sequenzen
-
Als Konsensussequenz wird diejenige Sequenz von Nukleotiden oder Aminosäuren bezeichnet, welche in der Summe am wenigsten von einer gegebenen Menge von entsprechenden Mustersequenzen abweicht. Die genaue Beschaffenheit dieser Sequenz kann hierbei je nach Wahl des Abstandsmaßes, wie etwa Hamming- oder Levenshtein-Distanz, variieren.
Meist liegt der Erstellung einer Konsensussequenz der Gedanke zugrunde, dass die gegebenen Sequenzen einen gemeinsamen evolutionären Ursprung haben, oder sie ein Sequenzmotiv mit einer bestimmten biologischen Aufgabe repräsentieren. Hierbei ist es oft auch sinnvoll, eine mehrdeutige Konsensussequenz anzugeben.
Bei Nukleinsäuren können hierfür die Basensymbole der Nukleinsäure-Nomenklatur verwendet werden. Dies sind neben den eindeutigen Basensymbolen beispielsweise R für Purin, Y für Pyrimidin oder N für ein beliebiges Nukleotid.
In der Regel werden Konsensussequenzen heuristisch aus einem multiplen Sequenzalignment (MSA) erstellt. Im einfachsten Fall wird dasjenige Element in die Konsensussequenz aufgenommen, welches in der entsprechenden Spalte der MSA am häufigsten vorkommt.
Wikimedia Foundation.