ClustalX

ClustalX
Clustal
Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Aktuelle Version: 2.10
(14. Oktober 2008)
Betriebssystem: Unix, Linux, Mac OS X, Microsoft Windows
Kategorie: Bioinformatik-Tool
Lizenz: Für akademische Benutzer kostenlos
www.clustal.org

Clustal ist ein weitverbreitetes Computerprogramm für Multiples Sequenzalignment. Die aktuelle Version ist 2.04. Es gibt zwei Varianten des Programms:

Inhaltsverzeichnis

Eingabe / Ausgabe

Das Programm kann eine große Auswahl Eingabeformate verarbeiten, darunter NBRF/PIR, FASTA, EMBL/Swisspro, Clustal, GCC/MSF, GCG9 RSF und GDE.

Die Ausgabe kann in folgenden Formaten erfolgen: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, NEXUS.

Multiples Sequenzalignment

Clustal führt drei Hauptschritte durch:

  1. Paarweises Alignment,
  2. einen Phylogenetischen Baum erstellen (oder einen benutzerdefinierten verwenden),
  3. den phylogenetischen Baum für das multiple Alignment verwenden.

Diese Schritte werden automatisch durchgeführt, wenn man Do Complete Alignment (Komplettes Alignment durchführen) auswählt. Als weitere Optionen stehen Do Alignment from guide tree (Führe Alignment anhand eines Guide tree) und Produce guide tree only (Nur den Guide Tree erstellen).

Profil Alignments

Paarweise Alignments werden für alle und gegen alle Sequenzen berechnet; Übereinstimmungen werden in einer Matrix gespeichert. Diese wird anschließend in eine Distanzmatrix (distance matrix) konvertiert, wo der Distanzwert den evolutionären Abstand zwischen jedem Sequenzpaar widerspiegelt.

Aus dieser Distanzmatrix wird anhand eines Neighbor-Joining-Algorithmus zur Clusterbildung (Neighbor-joining clustering algorithm) ein Guide Tree oder ein phylogenetischer Baum konstruiert, der die Reihenfolge vorgibt, in der Sequenzpaare aliniiert (angeordnet) und mit vorangegangenen Alignments kombiniert werden sollen. Sequenzen werden an jedem Zweigpunkt progressiv aliniiert, wobei mit demjenigen Sequenzpaar begonnen wird, dass den geringsten Abstand aufweist.

Einstellungen

Benutzer können unter Verwendung der Standardeinstellung Sequenzen alignieren, aber von Fall zu Fall ist es sinnvoll, eigene Parameter zu verwenden.

Die Hauptparameter sind gap opening penalty und die gap extension penalty (siehe Sequenzalignment).

Beschleunigte Version

Eine FPGA-basierte Version des ClustalW Algorithmus wird von der Firma Progeniq angeboten und verzeichnet eine zwanzigfach höhere Verarbeitungsgeschwindigkeit gegenüber der Software-Implementierung.

Quellen

  • J. D. Thompson et al. (1997): The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. In: Nucleic Acids Research. Bd. 25, S. 4876-4882. PMID 9396791
  • R. Chenna et al. (2003): Multiple sequence alignment with the Clustal series of programs. In: Nucleic Acid Research. Bd. 31, S. 3497-3500. PMID 12824352
  • M. A. Larkin et al. (2007): Clustal W and Clustal X version 2.0. In: Bioinformatics. Bd. 23, S. 2947-2948. PMID 17846036

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • ClustalX — Эта статья предлагается к удалению. Пояснение причин и соответствующее обсуждение вы можете найти на странице Википедия:К удалению/12 декабря 2012. Пока процесс обсужден …   Википедия

  • Clustal — Omega Тип Биоинформатика Разработчик Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD) Написана на C++ Операционная система UNIX, Linux, Mac, Windows Последняя версия 1.1.0 ( …   Википедия

  • Clustal — Developer(s) Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Stable release 2.1 / 17 November 2010; 11 months ago (2010 11 17) Written in C++ …   Wikipedia

  • Clustal — Desarrollador Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (University College Dublin) Clustal Información general Última versión estable 2.1 1 …   Wikipedia Español

  • T-Coffee — Infobox Software name=T Coffee developer=Cédric Notredame, CNRS Information Génomique et Structurale latest release version=6.92 latest release date = 2008 09 12 operating system=UNIX, Linux, MS Windows|genre=Bioinformatics tool website=… …   Wikipedia

  • Clustal — Entwickler Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version 2.1 (17. November 2010) Betriebssystem Unix, Linux, Mac OS X, Microsoft Win …   Deutsch Wikipedia

  • ClustalW — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • Clustal W — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • T-Coffee — (del inglés Tree based Consistency Objective Function For alignment Evaluation, función objetivo de coherencia basada en árbol para evaluación de alineamientos) es un software para el alineamiento múltiple de secuencias que utiliza un enfoque… …   Wikipedia Español

  • Conserved sequence — Residues conserved among various G protein coupled receptors are highlighted in green. In biology, conserved sequences are similar or identical sequences that occur within nucleic acid sequences (such as RNA and DNA sequences), protein sequences …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”