- Bioinformatik-Harvester
-
Der Bioinformatik-Harvester (englisch harvester, „die Erntemaschine, -arbeiter“) ist eine Bioinformatik-Meta-Suchmaschine über Gene und Proteine von Mensch, Maus, Zebrafisch, Arabidopsis, Drosophila und Ratte. Der Harvester vereint oder verlinkt den Inhalt von ca. 51 häufig verwendeten Bioinformatik-Ressourcen. Ein spezielles Ranking-Verfahren sortiert vorab die Informationen und präsentiert dem Benutzer die relevantesten Suchergebnisse in sehr kurzer Zeit.
Inhaltsverzeichnis
Funktionsweise
Der Harvester sammelt Informationen von Protein-/Gen-Datenbanken und sogenannten Vorhersage- oder prediction-Servern. Dazu simuliert der Harvester einen menschlichen Benutzer, ruft die entsprechende externe Datenbankseite auf und speichert diese auf lokalen Festplatten ab. Als Basis zum Sammeln der Informationen dienten die Uniprot-Protein-Datenbank des Uniprot-Konsortiums und die IPI Datenbank (international protein index). Die Harvester-Sammlung umfasst derzeit:
- Mensch: ca. 72.000 Seiten
- Maus: ca. 54.000 Seiten
- Ratte: ca. 41.000 Seiten
- Zebrafisch: ca. 45.000 Seiten
- Arabidopsis: ca. 34.000 Seiten
- Drosophila: ca. 33.000 Seiten
Bioinformatische Angaben
Die Harvester-Suche vereint folgende bioinformatische Angaben:
Textbasierte Angaben
… von den folgenden Datenbanken:
- Uniprot, weltweit größte Protein-Datenbank
- SOURCE, übersichtliche Darstellung von Geninformationen
- Simple Modular Architecture Research Tool (SMART),
- SOSUI, untersucht Transmembrandomänen
- PSORT, Vorhersage für Protein-Lokalisierung
- Homologene, vergleicht Proteine verschiedener Spezies
- gfp-cdna, Protein-Lokalisierung mit Hilfe von Fluoreszenzmikroskopie
- International Protein Index (IPI).
- OMIM, Umfangreiche Datenbank über Genveränderungen im Menschen
Datenbanken reich an graphischen Elementen
Diese Datenbanken werden nicht „gesammelt“, sondern in sogenannten Inline-Frames verlinkt. Inline-Frames sind eine Art durchsichtiges Fenster auf einer HTML-Seite. Durch dieses Fenster kann man in Echtzeit auf entsprechende externe Datenbanken „hindurchsehen“. Mehrere solcher Inline-Frame-Fenster werden auf einer Harvester-Protein-Seite kombiniert. Diese Methode erlaubt es, alle Informationen der verschiedenen Datenbanken auf einen Blick zu betrachten und zu vergleichen.
Derzeit werden folgende Server mittels Inline-Frame auf den Harvester-Seiten vereint:
- NCBI-BLAST, findet lokale Sequenzübereinstimmungen
- Conserved Domain Database findet Proteindomänen bekannter Funktion
- Ensembl, Automatische Genannotation. Ein Projekt von EMBL-EBI und Sanger-Institut
- Mouse_Genome_Informatics. Gen-Beschreibung und Phänotyp-Informationen der Maus
- RZPD, Deutsches Ressourcenzentrum für Genomforschung in Berlin/Heidelberg
- STRING, Server für die Darstellung von interagierenden Genen und Proteinen am EMBL
- iHOP, verlinkt Literatur (pubmed) mit Hilfe von Gen- und Protein-Synonymen
- Zfin, Zebrafisch spezifische Datenbank
Linkouts
Linkouts verlinken zu externen Suchmaschinen oder bioinformatischen Service-Einrichtungen.
- Genome-Browser, übersichtliche Darstellung aktueller Genome von der UCSC
- Mitocheck, Fluoreszenz-movies von siRNA Experimenten in Zellkulturen
- Entrez Gene, Meta-Suchmaschine des National Center for Biotechnology
- PolyMeta, Metasuchemaschine über PubMed, Scirus und andere Quellen Wissenschaftlicher Publikationen
- Google Scholar, Googles Literatursuche
- LOCATE subzelluläre Proteinlokalisations Datenbank (Maus)
Literatur
- Liebel, U., Kindler, B. und Pepperkok, R. (2004) 'Harvester': a fast meta search engine of human protein resources. Bioinformatics. 2004 Aug 12; 20 (12): 1962-3. Epub 2004 Feb 26.[1]
- Liebel, U., Kindler, B. und Pepperkok, R. (2005) Bioinformatic "Harvester": a search engine for genome-wide human, mouse, and rat protein resources. Methods Enzymol. 2005;404:19-26[2]
Weblinks
- Harvester IV search engine am Karlsruher Institut für Technologie (KIT)
- Harvester42 eine Suchmaschine mit mehr als 10 globale Suchmaschinen.
- Liebel-Lab am KIT
Vom Bioinformatik-Harvester unterstützte DatenbankenNCBI-BLAST | CDART | CDD | Ensembl | Entrez Gene | Flybase | Flymine | Genome-Browser | GeneCard | GFP-cDNA | Google Scholar | GoPubMed | Harvester42 | H-InvDB | HomoloGene | iHOP | IPI | MGI | Mitocheck | OMIM | PolyMeta | PSORT | RGD | Unigene | UniProt | SMART | SOSUI | SOURCE | RZPD | STRING | TAIR | Wikiprofessional | ZFIN |
Wikimedia Foundation.