- Computerdaten
-
Daten sind logisch gruppierte Informationseinheiten (engl., aber auch in der Informationstheorie Datum, von lat. dare = geben, datum = das Gegebene), die zwischen Systemen übertragen werden oder auf Systemen gespeichert sind.
Inhaltsverzeichnis
Anmerkung zum Sprachgebrauch von „Datum“
Diese Pluralform folgt damit anderen Wörtern lateinischen Ursprungs wie Faktum/Fakten und Skriptum/Skripten. In der deutschen Sprache hat sich jedoch die Bedeutung von „Datum“ im allgemeinem Sprachgebrauch auf „Kalenderdatum“ eingeengt. Deshalb wird das Wort „Daten“ als Plural von „Datum“ selten verwendet. „Datum“ wird manchmal behandelt, als ob es ein Singularetantum (Wort ohne Plural) wäre; „Daten“ wird häufig behandelt, als ob es ein Pluraletantum (Wort ohne Singular) wäre. Eine beliebte Methode, das Wort „Daten" zu vermeiden, ist die Umschreibung mit „Termine“. Um dagegen das Wort „Datum“ als Singular zu „Daten“ zu vermeiden, werden Wörter wie „Datenelement“, „Angabe“ oder „Wert“ verwendet.
Dennoch ist beispielsweise der Satz „An folgenden Daten der Geschichte gab es große Erdbeben“ vollkommen korrekt. Aus dem Satzzusammenhang geht hier auch klar hervor, dass mit „Daten“ in diesem Fall der Plural von Kalenderdatum gemeint ist.
Recht
Das Recht verwendet an verschiedenen Stellen den Datenbegriff. Dennoch gibt es keine Definition des Datenbegriffs im Recht. Verwendet wird der Begriff etwa im Datenschutz (Bundesdatenschutzgesetz), dem Ausspähen von Daten (§ 202a StGB) etc. Eine Definition findet sich nicht in § 202a Abs. 2 StGB, auch wenn dieser teils so verstanden wird. § 202a Abs. 2 StGB geht von einem Datenbegriff aus und schränkt ihn weiter ein. ("Daten im Sinne des Absatzes 1 (!) sind solche, die ...").
Informatik
Nach der Terminologienorm DIN 44300 Nr. 19 (inzwischen abgelöst durch DIN ISO/IEC 2382) sind Daten Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.
In der Informatik und Datenverarbeitung versteht man Daten als (Maschinen-) lesbare und bearbeitbare in der Regel digitale Repräsentation von Information. Die Information wird dazu meist zunächst in Zeichen (bzw. Zeichenketten) kodiert, deren Aufbau strengen Regeln folgt, der so genannten Syntax. Um aus Daten Informationen zu gewinnen, müssen sie in einem Bedeutungskontext interpretiert werden. So kann die Zahlenfolge „12345678“ zum Beispiel in Abhängigkeit vom Kontext für eine Telefonnummer, eine Kontonummer oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Als reiner Datensatz betrachtet handelt es sich bei „12345678“ nur um eine Aneinanderreihung von Ziffern oder Symbolen. Die Bedeutung wird erst im jeweiligen Kontext sichtbar.
Die Speicherung von Daten in datenverarbeitenden Maschinen erfolgt in der Regel in binärer Form. Dies erfolgt auf der Grundlage von Bits als kleinster Speichereinheit. Grundsätzlich ist auch die Verwendung von Symbolen mit höherem Informationsgehalt (entsprechend Zeichensätzen mit mehr als zwei Elementen) möglich. Sie erfolgt aus technischen Gründen jedoch bisher nur in der Nachrichtentechnik. In der Computertechnik finden solche Verfahren bisher keine praktische Anwendung:
- Gebräuchliche Speicherzellen kennen nur die Zustände „An“ und „Aus“, die als 1 und 0 und damit die Basiswerte des Binärsystems interpretiert werden.
- Speicherzellen für höherwertige Zahlensysteme finden keinen praktischen Einsatz.
- Speicherzellen für analoge Daten existieren (z. B. Fotopapier), werden aber in modernen datenverarbeitenden Maschinen lediglich in der verlustbehafteten, binären Transformation verwendet.
- Die Darstellung von Information durch überlagerte Quantenzustände befindet sich noch im Forschungsstadium.
Man unterscheidet:
- strukturierte Daten (zum Beispiel Datenbanken)
- semistrukturierte Daten (z. B. Extensible Markup Language)
- unstrukturierte Daten (beispielsweise Dokumente)
- transiente Daten
Strukturierte Daten beinhalten Nutzdaten und zusätzlich Metadaten, das sind andere Elemente, die für eine zuverlässige sich strukturierte Daten relativ einfach maschinell weiterverarbeiten lassen, ist dies bei unstrukturierten Daten nur schwer oder ungenau möglich.
Das Synchronisieren von Daten wird als Datenabgleich bezeichnet.
Neartime-Daten sind Kopien von aktuellen Daten mit etwas geringerer Aktualität als die Originaldaten.
Semiotik
Die Semiotik definiert Daten als potenzielle Information. In der Semiotik werden Daten heute in die Sigmatik-Ebene eingeordnet.
Beispiele für Daten
- Ländercode (Internet)
- Ländervorwahlen für das internationale Telefonnetz
- Städtevorwahlen für Deutschland
- Anzahl der Fenster in einem Haus
- Größe und Masse
- Ergebnisse von Experimenten in den Naturwissenschaften
- technische Fakten
- Zahl der Einwohner/Bürger eines Landes
- Antworten von Umfragen, Volkszählungen, …
Siehe auch
Wikimedia Foundation.