- Daten
-
Daten sind „zum Zweck der Verarbeitung zusammengefasste Zeichen, die aufgrund bekannter oder unterstellter Abmachungen Informationen (d. h. Angaben über Sachverhalte und Vorgänge) darstellen“ (Gabler). [1]
Etymologie (Duden): Plural von Datum; von lat. dare = geben, datum = das Gegebene (früher verwendet mit „gegeben zu <Datum>“ als Überschrift in Schriftstücken – deren Inhalt somit „das Gegebene“ war); in der Mathematik die gegebenen Größen zur Lösung einer Aufgabe
Inhaltsverzeichnis
Anmerkung zum Sprachgebrauch von „Datum“
Diese Pluralform folgt damit anderen Wörtern lateinischen Ursprungs wie Studium/Studien und Individuum/Individuen. In der deutschen Sprache hat sich jedoch die Bedeutung von „Datum“ im allgemeinem Sprachgebrauch auf „Kalenderdatum“ eingeengt. Dem entsprechend wird das Wort „Daten“ nicht als Plural von „Datum“ aufgefasst, und stattdessen von „Datumsangaben“ oder „Terminen“ gesprochen. Umgekehrt werden für die Einzahl von „Daten“ im Sinne von Angaben Wörter wie „Datenelement“, „Angabe“ oder „Wert“ verwendet.
Dennoch ist „Datum“ der korrekte Singular und kann entsprechend Anwendung finden. Alternative Konstrukte wie z.B. das häufig anzutreffende deutsch ausgesprochene „Date“, angewandt etwa als „Zwei Daten, eine Date“, sind falsch.
Recht
Das Recht verwendet an verschiedenen Stellen den Datenbegriff. Dennoch gibt es keine Definition des Datenbegriffs im Recht. Verwendet wird der Begriff etwa im Datenschutz oder im Strafrecht unter „Ausspähen von Daten“ (§ 202a StGB); „Daten“ in diesem Sinn sind „.. nur solche, die elektronisch, magnetisch oder sonst nicht unmittelbar wahrnehmbar gespeichert sind oder übermittelt werden.“
Informatik
Nach der Terminologienorm DIN 44300 Nr. 19 (inzwischen abgelöst durch DIN ISO/IEC 2382) sind Daten „Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.“
Gemäß dem internationalen Technologiestandard ISO/IEC 2382-1 handelt es sich bei Daten um „a reinterpretable representation of information in a formalized manner, suitable for communication, interpretation or processing“, also um eine interpretierfähige, in einer formalisierten Art und Weise verfügbaren Repräsentation von Informationen, nutzbar zur Kommunikation, Interpretation oder zur Verarbeitung.
In der Informatik und Datenverarbeitung versteht man Daten als (maschinen-) lesbare und -bearbeitbare, in der Regel digitale Repräsentation von Information. Ihr Inhalt wird dazu meist zunächst in Zeichen (bzw. Zeichenketten) kodiert, deren Aufbau strengen Regeln folgt, der so genannten Syntax. Um aus Daten Informationen zu gewinnen, müssen sie in einem Bedeutungskontext interpretiert werden. So kann die Zahlenfolge „123456“ zum Beispiel in Abhängigkeit vom Kontext für eine Telefonnummer, eine Kontonummer oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Eine nur abstrakt betrachtete Zeichenfolge mit dem Inhalt „123456“ kann nur als Aneinanderreihung von Ziffern erkannt werden; ihre Bedeutung wird erst im jeweiligen Kontext klar.
Die Speicherung von Daten in datenverarbeitenden Maschinen erfolgt in der Regel in binärer Form. Dies erfolgt auf der Grundlage von Bits als kleinster Speichereinheit. Grundsätzlich ist auch die Verwendung von Symbolen mit höherem Informationsgehalt (entsprechend Zeichensätzen mit mehr als zwei Elementen) möglich. Sie erfolgt aus technischen Gründen jedoch bisher nur in der Nachrichtentechnik. In der Computertechnik finden solche Verfahren bisher keine praktische Anwendung:
- Gebräuchliche Speicherzellen kennen nur die Zustände „An“ und „Aus“, die als 1 und 0 und damit die Basiswerte des Binärsystems interpretiert werden.
- Speicherzellen für höherwertige Zahlensysteme finden keinen praktischen Einsatz. Sie kamen über das Versuchsstadium etwa im russischen Rechner Setun nicht hinaus.
- Speicherzellen für analoge Daten existieren (z. B. Fotopapier), werden aber in modernen datenverarbeitenden Maschinen lediglich in der verlustbehafteten, binären Transformation verwendet.
- Die Darstellung von Information durch überlagerte Quantenzustände befindet sich noch im Forschungsstadium.
Bei der Speicherung werden Daten, von der binär kleinsten Einheit ausgehend, immer zu definierten Gruppierungen zusammengefasst – wie z. B. zum Buchstaben 'H' im Datenfeld 'Hauptstraße' der Datengruppe Adresse des Kunden Müller. In technischer Hinsicht sind dabei Begriffe wie Datenfeld, Datensatz, Dokument, Datei / Ordner, Datenbank gebräuchlich.
Man unterscheidet:
- strukturierte Daten: Die Daten (zum Beispiel in Datenbanken oder Dateien) weisen eine gleichartige Struktur auf. Siehe auch Datenmodell
- semistrukturierte Daten (z. B. Extensible Markup Language (XML))
- unstrukturierte Daten (beispielsweise Dokumente, beliebige Texte, Grafiken)
Nach dem Grad ihrer Beständigkeit unterscheidet man:
- Transiente Daten (flüchtig, übergangsweise) versus persistente Daten ('dauerhaft')
- Eingabedaten versus Ausgabedaten versus zu speichernde bzw. gespeicherte Daten
Weitere Begriffe für Datenarten:
- Neartime-Daten sind Kopien von aktuellen Daten mit etwas geringerer Aktualität als die Originaldaten.
- Sicherungsdaten: Zur Sicherheit kopierte Datenbestände, auf die bei Bedarf zurück gegriffen werden kann
- Originäre versus abgeleitete Daten: Originär sind erst- und einmalig vorhandene Daten. Aus ihnen können Summen, Kopien oder andere Konstrukte gebildet (abgeleitet) werden.
- Serielle Daten (auch 'sequentielle' Daten genannt): Die Daten werden nicht unter einem DBMS verwaltet, sondern in einer Standard-Dateiform des Betriebssystems gespeichert und verarbeitet. In der Regel ist dabei ein Direktzugriff nicht möglich; die Daten müssen 'der Reihe nach' geschrieben bzw. gelesen werden.
- Historische Daten: Der Stand von Daten zu bestimmten Zeitpunkten (z. B. Stand vor Änderungen) kann getrennt gespeichert und später in bestimmten Funktionen (z. B. Bildschirmanzeige) verwendet werden.
Formen der Verarbeitung von Daten:
Als Datenoperationen beim Speichern von Daten sind nach dem Prinzip 'CRUD' das erste Erfassen von Daten (create), das Lesen (read), das Verändern (update) und das Löschen (delete) zu unterscheiden. Gegenstand solcher Operationen ist dabei i. d. R. eine bestimmte Gruppe von Daten (wie z. B. eine Kundenadresse, Bestellung etc.), gebildet z. B. nach den Regeln der Datenmodellierung.
Zweck der Speicherung von Daten ist in der Regel ihre Nutzung. Dabei lässt sich die einfache 'Wiedergabe' (z. B. in Form von Anzeigen oder Listen) und das 'Auswerten' unterscheiden – wo die Daten in unterschiedliche logische, mathematische oder Darstellungsverfahren einfließen (z. B. zur Summenbildung, Durchschnittsberechnung, Differenzbildung, Datenabgleich, als grafische Diagramme etc.).
Als besondere Form der Daten-Verarbeitung sind der Datenimport (Dateiimport) und Datenexport (Dateiexport) als gängige Methode zum Datenaustausch zwischen verschiedenen Systemen zu nennen. Hierbei ist u.U. auch eine Datenkonvertierung verschiedener Datenformate oder Dateiformate zwischen Ausgangs- zum Zielsystem erforderlich.
Bemerkenswertes
Auf der Erde gibt es (Stand 2011) [2] 1,8 Zettabytes (1021 Bytes = 1,8 Billionen Gigabytes) an digitalen Informationen. Das Gesamtvolumen wuchs in den letzten fünf Jahren um den Faktor fünf und wächst zurzeit täglich um 1018 Bytes. Wollte man die gesamte Datenmenge auf DVD brennen, so benötigte man einen Stapel DVDs, der von der Erde zum Mond und wieder zurück reichen würde. Die digitalen Informationen sind allein im Jahr 2009 um 62 Prozent gewachsen[3].
Semiotik
Die Semiotik definiert Daten als potenzielle Information; siehe auch semiotisches Dreieck. In der Semiotik werden Daten heute in die Sigmatik-Ebene eingeordnet.
Beispiele für Daten
Daten im allgemeinen Sinn:
- Inhalte von Lexika und Büchern
- Die an einem Thermometer angezeigte Temperatur
- Die (gemessene) Geschwindigkeit eines vorbei fahrenden Fahrzeugs
- Antworten von Umfragen, Volkszählungen – in den Fragebögen
- Ergebnisse von Experimenten in den Naturwissenschaften, technische Fakten
Daten in der Informatik:
- Ländercode (Internet)
- Telefonnummern (ggf. inkl. Vorwahlnummern) – in elektronischen Telefonbüchern, Websites, in Anruflisten von Handy's oder in beliebigen anderen elektronischen Dokumenten
- Antworten von Umfragen, Volkszählungen – nach der elektronischen Erfassung
- Die Inhalte elektronischer Lexika
- Das Pressearchiv von Zeitungsverlagen
- Inhalte statistischer Datenbanken (mit allen Fakten, Tabellen, Grafiken, aktuell und für vergangene Jahre)
- Inhalte eines USB-Sticks oder einer SD-Karte
- Der Inhalt einer ganzen Festplatte; damit alle auf Computern gespeicherte Daten
- Daten, die bei Internet-Nutzung zwischen den beteiligten Rechnern fließen (Anmeldung, Informationsabruf, Bilder, Videos, E-Mails, Programme usw.)
Einzelnachweise
- ↑ Verlag (Herausgeber), Gabler Wirtschaftslexikon, Stichwort: Daten, online im Internet. Abgerufen am 27. Feb. 2011.
- ↑ Datenwachstum verdoppelt sich alle zwei Jahre – EMC. EMC Corporation, abgerufen am 16. Juli 2011.
- ↑ Das digitale Wissen der Menschheit wächst rasend schnell. DRadio Wissen, abgerufen am 4. Mai 2010.
Siehe auch
Wiktionary: Daten – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wikimedia Foundation.