- Digitalisierung
-
Der Begriff Digitalisierung bezeichnet die Überführung kontinuierlicher Größen in abgestufte (diskrete) Werte als Binärcode; meist zu dem Zweck, sie zu speichern oder elektronisch in der EDV oder IT zu verarbeiten. Diese Umwandlung erfolgt in erster Linie durch Abtastung (Rasterung) und Quantisierung. Es wird geschätzt, dass 2007 bereits 94 % der weltweiten technologischen Informationskapazität digital war (nach lediglich 3 % im Jahr 1993)[1]. Es wird angenommen, dass es der Menschheit im Jahr 2002 zum ersten Mal möglich war, mehr Information digital als analog zu speichern (der Beginn des „Digitalen Zeitalters“).[2].
Inhaltsverzeichnis
Digitale Grundformen
Es werden drei verschiedene Grundformen unterschieden.
Universalcode
Hierbei existiert eine stark begrenzte Anzahl von Zeichen (beispielsweise der ASCII), mit denen eine einfache Struktur von Informationen (beispielsweise Sätze) transportiert werden kann. Eine typische Anwendung ist die digitalisierte Übertragung von Text. Dabei wird nicht das Aussehen der Buchstaben, sondern nur der Buchstabe selbst übertragen. Das Aussehen wird erst im Endgerät (Monitor, Drucker, …) erzeugt. Die Übertragung eines Universalcodes ist unkompliziert und genügsam.
Matrixcode
Dieser wird für den Transport komplexer Informationen (beispielsweise eines Fotos) benutzt. Innerhalb eines festgelegten Raumes (häufig einer Fläche) wird ein gleichmäßiges Raster (=die Matrix) gebildet. Der gesamte Raum (Fläche) ist dabei in gleichgroße Elemente (beispielsweise Pixel) aufgeteilt. Für jedes Element ist eine gewisse Anzahl an Informationsvolumen (beispielsweise Bits und Bytes) freigehalten. Dieses Freihalten erfolgt auch, wenn innerhalb des festgelegten Raumes (Fläche) an dieser Stelle keine Information enthalten ist (beispielsweise das Bild an einer Stelle leer ist).
Die Übertragung eines Matrixcodes ist technisch aufwendig und speicherintensiv.
Vektorcode
Ein Vektorcode beschreibt Aussehen und Koordinaten einer Kurve innerhalb eines Raumes (oder einer Fläche). Ein typischer Anwendungsfall ist das Aussehen von Buchstaben. Der Vektorcode beschreibt dabei die Krümmung, Länge und Intensität der Linien, die das Aussehen eines Buchstabens bestimmen. Die Übertragung eines Vektorcodes ist sparsam, aber technisch aufwendig.
Prinzip der Digitalisierung
- 1. Universalcode
- Bei der Nutzung des Universalcodes steht der Wunsch im Vordergrund, den Informationsgehalt einer Sache auf den wesentlichen Kern zu reduzieren.
-
- Bei einem Text ist der wesentliche Kern des Informationsgehaltes die Aneinanderreihung von Buchstaben. Farbe, Form, Größe und andere Gestaltungselemente werden hierbei nicht berücksichtigt.
- Eine geeignete Software vergleicht hierzu bekannte Muster mit der Vorlage. Wird ein Muster erkannt, erhält es einen Universalcode. Danach sucht die Software nach dem nächsten Muster.
-
- Jeder Buchstabe kann auf verschiedene Arten geschrieben werden. Im Speicher der Software sind typische Arten gespeichert, die auf Formähnlichkeit mit der Vorlage verglichen werden. Bei hoher Übereinstimmung ersetzt die Software diesen Buchstaben durch den zugehörigen ASCII-Code.
- Voraussetzung für die Arbeit der Schrifterkennungssoftware ist, dass die Textvorlage als Pixelbild vorliegt.
- 2. Matrixcode
- Es gibt kein technisches System, das den kompletten Umfang aller Farb- und Helligkeitswerte der Natur fixieren kann. Daher wird diese (natürliche) Informationsmenge stark reduziert. Bedingt durch die technischen Voraussetzungen werden die Feinheit der Matrix und die Differenzierungsstufen innerhalb jedes Einzel-Elementes festgelegt.
-
- Am Beispiel eines Fotos erkennt man, dass nicht nur die Pixelmenge (Feinheit der Auflösung), sondern auch die Farbtiefe (im Regelfall 256 Abstufungen pro Farbkanal) festgelegt wird.
- Obwohl jedes Element eines Matrix]codes eine hohe Informationsdichte enthält, ist das einzelne Element in der Regel ohne Nutzen. Nur durch den Zusammenhang mit den anderen Elementen der Matrix entsteht die gewünschte Information.
- 3. Vektorcode
- Eine geeignete Software sucht nach Kanten und Linien. Anschließend werden diese von der Software idealisiert. Dabei entstehen einfache mathematische Beschreibungen dieser idealisierten Kurven.
- Durch die Idealisierungen einfacher grafischer Elemente können zahlreiche Manipulationen durchgeführt werden.
Endprodukt
Das Endprodukt einer Digitalisierung besteht aus einer oder mehreren Dateien.
-
- Beispiel A): 1 Foto wird für den Druck digitalisiert
-
- Es entsteht 1 Datei mit den gewünschten Pixeln.
-
- Beispiel B): 1 Seite mit Text und Fotos wird digitalisiert und als PDF-Datei gespeichert.
-
- Die entstandene PDF-Datei besteht aus mehreren Einzelelementen: Pixeldaten und Vektordaten.
- Durch das PDF-Format werden die Einzelelemente auf speichersparende Art in einer Datei untergebracht.
- Die Einzelelemente stellen vollwertige Digitalisierungen (einzelner Teile) dar. Aber erst die Verbindung der Einzelelemente im Endprodukt erzeugt eine nutzbare Datei, denn diese nutzbare Datei verknüpft die Einzelelemente in der ursprünglichen Anordnung (Layout).
-
- Beispiel A): 1 Foto wird für den Druck digitalisiert
Unabhängig von der Menge der entstandenen Einzelelemente wird das Endprodukt der Digitalisierung mitunter auch als Digitalisat bezeichnet (in Anlehnung an Begriffsbildungen wie Kondensat oder Korrelat).
Technische Umsetzung
Es existieren verschiedene technische Geräte, die kontinuierliche Größen in diskrete Zahlenwerte umsetzen. Physikalische Größen werden von Messgeräten zunächst als elektrische Spannung ausgegeben (Druck, Temperatur, Lichtstärke) und dann von einem Analog-zu-digital-Konverter (ADC) zu Zahlenwerten digitalisiert. Darunter fallen:
- die Erfassung und Umsetzung von Bildern, Fotos, Dias usw. in digitale Bilddateien (Hilfsmittel: Scanner oder Digitalkameras bzw. Scanbacks).
- die Erfassung und Umsetzung der Abmessungen dreidimensionaler Gegenstände in digitale Dateien (Hilfsmittel: 3D-Scanner).
- die Erfassung und Umsetzung von Schrift in digitale Textdateien (Hilfsmittel: Scanner und OCR-Software)
- ganz allgemein die Umsetzung eines kontinuierlichen analogen Signals wie z. B. der elektrischen Spannung, der Helligkeit, des Schalls (Sprache, Musik) oder des Druckes (z. B. Blutdruck) in eine Folge digitaler Werte
- der Übergang von Analog- zur Digitaltechnik, speziell der rückläufige Einsatz analoger Elektronik zugunsten digitaler Elektronik in vielen Bereichen der Technik und des alltäglichen Lebens.
In der Regel wird das Ergebnis der Digitalisierung in binär codierter Form gespeichert, übertragen und verarbeitet.
Gründe für die Digitalisierung
Das Vorliegen von Informationen und Daten in digitaler Form besitzt verschiedene Vorteile:
- Digitale Daten erlauben die Nutzung, Bearbeitung, Verteilung, Erschließung und Wiedergabe in elektronischen Datenverarbeitungssystemen.
- Digitale Daten können maschinell und damit schneller verarbeitet werden.
- Sie können (auch wortweise) durchsucht werden.
- Der Platzbedarf ist heute deutlich geringer.
- Auch bei langen Transportwegen und nach vielfacher Bearbeitung sind Fehler und Verfälschungen (z. B. Rauschüberlagerungen) im Vergleich zur analogen Verarbeitung gering oder können ganz ausgeschlossen werden.
Ein weiterer Grund für die Digitalisierung analoger Inhalte ist die Langzeitarchivierung. Geht man davon aus, dass es keinen ewig haltbaren Datenträger gibt, ist ständige Migration ein Faktum. Fakt ist auch, dass analoge Inhalte mit jedem Kopiervorgang an Qualität verlieren. Digitale Inhalte bestehen hingegen aus diskreten Werten, die entweder lesbar und damit dem digitalen Original gleichwertig sind, oder nicht mehr lesbar sind, was durch redundante Abspeicherung der Inhalte beziehungsweise Fehlerkorrekturalgorithmen verhindert wird.
Schließlich wäre noch die Digitalisierung analoger Originale zur Erstellung von Benützungskopien zu erwähnen, um die Originale zu schonen. Denn viele Datenträger, darunter auch LPs, verlieren allein durch die Wiedergabe an Qualität.
Es sei angemerkt, dass der Schritt der Digitalisierung theoretisch immer mit Qualitätsverlust verbunden ist, weil die Auflösung 'endlich' bleibt. Ein Digitalisat kann jedoch in vielen Fällen so genau sein, dass es für einen Großteil der möglichen (auch zukünftigen) Anwendungsfälle ausreicht. Wenn diese Qualität durch das Digitalisat erreicht wird, spricht man von Preservation Digitisation, also der Digitalisierung zur Erhaltung (= Ersetzungskopie). Der Begriff verkennt jedoch, dass nicht alle zukünftigen Anwendungsfälle bekannt sein können. Beispielsweise ermöglicht eine hochauflösende Fotografie zwar das Lesen des Texts einer Pergamenthandschrift, kann aber z. B. nicht für physikalische oder chemische Verfahren zur Altersbestimmung der Handschrift verwendet werden.
Historische Entwicklung
Die Digitalisierung hat eine lange Entwicklung hinter sich. Bereits vor langer Zeit wurden Universalcodes verwendet. Historisch frühe Beispiele dafür sind die Brailleschrift (1829) und das Morsen (ab 1837). Das Grundprinzip, festgelegte Codes zur Informationsübermittlung zu benutzen, funktionierte auch bei technisch ungünstigen Bedingungen per Licht- und Tonsignal (Funktechnik, Telefon, Telegrafie). Später folgten Fernschreiber (u. a. unter Verwendung des Baudot-Codes), Telefax und E-Mail. Die heutigen Computer verarbeiten Informationen ausschließlich in digitaler Form.
Bereiche der Digitalisierung
Siehe auch: Retrodigitalisierung
Allgemein wird der Prozess der Digitalisierung von einem Analog-Digital-Umsetzer durchgeführt, welcher die analogen Eingangssignale in festgesetzten Intervallen, seien dies nun Zeitintervalle bei linearen Aufzeichnungen oder der Abstand der Foto-Zellen beim Scannen, misst (siehe auch Abtastrate) und diese Werte mit einer bestimmten Genauigkeit (siehe Quantisierung) digital codiert (siehe auch CoDec).
Die fortschreitende Digitalisierung dringt mehr und mehr in die klassischen Bereiche der Kommunikation ein. Groß in Mode sind Internet, Mobiltelefon und Digitalfernsehen. In der Geschäftswelt sind bereits 75 % der Büroarbeitsplätze mit Computern statt der elektrischen Schreibmaschinen ausgestattet.
Je nach Art des analogen Ausgangsmaterials und des Zwecks der Digitalisierung werden verschiedenste Verfahren eingesetzt.
Digitalisierung von Text
Geht man bei der Digitalisierung von Texten davon aus, dass lediglich der sprachliche Inhalt der Dokumente von Interesse ist, so wird der Text zuerst gescannt und anschließend die Zeichen von Schrifterkennungsprogrammen (siehe Texterkennung) in ein Schriftcodierungssystem kompiliert.
Eine mögliche Form der Repräsentation von Text ist z. B. der sehr verbreitete ASCII, bei dem jeder lateinische Buchstabe durch eine Folge von sieben Bits dargestellt wird. Z. B. wird für den Großbuchstaben »A« die Folge 1000001 geschrieben. Die Codierung in Unicode ermöglicht einen reichhaltigeren Zeichensatz.
Soll das Digitalisat das ursprüngliche Aussehen des Dokumentes möglichst genau wiedergeben, so wird das Textdokument wie ein Bild digitalisiert.
Digitalisierung von Bildern
Um ein Bild zu digitalisieren, wird das Bild gescannt, das heißt in Zeilen und Spalten (Matrix) zerlegt, für jeden der dadurch entstehenden Bildpunkte der Farbwert ausgelesen und mit einer bestimmten Quantisierung gespeichert. Zur finalen Speicherung des Digitalisates können gegebenenfalls Komprimierungs-Formate eingesetzt werden.
Bei einer Schwarz-Weiß-Rastergrafik ohne Grautöne nimmt dann der Wert für ein Pixel die Werte 0 für Schwarz und 1 für Weiß an. Die Matrix wird zeilenweise ausgelesen, wodurch man eine Folge aus den Ziffern 0 und 1 erhält, welche das Bild repräsentiert. In diesem Fall wird also eine Quantisierung von einem Bit verwendet.
Um ein Farb- oder Graustufenbild digital zu repräsentieren, wird eine höhere Quantisierung benötigt. Bei Digitalisaten im RGB-Farbraum wird jeder Farbwert eines Pixels in die Werte Rot, Grün und Blau zerlegt, und diese werden einzeln mit derselben Quantisierung gespeichert (max. ein Byte/Farbwert = 24 Bit/Pixel). Beispiel: Ein Pixel in reinem Rot entspräche R=255, G=0, B=0.
Im YUV-Farbmodell können die Farbwerte eines Pixels mit unterschiedlicher Quantisierung gespeichert werden, da hierbei die Lichtstärke, welche vom menschlichen Auge genauer registriert wird, von der Chrominanz (=Farbigkeit), die das menschliche Auge weniger genau registriert, getrennt sind. Dies ermöglicht ein geringeres Speichervolumen bei annähernd gleicher Qualität für den menschlichen Betrachter.
Siehe auch Farbmodelle: RGB, CMYK und YUV.
Digitalisierung von Druckfilmen
In Großformatscanner werden die einzelnen Farbauszüge der Druckfilme eingescannt, zusammengefügt und „entrastert“, damit die Daten wieder digital für eine CtP-Belichtung vorhanden sind.
Digitalisierung von Audio
Oft als „Sampling“ bezeichnet. Zuvor in analoge elektronische Schwingungen verwandelte Schallwellen (etwa aus einem Mikrofon) werden stichprobenartig schnell hintereinander als digitale Werte gemessen und gespeichert. Diese Werte können umgekehrt auch wieder schnell hintereinander abgespielt und zu einer analogen Schallwelle „zusammengesetzt“ werden, die dann wieder hörbar gemacht werden kann. Aus den gemessenen Werten würde sich eigentlich bei der Rückumwandlung eine eckige Wellenform ergeben; umso eckiger, je gröber die Sampling-Frequenz. Dies kann aber durch mathematische Verfahren ausgeglichen werden (Interpolation). Die Bittiefe bezeichnet beim Sampling den „Raum“ für Werte in Bits, die u. a. für die Auflösung des Dynamikumfangs notwendig sind. Ab einer Samplingfrequenz von 44,1 kHz und einer Auflösung von 16 Bit spricht man von CD-Qualität.
Aufgrund der großen anfallenden Datenmengen kommen verlustfreie und verlustbehaftete Kompressionsverfahren zum Einsatz. Diese erlauben, Audiodaten platzsparender auf Datenträgern zu speichern (s. flac, Mp3).
Gängige Dateiformate für Audio sind: „wav“, „aiff“, „flac“, „mp3“, „aac“, „snd“ oder „ogg Vorbis“.
Gängige Umsetzverfahren siehe Analog-Digital-Umsetzer.
Digitalisierung in der Messtechnik
Siehe hierzu Digitale Messtechnik.
Digitalisierung von archäologischen Objekten
Hierbei dreht es sich meist um die digitale Erfassung archäologischer Objekte in Schrift und Bild. D. h. alle verfügbaren Informationen (Klassifizierung, Datierung, Maße, Eigenschaften, etc.) zu einem archäologischen Objekt (z. B. ein Gefäß, Steinwerkzeug, Schwert, etc.) werden digital erfasst, durch elektronische Abbildungen und Zeichnungen ergänzt und in einer Datenbank gespeichert. Anschließend können die Objekte in Form eines Daten-Imports in ein Objekt-Portal wie z.B. museum-digital integriert werden, wo die Objekte für jeden frei recherchierbar sind. Hintergrund der Digitalisierung von archäologischen Objekten ist meist die Erfassung größerer Bestände wie archäologische Sammlungen an Museen oder der für die Bodendenkmalpflege zuständigen Ämter, um sie der Öffentlichkeit zu präsentieren. Da im musealen Alltag nie alle Objekte einer Sammlung in Form von Ausstellungen oder Publikationen gezeigt werden können, stellt die Digitalisierung eine Möglichkeit dar, die Objekte dennoch der breiten Öffentlichkeit und auch der wissenschaftlichen Welt zu präsentieren. Außerdem wird so eine elektronische Bestandssicherung vorgenommen, ein in Hinblick auf den Einsturz des historischen Archives der Stadt Köln nicht unwesentlicher Aspekt.
Soziale und ökonomische Folgen von Digitalisierung
Die grundlegenden Vorteile der Digitalisierung liegen in der Schnelligkeit und Universalität der Informationsverbreitung. Bedingt durch kostengünstige Hard- und Software zur Digitalisierung und der immer stärkeren Vernetzung über das Internet entstehen in hohem Tempo neue Möglichkeiten, aber auch Gefahren. Exemplarisch dafür ist der:
Kopierschutz
Die Eigenschaft vereinfachter Reproduktion hat zu verschiedenen Konflikten zwischen Erstellern und Nutzern digitaler Inhalte geführt. Industrie und Verwertungsgesellschaften reagieren auf die veränderten Bedingungen mit Strategien künstlicher Verknappung, insbesondere mit urheberrechtlicher Absicherung von geistigem Eigentum und der technologischen Implementierung von Kopierschutz.
Kostenveränderung
Ein wesentliches Merkmal digitaler Inhalte ist eine Veränderung der Kostenstruktur. Eine Kostenreduktion betrifft oft die Kopierbarkeit und den Transport (z. B. über das Internet). So werden die Kosten für jede weitere digitale Kopie (Produktionsgrenzkosten) nach der Erstellung des Originalinhaltes oft als gering gesehen.
Nach der Etablierung großer Unternehmen werden die Kosten nach derzeitigem Stand durch erhöhte Aufwendungen im Bereich der urheberrechtlichen Absicherung von geistigem Eigentum und der technologischen Implementierung von Kopierschutz erhöht. Auch die erwartete hohe Sicherheit der Datenübertragung und große Zuverlässigkeit der Computeranlagen wirken sich kostensteigernd aus. Zudem werden oft hohe Investitionen in zukünftige Technologien getätigt, die dann oft keine Rentabilität zeigen.
Literatur
- Marianne Dörr: Planung und Durchführung von Digitalisierungsprojekten. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 103–112
- Peter Exner: Verfilmung und Digitalisierung von Archiv- und Bibliotheksgut. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 113–127
- Thomas Fricke und Gerald Maier: Automatische Texterkennung bei digitalisiertem Archiv- und Bibliotheksgut. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 201–221
- Gerald Maier und Peter Exner: Wirtschaftlichkeitsüberlegungen für die Digitalisierung von Archiv- und Bibliotheksgut. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 223–229
- Tamas Müller: Digitalisierung von Schrift und wissenschaftliche Kommunikation. Diplomarbeit Universität Wien, 2007
- Thomas Parschik: Durchführung von Digitalisierungsprojekten in Bibliotheken. In: Bibliotheksdienst. 40. Jahrgang, 2006, H. 12, S. 1421−1443 (PDF-Datei; 144 kB)
- Stefan Rohde-Enslin: Nicht von Dauer. Kleiner Ratgeber für die Bewahrung digitaler Daten in Museen. Berlin, 2004 (PDF-Datei; 1,06 MB)
- Stephan Humer: Zwei neue Fundamente der Identität: Digitalität und Imagination. In: Digitale Identitäten. Der Kern digitalen Handelns im Spannungsfeld von Imagination und Realität. Winnenden. 2008. S. 24-71.
- Guido Nockemann: The DAS Project – Digitization of an archaeological collection, 2011, e-paper for the 'Day Of Archaeology 2011' (englisch)
Weblinks
Wiktionary: Digitalisierung – Bedeutungserklärungen, Wortherkunft, Synonyme, ÜbersetzungenCommons: Digitization – Sammlung von Bildern, Videos und AudiodateienQuellen
- ↑ "The World’s Technological Capacity to Store, Communicate, and Compute Information", Martin Hilbert and Priscila López (2011), Science, 332(6025), 60-65; kostenfreien Zugriff auf den Artikel gibt es hier: martinhilbert.net/WorldInfoCapacity.html
- ↑ "Video Animation über The World’s Technological Capacity to Store, Communicate, and Compute Information from 1986 to 2010
Wikimedia Foundation.