- Digitalisieren
-
Der Begriff Digitalisierung bezeichnet die Überführung kontinuierlicher Größen in diskrete Werte.
Inhaltsverzeichnis
Digitale Grundformen
Es werden drei verschiedene Grundformen unterschieden.
Universalcode
Hierbei existiert eine stark begrenzte Anzahl von Zeichen (beispielsweise der ASCII-Code), mit denen eine einfache Struktur von Informationen (beispielsweise Sätze) transportiert werden kann. Ein typische Anwendung ist die digitalisierte Übertragung von Text. Dabei wird nicht das Aussehen der Buchstaben, sondern nur der Buchstabe selbst übertragen. Das Aussehen wird erst im Endgerät (Monitor, Drucker, …) erzeugt. Die Übertragung eines Universalcode ist unkompliziert und sparsam.
Matrixcode
Dieser wird für den Transport komplexer Informationen (beispielsweise eines Fotos) benutzt. Innerhalb eines festgelegten Raumes (häufig einer Fläche) wird ein gleichmäßiges Raster (=die Matrix) gebildet. Der gesamte Raum (Fläche) ist dabei in gleichgroße Elemente (beispielsweise Pixel) aufgeteilt. Für jedes Element ist eine gewisse Anzahl an Informationsvolumen (beispielsweise Bits und Bytes) freigehalten. Dieses Freihalten erfolgt auch, wenn innerhalb des festgelegten Raumes (Fläche) an dieser Stelle keine Information enthalten ist (beispielsweise das Bild an einer Stelle leer ist).
Die Übertragung eines Matrixcodes ist technisch aufwendig und Speicherintensiv.
Vektorcode
Ein Vektorcode beschreibt Aussehen und Koordinaten einer Kurve innerhalb eines Raumes (oder einer Fläche). Ein typischer Anwendungsfall ist das Aussehen von Buchstaben. Der Vektorcode beschreibt dabei die Krümmung, Länge und Intensität der Linie, die das Aussehen eines Buchstabens bestimmt. Die Übertragung eines Vektorcode ist sparsam, aber technisch aufwendig.
Prinzip der Digitalisierung
- 1. Universalcode
- Bei der Nutzung des Universalcodes steht der Wunsch im Vordergrund, den Informationsgehalt einer Sache auf den wesentlichen Kern zu reduzieren.
-
- Bei einem Text ist der wesentliche Kern des Informationsgehaltes die Aneinanderreihung von Buchstaben. Farbe, Form, Größe und andere Gestaltungselemente werden hierbei nicht berücksichtigt.
- Eine geeignete Software vergleicht hierzu bekannte Muster mit der Vorlage. Wird ein Muster erkannt, erhält es einen Universalcode. Danach sucht die Software nach dem nächsten Muster.
- Voraussetzung für die Arbeit der Schrifterkennungssoftware ist, dass die Textvorlage als Pixelbild vorliegt.
- Es gibt kein technisches System, das den kompletten Umfang aller Farb- und Helligkeitswerte der Natur fixieren kann. Daher wird diese (natürliche) Informationsmenge stark reduziert. Bedingt durch die technischen Voraussetzungen wird die Feinheit der Matrix und die Differenzierungsstufen innerhalb jedes Einzel-Elementes festgelegt.
-
- Am Beispiel eines Fotos erkennt man, dass nicht nur die Pixelmenge (Feinheit der Auflösung), sondern auch die Farbtiefe (im Regelfall 256 Abstufungen pro Farbkanal) festgelegt wird.
- Obwohl jedes Element eines Matrixcodes eine hohe Informationsdichte enthält, ist das einzelne Element in der Regel ohne Nutzen. Nur durch den Zusammenhang mit den anderen Elementen der Matrix entsteht die gewünschte Information.
- Eine geeignete Software sucht nach Kanten und Linien. Anschließend werden diese von der Software idealisiert. Dabei entstehen einfache mathematische Beschreibungen (von diesen idealisierten Kurven).
- Durch die Idealisierungen einfacher grafischer Elemente können zahlreiche Manipulationen durchgeführt werden.
Digitalisat
Das Endprodukt einer Digitalisierung besteht aus ein oder mehreren Dateien.
-
- Beispiel A): 1 Foto wird für den Druck digitalisiert
-
- Es entsteht 1 Datei mit den gewünschten Pixeln.
-
- Beispiel B): 1 Seite mit Text und Fotos wird digitalisiert und als PDF-Datei gespeichert.
-
- Die entstandene PDF-Datei besteht aus mehreren Einzelelementen: Pixeldaten und Vektordaten.
- Durch das PDF-Format werden die Einzelelemente auf speichersparende Art in einer Datei untergebracht.
- Die Einzelelemente stellen vollwertige Digitalisierungen (einzelner Teile) dar. Aber erst die Verbindung der Einzelelemente im Endprodukt erzeugt eine nutzbare Datei, denn diese nutzbare Datei verknüpft die Einzelelemente in der ursprünglichen Anordnung (Layout).
-
- Beispiel A): 1 Foto wird für den Druck digitalisiert
Unabhängig von der Menge der entstandenen Einzelelemente wird das Endprodukt der Digitalisierung Digitalisat genannt.
Technische Umsetzung
Es existieren verschiedene technische Geräte, die kontinuierliche Größen in diskrete Zahlenwerte umsetzen. Physikalische Größen werden von Messgeräten zunächst als elektrische Spannung ausgegeben (Druck, Temperatur, Lichtstärke) und dann von einem Analog-zu-digital-Konverter (ADC) zu Zahlenwerten digitalisiert. Darunter fallen:
- die Erfassung und Umsetzung von Bildern, Fotos, Dias usw. in digitale Bilddateien (Hilfsmittel: Scanner oder Digitalkameras bzw. Scanbacks).
- die Erfassung und Umsetzung der Abmessungen dreidimensionaler Gegenstände in digitale Dateien (Hilfsmittel: 3D-Scanner).
- die Erfassung und Umsetzung von Schrift in digitale Textdateien (Hilfsmittel: Scanner und OCR-Software)
- ganz allgemein die Umsetzung eines kontinuierlichen analogen Signals wie z. B. der elektrischen Spannung, der Helligkeit, des Schalls (Sprache, Musik) oder des Druckes (z. B. Blutdruck) in eine Folge digitaler Werte
- den Übergang von Analog- zur Digital-Technik, speziell der rückläufige Einsatz analoger Elektronik zugunsten digitaler Elektronik in vielen Bereichen der Technik und des alltäglichen Lebens.
In der Regel wird das Ergebnis der Digitalisierung in binär codierter Form gespeichert, übertragen und verarbeitet.
Gründe für die Digitalisierung
Das Vorliegen von Informationen und Daten in digitaler Form besitzt verschiedene Vorteile:
- Digitale Daten erlauben die Nutzung, Bearbeitung, Verteilung, Erschließung und Wiedergabe in elektronischen Datenverarbeitungssystemen.
- Digitale Daten können maschinell und damit schneller verarbeitet werden.
- Der Platzbedarf ist heute deutlich geringer.
- Auch bei langen Transportwegen und nach vielfacher Bearbeitung sind Fehler und Verfälschungen (z. B. Rauschüberlagerungen) im Vergleich zur analogen Verarbeitung gering oder können ganz ausgeschlossen werden.
Ein weiterer Grund für die Digitalisierung analoger Inhalte ist die Langzeitarchivierung. Geht man davon aus, dass es keinen ewig haltbaren Datenträger gibt, ist ständige Migration ein Faktum. Fakt ist auch, dass analoge Inhalte mit jedem Kopiervorgang an Qualität verlieren. Digitale Inhalte bestehen hingegen aus diskreten Werten, die entweder lesbar und damit dem digitalen Original gleichwertig sind, oder nicht mehr lesbar sind, was durch redundante Abspeicherung der Inhalte beziehungsweise Fehlerkorrekturalgorithmen verhindert werden soll. Das bedeutet, dass man beim Kopieren von digitalen Datenträgern im Normalfall nicht nur eine dem Original gleichwertige Kopie erhält, sondern die Fehlerkorrektur-Daten neu erstellt werden und damit die digitale Kopie von digitalen Inhalten sogar besser ist als das digitale Original.
Schließlich wäre noch die Digitalisierung analoger Originale zur Erstellung von Benützungskopien zu erwähnen, um die Originale zu schonen. Denn viele Datenträger, darunter auch LPs, verlieren allein durch die Wiedergabe an Qualität.
Es sei an dieser Stelle angemerkt, dass Digitalisierung analoger Dokumente immer mit Qualitätsverlust verbunden ist, zumal die digitale Kopie aus messtechnischen Gründen wie auch aus Gründen der Speicherplatzökonomie nicht beliebig genau sein kann. Ein Digitalisat kann jedoch in vielen Fällen so genau sein, dass es für einen Großteil der möglichen (auch zukünftigen) Anwendungsfälle ausreicht. Wenn diese Qualität durch das Digitalisat erreicht wird, spricht man von Preservation Digitisation, also der Digitalisierung zur Erhaltung (= Ersetzungskopie). Der Begriff verkennt jedoch, dass nicht alle zukünftigen Anwendungsfälle bekannt sein können. Beispielsweise ermöglicht eine hochauflösende Fotografie zwar das Lesen des Texts einer Pergamenthandschrift, kann aber z. B. nicht für physikalische oder chemische Verfahren zur Altersbestimmung der Handschrift verwendet werden.
Historische Entwicklung
Die Digitalisierung hat eine lange Entwicklung hinter sich. Bereits vor langer Zeit wurden Universalcodes verwendet. Historisch frühe Beispiele dafür sind die Brailleschrift (1829) und das Morsen (ab 1837). Das Grundprinzip, festgelegte Codes zur Informationsübermittlung zu benutzen, funktionierte auch bei technisch ungünstigen Bedingungen per Lichtsignal und Tonsignal (Funktechnik, Telefon, Telegraphie). Später folgten Fernschreiber (u. a. unter Verwendung des Baudot-Codes), Telefax, E-Mail. Die heutigen Computer verarbeiten Informationen ausschließlich in digitaler Form.
Bereiche der Digitalisierung
Allgemein wird der Prozess der Digitalisierung von einem Analog-Digital-Umsetzer durchgeführt, welcher die analogen Eingangssignale in festgesetzten Intervallen, seien dies nun Zeitintervalle bei linearen Aufzeichnungen oder der Abstand der Foto-Zellen beim Scannen, misst (siehe auch Abtastrate) und diese Werte mit einer bestimmten Genauigkeit (siehe Quantisierung) digital codiert (siehe auch CoDec).
Die fortschreitende Digitalisierung dringt mehr und mehr in die klassischen Bereiche der Kommunikation ein. Groß in Mode sind Internet, Mobiltelefon, Digitalfernsehen. In der Geschäftswelt sind bereits 75% der Büroarbeitsplätze statt den elektrischen Schreibmaschinen mit Computern ausgestattet.
Je nach Art des analogen Ausgangsmaterials und des Zweckes der Digitalisierung werden verschiedenste Verfahren eingesetzt.
Digitalisierung von Text
Geht man bei der Digitalisierung von Texten davon aus, dass lediglich der sprachliche Inhalt der Dokumente von Interesse ist, so wird der Text zuerst gescannt und anschließend die Zeichen von Schrifterkennungsprogrammen (siehe Texterkennung) in ein Schriftcodierungssystem kompiliert.
Eine mögliche Form der Repräsentation von Text ist z. B. der sehr verbreitete ASCII-Code, bei dem jeder lateinische Buchstabe durch eine Folge von sieben bits dargestellt wird. Z. B. wird für den Großbuchstaben »A« die Folge 1000001 geschrieben. Die Codierung in Unicode ermöglicht einen reicheren Zeichenschatz.
Soll das Digitalisat das ursprüngliche Aussehen des Dokumentes möglichst genau wiedergeben, so wird das Textdokument wie ein Bild digitalisiert.
Digitalisierung von Bildern
Um ein Bild zu digitalisieren, wird das Bild gescannt, das heißt in Zeilen und Spalten (Matrix) zerlegt, für jeden der dadurch entstehenden Bildpunkte der Farbwert ausgelesen und mit einer bestimmten Quantisierung gespeichert. Zur finalen Speicherung des Digitalisates können gegebenenfalls Komprimierungs-Formate eingesetzt werden.
Bei einer Schwarz-Weiß-Rastergrafik ohne Grautöne nimmt dann der Wert für ein Pixel die Werte 0 für schwarz und 1 für weiß, an. Die Matrix wird zeilenweise ausgelesen, wodurch man eine Zahlenfolge aus den Zahlen 0 und 1 erhält, welche das Bild repräsentiert. In diesem Fall wird also eine Quantisierung von einem Bit verwendet.
Um ein Farb- oder Graustufenbild digital zu repräsentieren wird eine höhere Quantisierung benötigt. Bei Digitalisaten im RGB-Farbraum wird jeder Farbwert eines Pixels in die Werte Rot, Grün und Blau zerlegt und diese wiederum einzeln mit derselben Quantisierung gespeichert (max. ein Byte/Farbwert = 24 Bit/Pixel). Beispiel: Ein Pixel in Reinem Rot entspräche R=255, G=0, B=0.
Im YUV-Farbmodell können die Farbwerte eines Pixels mit unterschiedlicher Quantisierung gespeichert werden, da hierbei die Lichtstärke, welche vom menschlichen Auge genauer registriert wird, von der Chrominanz (=Farblichkeit), die das menschliche Auge weniger genau registriert, getrennt sind. Dies ermöglicht ein geringeres Speichervolumen bei annähernd gleicher Qualität für den menschlichen Betrachter.
Siehe auch Farbmodelle: RGB, CMYK und YUV.
Digitalisierung von Druckfilmen
In Großformatscanner werden die einzelnen Farbauszüge der Druckfilme eingescannt, zusammengefügt und „entrastert“, damit die Daten wieder digital für eine CtP-Belichtung vorhanden sind.
Digitalisierung von Audio
Oft als „Sampling“ bezeichnet. Zuvor in analoge elektronische Schwingungen verwandelte Schallwellen (etwa aus einem Mikrofon) werden stichprobenartig schnell hintereinander als digitale Werte gemessen und gespeichert. Diese Werte können umgekehrt auch wieder schnell hintereinander abgespielt werden, und zu einer analogen Schallwelle „zusammengesetzt“ werden, die dann wieder hörbar gemacht werden kann. Aus den gemessenen Werten würde sich eigentlich bei der Rückumwandlung eine eckige Wellenform ergeben, umso eckiger, je grober die Sampling-Frequenz. Dies kann aber durch mathematische Verfahren ausgeglichen werden (Interpolation). Die Bittiefe bezeichnet beim Sampling den „Raum“ für Werte in Bits, die u. a. für die Auflösung des Dynamikumfangs notwendig sind. Ab einer Samplingfrequenz von 44,1 KHz und einer Bittiefe von 16 Bit spricht man von CD-Qualität.
Aufgrund der anfallenden hohen Datenmengen kommen verlustfreie und verlustbehaftete Kompressionsverfahren zum Einsatz. Diese erlauben Audiodaten platzsparender auf Datenträger zu speichern (s. flac, Mp3).Gängige Dateiformate für Audio sind: „wav“, „aiff“, „flac“, „mp3“ oder „snd“.
Soziale und ökonomische Folgen von Digitalisierung
Die grundlegenden Vorteile der Digitalisierung liegen in der Schnelligkeit und Universalität der Informationsverbreitung. Bedingt durch kostengünstige Hard- und Software zur Digitalisierung und der immer stärken Vernetzung über das Internet entstehen in hohem Tempo neue Möglichkeiten, aber auch Gefahren. Exemplarisch dafür ist der:
Kopierschutz
Die Eigenschaft vereinfachter Reproduktion hat zu verschiedenen Konflikten zwischen Erstellern und Nutzern digitaler Inhalte geführt. Industrie und Verwertungsgesellschaften reagieren auf die veränderten Bedingungen mit Strategien künstlicher Verknappung, insbesondere mit urheberrechtlicher Absicherung von geistigem Eigentum und der technologischen Implementierung von Kopierschutz.
Kostenveränderung
Ein wesentliches Merkmal digitaler Inhalte ist eine Veränderung der Kostenstruktur. Eine Kostenreduktion betrifft oft die Kopierbarkeit und den Transport (z. B. über das Internet). So werden die Kosten für jede weitere digitale Kopie (Produktionsgrenzkosten) nach der Erstellung des Originalinhaltes oft als gering gesehen.
Nach der Etablierung großer Unternehmen werden die Kosten nach derzeitigem Stand durch erhöhte Aufwendungen im Bereich der urheberrechtlichen Absicherung von geistigem Eigentum und der technologischen Implementierung von Kopierschutz erhöht. Auch die erwartete hohe Sicherheit der Datenübertragung und hohe, jederzeitige Zuverlässigkeit der Computeranlagen wirken sich kostensteigernd aus. Zudem werden oft hohe Investitionen in zukünftige Technologien getätigt, die dann oft keine Rentabilität zeigen.
Siehe auch
- Medientheorie, Digitales Fernsehen, Digitale Medien, Retrodigitalisierung, Langzeitarchivierung, Media Asset Management, Elektronische Publikation, Dokumentenmanagement, Workflow, Elektronische Archivierung, Enterprise Content Management
Literatur
- Marianne Dörr: Planung und Durchführung von Digitalisierungsprojekten. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 103–112
- Peter Exner: Verfilmung und Digitalisierung von Archiv- und Bibliotheksgut. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 113–127
- Thomas Fricke und Gerald Maier: Automatische Texterkennung bei digitalisiertem Archiv- und Bibliotheksgut. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, S. 201–221
- Gerald Maier und Peter Exner: Wirtschaftlichkeitsüberlegungen für die Digitalisierung von Archiv- und Bibliotheksgut. In: Hartmut Weber und Gerald Maier [Hrsg.]: Digitale Archive und Bibliotheken. Neue Nutzungsmöglichkeiten und Nutzungsqualitäten. Stuttgart. 2000, 223–229
- Tamas Müller: Digitalisierung von Schrift und wissenschaftliche Kommunikation. Diplomarbeit Universität Wien, 2007
- Thomas Parschik: Durchführung von Digitalisierungsprojekten in Bibliotheken. In: Bibliotheksdienst. 40. Jahrgang, 2006, H. 12, S. 1421−1443
- Stefan Rohde-Enslin: Nicht von Dauer. Kleiner Ratgeber für die Bewahrung digitaler Daten in Museen. Berlin, 2004
- Stephan Humer: Zwei neue Fundamente der Identität: Digitalität und Imagination. In: Digitale Identitäten. Der Kern digitalen Handelns im Spannungsfeld von Imagination und Realität. Winnenden. 2008. S. 24-71.
Weblinks
Wikimedia Foundation.