- Graphem
-
Grapheme (auch: Grafeme, von griechisch γραφή graphē ‚Schrift‘ und Suffix -em) sind die kleinsten bedeutungsunterscheidenden graphischen Einheiten des Schriftsystems einer bestimmten Sprache. Sie sind der sprachwissenschaftliche Untersuchungsgegenstand der Graphem(at)ik.
Inhaltsverzeichnis
Schreibweise (Notation)
Grapheme aus dem Skript der Metasprache, d.h. lateinische sowie bei manchen Autoren auch griechische und kyrillische Buchstaben, werden in der Linguistik üblicherweise in spitze Klammern gefasst: 〈a〉, behelfsweise auch ‹a› oder <a>. Dies gilt auch für Graphemketten, also Buchstabenfolgen, die normalerweise orthographische Wörter bilden: 〈abc〉.
Grapheme aus Objektsprachen mit anderem phonographischen Skript werden meistens nicht gesondert gekennzeichnet, stattdessen wird ihre Transliteration eingeklammert und ggf. ihr Name angegeben: ψ 〈ps〉 Psi, か 〈ka〉.
Die Bedeutung funktioneller und (teil-)logographischer Grapheme wird üblicherweise in Kapitälchen angegeben und folgt ansonsten den Konventionen für Lexeme: Γ Majuskel, 〈&〉 und Ampersand, 山 〈shān / san / yama / …〉 Berg, 沐 〈mù〉 Wasser ‚sich die Haare waschen‘.
Begriffsbestimmung
Der Begriff Graphem für die graphische Ebene der Schrift folgt dem Bildungsmuster von Phonem und Morphem. Diese drei emischen Begriffe tauchen erstmals Anfang des 20. Jahrhunderts bei Baudouin de Courtenay auf. Der Graphembegriff wurde aber um 1932 von Penttilä vermutlich unabhängig davon nochmals neu geprägt[1] und setzte sich erst anschließend international durch. Allerdings herrscht bis heute nicht in jedem Fall vollständige Einigkeit darüber, was ein Graphem ist und was nicht.
Auf Grundlage dieser Begriffe entstanden die entsprechenden Bezeichnungen für etische Grundeinheiten, d.h. Phon, Morph und Graph, sowie für Fachdisziplinen, z.B. Phonem(at)ik (Phonologie), Morphem(at)ik (Morphologie) und Graphem(at)ik oder entsprechend Phonetik und Graphetik.
Unter Vertretern der Dependenztheorie, nach der die Schrift ein nachgeordnetes und nicht nebengeordnetes Zeichensystem zur Rede ist, gelten Grapheme häufig als unidirektional abhängige visuelle Abbilder von Phonemen. Im allgemeinen Sprachgebrauch werden Grapheme häufig nicht oder nicht deutlich von den sprachunabhängigen Schriftzeichen und den nur in segmentalen Schriftsystemen vorkommenden Buchstaben unterschieden. Selbst unter Schriftlinguisten ist die Terminologie uneinheitlich und bisweilen eurozentrisch. Die Abgrenzung zu den graphetischen Einheiten Graph und Glyphe ist teilweise schwierig und umstritten, für viele Anwendungsfälle außerdem irrelevant.
Lautsprache: Analogbildung zu Phonem
Das Graphem wurde analog zum Phonem geschaffen. Beide sind die kleinsten bedeutungsunterscheidenden Einheiten ihres Mediums. Als lautliche (phonische) Einheit ist das Phonem der Untersuchungsgegenstand der Phonologie.
Vielfach wird mit Bezug auf Aristoteles[2], Saussure[3] oder Bloomfield[4] die Schriftsprache nicht nur als phylogenetisch und ontogenetisch sekundär aufgefasst, sondern als einseitig abhängiges graphisches System. Vertreter dieser Dependenztheorie sehen das Graphem entsprechend als Abbild des Phonems.[5] Für Anhänger der konkurrierenden Autonomiehypothese – wie die Prager Schule – oder der vermittelnden Interdependenz- bzw. Korrespondenztheorie[6] sind die Begriffe hingegen parallel angelegt und gleichberechtigt.
Dies drückt sich bspw. auch in der Terminologie der Glossematik nach Hjelmslev aus, worin die kleinsten ausdrucksseitigen Einheiten Keneme genannt werden und sowohl Phoneme als auch Grapheme sein können; zusammen mit den inhaltsseitigen Pleremen bilden sie die kleinsten sprachlichen Zeichen, genannt Glosseme. Um es beiden Lagern recht zu machen, schlug McLaughlin[7] für phonemabhängige graphische Einheiten den Terminus Graphonem (neben Graphem) vor, während später Heller[8] stattdessen die Grapheme aufteilt in phonematisch bestimmte Phonographeme und graphematisch bestimmte Graphographeme, welche verallgemeinerte Klassen von konkreten Schriftzeichen seien.
Als semantisch distinktive Einheiten sollten sowohl Phoneme als auch Grapheme per Minimalpaaranalyse gefunden werden. Da das Lautmedium kontinuierlich, das Schriftmedium hingegen (annähernd) diskret ist, werden Phoneme beim paarweisen Vergleich phonematischer Wörter als Bestandteile der größeren Einheit Silbe gefunden, Grapheme hingegen als Kompositionen der kleineren Einheit Schriftzeichen (character). Dies liegt daran, dass graphematische Wörter in vielen Schriftsystemen einerseits bereits klare Außengrenzen aufweisen und andererseits auch intern schon segmental strukturiert sind. In beiden Realisationen von Sprache tritt dabei als Sonderfall die Identität auf, indem ein Phonem einer (vokalischen) Silbe bzw. indem ein Graphem einem Buchstaben entspricht.
Rekursivität: Abgrenzung von Buchstaben
Das Graphem sollte (gemeinsam mit dem Phonem) den vor der Linguistischen Wende verwendeten Begriff des Buchstabens (in anderen Sprachen letter, littera u.ä.) ersetzen, da dieser sowohl für schriftliche als auch für lautliche Sprachzeichen verwendet wurde. Seitdem seine phonische Bedeutung weitgehend verschwunden ist, verwenden einige Linguisten Buchstabe synonym zu oder anstelle von Graphem, zumindest solange sie sich mit segmentalen, d.h. alphabetischen Schriftsystemen beschäftigen.[9]
Neef[10] argumentiert, dass die Graphematik einer Alphabetschrift allein mit der Einheit Buchstabe auskommen können müsse, da die Einheit Graphem sowohl durch Einzelbuchstaben, bspw. 〈s〉, als auch durch Buchstabengruppen, 〈sch〉, realisiert werden kann, und sich bspw. die Anfangsgroßsschreibung auf Buchstaben, 〈Schnee〉, statt auf Grapheme, *〈SCHnee〉, bezieht.
Ein Alphabet ist eine konventionalisierte Menge von Buchstaben. Es unterscheidet sich von einem beliebigen geschlossenen Zeichensatz vor allem dadurch, dass es die Sortierreihenfolge der Buchstaben festlegt. Die Elemente einiger Alphabete dienen daher auch als Zähl- oder Zahlzeichen, so hat sich bspw. in der griechischen Schrift das Qoppa 〈ϟ〉 nur als Ordinalzeichen für 90. erhalten. Grapheme haben derartige Eigenschaften nicht, dafür kann ein Graphem rekursiv andere, kleinere Grapheme enthalten.
Das Konzept der Buchstaben umschließt in manchen Skripten verschiedene Fälle, insbesondere die Unterscheidung in Minuskeln und Majuskeln, d.h. Klein- und Großbuchstaben; daher hat das englische Alphabet 26 und nicht 52 Buchstaben. Grapheme sind hingegen, obwohl sie graphische Einheiten sind, nicht notwendigerweise an einen Zeichenkörper gebunden und oft wird bei ihnen entweder überhaupt nicht zwischen Majuskel und Minuskel unterschieden oder diese Buchstabenvarianten werden genauso wie zwei voneinander unabhängige Graphe behandelt.
Sprachabhängigkeit: Anwendung von Schriftzeichen
Grapheme sind sprachabhängig, d.h. sie müssen für jede Schriftsprache bzw. für jedes Schriftsystem eigens bestimmt werden. Schriftzeichen (engl. character) als Konstituenten eines Skripts sind hingegen übersprachlich oder sogar unsprachlich definierbar. Es gibt Sonderfälle wie das serbokroatische Schriftsystem, in welchem jedes Grundgraphem je ein lateinisches und ein kyrillisches Schriftzeichen verwendet.
Im Sinne der Semantik sind Schriftzeichen trotz der anderes implizierenden Bezeichnung noch keine sprachlichen Zeichen, sondern erst Grapheme. Beide werden jedoch mittels Glyphen als Graphe realisiert.
Abstraktion: Konkretisierung als Graph
Grapheme sind kleinste sprachliche Einheiten, trotzdem lassen sie sich mitunter weiter unterteilen. Diese weitergehende Analyse ist per Definition nicht mehr Teil der (Schrift-)Linguistik, sondern Aufgabe einer ihrer (paralinguistischen) Hilfswissenschaften, der Graphetik. Deren Betrachtungsgegenstand ist jede „konkrete, klassifizierbare graphische Erscheinung“[11] und heißt Graph. Grapheme sind dann abstrakte Klassen von äquivalenten Graphen, die Allographe genannt werden.
Einige Graphetiker[12] haben die lateinischen und teilweise auch die griechischen Minuskeln dahingehend analysiert, wie ihre abstrakten Formbetandteile mit phonologischen Eigenschaften korrelieren; so haben bspw. die normalen Vokalbuchstaben 〈a, e, i, o, u〉 keine Ober- und Unterlängen. Da damit begründbar wäre, dass Grapheme kleinere Einheiten als Buchstaben sein können, wird die Definition mitunter um die Forderung ergänzt, dass Grapheme aus (in einem Frame) abgeschlossenen, ungebundenen, aber möglicherweise komplex zusammengesetzten Einheiten bestehen. Grapheme können also rekursiv sein, was sowohl bei Buchstabenverbindungen wie 〈sch〉 der Fall ist als auch bei den meisten Sinogrammen, da zumindest einige ihrer Konstituenten jeweils selbst Grapheme sein können.
Viele Bezeichnungen graphischer Einheiten verwenden den Morph {-graph} oder {-gramm}. Mit dem ersten ist eher eine graphetische, mit dem zweiten eine graphematische Bedeutung assoziiert, aber die Unterscheidung bspw. zwischen Ideogramm und Ideograph wird nicht einheitlich und systematisch getroffen.
Virtualität: Materialisierung als Glyphe
Wenn es um das (prototypische) Aussehen eines Graphs in einer bestimmten Hand- oder Druckschrift geht, spricht man stattdessen von Glyphen. Sie sind u.a. der Arbeitsgegenstand von Schriftgestaltern (Typographen) und Schriftkünstlern (Kalligraphen). Damit sind sie noch weniger als Graphe Gegenstand der Linguistik.
So zeigen sich etwa positionale Allographen, also solche, die sich am Wortanfang (initial), evtl. abhängig von den Nachbarn im Wort (medial), am Wortende (final) und alleinstehend (isoliert) optisch voneinander bis zu einem gewissen Grad unterscheiden, oder direktionale Allographen, die von der Schreibrichtung (horizontal oder vertikal, dextrograd oder sinistrograd) abhängen, in mehreren verschiedenen, aber optisch ähnlichen Glyphen. Auch Ligaturen haben eigene Glyphen, obwohl sie aus mehreren Graphen bestehen, während einzelne Graphen aus Basis und Diakritikum aus zwei Glyphen zusammengesetzt werden können. Glyphgrenzen können also, müssen aber nicht mit Graph- oder Graphemgrenzen korrelieren. Dieselbe Glyphe kann für verschiedene Schriftsysteme verwendet werden, z.B. beim lateinischen Großbuchstaben 〈A〉 und dem griechischen großen 〈Α〉 Alpha, während sich die Kleinbuchstaben unterscheiden.
Zusammenfassend und vereinfachend gesagt, werden Glyphen geschrieben, Graphe erfasst, Allographe erkannt, Grapheme gelesen und Morpheme verstanden.
Glottographische Typen
Der Status von graphischen Zeichen in nicht- und parasprachlichen Notationen, z.B. in mathematischen oder chemischen Formeln, wird nicht einheitlich gehandhabt. In manchen Theoriegebilden werden sie einfach ignoriert oder übersehen, andere versuchen sie als speziellen Typus von Graphemen zu beschreiben. Viele Schriftlinguisten beschränken sich also auf glottographische Graphemtypen, von denen es im Grundsatz zwei verschiedene Gruppen gibt:
- Offene Zeichensätze mit mehreren Tausend Logo- oder Morphogrammen, die dialekt- und sprachübergreifend einheitlich gebraucht und zumindest prinzipiell über Konstitutionsregeln ständig um neue Zeichen erweitert werden können.
- Geschlossene Klassen einiger Dutzend bis Hundert Phonogramme, deren graphische Gestalt weitgehend arbiträr ist und die im Wortkontext – abhängig von zum Teil komplexen, konventionalisierten orthographischen Distributions- und Korrespondenzregeln – eine eindeutige, sprachabhängige Lesung mit lediglich dialektaler Varianz besitzen.
Daneben existiert eine Gruppe von Hilfsgraphemen für die Interpunktion, die üblicherweise erst auf syntaktischer Ebene von Bedeutung sind und zwar Einfluss auf die Aussprache der Phrase (Prosodie) haben können, selbst aber nicht verlautet werden. Dazu gehört als „Nullgraphem“ auch das Leerzeichen (Spatium) 〈␣〉 in verschiedenen Formen.
Offener Zeichensatz
Obwohl sie häufig Logogramme genannt werden, stehen Zeichen dieses Typs in der Regel nicht für vollständige Wortformen, sondern für das meist freie lexikalische Wortparadigma und die üblicherweise gebundenen grammatischen Affixe oder freie Partikeln, also für L- und G-Morpheme. Deswegen wird alternativ von Morphogrammen gesprochen.
Der Grundstock dieser graphischen Zeichen ist häufig ursprünglich mittels einer von zwei ikonischen Methoden gebildet worden: entweder konkret abbildend, piktographisch, oder abstrakt symbolisierender, ideographisch. Beachtet man einige graphische Konventionen, die aus dem bevorzugt verwendeten Schreibmedien resultieren, besteht diese Möglichkeit der Zeichengenese prinzipiell weiterhin, doch normalerweise existiert ein beschränktes (Sub-)Inventar von Konstituenten, aus denen nach bestimmten Kombinationsregeln neue Zeichen zusammengesetzt werden können.
Üblicherweise wird der Begriff des Graphems hierbei abweichend von seiner eigentlichen Definition auf das Produkt und nicht auf die bedeutungsdifferenzierenden Konstituenten angewendet, die stattdessen als Subgrapheme o.ä. bezeichnet werden. Dies gilt umso mehr, wenn dieses, wie bei den ostasiatischen Sinogrammen üblich, unabhängig von seiner inhärenten und kombinatorischen Komplexität, d.h. der Anzahl der Striche und Teilzeichen, in einen unsichtbaren Rahmen (Frame) fester, üblicherweise quadratischer Größe eingeschrieben wird. Aufgrund dieser Formationsregel werden sie auch als Tetragramme bezeichnet, welche im normalen Schreib- und Leseprozess trotz ihres systematischen Aufbaus als atomar wahrgenommen werden. Da dies lediglich ein graphetischer und kein graphemischer Begriff ist, deckt er auch die Zeichen der geschlossenen, phonographischen Systeme der japanischen Kana und des koreanischen Hangul ab.
Die Subgrapheme können je nach Skript auch eigenständig verwendbar bleiben, sind dann also rekursive Einheiten auf verschiedenen Ebenen des Schriftsystems. Sie können verschiedene positionell motivierte Allographen aufweisen, d.h. sie sehen je nach Position und Kombination etwas anders aus.
Die Konstituenten leisten entweder als pleremisches Determinativ (Δ), auch Signifikum, einen Beitrag zur Bedeutung oder geben als kenemisches Phonetikum (Φ) einen Hinweis auf die Aussprache des Summengegenstandes, d.h. des Morphogramms. Beide sind in der Regel ungenau und nur in der konventionalisierten Kombination eindeutig. Wenn es nur wenige mögliche Determinative gibt, die somit nur eine grobe Kategorisierung zulassen, spricht man auch von Taxogrammen, wenn es für eine genauere semantische Einordnung taugt, auch von Semagrammen. In manchen Skripten können einige oder alle Subgrapheme beide Rollen einnehmen, in anderen sind sie auf eine beschränkt, z.B. bei den ägyptischen Hieroglyphen. Die Positionen im Gesamtzeichen können bevorzugt oder ausschließlich von dem einen oder dem anderen Typ belegt sein. Es treten je nach System nur einige oder alle denkbaren Kombinationen der beiden Typen auf: ΔΦ, ΦΔ, ΔΔ, ΦΦ sowie komplexere Konstrukte. Im einfachsten Fall steht ein einzelnes Phonetikum für ein Homophon und wenn mehrere, aber ausschließlich Phonetika verwendet werden, greift das Rebus-Prinzip, wobei unter mehren möglichen Zeichenalternativen oft die semantisch naheliegendste gewählt wird, bspw. in der chinesischen Transkription ausländischer Orts- und Personennamen.
Bei einer engen Auslegung des Graphembegriffs, wenn also die Konstituenten als Grapheme und die Produkte als (zweidimensionale) Graphemketten oder als graphematische Wörter bezeichnet werden, verschwindet der Unterschied zu den Silbensystemen weitgehend. Das Phonographeminventar der Phonetika ist lediglich sehr groß, enthält Duplikate und überschneidet sich unter Umständen mit dem Graphographeminventar der Determinativa, welches es in klassischen Syllabaren nicht oder nur sehr eingeschränkt gibt.
Geschlossener Zeichensatz
Klassischerweise werden Phonogramme danach unterteilt, ob sie hauptsächlich für die Repräsentation von Silben oder von Silbensegmenten (Buchstaben) verwendet werden.
Syllabische Grapheme
In Silbenschriften werden das Zeicheninventar Syllabar und die Zeichen Syllabogramme genannt. Es gibt jedoch eine Vielzahl von Typen, da nie alle möglichen phonologischen Silben einer Sprache mit je einem exklusiven Syllabogramm verschriftet werden. Stattdessen gibt es orthographische Regeln, um mit einem beschränkten, ggf. sprachübergreifendem Repertoire auszukommen. Wegen derartiger Zeichenkombinationen wird der Graphembegriff manchmal auf „Syllabogrammketten“ wie die japanischen Yōon ausgedehnt.
In einer echten Silbenschrift können die silbischen Schreib- und Leseeinheiten als Grapheme angenommen werden, doch viele Systeme sind nicht völlig arbiträr:
Einerseits gibt es manchmal als Abugida[9] bezeichnete synthetische Schriften wie die des indischen Brahmi-Schriftkreises, in denen Vokale entweder inhärent sind Ca 〈Ca〉 oder diakritisch an die silbischen Basen gebunden werden Cae 〈Ce〉 und dabei z.T. komplexe Ligaturen bilden. Da Konsonanten und Vokale auf unterschiedlichen Ebenen des Schriftsystems notiert werden, sehen manche Linguisten die gebildeten Silbenligaturen als Grapheme an, für andere unterscheidet sich dieses hierarchisch segmentale Prinzip nicht wesentlich von den gleichberechtigt segmentalen Schriften und entsprechend gelten vorbehaltlich einzelsprachlicher Untersuchungen beide phonographischen Zeichentypen als Grapheme. Eine besondere Art von Graphem in diesen Schriften ist das Virama, das wie ein Vokalzeichen verwendet wird, aber den Wegfall des inhärenten Vokals kennzeichnet.
Andererseits sind vor allem in der Neuzeit entwickelte Schriften wie die der Cree häufig systematisch, indem sowohl die Konsonanten als auch die Vokale der CV-Syllabogramme reihen- bzw. spaltenweise einheitlich geometrisch variieren. Hier stellt sich die Frage, ob die Zeichenorientierung graphemisch ist, also ob die Analyse Dreieck V, Spitze (rechts) unten Ce …, also ᐁ Ve, ᐃ Vi, ᐅ Vo, ᐊ Va, oder aber ᐁ e, ᐃ i, ᐅ o, ᐊ a lauten sollte.
In den meisten sogenannten Silbenschriften gibt es auch nicht-silbische Zeichen, z.B. solche wie das japanische ん n, die nur für die Koda verwendet werden können. Diese haben in der Regel ebenfalls Graphemstatus.
Manche mit den Syllabogrammen verwendete Schriftzeichen wie die japanischen 〈っ / ッ〉 Sokuon und 〈ー〉 Chōon haben durch orthographische Konventionen variablen bzw. funktionalen Charakter und kommen nicht frei vor, sondern sind an das vorangehende oder nachfolgende Syllabogramm gebunden, wodurch dessen phonographische Qualität verändert wird.
Segmentale Grapheme
Oft werden für Alphabetschriften pauschal die jeweiligen Buchstaben als Grapheme angesetzt (alphabetisches Graphem). Dies gilt auch für manchmal Abdschad[9] genannte andere segmentale Skripte, in denen (manche) Vokale nicht auf derselben Schriftebene wie Konsonanten oder optional oder überhaupt nicht geschrieben werden.
Viele Linguisten verstehen die Groß- und Kleinbuchstaben als allographische Varianten desselben Graphems oder als „funktional verbundenes Paar von Graphemen“[13], doch vor allem im Deutschen kann die Unterscheidung semantisch relevant sein, vgl. Adjektiv 〈arm〉 vs. Substantiv 〈Arm〉 vs. Akronym 〈ARM〉. Zu beachten ist außerdem, dass die Anfangsgroßschreibung in vielen Sprachen auf Buchstaben, in manchen aber auf Grapheme wirkt, z.B. niederländisch 〈IJssel〉 statt *〈Ijssel〉. Daher postulieren einige Wissenschaftler abstrakte Funktionsgrapheme, die ihr Vorhandensein nur durch Interaktion mit anderen Zeichenkörpern anzeigen, z.B. „Supragrapheme“ bei Gallmann[14]. Diese Funktionen können syntagmatisch (aus dem Satz heraus) oder paradigmatisch (aus dem Wort heraus) und sogar rein graphostilistisch aktiviert werden. Damit können 〈ARM〉, 〈Arm〉 und 〈arm〉 jeweils als unmarkierte oder markierte Schreibungen von arm, Arm und ARM legitimiert und gleichzeitig 〈aRM〉, 〈arM〉, 〈ArM〉 und 〈ARm〉 ausgeschlossen werden.
Weil das Graphem die kleinste bedeutungsunterscheidende Einheit ist, müssen bedeutungsgleiche Graphemketten, d.h. graphematische Wörter, aus denselben Graphemen aufgebaut sein. Viele Orthographien lassen aber bestimmte Varianten zu, z.B. 〈Frisör〉 und 〈Friseur〉, sodass schon allein deswegen nicht pauschal davon ausgegangen werden kann, dass ein Graphem einem Buchstaben entspricht (orthographisches Graphem). In der dependenztheoretischen Begriffswelt, wozu häufig die Schreibdidaktik gehört, kann zwischen dem im Normalfall verwendeten Basisgraphem, bspw. /t/ → 〈t〉, und seinen orthographisch begründeten Varianten, den Orthographemen, unterschieden werden, bspw. /t/ → 〈d〉 wegen Morphemkonstanz.
Da in vielen Schriftsystemen manche (feste) Buchstabenverbindungen in der Minimalpaaranalyse Positionen einnehmen, die sonst nur von Einzelbuchstaben eingenommen werden können, werden solche Digraphe, Trigraphe oder Plurigraphe oft ebenfalls als Grapheme dieser Sprache angesehen. In der lateinischen Schrift wird besonders häufig das 〈h〉 als hintere Komponente dieser Kombinationen verwendet. Der Buchstabe 〈c〉 in den (nicht nur) deutschen Verbindungen 〈ck〉 und 〈ch〉 kann als allographische Variante des Folgebuchstabens interpretiert werden, sodass sich die regelmäßiger gebildeten (theoretischen) Grapheme 〈kk〉 und 〈hh〉 ergeben; ähnliches gilt für das Verhältnis von 〈tz〉 zu 〈zz〉.
Die diakritischen Zeichen, welche es übrigens auch in Silbenschriften gibt, können nach Gallmann[15] (hier am Beispiel der deutschen Umlaute) auf drei verschiedene Arten graphematisch analysiert werden:
- 〈ä〉, 〈ö〉, 〈ü〉 sind wie 〈i〉 eigenständige Grapheme. In österreichischen Telefonbüchern zeigt sich eine solche Interpretation darin, dass die Akzentbuchstaben hinter den Grundbuchstaben einsortiert werden, während sie in den skandinavischen Sprachen am Ende des Alphabetes angefügt werden.
- 〈ä〉, 〈ö〉, 〈ü〉 sind allographische Realisierungen der Graphemgruppen 〈ae〉, 〈oe〉, 〈ue〉 oder die Umlautpunkte 〈¨〉 sind allograph zum 〈e〉. Diese Interpretation liegt Kreuzworträtseln und der Bibliotheksortierung zugrunde, bei der gleich klingende, aber anders geschriebene Namen beieinander stehen sollen.
- 〈ä〉, 〈ö〉, 〈ü〉 sind 〈a〉, 〈o〉, 〈u〉 plus diakritisches Zeichen «Umlautpunkte», d.h. sie bilden lediglich eine markierte Variante der Basisbuchstaben. Die Wörterbuchsortierung nutzt dieses Prinzip, da so aus Ableitungen (Derivation) gebildete Lexeme häufig bei ihren Stammwörtern stehen.
Der zweite und dritte Ansatz entspricht der umgangssprachlichen Ansicht, dass das deutsche Alphabet 26 Buchstaben habe.
Beispiel
So schreibt man nach traditioneller deutscher Rechtschreibung und ohne eingedeutschter Schreibung französischer Lehnwörter 〈Nuß-Nougat-Crème〉, wobei der Akzent häufig weggelassen wird, 〈…-Creme〉, und das End-‹e› stumm bleiben kann. Mit der Rechtschreibreform muss 〈Nuß〉 durch 〈Nuss〉 ersetzt werden, während der Gallizismus 〈Nougat〉 wahlweise als 〈Nugat〉 geschrieben und dann auch 〈Creme〉 je nach intendierter Aussprache zu 〈Krem〉 oder 〈Kreme〉 geändert werden kann. Damit teilt sich dieses Wort ohne Bedeutungsänderung in die orthographischen Grapheme 〈N〉〈u〉〈ß|ss〉〈-〉〈N〉〈ou|u〉〈g〉〈a〉〈t〉〈-〉〈C|K〉〈r〉〈è|e〉〈m〉〈e|∅〉, die allerdings bezüglich ihrer Kombination miteinander nicht völlig frei sind.
Der Bindestrich (und auf etwas andere Weise der Apostroph) nimmt in den europäischen Buchstabenschriften eine Sonderrolle ein, da er kein Phonogramm ist, also nicht direkt gesprochen wird, sondern lediglich den Status anderer Graphemketten verändern kann, indem er sie zu Komposita konkateniert. Neben diesem expliziten Bindestrich gibt es auch einen impliziten Trennstrich an allen möglichen Trennstellen> 〈·〉, an denen er ausschließlich am Zeilenende sichtbar wird. Obwohl hierbei häufig pauschal von Silbentrennung gesprochen wird, gibt es in den verschiedenen Schriftsystemen der Welt Trennverfahren an Silben-, Morphem- und Graphem-, selten auch an Glyphen-Grenzen. Die Zusammensetzung mehrerer Einzelwörter zu einem neuen kann je nach orthographischen Konventionen allerdings nicht nur durch einen Bindestrich 〈x-y〉, sondern auch durch direktes Aneinanderhängen 〈x∅y〉 oder – häufig außerhalb von Phrasen, aber nicht regelkonform – mit Leerzeichen (d.h. horizontaler Weißraum 〈x␣y〉 oder Zeilenumbruch 〈x|y〉) erfolgen, wobei die Anfangsgroßschreibung des hinteren Gliedes nicht erhalten bleiben muss, da nicht unbedingt eine Wortgrenze 〈#〉 enthalten ist.
Für das erste Graphem nach einer (initialen) Wortgrenze kann syntaktisch (wenn es mit initialer Satzgrenze zusammenfällt), grammatisch (beim nichtpronominalen Kopf einer Nominalphrase) oder lexemisch (bei Namen und Substantiven) motiviert eine Allographiebeschränkung greifen, der zufolge für den ersten Buchstaben des Graphems nur eine Majuskel zulässig ist. Ähnlich galten früher, vor allem im Fraktursatz, für das letzte Graphem vor einer medialen oder finalen Wortgrenze Sonderbedingungen wenn es mit dem Buchstaben 〈s〉 endet, welcher dann nicht mit dem Graph ‹ſ›, sondern als ‹s› und bei Verdopplung statt ‹ſſ› oder ‹ſs› orthographisch ligiert als ‹ß› dargestellt wurde.
Das Graphem 〈-〉 kann also die Ausprägungen ‹-#›, ‹∅#›, ‹∅› (leer), ‹␣#› (Spatium) und ‹↩› (Zeilenwechsel) haben. Dabei ist zu beachten, dass diese Graphemvarianten die Teilwörter unterschiedlich stark aneinander binden und damit zur Bedeutungsdifferenzierung genutzt werden können, wodurch sie ggf. zu unterschiedlichen Graphemen werden: 〈Nussnugatkrem〉, 〈Nuss-Nugat-Krem〉, 〈NussNugatKrem〉 und eventuell auch 〈Nuss Nugat Krem〉 sind dasselbe Wort, wohingegen in 〈Nuss-Nugatkrem〉 und 〈Nussnugat-Krem〉 verschiedene semantisch relevante Akzente gesetzt werden, nämlich im ersten Fall bspw. in Abgrenzung zu 〈Mandel-Nugatkrem〉 oder 〈Nuss-Kuchen〉 und im zweiten Fall bspw. zu 〈Nussnugat-Riegel〉 oder 〈Erdnuss-Krem〉.
Damit lässt sich dieses Beispielwort mit seinen diachronen Varianten, die z.T. noch nicht oder nicht mehr orthographisch valide sind, graphemisch folgendermaßen beschreiben:
- Nuss-Nougat-Creme
- → 〈Nuss-Nougat-Crème〉
- 〈N〉 → 〈#n〉
- 〈C〉 → 〈#c〉
- 〈^c〉 → ‹C›
- 〈^k〉 → ‹K›
- 〈^n〉 → ‹N›
- 〈ss〉 → ‹ss|ß›
- 〈c〉 → 〈c|k〉
- 〈ou〉 → 〈ou|u〉
- 〈è〉 → 〈è|e〉
- 〈me〉 → 〈·me|m∅〉
- 〈·〉 → ‹∅› ∨ ‹-↩› ∨ ‹↩›
- 〈-〉 → 〈#·|#-#|∅|#␣#〉 = 〈〈#〈·|〈-|␣〉#〉〉|∅〉
- 〈##〉 → 〈#〉
- 〈#nu〈ss〉〈-〉n〈ou〉·gat〈-〉〈c〉r〈è〉〈me〉#〉
- 〈#nu(ß|ss)〈-〉n(ou|u)·gat〈-〉(c|k)r(è|e)(·|∅)m(e|∅)#〉
Diese Variantenanalyse trifft allerdings noch keine Entscheidung über tatsächlich im deutschen Schriftsystem vorhandene Grapheme, sondern identifiziert lediglich erste Kandidaten.
Syntaktische Grapheme
Graphische Zeichen eines Schriftsystems, die nicht zur Wortbildung, sondern nur dem Satzbau dienen, werden teils ebenfalls als Grapheme angesehen und syntaktische Grapheme[16] oder Syngrapheme genannt. Dazu gehören neben der Interpunktion auch indirekt sichtbare Funktionsgrapheme wie die Großschreibung am Satzanfang, die ggf. dafür sorgt, dass auch Wörter, die nach lexikalischen Regeln mit einem Kleinbuchstaben beginnen, mit einer Initialmajuskel geschrieben werden.
Unter den Satzzeichen gibt es verschiedene Typen: einige können nur am Anfang oder Ende eines Wortes[17] oder Satzes[18] stehen, andere auch oder nur mittig (trennend oder verbindend) und wieder andere, bspw. Klammern und Anführungszeichen, treten i.d.R. nur als Paar auf.
Technisches Graphem
Zur angewandten Linguistik gehört an der Schnittstelle zur Computertechnik die elektronische Kodierung von Schrift und ihrer Zeichen. Dabei gibt es glyphenbasierte Ansätze wie in 7bit-SMS-Nachrichten, graphem- / konstituentenbasierte Ansätze oder framebasierte Ansätze. In Unicode werden die Schriftzeichen zwar prinzipiell als Kombinationen von Grundeinheiten, welche kodiert werden, modelliert, aber teilweise aus Kompatibilitätsgründen und teilweise aus Pragmatik gibt es viele vorgefertigte Zeichen, was es erforderlich macht, kanonische Äquivalenzen und bevorzugte Codes festzulegen (bspw. NFC). So kann ein 〈ä〉 als Kombination aus 〈a〉 U+0061 und 〈¨〉 Trema U+0308 oder direkt als 〈ä〉 U+00E4 gespeichert werden. Die koreanischen Hangul liegen sowohl als Einzelkomponenten (knapp 70 Jamo) als auch als Silbenblöcke (über 11000) vor, während Sinogramme nur als Gesamteinheit kodiert werden.
Die Zeichenkodierung braucht nicht auf einfache Weise mit der Eingabe über die Tastatur o.ä. korrelieren, bspw. werden Akzente über Tottasten vor dem Basisbuchstaben eingetippt, aber andersrum oder als eine Code-Einheit gespeichert.
Der Unicode-Standard verwendet den Begriff Graphem in vereinfachter und sprachunabhängiger Bedeutung:[20]
- Graphem (Grapheme)
-
- Eine minimale distinktive Einheit der Schrift im Kontext eines Schriftsystems, also ein graphisches Zeichen, mit dem zwei Wörter voneinander unterschieden werden können (Minimalpaaranalyse).
- Was Benutzer für ein Schriftzeichen (Character) halten.
- Graphembasis (Grapheme Base)
- Ein Schriftzeichen mit der entsprechenden, zugewiesenen Eigenschaft oder jeder Hangul-Silbenblock.
- Graphemhaufen (Grapheme Cluster)
- Text zwischen Graphemhaufengrenzen nach Anhang 29 „Textsegmentation“. Ein Graphemhaufen repräsentiert eine horizontal segmentierbare Texteinheit, bestehend aus irgendeiner Graphembasis kombiniert mit beliebig vielen nullbreiten Markern.
- Graphemerweiterung (Grapheme Extender)
- Ein Schriftzeichen mit der entsprechenden, zugewiesenen Eigenschaft. Graphemerweiterungszeichen sind alle nullbreiten Marker, nullbreiter Verbinder, nullbreiter Trenner und einige nichtnullbreite Marker.
- Graphisches Schriftzeichen (Graphic Character)
- Ein Schriftzeichen mit der Kategorie Buchstabe (Letter), Kombininierender Marker, Ziffer, Interpunktion, Symbol, oder Spatium.
Siehe auch
Literatur
- Julie D. Allen: The Unicode Standard, version 6.0. The Unicode Consortium, Mountain View 2011, ISBN 9781936213016 (Online-Version).
- Christa Dürscheid: Einführung in die Schriftlinguistik. 2. Auflage. Studienbücher zur Linguistik 8, Verlag für Sozialwissenschaft, Wiesbaden 2004, ISBN 3-531-33680-0.
- Peter Gallmann: Graphische Elemente der geschriebenen Sprache. Grundlagen für eine Reform der Orthographie. Reihe germanistische Linguistik 60, Niemeyer, Tübingen 1985, ISBN 3-484-31060-X, 2.2 „Zum Begriff des Graphems“.
- Hartmut Günther, Otto Ludwig (Hrsg.): Schrift und Schriftlichkeit. Writing and Its Use. Ein interdisziplinäres Handbuch internationaler Forschung. Handbücher zur Sprach- und Kommunikationswissenschaft 10, 1. Halbband, Mouton de Gruyter, Berlin / New York 1994 (diverse relevante Artikel).
- Manfred Kohrt: Problemgeschichte des Graphembegriffs und des frühen Phonembegriffs. Reihe germanistische Linguistik 61, Niemeyer, Tübingen 1985, ISBN 3-484-31061-8, 5–6.
Einzelnachweise
- ↑ Kohrt (1985), 167.
- ↑ „Nun sind die (sprachlichen) Äußerungen unserer Stimme Symbole für das, was (beim Sprechen) unserer Seele widerfährt, und unsere schriftlichen Äußerungen sind wiederum Symbole für die (sprachlichen) Äußerungen unserer Stimme.“ Aristoteles: Peri Hermeneias. 16a3–6.
- ↑ „Sprache und Schrift sind zwei verschiedene Systeme von Zeichen; das letztere besteht nur zu dem Zweck, um das erstere darzustellen. Nicht die Verknüpfung von geschriebenem und gesprochenem Wort ist Gegenstand der Sprachwissenschaft, sondern nur das letztere, das gesprochene Wort allein ist ihr Objekt.“ Ferdinand de Saussure: Cours de linguistique générale. 1916.
- ↑ „Writing is not language, but merely a way of recording language by means of visible marks.“ Leonard Bloomfield: Language. 1933.
- ↑ Kohrt (1985): Kapitel 5 „Das ‚Graphem‘ als Phonemzeichen“.
- ↑ Kohrt (1985): Kapitel 6 „Das ‚Graphem‘ als autonome Einheit der geschriebenen Sprache“.
- ↑ John C. McLaughlin: A Graphemic-Phonemic Study of a Middle English Manuskript. Mouton, The Hague 1963, S. 29–32 (Zitiert in Kohrt (1985), 319).
- ↑ Klaus Heller: Zum Graphembegriff. In: Dieter Nerius, Jürgen Scharnhorst (Hrsg.): Theoretische Probleme der deutschen Orthographie. Akademie Verlag, Berlin 1980, S. 74–108 (Zitiert in Kohrt (1985), 319).
- ↑ a b c Beispiel für divergierende Terminologie:
„
- character
- … 2. conventional term for a unit of the Chinese writing system in East Asian scripts
- …
- diacritic
- a mark added to a character to indicate a modified pronunciation (or sometimes to distinguish homophonous words)
- …
- grapheme
- term intended to designate a unit of a writing system, parallel to phoneme and morpheme, but in practice used as a synonym for letter, diacritic, character (2), or sign (2)
- …
- letter
- a self-contained unit of an abjad, alphabet, or abugida
- …
- sign
- … 2. conventional term for a self-contained unit of cuneiform script
– Daniels / Bright : The World’s Writing Systems. 1995, Glossary.
- ↑ Martin Neef (2005): Die Graphematik des Deutschen, Kapitel 2.2 „Die Grundeinheiten der graphematischen Komponente“.
- ↑ Gallmann (1985), §47.
- ↑ u.a. Primus, Brekle
- ↑ Gallmann (1985), §30.
- ↑ Gallmann (1985), §31.
- ↑ Gallmann (1985), §39.
- ↑ Gallmann (1985), §33: „Hilfszeichen: Punkt, Ausrufezeichen, Fragezeichen, Doppelpunkt, Strichpunkt, Komma, Geviertstrich, Bindestrich (Divis), Apostroph, Anführungszeichen, Klammern. . ! ? : ; , — - ’ « » ‹› () []“ geschlossene Formklasse, abgegrenzt von der offenen Klasse der Sonderzeichen (§$%‰&*=+–)
- ↑ Gallmann (1985), §267ff: Wortbegrenzer
- ↑ Gallmann (1985), §92: Satzintention- vs. Grenzsignal
- ↑ Gallmann (1985), §28.
- ↑ Unicode Glossary
Weblinks
Wiktionary: Graphem – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen- Das autonome Graphem Zur GP-Korrespondenz
- Großes Schriftzeichenwiki der FH Mainz
Dieser Artikel befindet sich derzeit im Review-Prozess. Sag dort deine Meinung zum Artikel und hilf mit, ihn zu verbessern!
Wikimedia Foundation.