Markup

Markup ist der englische Begriff für „Auszeichnungssprache“ und bezeichnet eine Sprache, durch die Textinhalte in einer formalisierten Weise explizit gemacht, also „ausgezeichnet“ werden. Diese computerlesbaren Sprachen werden genutzt, um Texte und Dokumente zu beschreiben, zu formatieren und zu gliedern. Indem z. B. das in einem Text vorkommende Wort „Bäcker“ ausdrücklich als „Berufsbezeichnung“ (und nicht als „Familienname“) gekennzeichnet wird, kann bei der strukturierten Suche nach Worten innerhalb einer Textdatei nicht bloß die Zeichenfolge B-ä-c-k-e-r, sondern der damit verbundene Inhalt aufgefunden werden. Somit ermöglicht der maschinenlesbare Zeichensatz einer Auszeichnungssprache das Beschreiben sowohl der Formatierung eines Textes als auch des Inhaltes. Als Zeichensätze werden z. B. UTF-8, ASCII oder Unicode verwendet, diese sind international genormt, so dass ein reibungsloser Datenaustausch im Internet ermöglicht wird.
Auszeichnungssprachen werden so angewendet, dass die zu definierende Einheit durch eine Start- und End-Markierung (ein Start- und Endtag) umrahmt und dieser Markierung ein in der Regel menschenlesbarer Definitionsname gegeben wird. Diese Definitionen bezeichnet man als Elemente, die Wörter, Absätze oder Datenmengen näher spezifizieren. Um diese Markierungen von der regulären Textumgebung abzuheben, werden Sonderzeichen genutzt. Der dabei entstehende sogenannte Quelltext besteht also sowohl aus „normalem“ Text als auch aus einem ihn umgebenden Zeichensatz aus Klammern, Zahlen, Sonderzeichen usw. Eine Anzeige z. B. in einem Browser lässt diesen Quelltext verschwinden, die Auszeichnungen werden entsprechend interpretiert und umgesetzt. (Das zu wählende Werkzeug zur Umsetzung ist auch abhängig von der genutzten Auszeichnungssprache).
Eine allgemeine Auszeichnungssprache dieser Art („General Markup Language“ GML) wurde 1969 von Charles Goldfarb entwickelt, ihr folgte dann die „Structured Generalized Markup Language“ SGML (1986). Weite Verbreitung fanden die Auszeichnungssprachen erst durch die drastisch reduzierte (und überwiegend auf typographische Auszeichnung ausgerichtete) „HyperText Markup Language“ HTML (die Kernsprache des World Wide Web), vor allem aber durch die „erweiterbare Auszeichnungssprache“ („eXtensible Markup Language“ XML 1988). XML wird genutzt, um Texte in einer hierarchisch strukturierten Form (auch Baumstruktur) auszuzeichnen, welche inzwischen in zahlreichen Varianten benutzt wird (z. B. XHTML).

Das oben genannte Wort „Bäcker“ kann auf verschieden Weise mit verschiedenen Sprachen ausgezeichnet werden und bekommt jeweils eine andere Bedeutung.

HTMl: <h1>Bäcker</h1> --> hier wird das Wort Bäcker als Überschrift markiert. 
XML: <beruf>Bäcker</beruf> --> hier wird das Wort Bäcker als Berufsbezeichnung markiert.
LateX: \textit{Bäcker} --> hier wird das Wort Bäcker kursiv gesetzt.

Auszeichnungssprachen sind unbedingt von Programmiersprachen zu unterscheiden, denn letztere sind sogenannte formale Sprachen, welche eine Anleitung (bestehend z. B. aus Algorithmen) zu einer Rechenoperation, die ein Computer ausführen soll, beinhalten. Ein Beispiel für eine solche Programmiersprache ist Java Script.

Version 1.0.4