Skip to content
Snippets Groups Projects
usikora's avatar
usikora authored
Resolve "Überarbeitung Kommentare"

Closes #51

See merge request !49
6adee1f6
History

EUPT XML

(Vorerst beinhaltet diese Readme die Anfänge einer Dokumentation des Schemas)

Schemadokumentation

Metadaten

Lizenz

Lizenzangaben werden mittels tei:availability/tei:licence erfasst. In tei:licence wird als textlicher Inhalt der offizielle Name der Lizenz angegeben. Mit dem Attribut @target wird der URI zur ausführlichen Definition der Lizenzbestimmungen angegeben.

Beispiel:
<tei:availability>
    <tei:licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC-BY-SA-4.0</tei:licence>
</tei:availability>

Dies entspricht den Empfehlungen der KIM-Gruppe Lizenzen.

HTML-Serialisierung

Die Lizenzangaben werden im Metadatenpanel angegeben.

Daten

Hervorhebungen

Hervorhebungen werden mittels hi erfasst. Die Art der Hervorhebung wird mittels @rend definiert. Mögliche Werte für @rend sind:

  • bold: Fett
  • italics: Kursiv (Default)
  • small_caps: Kapitälchen
  • sub: Tiefgestellt
  • super: Hochgestellt
  • under: Unterstrichen
Beispiel
In der Abfolge der Erzählsequenzen <hi rend="bold">Angebot</hi> - <hi rend="under">Ablehnung des Angebots</hi> - <hi>Äußerung des eigentlichen Wunsches</hi> erhält Kirtus tatsächliches Anliegen nämlich besonderes Gewicht:
HTML-Serialisierung

Darstellung des Textes entsprechend des Werts von @rend.

Kommentare

Kommentare werden mittels note erfasst. Mittels @target können Kommentare auf verschiedene Elemente verweisen (bspw. seg, g, part, phr, w).

Kommentare können einen oder mehrere Typen zugewiesen werden. Hierfür wird das Attribut @type genutzt. Erlaubte Werte sind:

  • "con": Inhalt
  • "epi": Epigrafie
  • "gr": Grammatik
  • "lx": Lexik
  • "poet": Poetologie

Kommentare können mehrere Absätze enthalten. Dann muss der Inhalt des note ausschließlich aus p bestehen (das note darf also keinen textlichen Inhalt haben).

Alternativ kann das note in beliebiger Reihenfolge eine beliebige Anzahl an ana, hi, quote, ref, textBlock, bibl und Text enthalten.

Absätze

Ugaritische Textblöcke

Ugaritischer Text außerhalb der Transliteration und Vokalisation wird mittels textBlock erfasst.

textBlock darf eine beliebige Anzahl Elemente aus einer der folgenden Elementgruppen enthalten:

Beispiel
<textBlock><tei:supplied>D</tei:supplied> <segg>ṮDṮ</seg></textBlock>
HTML-Serialisierung

Der ugaritische Text soll genauso dargestellt werden wie in der Transliteration und in der Vokalisation .

Zitate

Zitate werden mittels quote erfasst.

quote darf in beliebiger Reihenfolge eine beliebige Anzahl an ana, hi, quote, ref, bibl, pc, phr, w, lb, Elemente zur Beschreibung der Transkription und Text enthalten.

HTML-Serialisierung

In der HTML-Serialisierung werden Anführungszeichen vor und nach dem Zitat eingefügt.

Literaturverweise

Verweise

Verweise (Links) werden mittels ref erfasst. Dabei wird @target genutzt, um das Ziel des Links zu erfassen.

ref darf hi, textBlock und Text enthalten.

Ana

Linebeginning

Steuerzeichen

Steuerzeichen im ugaritischen Text (Worttrenner, Markierungen für unindentifizierbare Zeichen) werden mittels pc erfasst.

Zudem wird pc mittels @type spezifiziert:

  • "non_identifiable_sign_multi" für eine unbestimmte Anzahl unidentifizierbarer Zeichen
  • "non_identifiable_sign_single" für ein einzelnes unidentifizierbares Zeichen
  • "word_boundary_separator" für Worttrenner

pc kann eine @xml:id zugewiesen werden. Mittels @cert kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das pc mit @cert="high" spezifiziert, wenn nicht dann mit @cert="low". Der Default-Wert ist "high".

HTML-Serialisierung

In der HTML-Serialisierung wird pc durch einen Punkt mit vorangehendem und folgendem schmalem Leerzeichen ersetzt.

metamark

Transliteration

Kolumns

Die Textspalten einer Tontafel werden mittels column erfasst.

column wird mittels @n eine Nummer zugewiesen. Es ist möglich, column eine @xml:id und/oder xml:base zuzuweisen.

column darf line, note, tei:damage sowie metamark enthalten.

Zeilen

Part

Seg

G

Ein Zeichen oder eine Glyphe wird mittels g erfasst.

g kann eine @xml:id sowie ein @ana zugewiesen werden. Mittels @cert kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das g mit @cert="high" spezifiziert, wenn nicht dann mit @cert="low". Der Default-Wert ist "high".

Das Zeichen beziehungsweise die Glyphe wird als Unicode-Zeichen im textlichen Inhalt von g erfasst.

Vokalisation und Übersetzung

phr

w

Einzelne Wörter werden mittels w erfasst.

w kann eine @xml:id, ein @ana, ein @corresp sowie ein @lemma zugewiesen werden. Mittels @cert kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das w mit @cert="high" spezifiziert, wenn nicht, dann mit @cert="low". Der Default-Wert ist "high".

w darf m, lb, die Elemente zur Beschreibung der Transkription sowie Text enthalten.

m

Translation

Die Übersetzung wird mittels translation erfasst.

Mit dem Attribut @xml:lang wird die Sprache der Übersetzung angegeben. Mittels @cert kann angegeben werden, ob man sich sicher ist, dass dies die richtige Übersetzung ist. Wenn ja, wird das translation mit @cert="high" spezifiziert, wenn nicht, dann mit @cert="low". Der Default-Wert ist "high".

translation darf pc, phr, w, lb, die Elemente zur Beschreibung der Transkription, hi sowie Text enthalten.

Elemente zur Beschreibung der Transkription

tei:choice

tei:sic

tei:sic darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:corr

tei:corr darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:reg

tei:reg darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:orig

tei:orig darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:add

tei:add darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:del

tei:del zeigt an, dass an dieser Stelle der Text gelöscht/durchgestrichen worden ist.

Mittels @next und @prev kann angegeben werden, dass auch (das) folgende/vorhergehende Zeichen gelöscht wurde. Dazu wird auf die @xml:id des vorhergehenden/folgenden tei:del verwiesen (mit #).

tei:del darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

HTML-Serialisierung

In der HTML-Serialisierung werden runde Klammern um den Inhalt von tei:del gesetzt.

Wenn mittels @prev auf ein vorhergehendes tei:del verwiesen wird, wird keine öffnende runde Klammer vor den Inhalt von tei:del gesetzt.

Wenn mittels @next auf ein folgendes tei:del verwiesen wird, wird keine schließende runde Klammer nach den Inhalt von tei:del gesetzt.

tei:unclear

Wenn nicht klar ist, ob ein Zeichen tatsächlich existiert, wird dieses Zeichen in tei:unclear erfasst.

tei:unclear darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

HTML-Serialisierung

In der HTML-Serialisierung müssen runde Klammern um den Inhalt von tei:unclear eingefügt werden.

tei:damage

tei:damage zeigt an, dass an dieser Stelle der Text beschädigt ist.

Mittels @unit wird spezifiziert, ob ein oder mehrere Zeichen (character) oder Zeilen (line) beschädigt sind.

Wenn @unit="line", wird mittels @atLeast (Mindestanzahl) und @atMost (Maximalanzahl) die Anzahl der beschädigten Zeilen angegeben.

Wenn @unit="character", werden die einzelnen Zeichen mittels pc@type="non_identifiable_sign_single" bzw. pc@type="non_identifiable_sign_multi" erfasst.

Mittels @next und @prev kann angegeben werden, dass auch (das) folgende/vorhergehende Zeichen beschädigt sind. Dazu wird auf die @xml:id des vorhergehenden/folgenden tei:damage verwiesen (mit #).

tei:damage darf pc, phr, w, g, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

HTML-Serialisierung

In der HTML-Serialisierung werden eckige Klammern um den Inhalt von tei:damage gesetzt.

Wenn mittels @prev auf ein vorhergehendes tei:damage verwiesen wird, wird keine öffnende eckige Klammer vor den Inhalt von tei:damage gesetzt.

Wenn mittels @next auf ein folgendes tei:damage verwiesen wird, wird keine schließende eckige Klammer nach den Inhalt von tei:damage gesetzt.

tei:restore

tei:restore darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:supplied

tei:supplied darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:surplus

tei:surplus darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:secl

tei:secl darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:mod

tei:mod darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:redo

tei:redo darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:retrace

tei:retrace darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.

tei:undo

tei:undo darf g, pc, part, seg, lb, die Elemente zur Beschreibung der Transkription und Text enthalten.