EUPT XML
(Vorerst beinhaltet diese Readme die Anfänge einer Dokumentation des Schemas)
Schemadokumentation
Metadaten
Lizenz
Lizenzangaben werden mittels tei:availability/tei:licence
erfasst. In tei:licence
wird als textlicher Inhalt der offizielle Name der Lizenz angegeben. Mit dem Attribut @target
wird der URI zur ausführlichen Definition der Lizenzbestimmungen angegeben.
Beispiel:
<tei:availability>
<tei:licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC-BY-SA-4.0</tei:licence>
</tei:availability>
Dies entspricht den Empfehlungen der KIM-Gruppe Lizenzen.
HTML-Serialisierung
Die Lizenzangaben werden im Metadatenpanel angegeben.
Daten
Hervorhebungen
Hervorhebungen werden mittels hi
erfasst. Die Art der Hervorhebung wird mittels @rend
definiert. Mögliche Werte für @rend
sind:
-
bold
: Fett -
italics
: Kursiv (Default) -
small_caps
: Kapitälchen -
sub
: Tiefgestellt -
super
: Hochgestellt -
under
: Unterstrichen
Beispiel
In der Abfolge der Erzählsequenzen <hi rend="bold">Angebot</hi> - <hi rend="under">Ablehnung des Angebots</hi> - <hi>Äußerung des eigentlichen Wunsches</hi> erhält Kirtus tatsächliches Anliegen nämlich besonderes Gewicht:
HTML-Serialisierung
Darstellung des Textes entsprechend des Werts von @rend
.
Kommentare
Kommentare werden mittels note
erfasst. Mittels @target
können Kommentare auf verschiedene Elemente verweisen (bspw. seg
, g
, part
, phr
, w
).
Kommentare können einen oder mehrere Typen zugewiesen werden. Hierfür wird das Attribut @type
genutzt. Erlaubte Werte sind:
- "con": Inhalt
- "epi": Epigrafie
- "gr": Grammatik
- "lx": Lexik
- "poet": Poetologie
Kommentare können mehrere Absätze enthalten. Dann muss der Inhalt des note
ausschließlich aus p
bestehen (das note
darf also keinen textlichen Inhalt haben).
Alternativ kann das note
in beliebiger Reihenfolge eine beliebige Anzahl an ana
, hi
, quote
, ref
, textBlock
, bibl
und Text enthalten.
Absätze
Ugaritische Textblöcke
Ugaritischer Text außerhalb der Transliteration und Vokalisation wird mittels textBlock
erfasst.
textBlock
darf eine beliebige Anzahl Elemente aus einer der folgenden Elementgruppen enthalten:
column
-
line
undtei:damage
-
part
,seg
,g
,lb
sowie die Elemente zur Beschreibung der Transkription -
pc
,phr
,w
,lb
sowie die Elemente zur Beschreibung der Transkription
Beispiel
<textBlock><tei:supplied>D</tei:supplied> <segg>ṮDṮ</seg></textBlock>
HTML-Serialisierung
Der ugaritische Text soll genauso dargestellt werden wie in der Transliteration und in der Vokalisation .
Zitate
Zitate werden mittels quote
erfasst.
quote
darf in beliebiger Reihenfolge eine beliebige Anzahl an ana
, hi
, quote
, ref
, bibl
, pc
, phr
, w
, lb
, Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung werden Anführungszeichen vor und nach dem Zitat eingefügt.
Literaturverweise
Verweise
Verweise (Links) werden mittels ref
erfasst. Dabei wird @target
genutzt, um das Ziel des Links zu erfassen.
ref
darf hi
, textBlock
und Text enthalten.
Ana
Linebeginning
Steuerzeichen
Steuerzeichen im ugaritischen Text (Worttrenner, Markierungen für unindentifizierbare Zeichen) werden mittels pc
erfasst.
Zudem wird pc
mittels @type
spezifiziert:
- "non_identifiable_sign_multi" für eine unbestimmte Anzahl unidentifizierbarer Zeichen
- "non_identifiable_sign_single" für ein einzelnes unidentifizierbares Zeichen
- "word_boundary_separator" für Worttrenner
pc
kann eine @xml:id
zugewiesen werden. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das pc
mit @cert="high"
spezifiziert, wenn nicht dann mit @cert="low"
. Der Default-Wert ist "high".
HTML-Serialisierung
In der HTML-Serialisierung wird pc
durch einen Punkt mit vorangehendem und folgendem schmalem Leerzeichen ersetzt.
metamark
Transliteration
Kolumns
Die Textspalten einer Tontafel werden mittels column
erfasst.
column
wird mittels @n
eine Nummer zugewiesen. Es ist möglich, column
eine @xml:id
und/oder xml:base
zuzuweisen.
column
darf line
, note
, tei:damage
sowie metamark
enthalten.
Zeilen
Part
Seg
G
Ein Zeichen oder eine Glyphe wird mittels g
erfasst.
g
kann eine @xml:id
sowie ein @ana
zugewiesen werden. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das g
mit @cert="high"
spezifiziert, wenn nicht dann mit @cert="low"
. Der Default-Wert ist "high".
Das Zeichen beziehungsweise die Glyphe wird als Unicode-Zeichen im textlichen Inhalt von g
erfasst.
Vokalisation und Übersetzung
phr
w
Einzelne Wörter werden mittels w
erfasst.
w
kann eine @xml:id
, ein @ana
, ein @corresp
sowie ein @lemma
zugewiesen werden. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das w
mit @cert="high"
spezifiziert, wenn nicht, dann mit @cert="low"
. Der Default-Wert ist "high".
w
darf m
, lb
, die Elemente zur Beschreibung der Transkription sowie Text enthalten.
m
Translation
Die Übersetzung wird mittels translation
erfasst.
Mit dem Attribut @xml:lang
wird die Sprache der Übersetzung angegeben. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass dies die richtige Übersetzung ist. Wenn ja, wird das translation
mit @cert="high"
spezifiziert, wenn nicht, dann mit @cert="low"
. Der Default-Wert ist "high".
translation
darf pc
, phr
, w
, lb
, die Elemente zur Beschreibung der Transkription, hi
sowie Text enthalten.
Elemente zur Beschreibung der Transkription
tei:choice
tei:sic
tei:sic
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:corr
tei:corr
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:reg
tei:reg
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:orig
tei:orig
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:add
tei:add
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:del
tei:del
zeigt an, dass an dieser Stelle der Text gelöscht/durchgestrichen worden ist.
Mittels @next
und @prev
kann angegeben werden, dass auch (das) folgende/vorhergehende Zeichen gelöscht wurde. Dazu wird auf die @xml:id
des vorhergehenden/folgenden tei:del
verwiesen (mit #).
tei:del
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung werden runde Klammern um den Inhalt von tei:del
gesetzt.
Wenn mittels @prev
auf ein vorhergehendes tei:del
verwiesen wird, wird keine öffnende runde Klammer vor den Inhalt von tei:del
gesetzt.
Wenn mittels @next
auf ein folgendes tei:del
verwiesen wird, wird keine schließende runde Klammer nach den Inhalt von tei:del
gesetzt.
tei:unclear
Wenn nicht klar ist, ob ein Zeichen tatsächlich existiert, wird dieses Zeichen in tei:unclear
erfasst.
tei:unclear
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung müssen runde Klammern um den Inhalt von tei:unclear
eingefügt werden.
tei:damage
tei:damage
zeigt an, dass an dieser Stelle der Text beschädigt ist.
Mittels @unit
wird spezifiziert, ob ein oder mehrere Zeichen (character
) oder Zeilen (line
) beschädigt sind.
Wenn @unit="line"
, wird mittels @atLeast
(Mindestanzahl) und @atMost
(Maximalanzahl) die Anzahl der beschädigten Zeilen angegeben.
Wenn @unit="character"
, werden die einzelnen Zeichen mittels pc@type="non_identifiable_sign_single"
bzw. pc@type="non_identifiable_sign_multi"
erfasst.
Mittels @next
und @prev
kann angegeben werden, dass auch (das) folgende/vorhergehende Zeichen beschädigt sind. Dazu wird auf die @xml:id
des vorhergehenden/folgenden tei:damage
verwiesen (mit #).
tei:damage
darf pc
, phr
, w
, g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung werden eckige Klammern um den Inhalt von tei:damage
gesetzt.
Wenn mittels @prev
auf ein vorhergehendes tei:damage
verwiesen wird, wird keine öffnende eckige Klammer vor den Inhalt von tei:damage
gesetzt.
Wenn mittels @next
auf ein folgendes tei:damage
verwiesen wird, wird keine schließende eckige Klammer nach den Inhalt von tei:damage
gesetzt.
tei:restore
tei:restore
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:supplied
tei:supplied
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:surplus
tei:surplus
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:secl
tei:secl
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:mod
tei:mod
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:redo
tei:redo
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:retrace
tei:retrace
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:undo
tei:undo
darf g
, pc
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.