EUPT XML
(Vorerst beinhaltet diese Readme die Anfänge einer Dokumentation des Schemas)
Schemadokumentation
Metadaten
Lizenz
Lizenzangaben werden mittels tei:availability/tei:licence
erfasst. In tei:licence
wird als textlicher Inhalt der offizielle Name der Lizenz angegeben. Mit dem Attribut @target
wird der URI zur ausführlichen Definition der Lizenzbestimmungen angegeben.
Beispiel:
<tei:availability>
<tei:licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC-BY-SA-4.0</tei:licence>
</tei:availability>
Dies entspricht den Empfehlungen der KIM-Gruppe Lizenzen.
HTML-Serialisierung
Die Lizenzangaben werden im Metadatenpanel angegeben.
Daten
Hervorhebungen
Hervorhebungen werden mittels hi
erfasst. Die Art der Hervorhebung wird mittels @rend
definiert. Mögliche Werte für @rend
sind:
-
bold
: Fett -
italics
: Kursiv (Default) -
sub
: Tiefgestellt -
super
: Hochgestellt -
under
: Unterstrichen
Beispiel
In der Abfolge der Erzählsequenzen <hi rend="bold">Angebot</hi> - <hi rend="under">Ablehnung des Angebots</hi> - <hi>Äußerung des eigentlichen Wunsches</hi> erhält Kirtus tatsächliches Anliegen nämlich besonderes Gewicht:
HTML-Serialisierung
Darstellung des Textes entsprechend des Werts von @rend
.
Kommentare
Kommentare werden mittels note
erfasst. Mittels @target
können Kommentare auf verschiedene Elemente verweisen (bspw. seg
, g
, part
, phr
, w
).
Kommentare können einen oder mehrere Typen zugewiesen werden. Hierfür wird das Attribut @type
genutzt. Erlaubte Werte sind:
- "con": Inhalt
- "gr": Grammatik
- "lx": Lexik
- "poet": Poetologie
Kommentare können mehrere Absätze enthalten. Dann muss der Inhalt des note
ausschließlich aus p
bestehen (das note
darf also keinen textlichen Inhalt haben).
Alternativ kann das note
in beliebiger Reihenfolge eine beliebige Anzahl an ana
, hi
, quote
, ref
, textBlock
, bibl
und Text enthalten.
Absätze
Ugaritische Textblöcke
Ugaritischer Text außerhalb der Transliteration und Vokalisation wird mittels textBlock
erfasst.
textBlock
darf eine beliebige Anzahl Elemente aus einer der folgenden Elementgruppen enthalten:
column
-
line
undtei:damage
-
part
,seg
,g
,lb
sowie die Elemente zur Beschreibung der Transkription -
pc
,phr
,w
,lb
sowie die Elemente zur Beschreibung der Transkription
Beispiel
<textBlock><tei:supplied>D</tei:supplied> <segg>ṮDṮ</seg></textBlock>
HTML-Serialisierung
Der ugaritische Text soll genauso dargestellt werden wie in der Transliteration und in der Vokalisation .
Zitate
Zitate werden mittels quote
erfasst.
quote
darf in beliebiger Reihenfolge eine beliebige Anzahl an ana
, hi
, quote
, ref
, bibl
, pc
, phr
, w
, lb
, Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung werden Anführungszeichen vor und nach dem Zitat eingefügt.
Literaturverweise
Verweise
Ana
Linebeginning
pc
metamark
Transliteration
Kolumns
Die Textspalten einer Tontafel werden mittels column
erfasst.
column
wird mittels @n
eine Nummer zugewiesen. Es ist möglich, column
eine @xml:id
und/oder xml:base
zuzuweisen.
column
darf line
, note
, tei:damage
sowie metamark
enthalten.
Zeilen
Part
Seg
G
Ein Zeichen oder eine Glyphe wird mittels g
erfasst.
g
kann eine @xml:id
sowie ein @ana
zugewiesen werden. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das g
mit @cert="high"
spezifiziert, wenn nicht dann mit @cert="low"
. Der Default-Wert ist "high".
Das Zeichen beziehungsweise die Glyphe wird als Unicode-Zeichen im textlichen Inhalt von g
erfasst.
Vokalisation und Übersetzung
phr
w
Einzelne Wörter werden mittels w
erfasst.
w
kann eine @xml:id
, ein @ana
, ein @corresp
sowie ein @lemma
zugewiesen werden. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das w
mit @cert="high"
spezifiziert, wenn nicht, dann mit @cert="low"
. Der Default-Wert ist "high".
w
darf m
, lb
, die Elemente zur Beschreibung der Transkription sowie Text enthalten.
m
Translation
Die Übersetzung wird mittels translation
erfasst.
Mit dem Attribut @xml:lang
wird die Sprache der Übersetzung angegeben. Mittels @cert
kann angegeben werden, ob man sich sicher ist, dass dies die richtige Übersetzung ist. Wenn ja, wird das translation
mit @cert="high"
spezifiziert, wenn nicht, dann mit @cert="low"
. Der Default-Wert ist "high".
translation
darf pc
, phr
, w
, lb
, die Elemente zur Beschreibung der Transkription, hi
sowie Text enthalten.
Elemente zur Beschreibung der Transkription
tei:choice
tei:sic
tei:sic
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:corr
tei:corr
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:reg
tei:reg
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:orig
tei:orig
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:add
tei:add
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:del
tei:del
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:unclear
Wenn nicht klar ist, ob ein Zeichen tatsächlich existiert, wird dieses Zeichen in tei:unclear
erfasst.
tei:unclear
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung müssen runde Klammern um den Inhalt von tei:unclear
eingefügt werden.
tei:damage
tei:damage
zeigt an, dass an dieser Stelle der Text beschädigt ist.
Mittels @unit
wird spezifiziert, ob ein oder mehrere Zeichen (character
) oder Zeilen (line
) beschädigt sind. Die Anzahl der Zeichen bzw. Zeilen wird mittels @atLeast
(Mindestanzahl) und @atMost
(Maximalanzahl) angegeben.
tei:damage
darf pc
, phr
, w
, g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
HTML-Serialisierung
In der HTML-Serialisierung werden eckige Klammern um den Inhalt von tei:damage
gesetzt.
tei:restore
tei:restore
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:supplied
tei:supplied
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:surplus
tei:surplus
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:secl
tei:secl
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:mod
tei:mod
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:redo
tei:redo
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:retrace
tei:retrace
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.
tei:undo
tei:undo
darf g
, part
, seg
, lb
, die Elemente zur Beschreibung der Transkription und Text enthalten.