README.md

# EUPT XML

(Vorerst beinhaltet diese Readme die Anfänge einer Dokumentation des Schemas)

## Schemadokumentation

### Metadaten

#### Lizenz
Lizenzangaben werden mittels `tei:availability/tei:licence` erfasst. In `tei:licence` wird als textlicher Inhalt der offizielle Name der Lizenz angegeben. Mit dem Attribut `@target` wird der URI zur ausführlichen Definition der Lizenzbestimmungen angegeben.

##### Beispiel:
```
<tei:availability>
    <tei:licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC-BY-SA-4.0</tei:licence>
</tei:availability>
```

Dies entspricht den [Empfehlungen der KIM-Gruppe Lizenzen](https://wiki.dnb.de/pages/viewpage.action?pageId=217533672).

##### HTML-Serialisierung
Die Lizenzangaben werden im Metadatenpanel angegeben.

### Daten

#### Hervorhebungen
Hervorhebungen werden mittels `hi` erfasst. Die Art der Hervorhebung wird mittels `@rend` definiert. Mögliche Werte für `@rend` sind:

- `bold`: Fett
- `italics`: Kursiv (Default)
- `sub`: Tiefgestellt
- `super`: Hochgestellt
- `under`: Unterstrichen

##### Beispiel
```
In der Abfolge der Erzählsequenzen <hi rend="bold">Angebot</hi> - <hi rend="under">Ablehnung des Angebots</hi> - <hi>Äußerung des eigentlichen Wunsches</hi> erhält Kirtus tatsächliches Anliegen nämlich besonderes Gewicht:
```

##### HTML-Serialisierung
Darstellung des Textes entsprechend des Werts von `@rend`.

#### Kommentare
Kommentare werden mittels `note` erfasst. Mittels `@target` können Kommentare auf verschiedene Elemente verweisen (bspw. `seg`, `g`, `part`, `phr`, `w`).

Kommentare können einen oder mehrere Typen zugewiesen werden. Hierfür wird das Attribut `@type` genutzt. Erlaubte Werte sind:

  - "con": Inhalt
  - "gr": Grammatik
  - "lx": Lexik
  - "poet": Poetologie

Kommentare können mehrere Absätze enthalten. Dann muss der Inhalt des `note` ausschließlich aus [`p`](#absätze) bestehen (das `note` darf also keinen textlichen Inhalt haben).

Alternativ kann das `note` in beliebiger Reihenfolge eine beliebige Anzahl an [`ana`](#ana), [`hi`](#hervorhebungen), [`quote`](#zitate), [`ref`](#verweise), [`textBlock`](#ugaritische-textblöcke), [`bibl`](#literaturverweise) und Text enthalten.

#### Absätze

#### Ugaritische Textblöcke
Ugaritischer Text außerhalb der [Transliteration](#transliteration) und [Vokalisation](#vokalisation-und-übersetzung) wird mittels `textBlock` erfasst.

`textBlock` darf eine beliebige Anzahl Elemente aus einer der folgenden Elementgruppen enthalten:

- [`column`](#kolumns)
- [`line`](#zeilen) und [`tei:damage`](#damage)
- [`part`](#part), [`seg`](#seg), [`g`](#g), [`lb`](#linebeginning) sowie die [Elemente zur Beschreibung der Transkription](#elemente-zur-beschreibung-der-transkription)
- [`pc`](#pc), [`phr`](#phr), [`w`](#w), [`lb`](#linebeginning) sowie die [Elemente zur Beschreibung der Transkription](#elemente-zur-beschreibung-der-transkription)

##### Beispiel
```
<textBlock><tei:supplied>D</tei:supplied> <segg>ṮDṮ</seg></textBlock>
```

##### HTML-Serialisierung
Der ugaritische Text soll genauso dargestellt werden wie in der [Transliteration](#transliteration) und in der [Vokalisation](#vokalisation-und-übersetzung) .

#### Zitate
Zitate werden mittels `quote` erfasst.

`quote` darf in beliebiger Reihenfolge eine beliebige Anzahl an [`ana`](#ana), [`hi`](#hervorhebungen), [`quote`](#zitate), [`ref`](#verweise), [`textBlock`](#ugaritische-textblöcke), [`bibl`](#literaturverweise) und Text enthalten.

##### HTML-Serialisierung
In der HTML-Serialisierung werden Anführungszeichen vor und nach dem Zitat eingefügt.

#### Literaturverweise

#### Verweise

#### Ana

#### Linebeginning

#### pc

#### metamark

### Transliteration

#### Kolumns

Die Textspalten einer Tontafel werden mittels `column` erfasst.

`column` wird mittels `@n` eine Nummer zugewiesen. Es ist möglich, `column` eine `@xml:id` und/oder `xml:base` zuzuweisen.

`column` darf [`line`](#zeilen), [`note`](#kommentare), [`tei:damage`](#teidamage) sowie [`metamark`](#metamark) enthalten.

#### Zeilen

#### Part

#### Seg

#### G
Ein Zeichen oder eine Glyphe wird mittels `g` erfasst.

`g` kann eine `@xml:id` sowie ein `@ana` zugewiesen werden. Mittels `@cert` kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das `g` mit `@cert="high"` spezifiziert, wenn nicht dann mit `@cert="low"`. Der Default-Wert ist "high".

Das Zeichen beziehungsweise die Glyphe wird als Unicode-Zeichen im textlichen Inhalt von `g` erfasst.

### Vokalisation und Übersetzung

#### phr

#### w
Einzelne Wörter werden mittels `w` erfasst.

`w` kann eine `@xml:id`, ein `@ana`, ein `@corresp` sowie ein `@lemma` zugewiesen werden. Mittels `@cert` kann angegeben werden, ob man sich sicher ist, dass an dieser Stelle tatsächlich das erfasste Zeichen steht. Wenn ja, wird das `w` mit `@cert="high"` spezifiziert, wenn nicht, dann mit `@cert="low"`. Der Default-Wert ist "high".

`w` darf [`m`](#m), [`lb`](#linebeginning), die [Elemente zur Beschreibung der Transkription](#elemente-zur-beschreibung-der-transkription) sowie Text enthalten.

#### m

#### Translation
Die Übersetzung wird mittels `translation` erfasst.

Mit dem Attribut `@xml:lang` wird die Sprache der Übersetzung angegeben. Mittels `@cert` kann angegeben werden, ob man sich sicher ist, dass dies die richtige Übersetzung ist. Wenn ja, wird das `translation` mit `@cert="high"` spezifiziert, wenn nicht, dann mit `@cert="low"`. Der Default-Wert ist "high".

`translation` darf [`pc`](#pc), [`phr`](#phr), [`w`](#w), [`lb`](#linebeginning), die [Elemente zur Beschreibung der Transkription](#elemente-zur-beschreibung-der-transkription), [`hi`](#hervorhebungen) sowie Text enthalten.

### Elemente zur Beschreibung der Transkription

#### tei:choice

#### tei:sic

`tei:sic` darf `g` und Text enthalten.

#### tei:corr

`tei:corr` darf `g` und Text enthalten.

#### tei:reg

`tei:reg` darf `g` und Text enthalten.

#### tei:orig

`tei:orig` darf `g` und Text enthalten.

#### tei:add

`tei:add` darf `g` und Text enthalten.

#### tei:del

`tei:del` darf `g` und Text enthalten.

#### tei:unclear
Wenn nicht klar ist, ob ein Zeichen tatsächlich existiert, wird dieses Zeichen in `tei:unclear` erfasst.

`tei:unclear` darf `g` und Text enthalten.

##### HTML-Serialisierung
In der HTML-Serialisierung müssen runde Klammern um den Inhalt von `tei:unclear` eingefügt werden.

#### tei:damage

`tei:damage` zeigt an, dass an dieser Stelle der Text beschädigt ist.

Mittels `@unit` wird spezifiziert, ob ein oder mehrere Zeichen (`character`) oder Zeilen (`line`) beschädigt sind. Die Anzahl der Zeichen bzw. Zeilen wird mittels `@atLeast` (Mindestanzahl) und `@atMost` (Maximalanzahl) angegeben.

`tei:damage` darf `g` und Text enthalten.

##### HTML-Serialisierung
In der HTML-Serialisierung werden eckige Klammern um den Inhalt von `tei:damage` gesetzt.

#### tei:restore

`tei:restore` darf `g` und Text enthalten.

#### tei:supplied

`tei:supplied` darf `g` und Text enthalten.

#### tei:surplus

`tei:surplus` darf `g` und Text enthalten.

#### tei:secl

`tei:secl` darf `g` und Text enthalten.

#### tei:mod

`tei:mod` darf `g` und Text enthalten.

#### tei:redo

`tei:redo` darf `g` und Text enthalten.

#### tei:retrace

`tei:retrace` darf `g` und Text enthalten.

#### tei:undo

`tei:undo` darf `g` und Text enthalten.