remove non-Ugarit-Unicode
Ziel ist es, dass in Transliteration und Vocalisation nur ugaritischer Text als Unicode-Zeichen erfasst wird. Das bedeutet, dass alle Siglen (Klammern, Ausrufe- und Fragezeichen, Punkte und X) über Elemente und Attribute erfasst werden und erst in der Konversion zu HTML bzw. durch CSS hinzugefügt werden.
Die letzten Siglen, die noch entfernt werden müssen sind die "X"-Zeichen für einzelne nicht identifizierbare Buchstaben und "..." für eine unbestimmte Anzahl nicht identifizierbarer Zeichen. Außerdem besteht noch das Problem bei gelöschten und beschädigten Zeichen (tei:del
und tei:damage
), dass wenn mehrere von diesen hintereinander stehen, eckige Klammern um alle beschädigten/gelöschten Zeichen gezogen werden sollten und nicht um jedes einzelne Zeichen.
To-Do's:
-
Elment für "X" einführen ( pc
typisieren?!) und als Kind vontei:damage
undtei:del
erlauben + Doku anpassen (auch fürtei:damage
) -
Element für "..." einführen ( pc
typisieren?!) und als Kind vontei:damage
undtei:del
erlauben + Doku anpassen -
Überlegung zum verhindern von Klammern zwischen zwei tei:damage
oder zweitei:del
: Entweder über Attribute (next
,prev
?!) oder übers CSS regeln (könnte das Problem bedeuten, dass zwar die Zeichen, aber nicht die Elemente im HTML direkt hintereinander stehen).