remove non-Ugarit-Unicode

Ziel ist es, dass in Transliteration und Vocalisation nur ugaritischer Text als Unicode-Zeichen erfasst wird. Das bedeutet, dass alle Siglen (Klammern, Ausrufe- und Fragezeichen, Punkte und X) über Elemente und Attribute erfasst werden und erst in der Konversion zu HTML bzw. durch CSS hinzugefügt werden.

Die letzten Siglen, die noch entfernt werden müssen sind die "X"-Zeichen für einzelne nicht identifizierbare Buchstaben und "..." für eine unbestimmte Anzahl nicht identifizierbarer Zeichen. Außerdem besteht noch das Problem bei gelöschten und beschädigten Zeichen (tei:del und tei:damage), dass wenn mehrere von diesen hintereinander stehen, eckige Klammern um alle beschädigten/gelöschten Zeichen gezogen werden sollten und nicht um jedes einzelne Zeichen.

To-Do's:

Elment für "X" einführen (pc typisieren?!) und als Kind von tei:damage und tei:del erlauben + Doku anpassen (auch für tei:damage)
Element für "..." einführen (pc typisieren?!) und als Kind von tei:damage und tei:del erlauben + Doku anpassen
Überlegung zum verhindern von Klammern zwischen zwei tei:damage oder zwei tei:del: Entweder über Attribute (next, prev?!) oder übers CSS regeln (könnte das Problem bedeuten, dass zwar die Zeichen, aber nicht die Elemente im HTML direkt hintereinander stehen).

Edited May 21, 2024 by Max-Ferdinand Zeterberg