Angabe der Größe einer Collection
Zur Angabe der Größe einer Collection gibt es das Feld „size“. Dieses wird (leider) sehr heterogen befüllt, wodurch großes Potential liegen bleibt. Dabei gibt es momentan grundsätzlich zwei unterschiedliche Eintragsarten. 1) Eine Größenangabe und eine Einheit (Bsp.: "240 Datensätze"). 2) Zwei oder mehrere Angaben (Bsp.: "112 communications, 112 transcriptions, 348292 words").
Eine Evaluierung aller aktuell verwendeter Angaben zeigt, dass man das im Grunde auf drei Felder aufteilen könnte/müsste:
- Anzahl der enthaltenen Objekte
- Längenangabe der in der Ressource enthaltenen Objekte, z.B. Token, Wörter etc.
- Angabe der Dateigröße der Sammlung (insgesamt)
Rules:
- mindestens eine Angabe muss gemacht werden
-
- und 2) können ein- oder mehrfach verwendet werden.
- eine Angabe besteht immer aus einer Einheit (Dokument, Artikel, Token, GB etc.) und einer Zahl, die zusammen gehören, aber in zwei Feldern gespeichert werden
Vokabular:
size_objects:
- Datensätze, Datensätze, Datensätze (wachsend)
- Teildatensätze
- Ressource(n), Ressourcen, Resource(s)
- Dokumente, documents
- Datei, Dateien
- Werke
- Bild, Bilder
- Zeitung, Zeitungen
- Texte, Text, texts
- Manuskripte, Handschriften
- Artikel, articles
- Hefte
- Interviews
- recordings
- transcriptions
- communications
- speakers
size_length:
- Wörter, words
- Token, token, Tokens, tokens
- Seiten
- sentences
- minutes
- hours
size_filesize:
- B
- Kilobyte, kB
- Megabyte, MB
- Gigabyte, GB
Example:
"größe_länge": [
{
"umfang": 151546685,
"typ": "Token"
}
],
"größe_objekte": [
{
"umfang": 1473,
"typ": "Dokumente"
}
],
"größe_ressource": [
{
"umfang": null,
"typ": null
}
],
Edited by Marius Hug