Angabe der Größe einer Collection

Zur Angabe der Größe einer Collection gibt es das Feld „size“. Dieses wird (leider) sehr heterogen befüllt, wodurch großes Potential liegen bleibt. Dabei gibt es momentan grundsätzlich zwei unterschiedliche Eintragsarten. 1) Eine Größenangabe und eine Einheit (Bsp.: "240 Datensätze"). 2) Zwei oder mehrere Angaben (Bsp.: "112 communications, 112 transcriptions, 348292 words").

Eine Evaluierung aller aktuell verwendeter Angaben zeigt, dass man das im Grunde auf drei Felder aufteilen könnte/müsste:

  1. Anzahl der enthaltenen Objekte
  2. Längenangabe der in der Ressource enthaltenen Objekte, z.B. Token, Wörter etc.
  3. Angabe der Dateigröße der Sammlung (insgesamt)

Rules:

  • mindestens eine Angabe muss gemacht werden
    1. und 2) können ein- oder mehrfach verwendet werden.
  • eine Angabe besteht immer aus einer Einheit (Dokument, Artikel, Token, GB etc.) und einer Zahl, die zusammen gehören, aber in zwei Feldern gespeichert werden

Vokabular:

size_objects:

  • Datensätze, Datensätze, Datensätze (wachsend)
  • Teildatensätze
  • Ressource(n), Ressourcen, Resource(s)
  • Dokumente, documents
  • Datei, Dateien
  • Werke
  • Bild, Bilder
  • Zeitung, Zeitungen
  • Texte, Text, texts
  • Manuskripte, Handschriften
  • Artikel, articles
  • Hefte
  • Interviews
  • recordings
  • transcriptions
  • communications
  • speakers

size_length:

  • Wörter, words
  • Token, token, Tokens, tokens
  • Seiten
  • sentences
  • minutes
  • hours

size_filesize:

  • B
  • Kilobyte, kB
  • Megabyte, MB
  • Gigabyte, GB

Example:

"größe_länge": [
      {
        "umfang": 151546685,
        "typ": "Token"
      }
    ],
"größe_objekte": [
      {
        "umfang": 1473,
        "typ": "Dokumente"
      }
    ],
 "größe_ressource": [
      {
        "umfang": null,
        "typ": null
      }
    ],
Edited by Marius Hug
To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information