Anforderungen an Daten

Anforderungen an Daten, die von Sammlungen bereitgestellt werden

Dies ist eine Übersicht über Dinge, die bei jeder Art von Import zu beachten sind. Anforderungen, die spezifisch für den CSV- oder JSON-Import sind, werden auf der jeweiligen Seite behandelt.

Im Reiter “Ressourcen” finden sich Tools, die bei der Aufbereitung von Daten für den Import helfen können.

Allgemein

Allgemein gilt für Daten für (Listen-)Objekte, die in tabellarischer Form vorliegen:

  • Jede Spalte sollte nur die Information beinhalten, die in CODA genau einem Feld zugeordnet wird. (Ausnahmen sind weiter unten gelistet.)
    • Falls beispielweise eine Datierung unsicher ist, dann sollte im Datumsfeld nicht “01.01.2000 (?)” o.ä. stehen. Stattdessen sollte eine neue Spalte für den Informationsstatus angelegt werden, sodass man dann “01.01.2000” und “Informationsstatus unsicher” o.ä. hat.
  • Werden im Datensatz Listenfelder aus CODA referenziert, muss die Schreibweise exakt dem Titel des Listeneintrags entsprechen, andernfalls kommt es zu einer Fehlermeldung beim Upload (etwa wenn in den zu importierenden Daten “Frankfurt” als Ort angegeben wird, aber der CODA-Listeneintrag eigentlich “Frankfurt am Main” heißt).
  • Spaltentitel sind frei wählbar, werden aber beim Import-Mapping automatisch erkannt, wenn es die internen Feldnamen von CODA sind. Siehe dazu auch das Upload-Template.

Datumsangaben

Datierungen können sowohl in deutscher (z.B. 26.05.2007) als auch amerikanischer Formatierung (2007-05-06) angegeben werden. Datumsbereiche müssen auf zwei Spalten aufgeteilt werden, die Start- bzw. Ende des Datumsbereichs enthalten. CODA unterstützt auch die automatische Umwandlung von Textangaben in Datumsbereiche: So wird die Angabe “19. Jahrhundert” automatisch in 1801 bis 1900 umgerechnet.

Mehr Informationen zur Formatierung von Datumsangaben sind der easyDB-Dokumentation des CSV-Imports zu entnehmen.

Personendaten

Siehe die Formatierungsrichtlinien für die Liste “Personen” auf der Seite Datenqualität.

Normdaten einbinden

Die Angabe von Normdaten ist extrem wichtig, damit in Listen eine Standardisierung und Eindeutigkeit der Einträge möglich ist. Mehr Informationen dazu, was Normdaten sind und wofür sie wichtig sind, findest du hier.

Hinterlege (wenn möglich) zu jedem Listeneintrag einen Verweis auf Normdaten. Wenn es allerdings keine Normdaten zu einem Begriff gibt, dann ist das eben so.

Zur Aufbereitung von Normdatenverweisen für den CSV-Import siehe hier.

Listenhierarchie beachten

Viele der Listen in CODA sind hierarchisch strukturiert. Daher solltest du beim Ergänzen neuer Einträge stets die Zuordnung zu einem übergeordneten Begriff bedenken und vorab passende Überbegriffe auswählen bzw. anlegen. Es könnte bspw.Verwirrung stiften, wenn du in der Liste mit Objektarten den Eintrag “Klavier” auf der obersten Ebene anlegst, obwohl mit “Musikinstrument” ein passender Überbegriff vorhanden ist.

Nichtsdestotrotz kann es häufig schwierig sein, einen passenden Überbegriff zu finden: Etwa, wenn die Zuordnung vom Kontext der Verwendung abhängt (ein Messer kann bspw. Küchenutensil oder eine Jagdwaffe sein). Versuche dies ggf. in der Wahl der Bezeichnung für deinen Listeneintrag zu spezifizieren und passende Normdaten zu finden (etwa für Küchenmesser oder Jagdmesser). Im Zweifelsfall kannst du dich daran orientieren, wie die Begriffe in bestehenden kontrollierten Vokabularen strukturiert sind (auch wenn diese nicht immer gut und verständlich sind).

Hierarchische Listen kann man auf mehrere Arten für den Import aufbereiten, aber wir empfehlen hier die Variante, bei der man eine Spalte mit dem Namen des Eintrags hat und ein Spalte mit dem Namen des übergeordneten Eintrags (“parent”).

id parent name
1 Deutschland
2 Deutschland Brandenburg
3 Brandenburg Potsdam

In jedem Fall solltest du die Daten möglichst einheitlich und nach Hierarchieebene geordnet organisieren.

Andere Möglichkeiten der Formatierung von Hierarchien sind in der offiziellen Dokumentation beschrieben: Englisch (fylr-Doku), Deutsch (alte easyDB-Doku).

Duplikate

Überprüfe die zu importierenden Daten immer auf Duplikate. Bei Objekten sollte das ohnehin kein Problem sein (wegen Sammlungskürzel und Inventarnummer), aber bei Listen kann das schonmal vorkommen. Siehe hierzu den Umgang mit doppelten Listeneinträgen.

Mehrsprachige Bezeichnungen verwenden

Stelle für alle Listeneinträge und möglichst alle Hauptobjekttypen sowohl eine deutsche als auch eine englische Bezeichnung zur Verfügung. Insbesondere bei Listeneinträgen ist das sehr wichtig, da diese häufig ein wichtiger Filter bei der Recherche sind. Damit wird die internationale Nutzbarkeit von CODA erweitert.

Zuletzt geändert 07.03.2025