Aufbau von CODA

Ein Überblick über das Datenmodell und die zentralen Konzepte von CODA

Präludium

Bevor du in die Datenbank eintauchst, empfehlen wir dir, dich kurz mit der Struktur der Datenbank sowie einigen Bezeichnungen vertraut zu machen. Hier ist anzumerken, dass CODA auf der Software fylr aufgebaut ist und einige Begriffe aus dem Kosmos von fylr auch für die Beschreibung von CODA übernommen wurden. Auf dieser Seite findest du daher einen Überblick über die wichtigsten Grundbegriffe für das Zurechtfinden in CODA. Weitere Begriffe sind im Glossar aufgeführt.

Metadaten & Datenmodell

CODA ist eine Datenbank für Universitätssammlungen und sammlungsbezogene Forschungsprojekte. Das heißt, sie versucht, Wissen zu Sammlungsobjekten in Datensätzen abzubilden. Grob gesagt sollte am Ende ein Sammlungsobjekt in einem (Objekt-)Datensatz beschrieben werden. Bei Sammlungsobjekten handelt es sich klassischerweise um physisch existierende Objekte, aber es könnten auch original virtuelle Objekte sein, die ursprünglich als Dateien erstellt wurden. Ein Objektdatensatz besteht dann aus Informationen wie zum Beispiel dem Namen des Objektes, seinen Maßen oder seinem Herstellungsort (oder bei virtuellen Objekten aus der Dateigröße, etc.). Das sind die Metadaten.

Metadaten sind strukturierte Informationen, die Aussagen über die Merkmale von Objekten oder Ressourcen wie Bildern, Videos etc. treffen. Im Fall von CODA sind damit hauptsächlich (aber nicht nur) die Informationen gemeint, die zu den Sammlungsobjekten vorliegen bzw. erschlossen werden. Metadaten lassen sich in unterschiedliche Kategorien einteilen: So gibt es zum Beispiel deskriptive Metadaten (zu äußerlichen oder inhaltlichen Merkmalen eines Objekts wie Maße, Material, oder abgebildete Orte), administrative Metadaten (etwa der Aufbewahrungsort) oder Metadaten zur Herkunft (mit Provenienzmerkmalen).

Natürlich ist eine Definition notwendig, wie so ein Datensatz aussehen soll, damit klar ist, welche Informationen er enthalten kann. Diese Definition ist im Datenmodell enthalten.

In einem Datenmodell lassen sich verschiedene Typen von Datensätzen definieren. Wenn ein Typ von Datensatz erstmal definiert ist, können zum Beispiel die verfügbaren Metadaten zu einem bestimmten physischen Sammlungsobjekt in einem einzelnen Datensatz dieses Typs gespeichert werden. Wenn ein Datensatztyp so definiert ist, dass sich Bücher darin eintragen lassen, dann könnte ein solcher Datensatz Metadaten zu Autor*in, Titel, Verlag etc. enthalten.

So ein Datensatztyp bestimmt also die Gesamtheit der Metadaten, die in einem Datensatz erfasst werden können. Alle Typen von Datensätzen und ihre Relationen untereinander werden dann als Datenmodell bezeichnet. Beispielsweise kann es einen Datensatztyp geben, in dem Sammlungsobjekte gespeichert werden können, aber auch einen Typ, in dem Informationen zu geographischen Angaben, zum Beispiel Frankfurt am Main, gespeichert werden. Wenn man dann für alle Objekte einer Sammlung angeben will, dass ihr Aufbewahrungsort Frankfurt am Main ist, dann kann man dort einfach eine Referenz zum entsprechenden Ortsdatensatz setzen, statt jedes Mal den Ortsnamen einzutippen. (So ein Aufbau hat noch andere Vorteile, siehe dazu den Abschnitt Datenqualität.)

In CODA heißen solche Typen von Datensätzen “Objekttypen”. Welche Objekttypen es gibt, erfahrt ihr im nächsten Abschnitt.

Objekttypen

Alle Datensätze, die in CODA ablegt sind, werden einem bestimmten Objekttyp zugeordnet. Somit entsprechen Objekttypen den oben beschriebenen Typen von Datensätzen und sind gewissermaßen Kategorisierungen der Datensätze. Alle Objekttypen verfügen dabei über eine individuelle Definition (auch Relationenschema genannt), die jeweils einen eigenen Satz an Metadaten erlaubt. Die Objekttypen in CODA lassen sich unterteilen in Haupt- und Neben-Objekttypen, wobei Letztere meist als Listen bezeichnet werden.

Hinweis: Die Objekttypen sind ein Begriff aus der fylr-Software und sollten nicht mit dem Feld bzw. der CODA-Liste “Objektart” verwechselt werden! Letztere beziehen sich auf die Beschaffenheit eines CODA-“Objekts”.

Haupt-Objekttypen

Haupt-Objekttypen sind die zentralen Entitäten der Datenbank. Sie werden in der Rechercheansicht angezeigt und lassen sich bei einer Suche über das Ressourcenmenü filtern (siehe dazu Recherchieren und Studieren mit CODA). Zum jetzigen Stand (Oktober 2024) können in CODA die folgenden Haupt-Objekttypen angelegt werden:

Objekte: Objekte in CODA spiegeln größtenteils die Bestände einer Sammlung wieder, etwa die dort physisch vorhandenen Gegenstände, fotografische Aufnahmen, aber auch Lebewesen wie Pflanzen. Ein realer Sammlungsgegenstand kann also ein entsprechendes CODA-Objekt bekommen. Darüber hinaus lassen sich als Objekt in CODA auch abstrakte oder nicht mehr existente Gegenstände speichern (etwa eine Vase, von der nun nur noch Scherben vorliegen).
Digitalisate: Digitale Repräsentationen von (Sammlungs-)Gegenständen, zum Beispiel in Form von Bildern, Audio-Dateien, PDF-Dokumenten etc.
Konvolute: Ein Konvolut ist im Sammlungsalltag eine Menge von (Sammlungs-)Gegenständen, die durch verschiedene Eigenschaften miteinander verbunden sind - bspw. stammen sie alle aus dem Nachlass einer Person oder aus derselben Forschungsexpedition - und daher zusammen aufbewahrt werden. Konvolute in CODA sind dementsprechend einzelne Datensätze, die eine solche Menge an realen Gegenständen beschreiben.

Was kommt denn wo rein?!

Nicht immer ist es leicht, zwischen den verschiedenen Haupt-Objekttypen zu trennen, gerade dann, wenn es sich um Medien oder um nur digital existierende Objekte handelt. Als Orientierung kannst du vielleicht heranziehen: Alle Gegenstände, die etwa mittels einer Inventarnummer, als einzelne Sammlungsobjekte gekenntzeichnet sind, sollten als Objekte gespeichert werden. Wenn es sich dagegen um rein ergänzende Ressourcen zu derartigen Gegenständen handelt, dann sind diese eher bei den Digitalisaten unterzubringen.

Listen (Neben-Objekttypen)

Listen bieten die Möglichkeit, bestimmte Informationen, die für (Haupt-)Objekte benötigt werden, strukturiert und einheitlich zu sammeln. Sie können dabei eine ähnliche Funktion erfüllen wie kontrollierte Vokabulare (siehe den Wikipedia-Eintrag zu kontrollierten Vokabularen). Listen in CODA sind also letztendlich Sammlungen von standardisierten Begriffen, die für Datensätze von Objekten oder Digitalisaten verwendet werden können. Listeneinträge bestehen allerdings nicht nur aus den Begriffen selbst, sondern enthalten zudem häufig Referenzen zu Normdaten wie etwa aus GND, GeoNames oder WikiData (siehe auch den Abschnitt Normdaten auf der Seite zu Datenqualität). Sie ersparen es somit, ständig die gleichen Informationen erneut einzugeben und schaffen Eindeutigkeit: Angenommen, ein Sammlungsobjekt wird in der Stadt “York” aufbewahrt, dann kann man im Hauptobjekt-Datensatz auf den Eintrag “York” in der Ortsliste verweisen, der per Normdaten-Referenz eindeutig auf den Eintrag von “York” in der englischen Grafschaft New Yorkshire in WikiData verweist. So entsteht keine Verwirrung mit den zwanzig anderen Städten, die den gleichen Namen haben.

Keep your lists tidy!

Damit die Verwendung von Listen sinnvoll funktioniert, sollten beim Erstellen von Listenelementen einige Dinge zur Sicherstellung der Qualität der Einträge sichergestellt werden. Außerdem ist eine gute Pflege der Listen erforderlich. Mehr dazu erfährst du auf der Seite zu Datenqualität.

Listen können flach oder hierarchisch sein. Einträge in hierarchischen Listen können ein übergeordnetes Element haben, bspw. hat “Deutschland” in der Ortsliste den übergeordneten Eintrag “Europa”. In flachen Listen (etwa in einer Personenliste) gibt es keine solche Hierarchie.

Wie du Listenobjekte selbst anlegen kannst, erfährst du auf der Seite “Listeneinträge anlegen”.

In CODA sieht das dann zum Beispiel so aus wie hier am Beispiel der Ortsliste:

Screenshot einer Ortsliste aus CODA, in der verschiedene geografische Angaben untereinander aufgelistet sind

Pools

Pools sind die Struktureinheiten in CODA, in denen ähnlich wie einem “Ordner” Datensätze abgelegt werden. Ein Pool kann dabei sämtliche Haupt-Objekttypen gemischt enthalten, auch einige der Listen (Personen, Referenzen und Quellen) werden Pools zugeordnet. Die Datensätze innerhalb eines Pools unterliegen einem gemeinsamen Rechtemanagement, über das sich Sichtbarkeit oder Bearbeitungsrechte der Datensätze steuern lassen. Genau wie bei Hauptobjekttypen kann man bei einer Suche auch nach Pools filtern (siehe dazu Recherchieren und Studieren mit CODA).

Generell sind die Pools in CODA den einzelnen Sammlungen bzw. Projekten zugeordnet, für die jeweils eine Person als Poolverantwortliche*r agiert. Die Aufgaben der Poolverantwortlichen sind hier festgehalten: (TODO: Link). Innerhalb dieser Pools können Unter-Pools angelegt werden, etwa zur Gliederung von Beständen oder für Teilsammlungen. Die genaue Ausgestaltung bleibt dabei den Poolverantwortlichen überlassen.

Der Zusammenhang zwischen den verschiedenen Strukturen in CODA (Listen, Objekttypen und Pools) lässt sich in groben Zügen so veranschaulichen:

Schaubild über das Verhältnis von Listen, Objekttypen und Pools in CODA. Die Objekttypen wie Objekte oder Digitalisate sind Pools zugeordnet, während ihre Metadaten Listeneinträge, etwa aus einer Orstliste, referenzieren.

Masken

Masken sind das visuelle Layout der Metadaten zu einem Objekttyp. Im Datenmodell ist definiert, welche Felder ein Objekttyp hat, aber welche Felder letztlich wie in der Nutzeroberfläche angezeigt werden, wird durch die Masken bestimmt. Eine Maske bringt die Metadaten-Felder in eine bestimmte Reihenfolge und strukturiert sie in Reiter oder andere grafische Einheiten. Die Metadaten, die ein Datensatz enthält, werden dann im Editor und der Detailansicht (siehe die Seite zu Datensätze betrachten) nach den Bestimmungen der Maske angezeigt.

Und eine Maske muss nicht alle Metadaten aus einem Datensatz enthalten, sodass sich durch die Freigabe der Masken regulieren lässt, wer welche Informationen einsehen kann. Das ist möglich, weil man Masken mit bestimmten Pools verknüpfen kann. So können dann beispielsweise interne Anmerkungen oder Verwendungshinweise zu einem Objekt für externe Nutzende ausgeblendet werden. Zu manchen Objekttypen existieren daher mehrere Masken mit unterschiedlichem Umfang an Metadaten-Feldern.

Weiterführende Informationen

Im Reiter Ressourcen findest du den Feldkatalog, ein Glossar, und weitere Dinge rund um CODA.
Im DOLCE-Kurs, der auf den Moodle-Seiten der Goethe Universität angeboten wird, findest du auch einen Abschnitt zu den hier behandelten Themen:
- Objekttypen (DOLCE/Datenbank 101/Datensätze darstellen)
- Listen (DOLCE/Datenbank 101/Listen)
- Tags (DOLCE/Datenbank 101/Metadaten&Datenmodell)
- Metadaten (DOLCE/Datenbank 101/Metadaten&Datenmodell)
- Pools (DOLCE/Datenbank 101/Datensätze darstellen)

Zuletzt geändert 03.03.2025