Datenbanken
Das Anlegen einer eigenen Datenbank kann Ihnen bei verschiedenen Anwendungsfällen die Arbeit erleichtern: Datenbanken helfen bei Organisation und Strukturierung von Quellen, Literatur oder sonstigen Informationen und können auch neue Zugriffsperspektiven auf ihr Material eröffnen. Besonders dann, wenn Ihr Vorhaben die quantitative Auswertung eines festgelegten Quellenkorpus vorsieht, kann das Anlegen einer Datenbank die richtige Vorgehensweise sein. Unter einer Datenbank kann im weitesten Sinne jegliche systematische Strukturierung und Speicherung von Informationen verstanden werden. Dabei ist es üblich, dass die strukturierten Informationen unter Zuhilfenahme von Software abgefragt und sortiert werden können. Ob dafür „einfache“ Tabellenkalkulationsprogramme (Excel, Calc, Numbers) verwendet werden oder spezielle Programme, die für das Erstellen von Datenbanken entwickelt worden sind, ist bei der Erstellung relationaler Datenbanken, denen eine Tabellenstrukturzugrunde liegt, unerheblich.
Objektorientierte und dokumentenbasierte Datenbanken
Von dem hier vorgestellten Konzept relationaler Datenbanken, bei denen Daten in Tabellen gespeichert werden, die wiederum miteinander verbunden sein können, sind grundsätzlich solche Datenbanken zu unterscheiden, die auf anderen Datenmodellen aufbauen. Anders als relationale Datenbanken, verbinden objektorientierte Datenbanken, die Informationen in einem „Objekt“. Dabei werden z.B. alle Informationen zu einem Buch (AutorIn, Ort, HerausgeberIn…) in diesem „Objekt“ gespeichert und sind damit zusammen abrufbar. Relationale Datenbanken speichern diese Informationen jeweils in einzelne Tabellenspalten und -zeilen. Von relationalen Datenbanken ebenfalls zu unterscheiden, sind dokumentenbasierte Datenbanken. In ihnen werden keine Informationen anhand eines strikten Schemas in die Datenbank aufgenommen, sondern einzelne Dokumente unterschiedlichen Datentyps gespeichert und mit einem Kennzeichen versehen. Über diesen Indikator können die Dokumente angesteuert und mit Metadaten versehen werden.
Tabellenkalkulationsprogramm oder SQL-Datenbank:
- Mit Tabellenkalkulationsprogrammen können Sie keine unterschiedlichen Benutzerrollen und Zugriffseinschränkungen definiert werden. SQL-Datenbanken ermöglicht Ihnen dies hingegen
- Bei Tabellenkalkulationsprogrammen wird immer der komplette Datensatz geladen. Bei SQL-Datenbanken wird nur der Bereich geladen, der bearbeitet wird. Dies ist wichtig, wenn im Team mit unterschiedlichen Rollen gearbeitet wird.
- Und bei Tabellenkalkulationsprogrammen wie Excel sind die Daten bereits mit einer Formatierung verbunden sowie verschiedene Funktionen und Zugriffe vorkonfiguriert; bei SQL-Datenbanken muss ich Queries und Darstellung selbst einrichten.
Auf eine griffige Formel gebracht: Wenn Sie allein an einem Projekt arbeiten, und umfasst Ihre Tabelle weniger als 1 Million Zeilen und 16.000 Spalten, sollten Tabellenkalkulationsprogramme wie Excel ausreichen.
Beiden –, Tabellenkalkulationsprogramm und Datenbankanwendung – liegen die gleichen Denkmuster zugrunde. Sie unterschieden sich i.d.R. vorrangig im Umfang des zu bearbeitenden Quellenmaterials und hinsichtlich des Datenmodells. So kann es auch schon bei kleineren Projekten sinnvoll sein, die Daten in einem Tabellenkalkulationsprogramm als systematische Tabelle aufzunehmen. Selbst wenn keine quantitative Analyse geplant ist, können Sie mit Hilfe einer systematischen Aufnahme der zentralen Informationen und die Einordnung in von Ihnen definierte Kategorien leicht den Überblick über die wichtigsten Punkte Ihrer Quellenarbeit behalten. Dabei ist das Erstellen eines Datenmodells eine der zentralen Fähigkeiten , die Sie für die Arbeit mit Datenbanken benötigen. Das Datenmodell besteht nun aus den Kategorien, nach denen Sie die Informationen strukturieren, die Sie zur Beantwortung Ihrer Forschungsfrage benötigen.
An diesem Punkt gilt es eine wichtige Unterscheidung zu machen, die besonders für die historisch arbeitenden Wissenschaften zentral ist und die Arbeit mit Datenbanken entscheidend beeinflusst: Sie müssen sich nämlich fragen, zu welchem Zweck eine Datenbank angelegt und was genau sie abbilden soll. Konkret bedeutet das, dass Sie eine Entscheidung treffen müssen, ob Sie ein Datenmodell erstellen wollen, das versucht eine Quelle exakt wiederzugeben oder ob sie sich nur auf wenige Kategorien beziehen, die für Ihren konkreten Anwendungsfall relevant sind. Sie müssen sich also überlegen, welche Informationen aus Ihren Quellen Sie zur Beantwortung der Fragestellung benötigen und welche nicht. Diese Entscheidung beeinflusst die Planung und Durchführung eines Datenbankprojektes erheblich, da eine 1:1-Beschreibung der Quellen erheblich mehr Zeit benötigt, während das Begrenzen auf eine Forschungsfrage von Ihnen verlangt, das Datenmodell auf wenige zentrale Kategorien zu beschränken. Gerade hier liegt die Gefahr, erst auf halbem Weg zu bemerken, dass Ihnen wichtige Kategorien fehlen und Sie schon einmal bearbeitetes Quellenmaterial erneut durcharbeiten müssen. Auch deswegen ist es wichtig, dass Sie Ihre Überlegungen dokumentieren. So können Sie sicherstellen, dass Sie zu jedem Zeitpunkt Ihr eigenes Datenmodell nachvollziehen können und gleichzeitig anderen ForscherInnen ermöglichen, Ihre Gedankengänge nachverfolgen zu können.
Besonders zu Beginn Ihres Studiums werden sie kaum mit Forschungsfragen in Kontakt kommen, für die es notwendig ist, selbstständig eine strukturierte Datenbank anzulegen. Es kann sich dennoch lohnen, wenn Sie sich mit den Grundzügen dieser Methode vertraut machen. Das Denken in Modellen und Kategorien ist eine Fähigkeit, die trainiert werden muss. Da die Kategorisierung und Unterteilung der relevanten Informationen einer Quelle aber generell zum Arbeitsalltag von HistorikerInnen gehört, haben Sie schon durch die Aneignung „klassischer“ Methoden und Quellenarbeit einen guten Startpunkt, um sich diese Denkmuster anzueignen (die Fähigkeit effektiv zu kategorisieren wird auch bei Methoden wie Distant Reading benötigt).
Sollte das Anlegen einer Datenbank für Ihren konkreten Anwendungsfall in Frage kommen, beachten Sie zuerst, dass es sehr viel Zeit in Anspruch nehmen wird, eine Basis dafür zu schaffen, um Ihre Informationen/Daten in einer geeigneten Weise darstellen zu können. Wenn Sie sich einen kurzen Überblick darüber verschaffen möchten, welche Fragen Sie an sich und Ihr Quellenmaterial stellen können, können Sie sich dieses Flussdiagramm und die dazugehörige Handreichung anschauen. Einige der hier gefallenen Begriffe, werden dort anhand von Beispielen auch ein weiteres Mal erklärt.
Praxistipps:
- Bevor Sie in Erwägung ziehen, ein Datenbanksystem zu verwenden, machen Sie sich erst einmal mit den Möglichkeiten vertraut, die Ihnen die gängigsten Tabellenkalkulationsprogramme bieten
- Falls Sie sich näher mit Datenbanken beschäftigen möchten, schauen Sie sich das Angebot von nodegoat und die dazugehörigen Tutorials an
- Ein Beispiel einer mit nodegoat erstellten Datenbank können Sie sich hier ansehen: Repertorium Academicum Germanicum
- Gute Ressourcen finden Sie auch bei Programming Historian