zum Inhalt springen

Metadaten und OAI (Open Archive Initiative)

Metadaten

Da eine Volltextsuche den Inhalt einer Seite nur maschinell nach Zeichenketten absuchen kann, ist es für den menschlichen Sucher sehr hilfreich, wenn zusätzliche Angaben zu einem Dokument hinterlegt wurden. Dazu eignen sich Metadaten. Metadaten sind Daten über Daten, das heißt übergeordnete Informationen zu Dokumenten.

Metadaten geben Aufschluss über den Autor, den Lagerungsort, Schlagwörter oder das  Erscheinungsjahr des Artikels. Zusätzliche Informationen über ein Dokument kann auch die Dateiendung geben, die den Dateityp bezeichnet. An der Endung jpg, docx oder html kann zum Beispiel abgelesen werden, ob es sich um ein Bild, ein Textdokument oder eine Internetseite handelt. Für eine effektive wissenschaftliche Suche und qualitativ bessere Ergebnisse ist der Einsatz von Metadaten sehr sinnvoll.

Ein Standard, der sich international durchgesetzt hat, ist der Dublin Core Metadatenstandard. 1995 wurden auf einer Konferenz in Dublin/Ohio 15 Kernelemente für die Kategorisierung von Webressourcen festgelegt und nach dem Tagungsort Dublin Core metadata benannt. Diese Core Elements bieten zusätzliche Angaben zur Inhaltsbeschreibung, Autoren und Rechte, technischen Daten, Vernetzung und Lebenszyklus an. Schnittstellen, die in der Lage sind diese Metadaten auszulesen bzw. „abzuernten“, werden Metadatenharvester genannt. Ursprünglich wurde der Standard entwickelt, um Webseiten zu verschlagworten und nach Kategorien zu sortieren. Er wurde jedoch schnell von Bibliotheken und Archiven übernommen.

Standards, die vom W3C-Consortium empfohlen und nicht vorgeschrieben werden,  können nur funktionieren, wenn sie von möglichst vielen Anbietern verwendet werden. Ein Nachteil ist, dass eine solche Verschlagwortung von Dokumenten von qualifiziertem Fachpersonal durchgeführt werden muss und sehr aufwändig ist. Oft laufen Finanzierungen von Projekten aus und beenden damit die notwendige Verschlagwortung von Webseiten oder digitalen Projekten. An Verfahren, die eine automatische Vergabe von Metadaten ermöglichen, wird gearbeitet.

OAI (Open Archive Initiative)

Seitdem Universitäten Zugang zum Internet haben, versuchen Forscher Daten auszutauschen und digitale Publikationen zu vernetzten. In diesem Zusammenhang ist die Open Archive Initiative entstanden. An vielen Hochschulen wurden eigene Pre-Print-Server aufgebaut, auf denen Forschungspapiere, Thesenblätter und Dissertationen veröffentlicht werden konnten. Es wurde nach Standards gesucht für Formate, Metadaten, Datenaustausch- und Transportprotokollen. Die Open Archives Initiative hat das Protokoll OAI-PMH (Open Archives Initiative Protocol for Metadaten Harvesting) entwickelt. Es ist leichter anzuwenden als das bisher in den Bibliotheken verwendete Protokoll: Z 39.50. Dabei soll es dieses nicht ersetzen sondern zusätzlich angeboten werden. Es beschränkt sich auf weniger Metadaten, ist international einsetzbar und unterstützt nicht-textorientierte Datenformate. [1]

Eine Weiterentwicklung stellt das Protokoll OAI-ORE (Open Archives Initiative - Object Reuse and Exchange) dar. Mit ihm wird die Binnenstruktur eines Dokumentes beschrieben: Es zeichnet verschiedene Versionen, Formate und einzelne Teile sowie Verweise eines Dokumentes aus. Es werden inhaltliche Beziehungen zwischen Teilen eines Dokumentes hergestellt. Diese Binnenstruktur soll maschinell ausgelesen werden und in eine Ressourcen Map übertragen werden.
 

Anmerkungen

[1] Diann Rusch-Feja, Die Open Archives Initiative (OAI). Neue Zugangsformen zu wissenschaftlichen Arbeiten?, in: Bibliothek: Forschung und Praxis 25, Nr. 1, 2001, S. 291- 300. Online unter: http://www.b2i.de/fileadmin/dokumente/BFP_Bestand_2001/Jg_25-Nr_3/Jg_25-Nr_3_Aufsaetze/Jg_25-2001-Nr_3-S_291-300.pdf (25.09.2012), S. 291.

 

Links