Wo publiziere ich meine Daten?
27 October 2021
Torsten Bronger
Zentralbibliothek, Forschungszentrum Jülich
Mitglied der Helmholtz-Gemeinschaft
Torsten Bronger
Zentralbibliothek, Forschungszentrum Jülich
Für beides ist es nahezu egal, wo man veröffentlicht. Nicht jedoch für die folgenden Ziele:
⇒ Auffindbarkeit und Nachnutzbarkeit maximieren!
Mitglied der Helmholtz-Gemeinschaft
Aus den Leitlinien für Forschungsdaten des FZJ (https://go.fzj.de/datenpolicy):
„Forschungsdaten sollten unmittelbar nach ihrer Erstverwertung […] durch die für sie verantwortlichen Wissenschaftler öffentlich zugänglich gemacht werden, sofern dem keine erheblichen Gründe entgegenstehen.“
Was ist die Erstverwertung?
→ Typischerweise eine Textpublikation (oder eine Serie von Textpublikationen) in einer Fachzeitschrift, die auf diesen Daten basiert. Umfang und Dauer der Erstverwertung kann in einem DMP festgelegt werden.
Mitglied der Helmholtz-Gemeinschaft
Rohdaten
Metadaten
Mitglied der Helmholtz-Gemeinschaft
Ein Datensatz ist veröffentlicht, wenn die Metadaten in einem Repositorium, das Zugriff für mindestens 10 Jahre garantiert, per PID (typischerweise DOI) weltweit abrufbar sind.
Insbesondere heißt „veröffentlichen“ nicht zwangsläufig, daß die Rohdaten weltweit abrufbar sind. Ein möglicher Weg für andere Forscher ist:
Mitglied der Helmholtz-Gemeinschaft
Normalerweise werden Roh- und Metadaten an derselben Stelle veröffentlicht. Es kann aber gute Gründe geben, das nicht zu machen:
Ganz generell sollte man hinterfragen, warum Rohdaten überhaupt durch kopieren auf ein Repositorium verdoppelt werden sollen.
Mitglied der Helmholtz-Gemeinschaft
Findable
Accessible
Interoperable
Reusable
Mitglied der Helmholtz-Gemeinschaft
Kategorien der Wege einer Datenveröffentlichung:
Mitglied der Helmholtz-Gemeinschaft
Meine Einschätzung: Das wird meist nicht der Plan A sein.
Mitglied der Helmholtz-Gemeinschaft
Datenbanken, in denen Objekte archiviert, dokumentiert und publiziert werden können.
Ein Repositorium ermöglicht es,
Mitglied der Helmholtz-Gemeinschaft
Repositorien lassen sich gliedern in
Mitglied der Helmholtz-Gemeinschaft
⇒ Verwenden Sie es, wenn es eines für Sie gibt!
Beispiel: PANGAEA
Mitglied der Helmholtz-Gemeinschaft
Beispiel für ein öffentliches generisches Repositorium: Zenodo.
Mitglied der Helmholtz-Gemeinschaft
Empfehlung: Suchen auf dem Repositorien-Verzeichnis re3data. Das enthält mehrere Tausend Repositorien.
Gute Filtermöglichkeiten, zum Beispiel nach
Mitglied der Helmholtz-Gemeinschaft
Per Web-Formular: Hochladen der Daten über einen Internetbrowser, Beschreibung per Metadatenformular
→ Geeignet für das gelegentliche Hochladen von kleinen und mittleren Datenmengen
Per REST-API: Automatisiertes Einspielen von Daten und Metadaten
→ Geeignet für häufiges Hochladen oder größere Datenmengen
Per Client-Software: Eigene Software zum Hochladen und Beschreiben der Daten
→ Sicherstellen des Uploads, Wiederaufnahme bei Unterbrechung, Überprüfung der Metadaten
Mitglied der Helmholtz-Gemeinschaft
In den letzten Jahren haben sich die meisten Forschungseinrichtungen ein eigenes Repositorium für Forschungsdaten zugelegt.
Diese machen fast die Hälfte aller DOI-vergebenden Repos aus.
Ob diese Zersiedlung und Verdoppelung von Diensten eine gute Idee war, mag bezweifelt werden …
Mitglied der Helmholtz-Gemeinschaft
In Jülich haben wir das nur zur Hälfte nachgemacht: Es gibt Jülich DATA, aber dient dient in erster Linie dem Nachweis des Jülicher Daten-Outputs (z.B. um darüber Statistiken oder Evaluationen zu machen) und ist in dieser Hinsicht die Schwester von JuSER.
Wir empfehlen daher dringend, da nur Metadaten hochzuladen, die dann auf die Rohdaten zeigen. Das Zeigen kann über eine URL erfolgen, einen Verzeichnispfad auf dem Institutslaufwerk, oder eine textuelle Beschreibung. Es muß also nicht automatisch auflösen!
Technisch kann man allerdings auch Rohdaten hochladen. Die Gesamtkapazität ist bei Jülich DATA mit 10 TB regelrecht winzig.
Mitglied der Helmholtz-Gemeinschaft
Mitglied der Helmholtz-Gemeinschaft
Vorschlag für das Jülicher Repo-Modell:
Mitglied der Helmholtz-Gemeinschaft
Mitglied der Helmholtz-Gemeinschaft