Forschungsdatenmanagement in der ZB

Projekt und Vision

16 January 2019

Torsten Bronger

Zentralbibliothek, Forschungszentrum Jülich

Projekt

2

FDM-Dienste in der ZB

3

Repositorium: Workflow

4

Vision: Herausforderungen

5

Thesen

1.  Repositorien sind eine unnötige Fragmentierung der Forschungsdaten. Weg damit !

2.  Handle-basierte „Persistente IDs“ sind nicht persistent genug für FDM.

3.  Das Management von Rohdaten ist trivial. Metadaten sind die Herausforderung.

4.  Rohdaten zu bewegen, ohne daß sie am Ziel direkt nachgenutzt werden, ist Verschwendung.

5.  Eine Suchmaschine für Forschungsdaten über Freitextfelder kann man sich sparen.

6

Repositorien

— Frei nach xkcd.com/927.

7

Persistente Identifikatoren

Bislang ausschließlich Handle-System-basiert: DOI, ePIC, …

Zitat aus der Handle-Spezifikation (RFC 3650): „This of course does not guarantee persistence, which is a function of administrative care.“

“Administrative care”? Mal vergleichen:
Verlage Forschungsinstitutionen
durchorganisiert (jaja …) Quereinsteiger machen, was sie für gut halten; Dienste-Aufbau macht Spaß, Betrieb nicht
verdienen Geld mit der DOI-Auflösung kein harter Anreiz (Metadaten sind ja schon nachgewiesen)

⇒ Die Forschungscommunity muß erst noch beweisen, Handle-PIDs wirklich persistent machen zu können. Skepsis ist angebracht.

8

Publizierte Daten

Forscher publizieren Daten:

single toy in empty room

Original © Malcolm Lawson

Mit einem Datensatz allein kann man nichts anfagen. Also Botschaft an die Forscher: Fügt Metadaten hinzu! Schreibt eine Doku zu euren Daten! Beschreibt, was zu den Daten geführt hat!

Ergebnis:

9

Publizierte Daten

… und das ist nichtmal die Schuld der Forscher.

10

Rohdaten on the move

Ein Gedankenexperiment:

RWE hat einen Braunkohlebagger, der nicht mehr benötigt wird. Vielleicht wird er irgendwann mal woanders in Deutschland benötigt. Er parkt irgendwo und stört da auch nicht.

Genauso steht auch einer bei Lausitz Energie Bergbau in Sachsen und bei E.ON in Niedersachsen.

Für die perfekte Nachnutzung gründet man daraufhin bei Frankfurt ein Bagger-Repositorium und schickt die drei Bagger mit 0,3 km/h dahin.

11

Open Access – der falsche Weg

beware of the leopard sign

„Aber die Pläne lagen aus …“
„Lagen aus? Ich mußte schließlich zuerst in den Keller runter …“
[…]
„Aber die Bekanntmachung haben Sie doch gefunden, oder?“
„Jaja“, sagte Arthur, „ja, das habe ich. Ganz zuunterst, in einem verschlossenen Aktenschrank, in einem unbenutzten Klo, an dessen Tür stand: Vorsicht, bissiger Leopard!

Douglas Adams, Per Anhalter durch die Galaxis

Forschungsdaten suchen ist wie Geocaching: Man braucht Geduld und Übung, Abenteuer garantiert, und am Ende gibt’s meist nur Krimskrams. Die meisten versuchen es erst gar nicht.

12

Vision: Zutaten

13

Hashes

Schöne Online-Demo: OriginStamp

DNA 14

DHT

address book

Original © PSNS & IMF

15

Blockchain

Einziger Zweck: ein vertrauenswürdiger Eingangsstempel:

16

Blockchain

Im Briefumschlag können sein …

Und als Spezialfall:

Auch hier wieder: Kein Dienst nötig, keine Organisation

17

Provenance-Tracking

Domino pieces

Ein Forschungsergebnis ist eine Kausalkette: A₁ ⇒ A₂ ⇒ A₃ ⇒ A₄ … Alle „A“s sind dabei durch Daten repräsentiert, u. U. Freitext.

Provenance-Tracking ist die Dokumentation der Herkunft von Daten. Komplexere Ketten mit Abzweigen sind möglich. Standards und Werkzeuge dafür gibt es schon lange (für Simulationsforschung).

⇒ Forschung läßt sich maschinell lesbar mit Provenance-Tracking dokumentieren. Nachfolgende Forschung könnte direkt auf Teilschritte referenzieren.

18

Vision

19

Verteiltes Dateisystem

20

Verteiltes Dateisystem

Domino pieces 21

Linked Open Data

22

Indizierung von Forschungsdaten

Indizierung ist die entscheidende Voraussetzung für ein „Google für Forschungsdaten“.

Aber bitte nicht durch Google.

Label with search coins 23

Zusammenfassung

24

Thank you

Torsten Bronger

Zentralbibliothek, Forschungszentrum Jülich

Use the left and right arrow keys or click the left and right edges of the page to navigate between slides.
(Press 'H' or navigate to hide this message.)