This is a read only archive of pad.okfn.org. See the shutdown announcement for details.

Infocamp15_Session3_Raum1 Infocamp 2015
Session 3, Raum 1
Thema: Kontextualisierung von Daten
Teilnehmende: Silvio Gruber, Niklaus Stettler, Michele Merzaghi, Bruno Wenk, Andreas Stegmeier, Silvia Abegglen, Philipp Kuntschik, Bettina Flütsch, Simone Plüss


Klärung: Was ist mit Kontextualisierung von Daten gemeint? Welchen Kontext brauchen Daten?

Wie kann der Kontext in der aktiven Phase dokumentiert werden?

Problematik: Schemata sind vielleicht vorhanden aber Personal, das die Daten einpflegt ist nicht ausreichend geschult / wird unsorgfältig.


Können Metadaten in Dokument mit Daten integriert werden (entweder ausgewiesen oder in einem Container) analog der SIP

Gewisse Metadaten können auch im Datum selbst enthalten werden (Erstellungsdatum) zusätzlich können gewisse Metadaten selbst schnell zu Daten werden.

Quellenkritik und Methode der Erfassung sollte optimalerweise vom Produzenten bereitgestellt werden.

Sollte ein Zwang zu (vollständigen) Angaben von Metadaten bestehen? Manuelle Eingabe teilweise sehr aufwändig -> Motivation sinkt mit Detaillierungsgrad , Grund für Nachnutzung nicht vorhersehbar


Möglichkeit: Mehrere Ebenen -> Beschreibung der "Tabelle", bei den einzelnen "Daten" nur die Unterschiede

Spezifische Ablagen mit spezifischen Angaben mit Directory (nicht Repository) wäre nützlich. 


Prozess in Unternehmen

Unternehmen: Records entstehen durch Tätigkeiten in einem länger dauernden Prozess (von unterschiedlichen Personen erstellt), die Daten werden nur bei Notwendigkeit zusammengezogen

Konzept des Datenbanksystem (Dokumentation) ist ein wesentliches Element für die Metadaten erfassung (optimalerweise automatisert)
Problem vor allem bei Freitextfeldern, die von verschiedenen Personen ausgefüllt werden können (Bsp. Titel für Dokument / Geschäft / Projekt)
Bedürfnis, dass das System gewisse Vorgaben enthält (nicht nur klassisch als analoges festes Regelwerk)

Klar ist, das Dokumentation bei Daten gemacht werden sollen. Frage wie und wieso (Grund)?

3 Use Cases: Validität, Auffindbarkeit, Nutzung (Vergleichbarkeit, beötigt maximalen Hintergrund)


Frage: Was ist in 50 - 100 Jahren relevant? Ist es noch nutzbar?

System der Methadaten muss erweiterbar sein.


Gibt es Metadaten Standards? 

Konsenz: Metadaten sind Notwendig und es gibt grundsätzlich Möglichkeiten diese zu erfassen und auszuweisen

Wie praktisch umsetzbar:
    

Wieso erst jetzt: 
    

Idee: keine "Datenbanken" Dokumente werden "flach" gelagert (allf. in Standardformat, bsp. RDF) und können so maschinell (als Text) durchsucht werden. Entsprechende Formatierung (mit entsprechender Auszeichnung) nötig.

Problem: Missbrauch -> (absichtlich) falsche Auszeichnungen ausserhalb der sichtbaren Darstellung


Schwierigstes Metadatum: Methode
Ansatz: Auszeichnung der Metadaten mit Fokus auf Anwendung (allf. Möglichkeit zur Erweiterung)

Beispiel Astronomie: Lange Zeit festes Metadatenschema
Mit veränderung der Methoden / Möglichkeiten änderen sich die Anforderungen an Metadaten.

-> Spezifikation des Systems zentraler Punkt (auch für eine Nachnutzung der Daten) / allenfalls nachträgliche Dokumentation per Screenshots des System


Wann werden die Metadaten wichtig?

Es ist wichtig nicht nur die Langfristige Nutzung im Fokus zu behalten, sondern vor allem auch die kurz und mittelfristige Nutzung.


Fazit: Metadaten sind in erster Linie Community abhängig und sollten in Hinblick auf deren Bedürfnisse definiert und angewandt werden.