This is a read only archive of pad.okfn.org. See the shutdown announcement for details.

Infocamp15_Session1_Raum1 Infocamp 2015
Session 1, Raum 1
Thema: Data Life Cycle Management
    
Teilnehmende: Andreas Steigmeier, Eliane Blumer, Nicolas Prongué, Simone Plüss, Bettina Flütsch, Marco Zollinger, Michele Merzaghi, Mara Hellstern, Elena Mastrandrea, Silvio Gruber

Fragestellungen:
    
    - Ist der Life Cycle von strukturierten und unstrukturierten Daten der selbe? 3 Phasen  (aktiv, semi-aktiv, Archiv)?
    Ist es nicht der Life Cycle von Dokumenten gegenüber strukturierten Daten? 
    
    
- Muss bei strukturierten Daten die Struktur mit etrahiert werden?
- Muss Programm mit archiviert werden? (Können Daten in 10-20 Jahren noch gelesen werden)
- Wie glaubwürdig sind Daten? Wie wird Qualität dokumentiert?
- Teilweise schwierig: Bsp. Adressen (veraltet, unvollständig, Doppel)

- es gibt Systeme mit Logfiles, zum Teil gibt es Schemen, die Überprüfung unterstützen (Bsp. AHV Nr.)

- Erfahrung: Manuelle Kontrolle oft für Qualitätssicherung nötig (oft bei speziellen Ereignissen)

Qualitätsprobleme können durch menschliche Fehler (falsche Eingabe) oder automatismen (Migration), externe Faktoren (Kunden ziehen um)


These: Daten sind immer falsch. Der Grad richtet sich nach den Grund der Nutzung.

Einteilung in statische und dynamische Daten. Erreichen dynamische Daten je die 2. und 3. Phase?

Was geschieht bei Systemumstellungen: Wird altes System übergangsweise weiter verwendet? Migriert? 

Szenarien:
    - Buchhaltungsdaten... nach dem aktiven Jahr?
    - Kundendaten (z.B. in einer Bank).... nach der Migration in ein neues System?
    - Einwohnerkontrolle der Stadt Baden (digitale Stadtarchiv): 18'000 Einwöhner in der Tat, 80'000 Einträge in der Datenbank... sollen alle Einträge in die neue Datenbank migriert werden?
    - Fusion von 5 Banken... wie werden die Datensystemen  zusammengeführt?

Mögliche Fälle: 
    - Snapshots von Datenbanken
    - altes System wird bei Datenübergabe abgestellt
    - Dokumentation wird auf pdf archiviert, teilweise gar ausgedruckt so archiviert
    - altes System läuft noch ein Weilchen zu Konsultationszwecken (semi-aktive Phase)
    - Emulation auf lange Frist Beispiel von Emulation as a service:  http://bw-fla.uni-freiburg.de/  
    - keine Phase drei
    - keine Phase zwei und drei, weil immer direkt wieder aktiv, durch neues System
    Test für eine Anmerkung

Archivierungsformat : SIARD http://www.bar.admin.ch/dienstleistungen/00823/01911/index.html?lang=de 
Die wichtigsten Metadaten sind die Logfiles, speziell im Kontext der Qualitätssicherung

Definition von Statischen und dynamische Daten?  (Analogie zu Stammdaten und Bewegungsdaten? Stammdaten = können verändert werden, kommt aber selten vor)
Schritt von Phase 1 zu Phase 2 ist wichtig und wird tendenziell eher bei unstrukturierten Daten berücksichtigt.


Wie werden strukturierte Daten aus der 3. Phase nutzbar gemacht? Wie hoch ist der Aufwand (tendenziell viel höher als bei unstrukturierten Daten)? 
Gibt es Vergleiche bei der Länge des Life Cycles? 

Life Cycle von Systemen wenn Firma nicht mehr existiert:

Geschäftsrelevanteysteme werden grundsätzlich nicht ohne Nachfolger abgestellt.

Fusion Banken: Migration der Daten, altes System Read only nach Nützlichkeit.
Bei Konkurs: Über gesetzliche Aufbewahrungspflicht hinaus, lohnt sich die Aufbewahrung?

   Grundsatz: Viele strukturierte Daten werden nie in Phase 3 überführt. -> Aufwändig, fehlende Notwendigkeit / Nutzen
   
   
   Fragen zum Datenschutz: 
       
       Überlegungen zu Datenschutz und Öffentlchkeitsprinzip müssen berücksichtigt werden (Zugriffsberechtigungen)
       Überwiegende Mehrheit der Datensammlungen enthalten Dokumente, die Datenschutzrichtlinien unterliegen.
       
http://www.swissuniversities.ch/fileadmin/swissuniversities/Dokumente/EN/UH/SUK_P-2/Abstract_DLCM.pdf