A blog on museum-digital and the broader digitization of museum work.

In fünf Abschnitten berichten wir jetzt von unseren Erfahrungen rund um die Datenmigration in der Stiftung Moritzburg – ein etwas kniffliges Thema, weil dabei nicht alles zu 100% gut gelaufen ist. Umso mehr lohnt sich ein genauer Blick auf die neuralgischen Punkte und ein Erfahrungsbericht.

Dieser Bericht ist „gut abgehangen“: So können wir nicht nur mitteilen, was wir gemacht haben, sondern auch, ob es sich als hilfreich erwiesen hat. Ein weiterer Grund, warum wir nicht aus der Arbeit heraus oder direkt im Anschluss berichtet haben, ist, dass wir uns das Ergebnis zum Teil anders vorgestellt hatten und daher nicht rundum mit unserem Software-Partner zufrieden waren. Es spielte aber auch eine Rolle, dass wir unerfahren waren: Klar, wir haben uns eine Software gekauft, weil wir keine hatten.

Der ganze Prozess begann vor knapp drei Jahren mit der Auswahl und der Veranschlagung der für die Migration vorgesehenen Dateien/Datenbanken. Auswahlkkriterium Nr. 1 war inhaltlicher Gehalt und Nr. 2 die Anzahl der Datensätze in einer Datei.
Hat die Datei nur 4-5 Spalten, also Kategorien wie Inventarnummer, was ist es, wie heißt es, Maße und Künstler, ist das inhaltliche Gewicht vermutlich zu gering, um einen hochbezahlten Spezialisten daran zu setzen und eine Migration durchführen zu lassen. Wäre eine solche Datei allerdings viele tausend Datensätze stark, wäre dies schon wieder anders zu bewerten. Die bereits vorhandenen Informationen könnten eine Basis für eine Vertiefung sein.
Ein Mitarbeiter einer Software-Firma hat mir den Tipp gegeben, dass eine Datei ab 1.000 Datensätzen erst die Kosten lohnt. An diesem Rat haben wir uns orientiert. Im Nachhinein ist diese Information allerdings mit einem „aber“ zu versehen, denn muss man hinterher das Migrationsergebnis noch aufwändig bereinigen, lohnt sich vermutlich eine Neueingabe bzw. das copy & paste-Verfahren mehr. Man muss die Kosten für die Migration gegen die Kosten für das Personal abwägen. Wir haben bei der Bereinigung unserer Datensätze tatsächlich die Erfahrung gemacht, dass eine Bereinigung fast die Zeit einer Neueingabe in Anspruch nehmen kann. Dabei handelte es sich immerhin um eine „umfangreiche“, 70 Spalten starke Datei. Auf die genauen Gründe dafür komme ich anlässlich der Datenbereinigung, also einige Blogs später zurück.

Die Stiftung Moritzburg hat insgesamt sechs Dateien migrieren lassen:

1. eine Access-Datenbank zu rund 30.000 Geldscheinen (ohne Bilder)
2. eine Access-Datenbank zu 1.665 Münzen (ohne Bilder)
3. eine FileMaker-Datei zu 21.760 Photographien (ohne Bilder)
4. eine Excel-Datei mit rund 4.000 Adressen
5. eine Excel-Liste zu 1.350 Plakaten (ohne Bilder)
6. eine Datenbank mit 14.400 Datensätzen querbeet durch alle Sammlungen und Abteilungen der Moritzburg, mit je einem JPG-Bild.

gesamt rund 73.000

Diese Daten sind nicht etwa durch die Wissenschaftler der Abteilungen erstellt worden, sondern in zwei Fällen (Nr. 1 und 3) durch ehrenamtliche Spezialisten, denen hier und überhaupt für ihr Engagement nicht genug zu danken ist! Eine Datei ist durch eine museologisch ausgebildete Fach-Praktikantin erstellt worden (Nr. 5) und eine im Rahmen einer über mehrere Jahre laufenden AB-Maßnahme, während der vorhandene Erfassungen transkribiert und anlässlich von Buchprojekten entstandene Ektas von Objekten als TIFF gescannt wurden (Nr. 6). 

Die Kosten für eine Migration richten sich grundsätzlich nach der Anzahl der Spalten (nach rechts), während die Anzahl der Datensätze (nach unten) keine Rolle spielt. Unsere Dateien lagen in der Jahreswende 2011/2012 zwischen 410,- plus MWSt. (Excel-Adress- und Plakatdatei = ein halber Arbeitstag eines Software-Mitarbeiters zu 820,-) und 1.640,- plus MWSt. für die Migration der unter 6. genannten 70 Spalten umfassenden Datenbank. Es ist naheliegend, dass einfache und gängige Dateiformate wie Excel und Access weniger kosten als beispielsweise Daten, die aus einem proprietären System herausgeholt werden müssen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert