Bei vielen Importen von Daten, sind wir mit Orten wie „Berlin ?“ und Zeiten wie „ca. 1328“ konfrontiert. Das Import-Tool von museum-digital kann schon seit längerer Zeit mit solchen Angaben umgehen: „Berlin ?“ heißt, nach Lesart von museum-digital: „Berlin“, aber die Ortsangabe im Ereignis ist ungewiss.
Ähnlich verhält es sich bei Zeiten, die sehr verschieden Eingegeben werden können. Die übliche „Basis“-Schreibweise für Zeiten in der Datenbanktabelle für Zeiten ist das deutsche TT.MM.JJJJ, aber häufig werden Zeiten wie „15. Januar 1920“ eingegeben oder importiert. In vielen Fällen lassen sich diese automatisch in die normalisierte Form umwandeln – was wir im Vokabularkontroll-Tool (nodac) schon länger tun.
Beide Funktionalitäten, das automatische Erkennen von Ungewissheit aus dem Import-Tool und das Normalisieren von Zeit-Angaben aus nodac, haben wir im Zuge einiger sehr großer Importe (dazu später vielleicht mehr) überarbeitet und in ein eigenes Modul verschoben, sodass wir sie auch ins eigentliche Eingabetool musdb einbauen konnten.
Erkennen von Ungewissheit und Zeiten in musdb
musdb kann also jetzt Ungewissheit auf Basis von Listen von bekannten Indikatoren erkennen. Bei Zeiten sind das beispielsweise „um „, „wohl um „, „circa „, „ca. “ oder „ca “ am Beginn des eingegebenen Zeitnamens und „(?)“ oder „?“ am Ende der Eingabe. Wird einer dieser Indikatoren erkannt, wird er aus dem Zeitnamen gelöscht und die Angabe als unsicher gespeichert. Analog funktioniert es bei Akteurs- und Ortsangaben.
Besonders bei Zeiten ist, dass diese, so erkennbar, auch automatisch normalisiert werden können. Deutsche und ungarische Zeitgaben von einzelnen Tagen (15. Januar 1920) oder Monaten (Januar 1920) können so ausgelesen werden.
Einher mit der Normalisierung geht in vielen Fällen auch eine automatische Übersetzung. Dies ist besonders wichtig für Zeit-Angaben vor 1000 n. Chr., bei denen wo möglich eine automatische Angabe dazu gemacht wird, ob die Zeit vor oder nach Christus ist. Bisher ist dies für Zeitspannen implementiert. „312 – 315“ wird automatisch zu „312-315 n. Chr“ in Deutsch umgewandelt und in „312-315 CE“ auf English und „西暦312年から315年“ in Japanisch übersetzt.
Leichteres Massen-Veröffentlichen und Verstecken von Objekten
Eine kleine Erweiterung an anderer Stelle, ist, dass die Objektauswahl jetzt zur Veröffentlichung oder zum Verstecken von Objekten genutzt werden kann.