A blog on museum-digital and the broader digitization of museum work.

Bei vielen Importen von Daten, sind wir mit Orten wie „Berlin ?“ und Zeiten wie „ca. 1328“ konfrontiert. Das Import-Tool von museum-digital kann schon seit längerer Zeit mit solchen Angaben umgehen: „Berlin ?“ heißt, nach Lesart von museum-digital: „Berlin“, aber die Ortsangabe im Ereignis ist ungewiss.

Ähnlich verhält es sich bei Zeiten, die sehr verschieden Eingegeben werden können. Die übliche „Basis“-Schreibweise für Zeiten in der Datenbanktabelle für Zeiten ist das deutsche TT.MM.JJJJ, aber häufig werden Zeiten wie „15. Januar 1920“ eingegeben oder importiert. In vielen Fällen lassen sich diese automatisch in die normalisierte Form umwandeln – was wir im Vokabularkontroll-Tool (nodac) schon länger tun.

Beide Funktionalitäten, das automatische Erkennen von Ungewissheit aus dem Import-Tool und das Normalisieren von Zeit-Angaben aus nodac, haben wir im Zuge einiger sehr großer Importe (dazu später vielleicht mehr) überarbeitet und in ein eigenes Modul verschoben, sodass wir sie auch ins eigentliche Eingabetool musdb einbauen konnten.

Erkennen von Ungewissheit und Zeiten in musdb

musdb kann also jetzt Ungewissheit auf Basis von Listen von bekannten Indikatoren erkennen. Bei Zeiten sind das beispielsweise „um „, „wohl um „, „circa „, „ca. “ oder „ca “ am Beginn des eingegebenen Zeitnamens und „(?)“ oder „?“ am Ende der Eingabe. Wird einer dieser Indikatoren erkannt, wird er aus dem Zeitnamen gelöscht und die Angabe als unsicher gespeichert. Analog funktioniert es bei Akteurs- und Ortsangaben.

Eingabe einer Ortsangabe mit Indikator für Unsicherheit.
Ist einer der Indikatoren für Unsicherheit Teil der Ortsangabe, werden Orte als ungewiss erkannt.

Besonders bei Zeiten ist, dass diese, so erkennbar, auch automatisch normalisiert werden können. Deutsche und ungarische Zeitgaben von einzelnen Tagen (15. Januar 1920) oder Monaten (Januar 1920) können so ausgelesen werden.

Eingabe einer ungewissen Zeit in normalisierbarer Form.
Screenshot: Zeiten werden normalisiert und als ungewiss erkannt, wo nötig und möglich.

Einher mit der Normalisierung geht in vielen Fällen auch eine automatische Übersetzung. Dies ist besonders wichtig für Zeit-Angaben vor 1000 n. Chr., bei denen wo möglich eine automatische Angabe dazu gemacht wird, ob die Zeit vor oder nach Christus ist. Bisher ist dies für Zeitspannen implementiert. „312 – 315“ wird automatisch zu „312-315 n. Chr“ in Deutsch umgewandelt und in „312-315 CE“ auf English und „西暦312年から315年“ in Japanisch übersetzt.

Leichteres Massen-Veröffentlichen und Verstecken von Objekten

Eine kleine Erweiterung an anderer Stelle, ist, dass die Objektauswahl jetzt zur Veröffentlichung oder zum Verstecken von Objekten genutzt werden kann.

Veröffentlichen und verstecken über die Objektauswahl. Die Schalter für das Verstecken sind oben rechts rot eingerahmt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert