Der Aufgabenbereich gehört zu den vielfältigen Langzeitprojekt-Aktivitäten, die am ACDH-CH im Projektcluster Wörterbuch der historischen bairischen Mundartenin Österreich und Südtirol (WBÖ) gebündelt sind. Der Fokus des Aufgabenbereichs „WBÖ – Korpus & Infrastruktur” liegt auf den Prozessen der Datengenerierung (insbesondere in Form von Bild- und Volltextdigitalisierungen historischer analoger Daten), der Datenaufbereitung (primär in Form von Datenanreicherungen, Annotationen und Verlinkungen) sowie der Open-Access-Publikation aller Daten im Lexikalischen Informationssystem Österreich (LIÖ).

Das Herzstück bildet die sogenannte WBÖ-Belegdatenbank. Sie basiert auf den Handzetteln des WBÖ-Hauptkatalogs, der ab den 1910er-Jahren erstellt wurde. Der Großteil dieser Belegsammlung (ab der Buchstabenstrecke D) wurde in den 90ern und frühen 2000ern erstmals digital in TUSTEP erfasst und ab 2016 ins XML/TEI-Format überführt. Die Daten beinhalten in erster Linie Angaben zu Lemma, Bedeutung und Lautung sowie Herkunftsort und Sammler bzw. Sammlerin der Belege. Seit 2016 ist die Datenbank (ab Buchstabenstrecke D) über LIÖ zugänglich und damit für Forschungsfragen über die lexikographische Arbeit hinaus verfügbar. Die Daten werden sukzessive aufbereitet und mit Metadaten angereichert. Die Georeferenzierung ermöglicht die kartographische Projektion der Daten über das Kartierungstool in LIÖ.

Im Rahmen der Retrodigitalisierung der bereits gedruckten Bände (s. Aufgabenbereich “WBÖ – Lexikographie”) wird die dadurch aufgebaute XML-Datenbank zukünftig mit der WBÖ-Belegdatenbank verknüpft.

Seit 2017 wird der gesamte Hauptkatalog des WBÖ im Bildformat erfasst. Die Scans werden in der Handzettel-Datenbank gespeichert und mit den entsprechenden Einträgen in der WBÖ-Belegdatenbank verknüpft. In den kommenden Jahren erfolgt eine KI-gestützte Digitalisierung der Buchstabenstrecken A C, sodass zukünftig der komplette Handzettelbestand in der Belegdatenbank verfügbar sein wird. Darüber hinaus widmet sich der Aufgabenbereich der Anreicherung und Integration neuer Datenbestände, die im Rahmen weiterer WBÖ-Aktivitäten entstanden sind (z. B. Korpus österreichische Dialektaufnahmen im 20. Jahrhundert) oder weiter entstehen (z.B. Das ABC der Dialekte).

Die fortwährende Optimierung der Daten sowie deren Kuration für das hauseigene Repositorium ARCHE (A Resource Centre for the HumanitiEs) wird durch die Forschungseinheit DH Forschung und Infrastruktur (DHRI) unterstützt.

 

Zum Kernteam des Aufgabenbereichs gehören die folgenden Mitarbeiter:innen der Forschungseinheit Sprachwissenschaft: Angela Bergermayer, Hans Christian Breuer, Marlene Haslinger-Fenzl, Markus Kunzmann (CO-PI), Susanne Schmalwieser, Sonja Schwaiger und Philipp Stöckle (CO-PI). Der Aufgabenbereich arbeitet eng mit der Forschungseinheit DHRI zusammen, wobei hier insbesondere die texttechnologischen Experten Daniel Schopper (technischer Supervisor des Teilprojekts) und Omar Siam beteiligt sind.