Große Textcorpora, wie beispielsweise das „Deutschen Textarchiv - DTA“, erfordern eine repräsentative Auswahl und systematische digitale Aufbereitung in internationaler Zusammenarbeit. Academiae Corpora (AC) der ÖAW ist an Großprojekten dieser Art beteiligt und fördert den wissenschaftlichen Austausch nicht zuletzt mit der Organisation von Vorträgen und Tagungen.
Auf Einladung des AC präsentiert die Corpuslinguistin an der Berlin-Brandenburgischen Akademie der Wissenschaften, Susanne Haaf, das Thema im Rahmen der Kooperation „Interoperable Daten im Historischen Korpus des Deutschen Textarchivs“. Dabei geht es darum, trotz der Heterogenität des Ausgangsmaterials, den übergreifenden Zugang zum Archiv zu sichern. Das DTA stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis 1900 bereit. Das elektronische Volltextcorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch computerlinguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar.
Anmeldung bei hanno.biber(at)oeaw.ac.at