ParlaMint, ein CLARIN Flaggschiff-Projekt, mündete in die Erstellung vergleichbarer Parlamentskorpora aus 29 Ländern bzw. autonomen Regionen. Die Korpora decken zumindest den Zeitraum von 2015 bis 2022 ab (einige Korpora decken einen weiteren Zeitraum ab, darunter auch das österreichische Subcorpus) und beinhalten über 1 Milliarde Token. Die Korpora sind einheitlich kodiert, enthalten umfangreiche Metadaten über ihre 24 Tausend Sprecher und sind darüber hinaus bis auf die Ebene der Syntax universeller Abhängigkeiten und Eigennamen (NE) linguistisch annotiert.
Die Rolle des ACDH-CH bestand in der Erstellung des Österreichischen Subcorpus (ParlaMint-AT) bestehend aus den Österreichischen Parlamentsprotokollen und deren Annotation. Das ParlaMint-AT Subcorpus umfasst die Parlamentsprotokolle von 1996 bis 2022.
Die gesamten Daten sind hier als Download verfügbar https://www.clarin.si/repository/xmlui/handle/11356/1859 oder können online über Korpusmanagementwerkzeuge der CLARIN.si Infrastruktur abgefragt werden.
CLARIN
01/2022–09/2023