ParlaMint, ein CLARIN Flaggschiff-Projekt, mündete in die Erstellung vergleichbarer Parlamentskorpora aus 29 Ländern bzw. autonomen Regionen. Die Korpora decken zumindest den Zeitraum von 2015 bis 2022 ab (einige Korpora decken einen weiteren Zeitraum ab, darunter auch das österreichische Subcorpus) und beinhalten über 1 Milliarde Token. Die Korpora sind einheitlich kodiert, enthalten umfangreiche Metadaten über ihre 24 Tausend Sprecher und sind darüber hinaus bis auf die Ebene der Syntax universeller Abhängigkeiten und Eigennamen (NE) linguistisch annotiert.

Die Rolle des ACDH-CH bestand in der Erstellung des Österreichischen Subcorpus (ParlaMint-AT) bestehend aus den Österreichischen Parlamentsprotokollen und deren Annotation. Das ParlaMint-AT Subcorpus umfasst die Parlamentsprotokolle von 1996 bis 2022.
Die gesamten Daten sind hier als Download verfügbar https://www.clarin.si/repository/xmlui/handle/11356/1859 oder können online über Korpusmanagementwerkzeuge der CLARIN.si Infrastruktur abgefragt werden.


Publications

  • Wissik, Tanja, and Hannes Pirker. 2018. ParlAT beta Corpus of Austrian Parliamentary Records. Darja Fišer, Eskevich, Maria, and de Jong, Franciska. LREC2018 Workshop ParlaCLARIN: Creating and Using Parliamentary Corpora In Proceedings of the Eleventh International Conference on Language Resources and Evaluation LREC2018. Miyazaki: European Language Resources Association.
Projektleitung

Tanja Wissik

 

Kontakt (ACDH-CH)

Tanja Wissik

Hannes Pirker

 

Finanzierung

CLARIN

 

Projektlaufzeit

01/2022–09/2023

 

Links

ParlaMint Website