Forschung
ParlaMint, ein CLARIN Flaggschiff-Projekt, mündete in die Erstellung vergleichbarer Parlamentskorpora aus 29 Ländern bzw. autonomen Regionen. Die Korpora decken zumindest den Zeitraum von 2015 bis 2022 ab (einige Korpora decken einen weiteren Zeitraum ab, darunter auch das österreichische Subcorpus) und beinhalten über 1 Milliarde Token. Die Korpora sind einheitlich kodiert, enthalten umfangreiche Metadaten über ihre 24 Tausend Sprecher und sind darüber hinaus bis auf die Ebene der Syntax universeller Abhängigkeiten und Eigennamen (NE) linguistisch annotiert.
Die Rolle des ACDH-CH bestand in der Erstellung des Österreichischen Subcorpus (ParlaMint-AT) bestehend aus den Österreichischen Parlamentsprotokollen und deren Annotation. Das ParlaMint-AT Korpus umfasst die Parlamentsprotokolle von 1996 bis 2022. Die gesamten Daten sind hier als Download verfügbar https://www.clarin.si/repository/xmlui/handle/11356/1859 oder können online über Korpusmanagementwerkzeuge der CLARIN.si Infrastruktur abgefragt werden.
Maciej Ogrodniczuk, Polnische Akademie der Wissenschaften | Institute of Computer Science
CLARIN
01/2022–09/2023
Diese Website verwendet Cookies. Sie gewährleisten wesentliche Funktionalitäten der Website und ermöglichen uns, Inhalte laufend zu optimieren. Helfen Sie uns dabei, indem Sie der Erhebung statistischer Daten und der Darstellung externer multimedialer Inhalte zustimmen. Die Zustimmung ist jederzeit widerrufbar. Weitere Informationen finden Sie in den Cookie-Einstellungen sowie in der Datenschutzerklärung.