Das im Rahmen des Spezialforschungsbereich (SFB) "Deutsch in Österreich" (FWF F60) entstandene Sprachkorpus umfasst mehr als 1000 Stunden gesprochene Sprache zur Variation der deutschen Sprache in Österreich. Zur Korpuserstelleung wurden mehr als 850 Gewährspersonen (aus unterschiedlichen Alters- und Berufsgrupen) aus allen Sprachräumen Österreichs in verschiedenen Erhebungssettings aufgenommen (v. a. Interview, Gespräch zwischen Freunden und Freundinnen, Sprachproduktionsexperimente, Lese- und Übersetzungsaufgaben, Vorleseaufgaben) eigens für das Korpus erhoben. Ein Großteil der Daten ist standardorthographisch oder nach GAT-II transkribiert und automatisiert mit PoS-Tags angereichert.

Das Korpus ist als relationale PostGreSQL-Datenbank aufbereitet. Die automatische Annotation wurde mit SpaCy durchgeführt. Alle Audiofiles liegen als .ogg-Dateien vor. 

SFB DiÖ

 

Datenrepositorium

GitHub