Netzwerkbasierte Ansätze spielen eine zunehmend wichtige Rolle bei der Analyse von Daten. Insbesondere in den Digital Humanities (DH) haben Netzwerkmodelle in den letzten Jahren an Bedeutung gewonnen, da immer mehr datenbasierte und datengetriebene Forschung betrieben wird und die Datenmengen zunehmen (z.B. Big Data). 

Das von go!digital NEXT GENERATION geförderte Projekt schlägt eine Brücke zwischen den Bereichen Linguistik, Digital Humanities und Informatik, um die diachrone Entwicklung lexikalischer Netzwerke auf der Grundlage großer authentischer Sprachdaten zu erforschen. Das Projekt wird Sprachdaten wiederverwenden, die bereits am ACDH-CH verfügbar sind, nämlich das Austrian Media Corpus (amc) und das Korpus der Österreichischen Parlamentsdaten (ParlAT). Das amc deckt die gesamte österreichische Medienlandschaft der letzten 20 Jahre ab und enthält 40 Millionen Texte (mehr als 10 Milliarden Token). 

Das ParlAT-Korpus umfasst die österreichischen Parlamentsakten der letzten 20 Jahre mit mehr als 75 Millionen Token. Aus linguistischer Sicht wird das Projekt die diachrone Entwicklung von lexikalischen Netzwerken untersuchen und netzwerkbasierte Methoden für die diachrone Linguistik diskutieren. Aus der Sicht der Informatik wird das Projekt die Netzwerktheorie auf eine große Menge diachroner linguistischer Daten anwenden und neue Methoden für die automatische Analyse und den Vergleich dieser Netze diskutieren. Weiters wird das Projekt eine Netzwerkvisualisierung für die Daten entwickeln und bereits bestehende Daten mit zusätzlichen Annotationen anreichern. 

Das Projekt, koordiniert von Tanja Wissik als PI, wird von einem interdisziplinären Team vom ACDH-CH, der Universität Wien und der TU Wien durchgeführt. 


Publications

  • Wissik, Tanja. 2022. Encoding interruptions in parliamentary data: from applause to interjections and laughter. In: Journal of the Text Encoding InitiativeIssue 14, p. k.A.
  • Yim, Seun-bin, Katharina Wünsche, Asil Cetin, Julia Neidhardt, Andreas Baumann, and Tanja Wissik. 2022. Visualizing Parliamentary Speeches as Networks: The DYLEN Tool. In: Fišer, Darja, Maria Eskevich, Jakob Lenardic, and Franciska de Jong (Eds.),Proceedings of the Proceedings of the LREC 2022 ParlaCLARIN III Workshop on Creating, Enriching and Using Parliamentary Corpora.
  • Marakasova, Anna, Klaus Hofmann, Andreas Baumann, Julia Neidhardt, and Tanja Wissik. 2021. Lexical convergence and divergence in Austrian parliamentary debates: a network-based approach. In: Proceedings of the 1st Workshop on Computational Linguistics for Political Text Analysis (CPSS-2021). Düsseldorf.
  • Hofmann, Klaus and Tanja Wissik. 2021. The role of interjections in Austrian parliamentary debates. In: Proceedings of the 1st Workshop on Computational Linguistics for Political Text Analysis (CPSS-2021). Düsseldorf.
  • Baumann, Andreas, Klaus Hofmann, Bettina Kern, Anna Marakasova, Julia Neidhardt, and Tanja Wissik. 2021. Exploring Causal Relationships Among Emotional and Topical Trajectories in Political Text Data. In: Gromann, Dagmar, Gilles Sérasset, Thierry Declerck, John P. McCrae, Jorge Gracia, Julia Bosque-Gil, Fernando Bobillo, and Barbara Heinisch (Eds.),3rd Conference on Language, Data and Knowledge. LDK 2021, September 1-3, 2021, Zaragoza, SpainOpenAccess Series in Informatics (OASIcs) 93. Dagstuhl: Schloss Dagstuhl -- Leibniz-Zentrum für Informatik, p. 38:1-38:8.
  • Kern, Bettina M. J., Klaus Hofmann, Andreas Baumann, and Tanja Wissik. 2021. Komparative Zeitreihenanalyse der lexikalischen Stabilität und Emotion in österreichischen Korpusdaten. In: Katsikadeli, Christina, Manfred Sellner, and Michael Gassner (Eds.),Digital Lexis and Beyond. Selected Papers from the Workshop „Digital Lexis, and Beyond”. 45th Austrian Linguistics Conference Dec. 2019, p. 104-118.
  • Olsen, Sussi, Bolette S. Pedersen, Tanja Wissik, Anna Woldrich, and Simon Krek. 2020. Stimulating Knowledge Exchange via Trans-National Access – the ELEXIS Travel Grants as a Lexico-graphical Use Case. In: Navaretta, Costanza and Maria Eskevich (Eds.),Proceedings CLARIN Annual Conference 2020, p. 77-81.
  • Hofmann, Klaus, Anna Marakasova, Andreas Baumann, Julia Neidhardt, and Tanja Wissik. 2020. Comparing Lexical Usage in Political Discourse across Diachronic Corpora. Proceedings of the Workshop Creating, Using and Linking of Parliamentary Corpora with Other Types of Political Discourse ( ParlaCLARIN II) at LREC 2020, p. 58-65.
  • Baumann, Andreas, Julia Neidhardt, and Tanja Wissik. 2019. DYLEN: Diachronic Dynamics of Lexical Networks. In: Declerck, Thierry and John P. McCrae (Eds.),Proceedings of the Poster Session of the 2nd Conference on Language, Data and Knowledge (LDK-PS 2019). Leipzig, Germany, May 21, 2019CEUR Workshop Proceedings 2402, p. 24-28.
Projektleitung

Tanja Wissik

Seung-bin Yim

 
Finanzierung

ÖAW go!digital Next Generation

 

Projektlaufzeit

05/2019–04/2021

 

Projektpartner

Universität Wien

TU Wien

 

Links

DYLEN Website

 

Dieses Projekt benutzt Daten aus:

amc

ParlAT

 

Soziale Medien

#dylennetworks