Netzwerkbasierte Ansätze spielen eine zunehmend wichtige Rolle bei der Analyse von Daten. Insbesondere in den Digital Humanities (DH) haben Netzwerkmodelle in den letzten Jahren an Bedeutung gewonnen, da immer mehr datenbasierte und datengetriebene Forschung betrieben wird und die Datenmengen zunehmen (z.B. Big Data).
Das von go!digital NEXT GENERATION geförderte Projekt schlägt eine Brücke zwischen den Bereichen Linguistik, Digital Humanities und Informatik, um die diachrone Entwicklung lexikalischer Netzwerke auf der Grundlage großer authentischer Sprachdaten zu erforschen. Das Projekt wird Sprachdaten wiederverwenden, die bereits am ACDH-CH verfügbar sind, nämlich das Austrian Media Corpus (amc) und das Korpus der Österreichischen Parlamentsdaten (ParlAT). Das amc deckt die gesamte österreichische Medienlandschaft der letzten 20 Jahre ab und enthält 40 Millionen Texte (mehr als 10 Milliarden Token).
Das ParlAT-Korpus umfasst die österreichischen Parlamentsakten der letzten 20 Jahre mit mehr als 75 Millionen Token. Aus linguistischer Sicht wird das Projekt die diachrone Entwicklung von lexikalischen Netzwerken untersuchen und netzwerkbasierte Methoden für die diachrone Linguistik diskutieren. Aus der Sicht der Informatik wird das Projekt die Netzwerktheorie auf eine große Menge diachroner linguistischer Daten anwenden und neue Methoden für die automatische Analyse und den Vergleich dieser Netze diskutieren. Weiters wird das Projekt eine Netzwerkvisualisierung für die Daten entwickeln und bereits bestehende Daten mit zusätzlichen Annotationen anreichern.
Das Projekt, koordiniert von Tanja Wissik als PI, wird von einem interdisziplinären Team vom ACDH-CH, der Universität Wien und der TU Wien durchgeführt.
Seung-bin Yim
ÖAW go!digital Next Generation
05/2019–04/2021
Dieses Projekt benutzt Daten aus:
#dylennetworks