Das Vienna Corpus of Arabic Varieties (VICAV) wurde vor über einem Jahrzehnt mit dem Ziel gestartet, digitale Sprachressourcen zu sammeln, die Varietäten des gesprochenen Arabisch dokumentieren. Während es grundsätzlich für jede Art von Text offen ist, lag der Schwerpunkt in den Aufbaujahren auf bibliografischen Daten, sogenannten Sprachprofilen, standardisierten Feature lists und lexikalischen Daten. In nächster Zeit wird die Plattform durch rezente Projekte (SHAWI, WIBARAB) auch vermehrt Corpusdaten zur Verfügung stellen.

VICAV hatte eine starke methodische Komponente, die in der Entwicklung von nachnutzbaren digitalen Daten und Werkzeugen besteht. Ein großer Teil dieser Bemühungen konzentrierte sich auf die Modellierung von Daten, die Bereitstellung von Dokumentation für Entwicklungs- und pädagogische Zwecke, die Ausarbeitung spezialisierter Workflows sowie die Weiterentwicklung von frei zugänglichen XML-Editoren. VICAV setzt sich stark für die Verbreitung des Community-Standards Text Encoding Initiative (TEI) ein und bemüht sich um das auch im Rahmen des Elexis-Projekts weiterentwickelten Lex-0.

VICAV wurde als Kooperation zwischen dem Institut für Orientalistik der Universität Wien und dem Austrian Centre for Digital Humanities and Cultural Heritage der Österreichischen Akademie der Wissenschaften (ACDH-CH) ins Leben gerufen und stellt das technische Framework für die Projekte TUNICO, TUNOCENT, SHAWI und WIBARAB zur Verfügung.

VICAV Plattform

 

Datenrepositprium

GitHub