Die Datenmodellierung ist eine zentrale Herausforderung bei allen DH-Bestrebungen. Diese Tätigkeit umfasst sowohl die Konzeptualisierung des Diskursbereichs (konzeptionelles Modell) als auch die Formalisierung des konzeptionellen Modells in konkreten Schemata.
Das zu Beginn eines jeden Projekts erstellte Datenmodell ist eine Vereinbarung zwischen den DH-Expert:innen und dem Entwicklungsteam, das die technische Entwicklung leitet und die Grenzen für die Art der zu erfassenden Informationen festlegt. Das Datenmodell legt auch fest, wie die resultierenden Daten mit anderen Datensätzen und Werkzeugen interoperabel sein werden.
Obwohl jedes Projekt spezifische Anforderungen haben kann, stützen wir uns bei projektspezifischen Lösungen auf etablierte Referenzmodelle, standardisierte Terminologie und empfohlene digitale Formate, die den spezifischen Herausforderungen geisteswissenschaftlicher Daten (z. B. Spärlichkeit, Mehrdeutigkeit, Inkonsistenz oder Informationsmangel) gerecht werden. So verwenden wir beispielsweise TEI für die Kodierung von Textressourcen in XML und die CIDOC-CRM-Familie von Ontologien für strukturierte Daten in RDF.
Bei der Modellierung müssen auch die Formate der Quelldaten sowie die Beschränkungen berücksichtigt werden, die sich aus den für die Aufbereitung und Präsentation der Daten verwendeten Werkzeugen ergeben. Altdaten liegen oft nur in Form von Textdokumenten oder Tabellenkalkulationen vor, so dass benutzerdefinierte Konvertierungen ein wichtiger Bestandteil vieler Datenverarbeitungsworkflows sind.