eAQUA :: Teilprojekt 4.6: Papyrologie
eAQUA

Sprache: EN | DE


News

2010-07-05
Text Mining in the
Digital Humanities
2010-07-05
at Kings College
26-29 Drury Lane
London
2010-07-05
more information
about this event

Teilprojekt 4.6: Papyrologie

Projektleiter: Prof. Dr. R. Scholl
Alte Geschichte/Historisches Seminar, Universität Leipzig Universitätsbibliothek/ Papyrussammlung, Universität Leipzig



Das Corpus der antiken griechischen und lateinischen literarischen Texte ist – soweit es überliefert und damit erhalten geblieben ist - mehr oder weniger vollständig in kritischen Textausgaben, in Äbersetzungen in verschiedenen Sprachen und zum Teil auch zweisprachig zugänglich. Der größte Teil davon steht auch in digitaler Form zur Verfügung (vgl. TLG, Perseus, usw.). Es gibt nur noch selten Textzuwächse.

Dagegen kommen durch Ausgrabungen vor Ort oder in Museen oder über den Kunsthandel immer wieder neue Texte zum Vorschein, die sich auf Stein, Münzen, Papyri, Ostraka, Pergament befinden. Darunter gibt es bekannte literarische Texte, oft aber auch bisher unbekannte und keinem Autor zuschreibbare Fragmente. Die Mehrzahl dieser Neufunde ist allerdings dokumentarischer Natur.

Mit Hilfe von Text-Mining kann durch Vergleich der jeweiligen literarischen und semiliterarischen sogenannten „Wartetexte” (das sind Texte, deren Identifizierung bisher noch nicht gelungen ist) mit dem Gesamtcorpus der antiken Texte möglicherweise die neue Textpassage einem antiken Autor zugewiesen oder zumindest näher eingegrenzt oder – da die meisten Funde fragmentarisch sind – zumindest ergänzt werden.

Die Textergänzung selbst spielt bei Inschriften und Papyri eine entscheidende Rolle, da diese Zeugnisse in der Regel nie vollständig, sondern als unterschiedlich große Fragmente gefunden werden. Oft kommt es sogar vor, daß Teile ein und desselben Stückes sich in verschiedenen Sammlungen befinden, ohne daß die Zugehörigkeit zueinander erkannt wird. Hier kann Text-Mining eine große Hilfe sein, um Texte wieder zusammenzufügen oder zumindest zu ergänzen, indem Text-Mining Paralleltexte finden kann. Da ein Großteil der dokumentarischen Papyri oder Inschriften quasi als Urkunden diverser Art jeweils eine ähnliche Textstruktur besitzen, sich durch bestimmte Schlüsselworte/Keywords als ganz bestimmte Urkundenform zu erkennen geben (beispielsweise: emisthwsen, ekdwken/elaben, omologw – misthosasthai (Miet/Pachtvertrag); apedoto-epriato oder omologw pepraskenai (Kaufvertrag) oder edoxen-dedoxthai (Volksbeschluß)), ist durch die Kenntnis entsprechender Parallelen eine Ergänzung möglich. In Verbindung mit den unter (A) genannten Lexika wird das Text-Mining eine wertvolle Unterstützung sein. Die bereits edierten dokumentarischen Papyri und Ostraka sind mit den Metadaten im „Heidelberger Gesamtverzeichnis” in Form einer FileMaker Datenbank mit 55.803 Datensätzen (17.05.07) erfaßt (http://aquila.papy.uni-heidelberg.de/gvzFM.php). Jeder Papyrus/Ostrakon ist zum digitalisierten griechischen Originaltext in der Duke Data Bank of Documentary Papyri über das Perseus-Projekt verlinkt.

Für die Metadaten der literarischen Texte steht die „Leuven Database of Ancient Books” mit 11518 Texten (17.5.07) (http://ldab.arts.kuleuven.ac.be) und für literarische und semiliterarische Texte das „Centre de Documentation de Papyrologie Littéraire” an der Université de Liège.
( http://promethee.philo.ulg.ac.be/cedopal/index.htm )

Neben den so erfaßten publizierten Papyri existieren noch weit mehr unbearbeitete Papyri weltweit in den Papyrussammlungen, die noch der Katalogisierung, Digitalisierung und Edition harren. Für diese es zunächst notwendig, eine Klassifizierung der Texte nach bestimmten inhaltlichen und formalen Kriterien vorzunehmen, auch wenn der ganze Text zunächst noch gar nicht vollständig transkribiert und damit noch gar nicht digitalisiert ist. In diesem Fall ist eine lemmatisierte Keyword-Suche mit dem Text-Mining Programm sinnvoll.


Universität Leipzig
BMBF
end of page