start

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen gezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
start [2015/09/24 09:12]
admin [Zitations-Analyse]
start [2018/05/15 11:30] (aktuell)
Zeile 23: Zeile 23:
 ^ Teilaufgabe ^ Erläuterung ^ ^ Teilaufgabe ^ Erläuterung ^
 |Eigennamenextraktion |Erkennung von spezifischen Entitäten; meist auf der Basis manuell annotierter Datensätze. Hierbei sind nur die für die Domäne (das Korpus) typischen gemeint. ((Zum Beispiel die im Bühnenstück von Shakespeare „KING HENRY the Fourth“ abgekürzten "​Speaker"​-Segmente "​North."​ und "​West."​ sind Personenbezeichner,​ keine Himmelsrichtungen.)) ​ | |Eigennamenextraktion |Erkennung von spezifischen Entitäten; meist auf der Basis manuell annotierter Datensätze. Hierbei sind nur die für die Domäne (das Korpus) typischen gemeint. ((Zum Beispiel die im Bühnenstück von Shakespeare „KING HENRY the Fourth“ abgekürzten "​Speaker"​-Segmente "​North."​ und "​West."​ sind Personenbezeichner,​ keine Himmelsrichtungen.)) ​ |
-|Stopwortliste erstellen |Eine Stopwortliste ist eine Liste mit Begriffen, die bei der späteren Verarbeitung ausgenommen werden sollen. ((Solche Listen können sowohl domänenübergreifend,​ beispielsweise typisch für eine Sprache, als auch domänenspezifisch,​ beispielsweise typisch für eine Autorenschaft,​ sein. In eAQUA werden diese Liste anhand von Wortzählungen des Gesamtkorpus erstellt.)) ​ |+|Stopwortliste erstellen |Eine Stopwortliste ist eine Liste mit Begriffen, die bei der späteren Verarbeitung ausgenommen werden sollen. ((Solche Listen können sowohl domänenübergreifend,​ beispielsweise typisch für eine Sprache, als auch domänenspezifisch,​ beispielsweise typisch für eine Autorenschaft,​ sein. In eAQUA werden diese Listen ​anhand von Wortzählungen des Gesamtkorpus erstellt.)) ​ |
 |Topic-Modellierung |Automatische Zuordnung von Begriffen zu Themen auf Basis von Worteigenschaften und Kontextinformationen. ​ | |Topic-Modellierung |Automatische Zuordnung von Begriffen zu Themen auf Basis von Worteigenschaften und Kontextinformationen. ​ |
 |Faktenextraktion ​ |Vorher definierte Arten von Informationen werden durch die Verarbeitung modelliert. Viele Verfahren nutzen dafür die Abfolge unterschiedlicher Wörter in einem Satz. ((In eAQUA ist dies beispielsweise mit der Kookkurrenzanalyse vollzogen worden.)) | |Faktenextraktion ​ |Vorher definierte Arten von Informationen werden durch die Verarbeitung modelliert. Viele Verfahren nutzen dafür die Abfolge unterschiedlicher Wörter in einem Satz. ((In eAQUA ist dies beispielsweise mit der Kookkurrenzanalyse vollzogen worden.)) |