Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung Nächste Überarbeitung Beide Seiten der Revision | ||
start [2014/09/26 09:57] admin [Neue Methoden in den Geistenwissenschaften] |
start [2015/09/24 09:12] admin [Zitations-Analyse] |
||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ====== eAQUA ====== | + | ====== eAQUA Wissensdatenbank |
===== Neue Methoden in den Geistenwissenschaften ===== | ===== Neue Methoden in den Geistenwissenschaften ===== | ||
Zeile 69: | Zeile 69: | ||
Die Zitations-Analyse wird anhand von String-Matching-Algorithmen vorgenommen. Zeichenkettenalgorithmen suchen nach exakten Übereinstimmungen eines Musters in einem Text unter Definition von Toleranzkriterien. Diese Kriterien wurden in der Zitations-Analyse von eAQUA wie folgt festgelegt. | Die Zitations-Analyse wird anhand von String-Matching-Algorithmen vorgenommen. Zeichenkettenalgorithmen suchen nach exakten Übereinstimmungen eines Musters in einem Text unter Definition von Toleranzkriterien. Diese Kriterien wurden in der Zitations-Analyse von eAQUA wie folgt festgelegt. | ||
- | Reduziert um alle Satzzeichen und einer Liste der häufig benutzten Wörter ((Stoppwortliste: | + | Reduziert um alle Satzzeichen und einer Liste der häufig benutzten Wörter ((Stoppwortliste: |
- | Eine Eigenheit dieser Vorgehensweise ist, dass bei einigen Autoren Selbstzitate gefunden werden, also Stellen, an denen sie sich offensichtlich wiederholen. Eine andere, | + | Eine Eigenheit dieser Vorgehensweise ist, dass bei einigen Autoren Selbstzitate gefunden werden, also Stellen, an denen sie sich offensichtlich wiederholen. Eine andere, |
Die Parallelstellen werden schlussendlich unter Verwendung der Editierdistanz mit einem Similaritätswert belegt, der zwischen 0 = nicht identisch und 1 = vollständig identisch liegt. Berechnet wird nach einem Algorithmus **Similar-Text**, | Die Parallelstellen werden schlussendlich unter Verwendung der Editierdistanz mit einem Similaritätswert belegt, der zwischen 0 = nicht identisch und 1 = vollständig identisch liegt. Berechnet wird nach einem Algorithmus **Similar-Text**, | ||
Zeile 94: | Zeile 94: | ||
- | Similar-Text-Berechnungen sind nur bei kurzen | + | Similar-Text-Berechnungen sind nur bei kurzen |