Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
signifikanz [2014/05/20 09:30] admin [Jaccard] |
signifikanz [2021/03/31 12:49] (aktuell) |
||
---|---|---|---|
Zeile 72: | Zeile 72: | ||
Auf der Basis der Poisson-Verteilung geben //Quasthoff / Wolff// (([Quasthoff 02]. Uwe QUASTHOFF, Christian WOLFF. The Poisson Collocation Measure and its Applications. In Second International Workshop on Computational Approaches to Collocations, | Auf der Basis der Poisson-Verteilung geben //Quasthoff / Wolff// (([Quasthoff 02]. Uwe QUASTHOFF, Christian WOLFF. The Poisson Collocation Measure and its Applications. In Second International Workshop on Computational Approaches to Collocations, | ||
< | < | ||
- | an, welche beispielsweise für die Berechnung von Korpora im [[http:// | + | an, welche beispielsweise für die Berechnung von Korpora im [[http:// |
Nach einer Umstellung und der Grundannahme < | Nach einer Umstellung und der Grundannahme < | ||
Zeile 81: | Zeile 81: | ||
===== Log-Likelihood-Maß ===== | ===== Log-Likelihood-Maß ===== | ||
- | Eine der populärsten Signifikanzmaße bei der Analyse großer Textcorpora ist nach //Dunning// (([Dunning 93]. Dunning, T. " | + | Eine der populärsten Signifikanzmaße bei der Analyse großer Textcorpora ist nach //Dunning// (([Dunning 93]. Dunning, T. " |
< | < | ||
- | Dunning kommt schließlich | + | Dunning kommt schließlich |
Zeile 102: | Zeile 102: | ||
Charakteristisch für das Log-Likelihood-Maß ist, im Gegensatz beispielsweise zum Poisson-Maß, | Charakteristisch für das Log-Likelihood-Maß ist, im Gegensatz beispielsweise zum Poisson-Maß, | ||
So finden sich in den Digitalisaten vom TLG in der Version TLG-E bei rund 73,8 Millionen Wörtern etwa 1,3 Millionen Kookkurrenzen, | So finden sich in den Digitalisaten vom TLG in der Version TLG-E bei rund 73,8 Millionen Wörtern etwa 1,3 Millionen Kookkurrenzen, | ||
- | Einen ähnlich großen Wert von 34,553 haben zum Beispiel **καὶ** und **Τὸ**, die zusammen 14311 Mal gezählt wurden. | + | Einen ähnlich großen Wert von 34,553 haben zum Beispiel **καὶ** und **τὸ**, die zusammen 14311 Mal gezählt wurden. |