Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung Nächste Überarbeitung Beide Seiten der Revision | ||
signifikanz [2014/04/30 15:15] admin [Mutual Information] |
signifikanz [2014/05/20 09:31] admin [Poisson-Maß] |
||
---|---|---|---|
Zeile 5: | Zeile 5: | ||
Zur Berechnung werden abhängig vom Untersuchungsgegenstand unterschiedliche Formeln herangezogen, | Zur Berechnung werden abhängig vom Untersuchungsgegenstand unterschiedliche Formeln herangezogen, | ||
- | Eine der einfachsten Signifikanzmaße ist eine frequenzsortierte Kookkurrenzliste, | + | Eines der einfachsten Signifikanzmaße ist eine frequenzsortierte Kookkurrenzliste, |
^ Korpus ^ Anzahl Kookkurrenzen^ Kookkurrenzen freq = 1^ in Prozent ^ | ^ Korpus ^ Anzahl Kookkurrenzen^ Kookkurrenzen freq = 1^ in Prozent ^ | ||
Zeile 13: | Zeile 13: | ||
|TLG ((TLG-E, CD-ROM Version aus dem Jahre 1999)) | 355.021.014| | |TLG ((TLG-E, CD-ROM Version aus dem Jahre 1999)) | 355.021.014| | ||
- | Wie aus der kleinen Übersicht zu erkennen ist, sind ein Großteil der gefundenen Kookkurrenzen eher als niedrigfrequent zu bezeichnen. Um daraus die wichtigen zu filtern, | + | Wie aus der kleinen Übersicht zu erkennen ist, sind ein Großteil der gefundenen Kookkurrenzen eher als niedrigfrequent zu bezeichnen. Um daraus die wichtigen zu filtern, |
===== Dice ===== | ===== Dice ===== | ||
Zeile 53: | Zeile 53: | ||
|a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | |a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | ||
- | Für die Bewertung von Kokkurrenzen gilt beim Jaccard-Koeffizienten ähnliches, wie beim Dice-Koeffizienten. Beide berechnen den Signifikanzwert ähnlich, die relative Ordnung der Kookkurrenzen bleibt gleich, nur der absolute Signifikanzwert unterscheidet sich marginal. Eine Modell-Berechnung mit mittlerer Frequenz von 100 sieht wie folgt aus. | + | Für die Bewertung von Kokkurrenzen gilt beim Jaccard-Koeffizienten ähnliches wie beim Dice-Koeffizienten. Beide berechnen den Signifikanzwert ähnlich, die relative Ordnung der Kookkurrenzen bleibt gleich, nur der absolute Signifikanzwert unterscheidet sich marginal. Eine Modell-Berechnung mit mittlerer Frequenz von 100 sieht wie folgt aus: |
^ < | ^ < | ||
Zeile 72: | Zeile 72: | ||
Auf der Basis der Poisson-Verteilung geben //Quasthoff / Wolff// (([Quasthoff 02]. Uwe QUASTHOFF, Christian WOLFF. The Poisson Collocation Measure and its Applications. In Second International Workshop on Computational Approaches to Collocations, | Auf der Basis der Poisson-Verteilung geben //Quasthoff / Wolff// (([Quasthoff 02]. Uwe QUASTHOFF, Christian WOLFF. The Poisson Collocation Measure and its Applications. In Second International Workshop on Computational Approaches to Collocations, | ||
< | < | ||
- | an, welche beispielsweise für die Berechnung von Korpora im [[http:// | + | an, welche beispielsweise für die Berechnung von Korpora im [[http:// |
Nach einer Umstellung und der Grundannahme < | Nach einer Umstellung und der Grundannahme < |