Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung Nächste Überarbeitung Beide Seiten der Revision | ||
signifikanz [2014/04/30 15:15] admin [Mutual Information] |
signifikanz [2014/05/20 09:30] admin [Jaccard] |
||
---|---|---|---|
Zeile 5: | Zeile 5: | ||
Zur Berechnung werden abhängig vom Untersuchungsgegenstand unterschiedliche Formeln herangezogen, | Zur Berechnung werden abhängig vom Untersuchungsgegenstand unterschiedliche Formeln herangezogen, | ||
- | Eine der einfachsten Signifikanzmaße ist eine frequenzsortierte Kookkurrenzliste, | + | Eines der einfachsten Signifikanzmaße ist eine frequenzsortierte Kookkurrenzliste, |
^ Korpus ^ Anzahl Kookkurrenzen^ Kookkurrenzen freq = 1^ in Prozent ^ | ^ Korpus ^ Anzahl Kookkurrenzen^ Kookkurrenzen freq = 1^ in Prozent ^ | ||
Zeile 13: | Zeile 13: | ||
|TLG ((TLG-E, CD-ROM Version aus dem Jahre 1999)) | 355.021.014| | |TLG ((TLG-E, CD-ROM Version aus dem Jahre 1999)) | 355.021.014| | ||
- | Wie aus der kleinen Übersicht zu erkennen ist, sind ein Großteil der gefundenen Kookkurrenzen eher als niedrigfrequent zu bezeichnen. Um daraus die wichtigen zu filtern, | + | Wie aus der kleinen Übersicht zu erkennen ist, sind ein Großteil der gefundenen Kookkurrenzen eher als niedrigfrequent zu bezeichnen. Um daraus die wichtigen zu filtern, |
===== Dice ===== | ===== Dice ===== | ||
Zeile 53: | Zeile 53: | ||
|a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | |a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | ||
- | Für die Bewertung von Kokkurrenzen gilt beim Jaccard-Koeffizienten ähnliches, wie beim Dice-Koeffizienten. Beide berechnen den Signifikanzwert ähnlich, die relative Ordnung der Kookkurrenzen bleibt gleich, nur der absolute Signifikanzwert unterscheidet sich marginal. Eine Modell-Berechnung mit mittlerer Frequenz von 100 sieht wie folgt aus. | + | Für die Bewertung von Kokkurrenzen gilt beim Jaccard-Koeffizienten ähnliches wie beim Dice-Koeffizienten. Beide berechnen den Signifikanzwert ähnlich, die relative Ordnung der Kookkurrenzen bleibt gleich, nur der absolute Signifikanzwert unterscheidet sich marginal. Eine Modell-Berechnung mit mittlerer Frequenz von 100 sieht wie folgt aus: |
^ < | ^ < |