3.5 Mann-Whitney-U-Test für zwei unabhängige Stichproben

Der Mann/Whitney-U-Test gehört zu den stärksten Tests, um einen Zusammenhang zwischen einer zweistufigen nominalskalierten Variablen und einer ordinalskalierten Variablen zu testen. Man kann aber auch den Unterschied zwischen zwei unabhängigen Stichproben hinsichtlich der ordinal skalierten Variablen testen.

3.5.1 Testsituation

  • zwei unabhängige Stichproben, wobei n1<=n2 sein kann
  • stetige Untersuchungsvariable X
  • die Verteilung in beiden Gesamtheiten ist bis auf den Lageparamter gleich, ist eine Konstante:

3.5.2 Testidee

Geprüft wird, ob ein Zusammenhang zwischen zwei unabhängigen Stichprobenverteilungen existiert, genau genommen, ob die Verteilungen fon F1(x) und F2(X) bis auf eine Konstante gleich sind.
Die Hypothese lautet gewöhnlich: Ho:=0, d.h. der Parameter ist 0 -> es besteht ein Zusammenhang zwischen den beiden Stichprobenverteilungen.
Die Alternativhypothese lautet:

  • bei einem zweiseitigen Test: != 0
  • bei einem einseitigem Test: >0 oder <0
  • Vereinbart wird: n1<=n2, man numieriert die Stichproben entsprechend
  • Aus den Werten der beiden Stichproben bildet man nun eine gemeinsame Reihe in aufsteigender Folge.
  • Man vergleicht jeden Wert der einen Stichprobe (x1i=1...n) mit dem Wert der anderen Stichprobe (x2j, j=1...n2) (n1n2-Vergleiche)

3.5.3 Die Konstruktion der Prüfvariablen

Man bildet nun die Indikatorvariable U mit .
A) Falls der Wert der ersten Stichprobe > als der Wert der zweiten Stichprobe ist, wird aij=1 gesetzt: Falls xij>x2j -> aij=1
B) Falls der Wert der ersten Stichprobe < als der Wert der zweiten Stichprobe ist, wird aij=0 gesetzt:
Falls xij<x2j -> aij=0

Falls die obige (Homogenitäts-)Hypothese zutrifft, muß die Anzahl der Fälle von A so groß sein wie die Anzahl der Fälle von B - abgesehen von zufälligen Abweichungen.

3.5.4 Vorgehensweise

  • Die Hypothese läßt sich umschreiben in: Ho:E(U):0,5n1n2, d.h. die erwartete Häufigkeit der Prüfvariable U ist so groß wie die Hälfte der miteinander multiplizierten Stichprobenanzahlwerte.
  • Der Rückweisungspunkt ur sind in der Formelsammlung auf S. 43 tabelliert.
  • Um den Stichprobenbefund u (Prüfwert) zu ermitteln, nutzt man die folgende Beziehung zwischen u und w aus: u=w-0,5n1(n1+1)
    -> w ist vereinbarungsgemäß die Summe der Rangzahlen in der kleineren Stichprobe.
  • weisen beide Stichproben zum Teil gleiche Werte auf, werden die Werte entfernt und n verringert (siehe auch Mediantest (=Vorzeichentest), S. 18).

3.5.5 Bemerkungen

1. Wenn man einen großen Stichprobenumfang vorliegen hat (n>=20), kann man U asymptotisch approximieren nach:
2. Falls u>0,5n1n2 ist, nutzt man die Komplementärvariable von U U* aus.
(Es gilt: U=n1n2-U*). Man berechnet den transformierten Wert u= n1n2-u*.
3. Ab n2>=20 darf man als Näherung die Normalverteilung benutzen, wobei man die Kontinuitätsberichtigung nach YATES berücksichtigen muß.
4. Der Mann/Whitney-U-Test hat wegen der geringeren Voraussetzungen bei Anwendungen eine relativ große Bedeutung, Er ist nur geringfügig schlechter (95 Prozent Effizienz) als der vergleichbare t-Differenzentest für zwei Mittelwerte.

3.5.6 Beispiel (Tiede S. 93)

Zwei Leichtathletikgruppen mit fünf bzw. sechs Leuten (n1=5, n2=6) machen einen Fitnesstest, nachdem sie ein unterschiedliches Wintertraining durchgeführt haben. Jeder Athlet kann bis zu 20 Punkte erreichen.

x1j

5

10

15

17

12


x2j

6

6

7

9

9

13


Geprüft werden soll: Unterscheiden sich die Gruppenmittel von 15 und 8 nur zufällig voneinander? (5-Prozentiges Signifikanzniveau einseitig). Mathematisch gesprochen prüft man, ob beide Stichproben aus einer Gesamtheit stammen.
Die Hypothese lautet also : Ho: =0 (-> es gibt keinen signifikanten Unterschied zwischen Gruppe 1 und Gruppe 2), anders formuliert (s.o) Ho:E(U):0,5n1n2
1. Die beiden Gruppen werden zu einer Gruppe zusammengefaßt. Jeder Wert aus der ersten Stichprobe wird zur Kennzeichnung mit einer "0" markiert, die Werte aus der zweiten Stichprobe bekommen eine "1".:

Gesamtgruppe

5

10

15

17

12

6

6

7

9

9

13

stammt aus Gruppe:

0

0

0

0

0

1

1

1

1

1

1

Die Gesamtstichprobe wird der Übersicht halber sortiert, und es werden Ränge verteilt (Doppeltränge beachten!)

Gesamtgruppe

5

6

6

7

9

9

10

12

13

15

17

Kodierung

0

1

1

1

1

1

0

0

1

0

0

Ränge

1

2,5

2,5

4

5,5

5,5

7

8

9

10

11


  • Man verteilt nun Rangzahlen (der schlechteste Athlet bekommt den Rang 1 usw):

    x1j

    5

    10

    15

    17

    12

    6

    6

    7

    9

    9

    13

    x2j

    1

    7

    9

    10

    11

    2,5

    2,5

    4,

    5,5

    5,5

    8

  • Jetzt berechnet man w, die Summe der Rangzahlen der kleineren Stichprobe (sind beide gleich groß, nimmt man die erste Stichprobe): w=37
  • Die Prüfvariable u berechnet sich aus 37-0,5*5*6=37-15=22
  • Die Verteilung für den Mann-Whitney-Test ist nur linksseitig definiert. Deshalb muß man nun prüfen, ob der Prüfwert u in die transformierte Variable u* umgeformt werden muß, die tabelliert ist:
  • Geprüft werden muß, ob u>0,5n1n2 gilt. Hier gilt 22>15, d.h. man muß u* berechnen:
    u*=n1n2 - u=30-22=8.
  • Aus der Formelsammlung (S. 43) liest man für n1=5 und n2=6 den Wert für den Rückweisungspunkt u*r=5 ab.
  • Da der Rückweisungspunkt ur*=5 rechts von Prüfwert 8 (5<8) liegt, kann die Nullhypothese angenommen werden: Es gibt keinen signifikanten Unterschied zwischen den beiden Gruppen.

    3.6 Kruskal/Wallis-H-Test

    Der Kruskal/Wallis-H-Test ist eine Verallgemeinerung des U-Tests von Mann/Whitney. Er verwertet zusätzlich Informationen über die rangmäßige Abstufung der Stichprobenwerte.

    3.6.1 Testsituation

    • zwei unabhängige Stichproben der Umfänge n, i=1...,r
    • stetige Untersuchungsvariable X mit xij, i=1...r, j=1...ni

    3.6.2 Testidee

    Es wird geprüft, ob r unabhängige Stichproben, in denen eine stetige Untersuchungsvariable betrachtet wird, aus r Grundgesamtheiten mit gleichem Median stammen. Vereinfacht gesagt prüft man: stammen die r Stichproben aus der gleichen oder identischen Grundgesamtheit.
    Die Alternativhypothese behauptet: nicht alle Gesamtheiten haben den gleichen Median, anders formuliert: die r Stichproben stammen aus verschiedenen Grundgesamtheiten, wobei sich diese Verschiedenheit auf die Lageparameter (Mittelwerte) bezieht.
    1. Den Stichprobenwerten xij werden Rangzahlen Rg(xij) zugeordnet, so daß für die zusammengefaßte Stichprobe eine Rangreihe entsteht.
    2. -> der kleinste Wert xij bekommt den Rang 1
    3. man bildet in jeder Stichprobe die entsprechende Rangsumme
    4. Der Mittelwert der Rangsumme lautet: (-> Man dividiert für jede Stichprobe diese Summe durch die entsprechende Anzahl Elemente)
    5. Falls die Nullypothese zutrifft, wird man für nur zufällige Abweichungen ewarten.
    6. Der Prüfwert ergibt sich aus der Formelvon Kruskal/Wallis:

    3.6.3 Bemerkungen

    1. H kann für ni>=5 und r>=4 (Faustregel) einer [chi]²-Verteilung mit r-1 Freiheitsgraden angenähert werden.

    3.6.4 Beispiel (Tiede S. 99)

    Für eine geplante Fragebogenation wird über zufällig ausgewählte Personen ausprobiert, wie zeitraubend die Bearbeitung einer Reihe von Fragebogentypen ist. Man erhält die folgenden Zeitwerte in Minuten:

    Fragebogentyp

    Rangzahlen des Zeitaufwands

    1

    11

    14

    16

    19

    27

    29

    30

    31

    40

    41

    42

    2

    15

    17

    18

    25

    26

    32

    33

    33

    42

    43

    3

    20

    21

    30

    32

    35

    38

    45

    50

    55

    56

    4

    8

    10

    12

    13

    22

    28

    28

    28

    32

    33


    1. Man ordnet den Ursprungswerten Rangzahlen zu und erhält folgende Tabelle:

    Fragebogentyp

    Rangzahlen des Zeitaufwands

    Rangsummen

    1

    3

    6

    8

    11

    17

    21

    22,5

    24

    33

    34

    35,5

    215

    2

    7

    9

    10

    15

    16

    26

    29

    29

    35,5

    37


    213,5

    3

    12

    13

    22,5

    26

    31

    32

    38

    39

    40

    41


    294,5

    4

    1

    2

    4

    5

    14

    19

    19

    19

    26

    29


    138













    861

    2. Man berechnet H nach der obigen Formel und erhält: h=8,76.
    3. Da r>=4 und ni>=5 ist, folgt H hinreichend genau einer [chi]²-Verteilung mit (4-1)=3 Freiheitsgeraden.
    4. Man liest aus der [chi]²-Tabelle in der Formelsammlung auf Seite 30 den Rückweisungspunkt [chi]²r = 7,81 ab (-> 5 Prozent Signifikanzniveau).
    5. 8,76>7,81, d.h. die Nullhypothese, daß die Unterschiede zwischen den Fragebögen nicht zufällig sind, wird abgelehnt: Es existieren Unterschiede bei dem Zeitaufwand für die Fragebögen.

    Der Vorzeichentest (-> Schnelltest) kommt beim gleichen Beispiel zu einem anderen Ergebnis, der Kruskal-Wallis-Test hat eine Effizienz von 95%, seine Entscheidung gilt im Zweifelsfalle mehr.

    3.7 Prüfung des Rangkorrelationskoeffizienten

    Der SPEARMANsche Rangkorrelationskoeffizient dient zur Beurteilung des Zusammenhangs zweier stetiger Untersuchungsvariablen:
    wobei i: di =Rg(yi) ist

    3.7.1 Testsituation

    • X,Y, ordinal skaliert, n statistische Einheiten
    • Gemessen wird das Wertepaar xi, yi.
    • Man ordnet den Werten Rangzahlen zu, der kleinste Wert bekommt die Rangzahl 1.

    3.7.2 Testidee

    Geprüft wird, ob die Merkmale von X und Y in der Grundgesamtheit nicht korreliert sind, d.h. die Hypothese lautet: in der Grundgesamtheit hat der Rangkorrelationskoeffizient den Wert 0. Anders formuliert: X und Y sind statistisch unabhängig voneinander
    Ho: }Sp=0, Ha=}sp!=0
    Nun wird es in der Stichprobe unter Umständen immer so sein, daß die gezogene Stichprobe einen Rangkorrelationskoeffizienten hat, der nicht Null ist. Mathematisch formuliert lautet das Problem:
    [delta]sp<->Ysp, rsp!=0
    Lösungsidee: Man wählt eine geeignete Prüfvariable, hier den Rangkorrelationskoeffizienten selbt.
    Um die Stichprobenverteilung zu ermitteln, ordnete man die Rangzahlen Rg(xi) 1 2 3 ... n
    Falls x und y unkorreliert sind, ist jede Beliebige Anordnung für Rg(yi) möglich, auch eine vollständige geordnete (absteigend/aufsteigend), die zur vollständigen Korrelation führen würde.
    Bei n verschiedenen Elementen gibt es n! gleichmögliche verschiedene Möglichkeiten einer Ordnung für Rg(yi).
    Beispiel: für n=3 ergeben sich folgende Kombinationsmöglichkeiten für Rg(yi), sowie die folgenden Rangkorrelationskoeffizienten rsp. Daraus ergibt sich die Wahrscheinlichkeitsverteilung

    Rg(xi)

    1

    2

    3

    rsp

    Rg(yi)

    1

    2

    3

    1


    1

    3

    2

    0,5


    2

    1

    3

    0,5


    2

    3

    1

    -0,5


    3

    1

    2

    0,5


    3

    2

    1

    1

    P(1)=1/6, P(0,5)=1/3, P(-0,5)=1/3, P(-1)=1/6. Graphisch ergibt sich folgendes Bild:

    Die Stichprobenverteilung Rsp ist also diskret und symmetrisch zum Wert E(Rg)=0. Ihre Varianz ist VAR (Rsp)=. Die Rückweisungspunkte in Abhängigkeit von n und dem Signifikanzniveau sind in der Formelsammlung auf Seite 46 für n<11 tablliert. Ist n größer als 9, kann man approximativ die t-verteilte Prüfvariable mit v=n-2 Freiheitsgraden verwenden.
    Ab n>20 kann durch die Standardnormalverteilung N(0,1) approximiert werden.
    Annahmebereich der Testvariablen

    3.8 Literatur

    Tiede, Manfred; Voß, Werner

    Prüfverfahren in der Wirtschafts und Sozialstatistik

    Studienverlag Brockmeyer, 1982


    Billeter, Ernst P.

    Grundlagen der erforschenden Statistik

    Springer-Verlag

    UB AXB226

    Graff, Jörg

    Nichtparametrische Statistik in den Sozialwissenschaften

    Centataurus-Verlagsgesellschaft

    UB CSA2997