1 Tests bei metrischem Meߟniveau

1.1 Chi-Quadrat-Tests

1.1.1 -Anpassungstest

1.1.1.1 Testsituation

  • eine einfach Zufallsstichprobe des Umfangs n
  • die Untersuchungsvariable ist polytom -> r mögliche Werterealisationen
  • es werden für die Werterealisationen die absoluten Häufigkeiten bi i=1...,r, gezählt

1.1.1.2 Testidee

Der-Anpassungstest ist ein rechnerischer Test. Im Gegensatz zum Kolomogoroff-Smirnov-Test muߟ die H0 nicht voll spezifiziert sein.
Geprüft wird, ob eine empirische Häufigkeitsverteilung einer theoretisch angenommenen ähnelt, ob sie sich ihr anpaߟt:
H0: F(x)=F0(x) Ha: F(x)!=F0(x)
Anders formuliert: Gegeben ist eine Stichprobe aus einer Grundgesamtheit. Man kennt die Verteilungsfunktion der Grundgesamtheit nicht, testet, ob sie einer theoretischen Verteilung folgt, z.B. der Normalverteilung, Binominalverteilung, Poissonverteilung.
Die Nullhypothese behauptet also, die Grundgesamtheit habe eine bestimmte Verteilung, wobei es sich um stetige wie diskrete Zufallsverteilungen handeln kann.
Mathematisch werden beim Chiquadrat-Anpassungstest die Abstände zwischen individuellen beobachteten und individuellen theoretischen Häufigkeiten in die Prüfvariable U transformiert, die (approximativ) eine Chiquadratvariable ist.

1.1.1.3 Die Prüfvariable

Die Prüfvariable ist die Pearsonsche Variable U:
U=
Es geht nicht um signifikanten Abweichungen einzelner Werte, sondern um signifikante Abweichungen der gesamten Verteilungsfunktion. Deshalb wird über 1 summiert.
Besteht ein groߟer Abstand zwischen ei und bi, wird die Ho eher abgelehnt.
Bei jedem Chiquadrat-Anpassungstest muߟ man die Zahl der Freiheitsgrade bestimmen. Die Zahl der Freiheitsgrade hängt von der Zahl der Klassen und der Anzahl der Parameter, die geschätzt werden müssen ab. Bei r Klassen und zu schätzenden Parametern beträgt die Zahl der Freiheitsgrade :
= r- - 1.
Soll beispielsweise getestet werden, ob eine Nominalverteilung vorliegt, so hat man zwei Parameter, nämlich µ(Mittelwert) und (Streuung), d.h. = 2. Bei einer Binominalverteilung muߟ geschätzt werden ( = 1), bei einer Poissonverteilung (=1).

1.1.1.4 Beispiel (aus Tiede, S.42)

200 Studenten wurden nach dem ihnen am sympathischsten Fach befragt.

Fach bi ei (bi-ei)²
VWL 45 40 25 0,625
BWL 37 40 9 0,225
WiPo 48 40 64 1,600
Finanzwissenschaft 31 40 64 1,600
Statistik 39 40 1 0,025
200 200 4,5

Hypothese: Geprüft werden soll, ob die Studenten alle fünf Fächer gleich sympathisch finden. Das heiߟt, wenn diese Hypothese zutrifft, müߟten jeweils 1/5 der Studenten die fünf Fächer bevorzugen.
Die Nullhypothese lautet: oder in Worten ausgedrückt: ist genauso verteilt wie 0i.
Das Signifikanzniveau sei 5 Prozent.
Berechnung des Rückweisungspunktes:

Da keine Parameter geschätzt werden sollen und wir fünf Klassen (=Fächer) haben, ist die Zahl der Freiheitsgrade=5-0-1=4. In der Tabelle (Formelsammlung S. 30) liest man nach, daߟ für 4 Freiheitsgrade und fünfprozentigem Signifikanzniveau der Rückweisungspunkt bei ist.
Nun wird die Pearsonschen Prüfvariable: berechnet (s. Tabelle).
Als Wert ergibt sich u=4,5.
Der Prüfwert u=4,5 ist kleiner als der Rückweisungspunkt von 9,45 d.h. die Nullhypothese wird nicht verworfen, die Studenten finden alle Fächer gleich sympathisch, die Variable ist in Wahrheit gleichverteilt.

1.1.1.5 Bemerkungen

1. Für den Fall, daߟ der Stichprobenumfang grenzenlos wächst, folgt U einer Chiquadratverteilung mit v=r-1 Freiheitsgeraden. Die Prüfgröߟe U ist nämlich approximativ eine -Variable.
2. Eigentlich gilt der-Anpassungstest nur für n->, man kann ihn aber auch für kleine Werte von n durchführen. Jede einzelne Klasse der theoretischen Verteilung muߟ mindestens mit 5 "theoretischen Beobachtungen" besetzt sein: ei>=5
3. Die Stichprobe sollte nicht zu klein sein, die erwarteten Häufigkeiten nicht unter 1 liegen.
4. Voraussetzung für die Anwendbarkeit des -Anpassungstest (Tiede, S. 42):
Die Modellvoraussetzungen für die Multinominalverteilung müssen gegeben sein:

  • bei jedem Einzelzug muߟ das Stichprobenelement mit der von Zug zu Zug unveränderlichen Wahrscheinlichkeit 1 in die i-te Klasse fallen: Bei groߟem Auswahlsatz verwendet man das Modell mit Zurücklegen, bei kleinen wäre das nicht nötig. Führt man den Test mit Daten durch, deren Meߟniveau über dem nominalen liegt, muߟ man die Daten gruppieren.
    5. Der -Anpassungstest ist auch für den Fall von nur zwei Klassen verwendbar, dann entspricht er einem beidseitigem Binominaltest. Im Fall zweier Klassen entspricht der PEARSONsche Stichprobenumfang nämlich approximativ einer quadrierten Standardnormalvariable, also eine -Variable mit einem Freiheitsgrad. Beim -Test vergleicht man k² mit kr², beim zweiseitigen Binominaltest k mit kr.

    1.1.2 X2-Homogenitätstest

    Der -Homogenitätstest ist ein Test zur Prüfung der Unterschiede zwischen Anteilswerten aus mehr als zwei unabhängige Stichproben. Die Problemstellung entspricht der Problemstellung der Varianzanalyse.
    Testsituation
    r unabhängige Stichproben der Umfänge bi
    Vorgehensweise
    n Objekte kommen in die Auswahl, in jeder Einzelstichprobe werden die s Ausprägungen des interessierenden polytomen Merkmals A ausgezählt. Man beobachtet die absoluten Häufigkeiten bij  (bzw. die relativen Häufigkeiten )
    Zu prüfen ist die Hypothese: pij weicht nur zufällig von Grundgesamtheitsanteilswerten ij ab. Die Homogenitätshypothese dieses Tests behauptet also, daߟ ein Merkmal in den r Stichproben jeweils zugrundeliegenden Grundgesamtheiten jeweils die gleiche Verteilung hat. Zu prüfen ist also die Hypothese, daߟ die Stichproben aus einer Grundgesamtheit stammen: für alle i; j=1...s
    Prüfvariable ist wie bei allen Chi-Quadrat-Tests die Pearsonsche Variable U:

    Praktisch werden bei diesem Test die beobachteten Häufigkeiten bij mit den aufgrund der Homogenitätshypothese erwarteten Werten eij verglichen. Hierzu wird ein Chi-Quadrat-Test durchgeführt.
     Beispiel
    An der Ruhr-Uni Bochum wurden StudentInnen befragt, wie sie die Anforderungen ihres Studiums einschätzen. Es ergab sich folgender Befund:

    Fakultät
    Anforderungen
    zu hoch gerade noch zu bewältigen gut zu bewältigen bzw. gering Summe
    Philologie 10 (15,1) 58 (62,3) 47 (37,6) 115
    Jura 6 (15,8) 69 (65,0) 45 (39,3) 120
    Wirtschaftswissenschaft 18 (11,4) 53 (47,1) 16 (28,5) 87
    Sozialwissenschaft 3 (7,5) 25 (30,9) 29 (18,6) 57
    Maschinenbau 20 (7,2) 30 (29,8) 5 (18,0) 55
    Summe 57 235 142 434

    Entschieden werden soll, ob sich die Antworten über die Studienanforderungen zwischen den ausgewählten 5 Fakultäten wesentlich unterscheiden. Die Berechnung der erwarteten Häufigkeiten führt zu den eingeklammerten Werten: z.B. für "Philologie" und "gerade noch zu bewältigen" ergibt sich ein Wert von
    Für die Prüfvariable u ergibt sich ein Wert von 63,3 (Die Berechnung erfolgt analog zum Chi-Quadrat-Unabhängigkeitstest, S. 5).
    Die -Verteilung besitzt v=(r-1)(s-1)=4*2=8 Freiheitsgrade.
    Der Rückweisungspunkt liegt für v=8 und ein Signifikanzniveau von 10 Prozent bei 13,4 (Nachschlagen in Chi-Quadrat-Verteilung).
    Der Stichprobenbefund u=63,3 liegt rechts vom entsprechenden Rückweisungspunkt =13,4, die Hypothese muߟ zurückgewiesen werfen.
    Ergebnis: Die Nullhypothese muߟ abgelehnt werden, die Stichproben stammen nicht aus einer GG, die Unterschiede zwischen den Einschätzungen der einzelnen Studiengänge sind signfikant.

    1.1.3 X2-Unabhängigkeitstest

    Testsituation:

    • zwei dichotome oder polytome Merkmale X und Y
    • eine Stichprobe mit n Objekten, die jeweils eine Ausprägung von X und Y haben
    Vorgehensweise
    Der -Unabhängigkeitstest prüft die Hypothese, daߟ die beiden dichotomen/polytomen Merkmale in der Grundgesamtheit voneinander unabhängig sind:
    H0: ij=i..j
    Das weitere Vorgehen (Berechnung der Prüfvariable etc.) entspricht dem Vorgehen beim -Anpassungstest (S. 4)
    Beispiel
    vergleiche das Beispiel zum Anpassungstest, S. 4.
    Gezogen wird eine Stichprobe, wobei jede Person zwei Merkmale trägt: "Zugehörigkeit zu einer Fakultät" und "Beurteilung der Studienanforderungen".
    Geprüft werden soll, ob die These der Unabhängigkeit zwischen "Zugehörigkeit zu einer Fakultät" und "Beurteilung der Studienanforderungen" gestützt werden kann oder ob sie widerlegt werden muߟ. Der nun analog zu den anderen Chi-Quadrat-Tests durchzuführende Test wird als -Unabhängigkeitstest bezeichnet.

    1.2 t-Tests

    1.2.1 STUDENTisierung

    Die Tatsache, daߟ die Stichprobenverteilung des arithmetischen Mittels bei normalverteilter Gesamtheit ebenfalls normalverteilt ist, läߟt sich bei bekannter Grundgesamtheitsvarianz nutzen. Ist diese jedoch unbekannt, wäre eine entsprechende Schätzung über den Stichprobenbefund bei kleinem Stichprobenumfang zu ungenau. Eine Prüfvariable, die dies berücksichtigt, läߟt sich mit Hilfe des StUDENTisierung-Verfahrens gewinnen:
    Bei normalverteilter Grundgesamtheit gilt: .
    Es läߟt sich zeigen, daߟ wie verteilt ist (S ist die zur Stichprobenstreuung gehörende Stichprobenvariable). Man kann nun die Definition der Student-t-Variablen einsetzen und erhält die Gröߟe

    1.2.2 t-Test bei einer kleinen Stichprobe

    Testsituation:
    Der Mittelwertdifferenzentest ist ein t-Test bei einem kleinen Stichprobenumfang: n<30.
    Voraussetzung ist, daߟ die Verteilung in der Grundgesamtheit entweder dichotom oder normalverteil ist, sonst sollte man auf andere verteilungsfreie (aber ebenso effiziente) Prüfverfahren ausweichen, z.B. den U-Test.)
    Der t-Test testet, ob das arithmetische Mittel der Stichprobe sich signifikant vom arithmetischen Mittel der Grundgesamtheit unterscheidet. Der t-Test nutzt die Information, daߟ die Stichprobenverteilung des arithmetischen Mittels bei normalverteilter GG ebenfalls normalverteilt ist. Diese Beziehung läߟt sich nutzen, wenn die Grundgesamtheitsvarianz ebenfalls 0 ist.
    Es ergeben sich folgende Testsituationen:

    Varianz in der Grund-
    gesamtheit
    Verteilung der GG

    bekannt

    unbekannt

    normalverteilt






     nicht
    normalverteilt


    Ausweichen auf
    verteilungsfreie Verfahren!

     

    S ist die zur Stichprobenstreuung gehörende Stichprobenvariable.
    Vorgehensweise:

    • Die Nullhypothese lautet:
    • Man bestimmt den Wert der t-Variablen unter der Verwendung von .
    • Dieser Wert wird mit tr (ist abhängig vom SN und dem Parameter v=n-1) verglichen (Formelsammlung S. 31)

    1.2.3 Mittelwertdifferenzentest: t-Test bei zwei unabhängigen kleinen Stichproben

    Testidee
    Der t-Test für zwei unabhängige kleine Stichproben geht zurück auf das Studentisierungs-Verfahren (s. S.7).
    Bei kleinen Stichprobenumfängen lassen sich Aussagen über die Verteilungen der bislang verwendeten Prüfgröߟen nur machen, sofern die Grundgesamtheiten normalverteilt sind. Ist dies nicht der Fall, weicht man am besten auf verteilungsfreie Verfahren aus, z.B. den U-Test.
    Testsituation

    • zwei unabhängige kleine Stichproben (n<30)
    • Voraussetzung: GG sind normalverteilt, Varianzen der
      Gesamtheiten sind gleich (Varianzquotiententest durchführen!)
    Die Testsituation ergibt sich gemäߟ der Formelsammlung, S. 48.
    Beispiel
    Es werden zwei Gruppen von 4 bzw. 5 Schülern zufällig ausgewählt, die durch unterschiedliche Unterrichtsmethoden auf die Lösung von handwerklichen Problemen vorbereitet werden. Nach Abschluߟ des Unterrichts müssen die 9 Schüler jeweils 30 Probleme lösen. Man erhält für die beiden Gruppen folgendes Ergebnis (gelöste Probleme) und möchte wissen, ob die Differenz zwischen den beiden Grupenmitteln bei 5% Signifikanzniveau (einseitig) nur aus zufälligen Gründen aufgetreten ist.
    Gruppe 1 13 15 17 18
    Gruppe 2 14 16 18 22 23

    1. Die Nullhypothese lautet: 1=2
    2. Man berechnet die arithmetischen Mittel:
    3. ... und die Varianzen und (für den t-Test ist Voraussetzung, daߟ die GG normalverteilt sind und die Varianzen der Gesamtheiten gleich sind

  • ggf mit Varianzquotiententest prüfen!)
    4. Jetzt wird die Prüfgröߟe t1r berechnet:

    : Differenz der arithmetischen Mittel
    : ?, Differenz der arithm. Mittel in der Grundgesamtheit (?), kann aufgrund der Homogenitätshypothese mit 0 angenommen werden
    = =Varianz der Stichprobe 1,
    5. Für v=n1+n1-2=7 Freiheitsgerade ergibt sich bei einem SN von 5% einseitig (also bei 10% nachschauen, Tabelle Formelsammlung S.31) ein Rückweisungspunkt von 1,81.
    6. Die Prüfgröߟe liegt links vom Rückweisungspunkt (1,39<1,89), d.h. die Nullhypothese kann bestehen bleiben. Die Differenz zwischen den beiden Gruppenmitteln ist zufällig.

    1.2.4 Mittelwertdifferenzentest: t-Test bei zwei verbundenen Stichproben

    Der t-Test für zwei verbundene Stichproben läߟt sich als Problem des t-Test-Ein-Stichproben-Falls (S.7) auffassen. Ausgegangen wird von der Differenz der D=X1-X2. Aus den Paaren der Stichprobenvariablen (Xi1,X2i) und berechnet daraus den Durchschnitt:
    (weiteres siehe Formelsammlung)