2 Tests bei nominalem Meßniveau

2.1 Vorbemerkung

Bei nominalskalierten Daten ist der Anteilswert die statistische Maßzahl beim Testen.
Bei einem großen Stichprobenumfang dient die Normalverteilung als Stichprobenverteilung.

2.2 Binominaltest (= Anteilswerttest)

2.2.1 Testsituation

  • eine diskrete dichotome (-> zwei Ausprägungen) Zufallsvariable (z.B. Geschlecht mit den Ausprägungen männlich und weiblich)

2.2.2 Testidee

Geprüft werden soll, ob die Verteilungsfunktion F(x) der Zufallsvariablen X der durch die Hypothese festgelegten Verteilungsfunktion Fo(x) entspricht, d.h.
Ho: F(x)=Fo(x). Da die Variable dichotom ist, kann man vereinfachen zu Ho: =o Man prüft also, ob die Verteilung der Variablen X in der Stichproben der in der Grundgesamtheit entspricht.
Der Rückweisungspunkt beim Binominaltest ist durch das Signifikanzniveau gegeben. Da ein Signifikanzniveau von 0,05 oder 0,10 etc. nicht exakt tabelliert ist, muß man den Punkt ungefähr bestimmen und modifiziert die Nullhypothese Ho: <=o . Jeder Wert <= dem Rückweisungspunkt ist Rückweisungspunkt.

2.2.3 Methode

Da wir nur zwei Klassen vorliegen haben,
1. zählt man die Besetzungszahlen der beiden Klassen aus und
2. berechnet man die relativen Häufigkeiten p bzw. 1-p
In der Regel ergibt sich ein Unterschied zwischen der Verteilung der Grundgesamtheit und der Stichprobe. Geprüft wird nun, ob der Unterschied zufällig oder signifikant ist. (Signifikanzniveau beispielsweise 5 %).

2.2.4 Beispiel I (Vorlesung)

Ein Hersteller von Geräten behauptet, daß höchstens 5 Prozent defekte Stücke produziert werden. Per Zufall werden 20 Stücke entnommen. 3 Stücke sind defekt.
Frage: Kann man dem Hersteller bei 10% Signifikanzniveau trauen?
Folgende Werte sind gegeben:

  • n = 20
  • x = 3 (Anzahl der defekten Stücke)
  • (Anteilswert)
Es gibt nun zwei Möglichkeiten, den Test durchzuführen:
1. über den Anteilswert p
2. über die absolute Häufigkeit
Berechnung über den Anteilswert:
  • Ho: o<=0,05 (Es sind höchstens 5 Prozent kaputt sind, 5 %=0,05; entspricht der Erfolgswahrscheinlichkeit, ein fehlerhaftes Stück aufzufinden)
  • Ha: a>0,05 (in Wirklichkeit ist die Zahl der defekten Stücke größer als 5 Prozent)
  • (der Anteil der defekten Stücke beträgt 15 Prozent)
  • P folgt
  • Der Rückweisungspunkt ergibt sich aus dem Signifikanzniveau. Das Signifikanzniveau beträgt 10%, d.h. P(X>=xr)=0,10.
  • Da 0,10 nicht exakt in der Binominalverteilungstabelle tabelliert ist, schlägt man die beiden Werte nach, nie als nächstes an 0,1 herankommen (dabei benutzt man die Erfolgswahrscheinlichkeit des defekten Stückes von =0,05 oder 5%)
    Binominalverteilung B(n, ) (Auszug aus Formelsammlung B-Verteilung, Tafel 9):

n

X

0,050

20

0

0,358


1

0,377


2

0,189


3

0,060


4

0,013


5

0,002


6

0,000

Die Wahrscheinlichkeit, daß mehr als 3 defekte Stücke auftreten, P(X>=3) ist 0,073 (->man addiert die Werte ab 3 bis 20). 0,073 <=0,10, d.h. der Rückweisungspunkt würde unterschritten.
Die Wahrscheinlichkeit, daß mehr als 2 defekte Stücke auftreten, P(X>=2) ist 0,262 (->man addiert die Werte ab 3 bis 20). 0,262 >=0,10, d.h. der Rückweisungspunkt würde überschritten.
Der Wert für den Rückweisungspunkt läge zwischen 2 und 3, man wählt den Punkt, bei dem Ho höchstwahrscheinlich nicht verworfen wird, d.h. der Rückweisungspunkt lautet nicht mehr pr=0,10, sondern pr<=0,10, formal korrekt geschrieben: P(X>=xr)<=0,10. Diese Verschiebung des Signifikanzniveaus bezeichnet man als "Konservativer Test":
Der Punkt, der für die Beibehaltung der Ho tendenziell günstig liegt (Beispiel: genau 10% Signifikanzniveau) ist nicht möglich. Man wählt daher ein kleineres Signifikanzniveau, um die Ho beibehalten zu können. Beim konservativen Testen werden die Parameter abgeschätzt, die Ho im Zweifel eher angenommen.
Ergebnis: Der Stichprobenbefund von drei oder mehr defekten Stücken führt zur Rückweisung der Ho. Maximal zwei defekte Stücke sind erlaubt.

2.2.5 Beispiel II: klassische Aufgabenstellung für den Binomialtest

Zu testen ist die Hypothese, daß der Anteil weiblicher Studierender an der Ruhr-Uni-Bochum bei 50% liegt (Signifikanzniveau: 10 % einseitig). In einer Zufallsstichprobe werden n=16, x=4 Frauen beobachtet.
Frage: Sind die Frauen unterrepräsentiert?

Begründung des Prüverfahrens
Geprüft werden soll hier eine Hypothese über die Verteilung einer Zufallsvariablen in der Grundgesamtheit. Eine solche Hypothese läßt sich mit einem Anpassungstest prüfen. Da es sich hier um eine dichotome Untersuchungsvariable bei nominalem Meßniveau handelt, ist der Binomialtest das geeignete Prüfinstrument.
Prüfung der Voraussetzungen für ein Bernoulli-Experiment
  1. Zwei Ergebnisalternativen: a-weiblich: P(a)=0.5 b-männlich: =1-0.5=0.5
  2. Die Einzelwahrscheinlichkeiten sind mit =0.5 konstant.
  3. Die Wahrscheinlichkeit bei den 16 Experimenten ist gleich groß.
  4. Die Zufallsstichprobe gewährleistet die Unabhängigkeit der Ergebnisse.
Es liegt eine Versuchsanordnung nach Bernoulli vor, der Binomialtest kann durchgeführt werden.
Die Nullhypothese lautet: (Die Frauen sind nicht unterrepräsentiert)
Bei einer Bernoulli-Verteilung folgt die Zufallsvariable X einer Binomialverteilung B(n,), x folgt hier B(16, 0.5). Untersucht werden muß, ob der Stichprobenbefund (4 Frauen) oder ein noch weiter von der Hypothese abweichender Punkt (3, 2, 1, keine Frau) realisiert wird.
P(p<=0.25|H0)
falls p>, wird die H0 angenommen
falls p<, wird die H0 abgelehnt
Aus der Tabelllierung der Binomialverteilung kann man die Einzelwahrscheinlichkeiten für das Auftreten von keiner, 1, 2, 3, 4 Frauen ablesen:
P(4)=0.028
P(3)=0.009
P(2)=0.002
P(1)=0.0
P(0)=0.0
0.039
Die Wahrscheinlichkeit, daß der Stichprobenbefund oder ein noch weiter entfernter Befund realisiert wird, beträgt 0.039. Das entspricht einer prozentualen Wahrscheinlichkeit von 3,9 Prozent.
Der Rückweisungspunt pr ergibt sich durch das Signifikanzniveau von 10%, also einem Anteilswert von 0.1
0.039<0.1 (p<pr), daraus folgt, daß die H0 verworfen werden muß. Die Frauen sind in der Stichprobe unterrepräsentiert.

2.2.5.1 Bemerkungen

Der Binominaltest ist ein konservativer Test. Er begünstigt die Annahme der Nullhypothese.

2.3 McNEMAR-Test

2.3.1 Testsituation

Der McNemar-Test ist ein Homogenitätstest, der sich eignet für

  • zwei abhängige (=verbundene) Stichproben
  • nominalskalierte, dichotome Variablen
!

Wenn die Variablen mehrstufig sind, z.B. die Religionszugehörigkeit, muß man dichotomisieren, z.B. Katholiken gegen Nichtkatholiken oder christliche Religionen gegen andere.

2.3.2 Testidee

Der McNemar-Test gehört zu den binominalen Testverfahren. Er kann angewendet werden, wenn eine Vierfeldertafel vorliegt und wenn untersucht werden soll, ob sich bestimmte Merkmalskombinationen in bedeutsamer Weiser verändert haben.
Gegeben sind zwei Alternativmerkmale, die jeweils zwei Variationen aufweisen (dichotome Variable).
Es werden nun die Anzahl der Wechsler betrachtet, d.h. der Elemente, die in der zweiten Stichprobe eine andere Merkmalsausprägung angenommen haben. Man prüft, ob sich der Anteilswert von den Wechslern (siehe Beispiel unten) signifikant von 0,5 unterscheidet. 0,5 ist deshalb der Entscheidungswert, weil es sich um eine dichotome Variable handelt, deren Erfolgswahrscheinlichkeit 0,5 beträgt. Letztendlich wird ein Binominaltest durchgeführt, der zur Abweisung oder Annahme der Variablen führt (Details siehe Beispiel).
Der McNemar-Test ist ein konservativer Test, der oft bei vorher-nachher-Erhebungen oder mit-ohne Erhebungen durchgeführt wird.

2.3.3 Beispiel (Tiede S. 54)

Vor und nach einer Parteiveranstaltung werden die Besucher nach ihrem Wahlverhalten in Bezug auf diese Partei befragt. Für den McNemar-Test interessiert nun die Anzahl der Personen, die ihre Wahlabsichten geändert haben (-> Wechsler).

vorher[arrowdown]

nachher->

vorher

nachher

Summe

Partei wird gewählt

30

35

65

Partei wird nicht gewählt

30

25

55

Summe

60

60

120

Zu diesem Zweck stellt man die Tabelle folgendermaßen um, um die Differenz zwischen vorher und nachher deutlich machen zu können:


nachher

Summe



Partei wird nicht gewählt

Partei wird gewählt



Partei wird gewählt

25
a

5
b

30

vorher

Partei wird nicht gewählt

10
c

20
d

30

Summe

35

25

60

In den vier Feldern stehen die Anzahl der Leute, die ihre Meinung geändert haben (b=5, c=10) Personen, sowie der Anzahl der Leute, die ihre Meinung beibehalten haben (a=25, d=20).
Falls die Nullhypothese zutrifft, wird man erwarten, daß sich c und b nur zufällig voneinander unterscheiden. Als Prüfvariable dient hier beispielsweise (!) die Zahl der Wechsler b.
Sie ist, wenn die Nullhypothese zutrifft, binominalverteilt nach B(b+c; 0,5). Für c gilt das gleiche!
Das heißt, man kann hier einen Binominaltest (vgl. S. 13) durchführen, der testet, ob sich der Anteilswert signifikant von 0,5 unterscheidet.
Auf das Beispiel angewendet ergibt sich:
Die Rückweisungspunkte der vorliegenden Binominalverteilung B(15;0,5) liest man nun in Tiedes Buch, S. 153, Tabelle 3, oder in der Formelsammlung (Tabellierung für Median-Vorzeichen-Test) ab. Die Rückweisungspunkte lauten 3 und 12 bei einem Signifikanzniveau von 5 %.
und
Da 0,2 (-> 1. Rückweisungspunkt) <= 0,33 (Prüfwert) <= 0,8 (-> 2. Rückweisungspunkt) ist, wird die Nullhypothese angenommen. D.h. der Unterschied zwischen vorher und nachher ist zufällig. Das heißt ebenfalls: De Anteilswerte und unterscheiden sich nicht signifikant voneinander.
Auf den praktischen Inhalt der Aufgabe bezogen heißt das, daß die Wahlveranstaltung die Chancen der Partei nicht wesentlich verändert hat.
Der McNemar-Test nutzt die Tabellierung für den Median-(Vorzeichen)-Test.

2.4 Differenzentest für zwei Anteilswerte aus zwei großen unabhängigen Stichproben

Tiede faßt die Ergebnisse des ersten Bandes, S. 160 und S. 182, zusammen, in dem die Stichprobenverteilung der Differenz zweier Anteilswerte bereits erörtert wurde.

2.4.1 Testsituation

  • zwei große unabhängige Stichproben
  • die dichotome Variable ist nominal skaliert
  • die Auszählung der Kategorien ist gegeben, p1 und p2 sind bekannt

2.4.2 Testidee

Gegeben ist eine Stichprobe mit den Anteilswert 1. Über die Grundgesamtheit vermutet man jedoch einen Grundgesamtheitsanteilswert von 2. Ist der Unterschied zufällig oder signifikant?
Bei großem Stichprobenumfang und unbekannten Grundgesamtheitsangaben kann man die Stichprobenverteilung der Differenz zweier Anteilswerte durch eine Normalverteilung approximieren.
Die Rückweisungspunkte für die Hypothese Ho:1- 2=[delta] lauten:

Da man 1 und 2 nicht kennt, wird 1 und 2=0 geschätzt. Der Fischer-Test ist hier der bessere Lösungsweg.
Voraussetzung ist allerdings, daß die Anteilswerte nicht zu nahe bei Null liegen dürfen
Falls die Stichprobe klein ist, greift man zum Fisher-Test (siehe S. 17)

2.5 FISHER-Test

2.5.1 Testsituation

  • zwei unabhängige Stichproben mit zwei dichotomen Gesamtheiten
  • die unbekannten Verteilungsfunktionen heißen: F1(X) und F2(X).

2.5.2 Testidee

Der Fishertest ist eine Sonderform des [chi]2-Test, insofern also auch ein Anpassungstest.
Mit dem Fisher-Test läßt sich eine Vierfelderverteilung prüfen, auch wenn die Stichprobe und damit die erwarteten und beobachteten Häufigkeiten klein sind.
Mit Hilfe der hypergeometrischen Verteilung, die für diskrete Variablen definiert ist, kann man exakt die Wahrscheinlichkeit bestimmen, mit der bei gegebenen univariaten Randverteilungen eine bestimmte Häufigkeitverteilung in den vier Feldern der Tabelle auftritt.
Geprüft werden soll: Ho: F1(X)=F2(X) für alle x, d.h. die Verteilung der ersten Stichprobe entspricht der der zweiten Stichprobe, beide Stichproben stammen aus der gleichen Grundgesamtheit.
Eine Vierfeldertafel sei folgendermaßen notiert:

Ausprägung des Merkmals ->
Nr. der Stichprobe [arrowdown]

a


Summe

1

x1

n1-x1

n1

2

x2

n2-x2

n2

Summe

x

n-x

n

Falls die Nullhypothese zutrifft, unterscheiden sich die Anteilswerte nur zufällig voneinander.
Gesucht ist die Wahrscheinlichkeit für X1|x unter der Bedingung, daß Ho in Wahrheit zutrifft.
Um den Unterschied zwischen p1 und p2 zu beurteilen, genügt es, sich mit x1 (oder x2) zu befassen, da die anderen Werte (x=1n=2n=n und n1 und n2) bekannt sind, bzw. sich errechnen lassen (-> Nur ein Feld in der 2x2-Tafel ist frei variierbar).
Man numeriert die Stichproben so um, daß x1 <= die anderen drei Häufigkeiten ist!
Die Prüfgröße X1 folgt bei korrekter Nullhypothese X1 einer hypergeometrischen Verteilung mit:

Eigenschaften von x1:

  • relativ größere Werte von x1 führen dazu, daß die Differenz zwischen p1 und p2 größer wird (relativ oberer Bereich).
  • relativ große Werte von x1 führen eher zur Ablehnung der Ho.

2.5.3 Beispiel

Während einer Industrieausstellung wurden 5 Vertreter inländischer Unternehmen und 6 Vertreter ausländischer Unternehmen über ihren Eindruck vom Geschäftsklima befragt:

Änderung des Geschäftsklimas ->
Unternehmen [arrowdown]

Verschlechterung

Verbesserung

Summe

Inländisch

1

4

5

Ausländisch

5

1

6

Summe

6

5

11

Geprüft werden soll: Sind die Unterschiede in den Antworten zufällig (Ho) oder nicht (Ha)?
Ho (umformuliert): und unterscheiden sich nur zufällig voneinander.

  • Gegeben sei ein 5%iges Signifikanzniveau.
  • Man berechnet die Prüfgröße X1:
  • Man prüft nun für x1=1, ob der Rückweisungspunkt x1r rechts oder links von x1 liegt.
  • P(1)=0,0649.
  • Bei einem Signifikanzniveau von 5%, d.h. einem P(0,05), wird die Hypothese nicht verworfen, da 0,0649>0,05.
  • Ergebnis: die Unterschiede in beiden Stichproben sind zufällig!