7 Schätzen

  Schätzen nennt man das Festlegen von Werten für unbekannte Grundgesamtheiten mittels einer Stichprobe.
Unbekannt und gesucht sind Parameter einer Grundgesamtheit, bekannt sind lediglich Stichprobenmaßzahlen, von denen auf entsprechende Grundgesamtheiten geschlossen werden soll.

Die Punktschätzung löst Probleme der Art: Der unbekannte Parameter der Grundgesamtheit hat den Wert X. Wie groß ist X? Eine Punktschätzung berechnet also aus einer Zufallsstichprobe ein einziger Schätzwert für den unbekannten Parameter berechnet. Unbekannt bleibt, um welchen Betrag der erhaltene Schätzwert von dem gesuchten Parameter abweicht. Die Bestimmungsvorschrift für den unbekannten Parameter nennt man Schätzer oder Schätzfunktion, sie ist wiederum eine Zufallsvariable. Als Punktschätzverfahren sind vor allem die relativ anspruchslose Momentenmethode und die Maximum-Likelihood-Schätzung zu nennen. Die Momentenmethode macht keinerlei Verteilungsvorgaben über die Grundgesamtheit und schätzt die Momente der Grundgesamtheit mit den Momenten der Stichprobe ab.

Die Maximum-Likelihood-Schätzung setzt die Bekanntheit des Verteilungstyps der Grundgesamtheit voraus und bestimmt diejenigen Werte als Schätzwerte für die unbekannten Parameter, die dem erhaltenen Stichprobenresultat die größte Wahrscheinlichkeit des Auftretens verleihen.


Intervallschätzung: Der unbekannte Parameter der Grundgesamtheit liegt (mit einem Vertrauen von y%) im Bereich x1 bis x2, wobei der punktgeschätzte Wert X - der in der Mitte des Intervalls liegt - derjenige ist, der dem wahren Wert vermutlich am nächsten kommt. Die konstruierten Intervalle nennt man Konfidenzintervalle oder Vertrauensbereiche. Die Bereichsgrenzen sind Realisationen von Zufallsvariablen, sie werden aus der Stichprobe berechnet und bilden ein Zufallsintervall.

7.1 Maximum-Likelihood-Methode

Die Maximum-Likelihood-Methode ist eine Methode, um "Schätzer" zu finden (wie auch die Methode der kleinsten Quadrate). Der Grundgedanke der Maximum-Likelihood-Methode ist: Man sollte den oder die GG-Parameter so schätzen, daß die entsprechende Stichproben-Realisation die größte Chance hat, realisiert zu werden. Im Ggs zwischen Momentenmethode und zum Intervallverfahren müssen Informationen über die Verteilung vorliegen (à ein häufiges Problem).
Die Maximum-Likelihood-Methode geht auf die sogenannte Likelihoodfunktion zurück. Sie ist das Produkt aus n identischen Dichte- oder Wahrscheinlichkeitsfunktionen, gibt also die gemeinsame Dichte bzw. Wahrscheinlichkeit von n identischen und unabhängigen Zufallsvariablen an.
Die Zielfunktion lautet:
Der Grundgedanke der Maximum-Likelyhood-Methode läßt sich so beschreiben: Wenn wir einen theoretischen Parameter, z.B. µ, jenen Wert geben, den der aus der ML-Methode hervorgegangene Schätzer für eine konkret vorliegende Stichprobe annimmt, dann haben wir die Vorstellung mit genau jenem Parameterwert herausgefunden, für die das vorgefundene Stichprobenergebnis das "plausibelste" ist. Es ist plausibler, "vernünftiger" oder eben naheliegender, der GG-Verteilung diesen Parameterwert zuzuschreiben als irgeneinen anderen. Die höchste Vermutung ("Mutmaßlichkeit") spricht für diesen Parameterwert.

7.2 Güte von Punktschätzungen

Für die Güte der Punktschätzungen werden im allgemeinen vier Kriterien angegeben:

  1. Die Erwartungstreue
    Der Erwartungswert der Schätzfunktion sollte möglichst gleich dem wahren Parameterwert sein. Dies ist auch in vielen Fällen, wie z.B. bei der Punktschätzung des arithm. Mittels so, andererseits lassen sich auch Beispiele anführen, wie z.B. die Punktschätzung der Varianz der Grundgesamtheit über die Varianz in der Stichprobe, bei denen diese Erwartungstreue nur asymptotisch, bei großen Stichprobenumfängen gilt.
  2. die Effizienz
    eine Schätzfunktion sollte möglichst eine geringe Varianz aufweisen, ein Vergleich zweier erwartungstreuer Schätzfunktionen bezüglich dieses Kriteriums ermöglicht es, die effizientere zu wählen, ihre Einzelschätzungen liegen dann durchschnittlich näher am wahren Parameterwert als bei der Schätzfunktion mit der größeren Varianz. Die Präferenz für die Maximum-Likelihood-Methode gegenüber der Momentenmethode wird des öfteren mit diesem Kriterium begründet.
  3. die Konsistenz
    Die Varianz der Stichprobenfunktion sollte möglichst gemäß dem Gesetz der Großen Zahl, mit zunehmenden Stichprobenumfang abnehmen, d.h. der Schätzwert sollte mit steigendem Stichprobenumfang dem Grundgesamtheitsparameterwert beliebig nahe kommen und somit zu ihm stochastisch konvergieren. Anzumerken wäre, daß Punktschätzungen nach der Momentenmethode stets konsistent sind, während das für die ML-Methode nur für die Mehrzahl der Fälle gilt.
  4. die Suffizienz und Robustheit
    In der Literatur wird selten auch dieses letzte Kriterium angegeben. Das Kriterium besagt, daß die Schätzfunktion möglichst alle Informationen in der Stichprobe über den Parameter nutzen, und gegenüber Abweichungen und Extremwerten eine gewisse Robustheit vorliegen sollte. So ist z.B. der Median gegenüber Extremwerten robuster als das arithm. Mittel.

7.3 Konfidenzbereiche=Konfidenzintervalle=Vertrauensbereiche

Man versteht unter dem Begriff Vertrauensbereich ein aus Stichprobenwerten berechnetes Intervall, welches den wahren, aber unbekannten Parameter mit einer vorgegebenen Wahrscheinlichkeit überdeckt.

Beispiel: das arithmetische Mittel
Ausgehend von einem Repräsentationsschluß, also von einem Schluß von dem Schätzwert auf den Grundgesamtheitsparameter, ist der aus einer Stichprobe ermittelte Schätzwert nur eine Schätzung des Mittelwertes µ der Grundgesamtheit, d.h. daß bei verschiedenen Stichproben die ermittelten Schätzwerte im allgemeinen variieren. Nun läßt sich allerdings ein Intervall angeben, daß mit einer bestimmten Wahrscheinlichkeit auch den Parameter der Grundgesamtheit enthält. Wählt man also einen Vertrauensbereich von 90%, so enthält der Vertrauensbereich zu P=90% den Parameter der Grundgesamtheit, in 10% der Fälle wird er außerhalb liegen. Letztere Wahrscheinlichkeiten bezeichnet man auch als Irrtumswahrscheinlichkeit , P und ergänzen sich zu 1. Wesentlich ist nun, daß ein Gegensatz zwischen Schärfe der Aussage und der Sicherheit der Aussage besteh: ein hoher Wert für P führt zu sicheren, aber unscharfen Aussagen, d.h. der Vertrauensbereich ist sehr breit, ein kleiner Wert für P für zu unsicheren, aber scharfen Aussagen. Grundsätzlich werden Vertrauensbereiche enger, wenn also einerseits die Irrtumswahrscheinlichkeit, aber auch andererseits der Stichprobenumfang erhöht wird.