1. EducationMathStatisticsErstellung eines Konfidenzintervalls für den Unterschied zweier Mittelwerte mit bekannten Standardabweichungen
Statistics For Dummies, 2. Ausgabe

Von Deborah J. Rumsey

Wenn Sie die Standardabweichungen für zwei Stichproben kennen, können Sie ein Konfidenzintervall (CI) für die Differenz zwischen deren Mittelwerten oder Durchschnittswerten ermitteln. Viele statistische Erhebungen und Studien haben zum Ziel, zwei Bevölkerungsgruppen zu vergleichen, z. B. Männer gegen Frauen, Familien mit niedrigem oder hohem Einkommen und Republikaner gegen Demokraten. Wenn das zu vergleichende Merkmal numerisch ist (zum Beispiel Größe, Gewicht oder Einkommen), ist das interessierende Objekt der Betrag der Differenz in den Mitteln (Durchschnitten) für die zwei Populationen.

Zum Beispiel möchten Sie vielleicht den Unterschied im Durchschnittsalter von Republikanern gegenüber Demokraten oder den Unterschied im Durchschnittseinkommen von Männern gegenüber Frauen vergleichen. Sie schätzen die Differenz zwischen zwei Populationsmitteln,

image0.png

indem aus jeder Population eine Stichprobe genommen wird (z. B. Stichprobe 1 und Stichprobe 2) und die Differenz der beiden Stichprobenmittel verwendet wird

image1.png

plus oder minus eine Fehlerspanne. Das Ergebnis ist ein Konfidenzintervall für die Differenz zweier Populationsmittelwerte.

image2.png

Wenn beide Populationsstandardabweichungen bekannt sind, lautet die Formel für einen CI für die Differenz zwischen zwei Populationsmitteln (Durchschnittswerten)

image3.png

sind der Mittelwert und die Größe der ersten Stichprobe sowie die Standardabweichung der ersten Grundgesamtheit.

image4.png

gegeben ist (bekannt);

image5.png

und n2 sind der Mittelwert und die Größe der zweiten Stichprobe sowie die Standardabweichung der zweiten Grundgesamtheit.

image6.png

gegeben ist (bekannt). Hier ist z * der geeignete Wert aus der Standardnormalverteilung für Ihr gewünschtes Konfidenzniveau. (In der folgenden Tabelle finden Sie Werte für z * für bestimmte Vertrauensstufen.)

Gehen Sie wie folgt vor, um einen CI für die Differenz zwischen zwei Populationsmitteln mit bekannten Standardabweichungen zu berechnen:

image7.png

Angenommen, Sie möchten den Unterschied zwischen der mittleren (durchschnittlichen) Länge der Maiskolben zweier Zuckermais-Sorten mit einer Wahrscheinlichkeit von 95% schätzen (so dass sie die gleiche Anzahl von Tagen unter den gleichen Bedingungen anbauen können). Nennen Sie die beiden Sorten Corn-e-stats und Stats-o-sweet. Angenommen, die Populationsstandardabweichungen für Corn-e-stats und Stats-o-sweet betragen nach vorherigen Untersuchungen 0,35 Zoll bzw. 0,45 Zoll.

image15.png

Die Versuchung ist zu sagen: „Nun, ich wusste, dass Corn-e-stats-Mais länger war, weil sein Stichprobenmittel 8,5 Zoll betrug und Stat-o-sweet im Durchschnitt nur 7,5 Zoll betrug. Warum brauche ich überhaupt ein Konfidenzintervall? “Alle diese beiden Zahlen sagen, dass es sich um 210 Ähren handelt, die als Stichprobe genommen wurden. Sie müssen auch die Abweichungen anhand der Fehlerquote berücksichtigen, um Aussagen über die gesamte Maisbevölkerung treffen zu können.

Beachten Sie, dass Sie einen negativen Wert für erhalten können

image19.png

Wenn Sie beispielsweise die beiden Maissorten vertauscht hätten, hätten Sie für diesen Unterschied -1 erhalten. Sie würden sagen, dass Stats-o-sweet im Durchschnitt einen Zentimeter kürzer war als Corn-e-stats in der Stichprobe (dieselbe Schlussfolgerung wurde anders angegeben).

Wenn Sie negative Werte für die Differenz der Stichprobenmittelwerte vermeiden möchten, machen Sie die Gruppe mit dem größeren Stichprobenmittelwert immer zu Ihrer ersten Gruppe - alle Ihre Unterschiede sind positiv.

Selbst wenn die Gruppe mit dem größeren Stichprobenmittelwert als erste Gruppe dient, erhalten Sie manchmal immer noch negative Werte im Konfidenzintervall. Angenommen, in dem obigen Beispiel betrug der Stichprobenmittelwert von Corn-e-stats 7,6 Zoll. Somit beträgt die Differenz im Abtastmittel 0,1, und das obere Ende des Konfidenzintervalls beträgt 0,1 + 0,1085 = 0,2085, während das untere Ende 0,1 - 0,1085 = –0,0085 beträgt. Dies bedeutet, dass der wahre Unterschied einigermaßen überall liegt, von Corn-e-stats, die 0,2085 Zoll länger sind, bis hin zu Stat-o-sweet, das 0,0085 Zoll länger ist. Es ist zu nah, um genau zu sagen, welche Sorte durchschnittlich länger ist.