Übung 12

Methoden zum Vergleich von Gruppen 2
Published

December 2, 2024

Aufgaben

Hinweise:

  • Die Formelsammlung zu dieser Übung finden Sie auf OLAT.
  • Die Tabelle für die \(\chi^2\)-Verteilung finden Sie hier.


Aufgabe 12.1

Was kann mit einem \(\chi^2\)-Test getestet werden und welche Voraussetzungen müssen dabei erfüllt sein?

Mit dem \(\chi^2\)-Test kann überprüft werden, ob zwei kategoriale Variablen unabhängig voneinander sind. Die kategorialen Variablen können mehr als zwei Ausprägungen haben.

Vorausgesetzt wird hier, dass die Variablen kategorial sind und die Messungen (Stichproben) voneinander unabhängig sind. Das heisst eine Messung darf nicht in mehreren Feldern auftreten und die Messungen dürfen nicht abhängig sein (d.h. keine Messwiederholung oder gepaarte Daten). Ausserdem sollte die erwartete Häufigkeit für jede Zelle mind. 5 betragen, ansonsten wird auf den Fisher-Yates-Test zurückgegriffen. Ausserdem müssen die absoluten Häufigkeiten vorliegen, um die Prüfgrösse zu berechnen.


Aufgabe 12.2

Inwiefern ist der Zweistichproben-\(\chi^2\)-Test ein Globaltest, der keine spezifischen Hypothesen testet?

Der Test bezieht sich bei mehr als 4 Zellen in der Häufigkeitstafel auf eine globale Abweichung der empirischen Häufigkeitsverteilung von der theoretisch angenommenen Verteilung. Der Test ist also nicht in der Lage eine spezifische Hypothese zu Ausschnitten aus der Häufigkeitstabelle (d.h. zu spezifischen Zellen der Tafel) zu testen.

Er testet auch nicht die Richtung des Zusammenhangs. Dazu müssten zusätzliche Tests gemacht werden, um die Art und Richtung des Zusammenhangs genauer zu untersuchen. Der Vierfelder-\(\chi^2\)-Test ist formal auch ein Globaltest, jedoch ist hier eindeutig, welche Variablen zusammenhängen, da nur zwei Variablen mit je zwei Ausprägungen betrachtet werden.


Aufgabe 12.3

Bestimmen Sie für folgende Werte die Prüfgrösse:

  1. \(\chi^2_{95 \%;20}\)

  1. \(\chi^2_{5 \%;20}\)

  1. \(\chi^2_{95 \%;1}\)

  1. \(\chi^2_{97.5 \%;1}\)

  1. \(\chi^2_{50 \%;10}\)

  1. \(\chi^2_{95 \%;40}\)


Aufgabe 12.4

  1. Überprüfen Sie die Werte aus Aufgabe 4.7 mit Hilfe des \(\chi^2\)-Tests auf Unabhängigkeit auf einem Signifikanzniveau von \(\alpha=5 \%\), d.h. ob die beiden Ereignisse «Schirm» und «Regen» unabhängig sind oder nicht.


Regen “ja” Regen “nein” Summe
Schirm “ja” 20 10 30
Schirm “nein” 30 40 70
50 50 100


  • Berechnen Sie die erwarteten Häufigkeiten anhand der Formel \(e_{ij}=\frac {n_{i \bullet} \cdot n_{\bullet j}}{n}\). Multiplizieren Sie dazu jeweils die beiden Randverteilungen und dividieren Sie durch die Gesamtsumme.

  • Berechnen Sie anhand der Formel die Prüfgrösse und bestimmen Sie die Freiheitsgrade (\(df\)).

  • Bestimmen Sie mit Hilfe der Tabelle den kritischen Wert und vergleichen ihn mit der empirischen Prüfgrösse.

Die theoretisch erwartete Häufigkeitsverteilung unter der Nullhypothese, der zufolge die beiden Dimensionen “Schirm” und “Regen” voneinander unabhängig sind, sieht folgendermassen aus:

Regen “ja” Regen “nein” Summe
Schirm “ja” 15 15 30
Schirm “nein” 35 35 70
50 50 100


Aufgrund der beiden Häufigkeitsverteilung wird die Prüfgrösse \(\chi^2\) berechnet:

\(\chi^2=\frac{(20-15)^2}{15}+\frac{(10-15)^2}{15}+\frac{(30-35)^2}{35}+\frac{(40-35)^2}{35}=\frac{25}{15}+\frac{25}{15}+\frac{25}{35}+\frac{25}{35}=4.76\)

\(df=1\)

Der kritische \(\chi^2\)-Wert liegt bei \(3.84\). Daher kann die Nullhypothese abgelehnt werden, die postuliert, dass es zwischen “Schirm” und “Regen” keine Abhängigkeit gibt. Wir kommen also zum gleichen Schluss (keine Unabhängigkeit), wie bei Aufgabe 4.7.

Die Hypothese wird ungerichtet getestet, da nominalskalierte Daten vorliegen und diese beliegig codiert werden können. Ausserdem kann mit dem \(\chi^2\)-Test nur einseitig getestet werden, da der \(\chi^2\)-Wert nicht negativ werden kann.


  1. Überprüfen Sie die Werte aus Aufgabe 4.7 ausserdem auch mit Hilfe des \(\chi^2\)-Tests (Pearson’s Chi-squared test) in R (WebR). Erstellen Sie dazu eine Matrix mit den Häufigkeitsverteilungen und berechnen Sie dann den \(\chi^2\)-Test.

Um die Matrix zu erstellen, ersetzen Sie die Platzhalter n11, n21, n12, n22 durch die entsprechenden Werte.

Unter c("x1", "x2") können Sie die Zeilen (rows) beschriften, indem Sie z.B. x1 ersetzen.

Unter c("y1", "y2") können Sie die Spalten (colums) beschriften, indem Sie z.B. y1 ersetzen.

Drücken Sie Run Code.


Der Pearson’s Chi-squared test in R ergibt ebenfalls \(\chi^2=4.76\).

## 
##  Pearson's Chi-squared test
## 
## data:  data
## X-squared = 4.7619, df = 1, p-value = 0.0291


  1. Berechnen Sie die empirische Effektgrösse \(\hat \omega\) nach Cohen.

Mit Hilfe der Formel erhalten wir einen Wert von \(\hat \omega= \sqrt{ \frac{4.76}{100}}=0.22\). Es handelt sich dabei nach Cohen (1988) um einen kleinen Effekt.


  1. Berechnen Sie die Odds-Ratio.

\(OR=\frac {n_{11}}{n_{12}} \cdot \frac{n_{22}}{n_{21}}=\frac {20}{10} \cdot \frac{40}{30}=2.67\)

Das bedeutet, dass die Chancen (odds) für das Auftreten eines bestimmten Ereignisses in der ersten Gruppe 2.67-mal höher ist als in der Vergleichsgruppe.

Regen tritt in der Gruppe mit Schirm “ja” 2.67-mal häufiger auf als in der Gruppe Schirm “nein”. Es ist also 2.67-mal wahrscheinlicher, dass es regnet, wenn man einen Schirm dabei hat, als wenn man keinen Schirm dabei hat. Hierbei handelt es sich selbstverständlich nicht um einen Kausalzusammenhang bei dem der Schirm den Regen beeinflusst.


  1. Weshalb kann für einen \(\chi^2\)-Test kein Konfidenzintervall berechnet werden?

Mit einem Konfidenzintervall wird die Unsicherheit der Parameterschätzung angegeben. Bei einem \(\chi^2\)-Test wird jedoch kein Parameter geschätzt. Da er keine Punkt- oder Parameterschätzung liefert, gibt es keine direkte Grundlage für ein Konfidenzintervall.


Aufgabe 12.5

In einem Experiment wurden Versuchspersonen in zwei Bedingungen eingeteilt und in beiden Gruppen die Stimmung manipuliert. Dazu wurden die Versuchspersonen entweder in gute Stimmung (Gruppe 1) oder in schlechte Stimmung (Gruppe 2) versetzt; anschliessend sollten sie eine Anagrammaufgabe lösen. Gezählt wurde, wie viele Anagramme die Versuchspersonen in den beiden Bedingungen gelöst haben. Bei dieser abhängigen Variablen soll es sich um einen Indikator für die stetige Variable kognitive Leistungsfähigkeit handeln.

Im Anschluss wurde geprüft, ob die Stimmung auch die Hilfsbereitschaft beeinflusst. Die Versuchspersonen erhielten als Entschädigung für ihre Teilnahme an der Untersuchung 10 CHF, die sie (a) entweder selbst behalten, (b) der Universität zur Verbesserung der Bibliotheksausstattung oder (c) einem Kinderhilfswerk spenden durften.

In Gruppe 1 (positive Stimmung) entschieden sich 5 Personen für a, 12 Personen für b und 13 Personen für c. 

In Gruppe 2 (negative Stimmung) entschieden sich 10 Personen für a, 14 Personen für b und 6 Personen für c. 

  1. Prüfen Sie mithilfe eines Zweistichproben-\(\chi^2\)-Tests auf einem Signifikanzniveau von \(\alpha=5 \%\), ob die Verteilungen in den beiden Stichproben (Bedingungen) signifikant voneinander abweichen. Zu welchem Ergebnis kommen Sie?

Die empirische Häufigkeitsverteilung sieht folgendermassen aus:

(a) (b) (c) Summe
positiv 5 12 13 30
negativ 10 14 6 30
15 26 19 60


Die theoretisch erwartete Häufigkeitsverteilung unter der Nullhypothese, der zufolge die beiden Dimensionen Stimmung und Entscheidung voneinander unabhängig sind, sieht folgendermassen aus:

(a) (b) (c) Summe
positiv 7.5 13 9.5 30
negativ 7.5 13 9.5 30
15 26 19 60


Aufgrund der beiden Häufigkeitsverteilung wird die Prüfgrösse \(\chi^2\) berechnet:

\(\chi^2=\frac{(5-7.5)^2}{7.5}+\frac{(10-7.5)^2}{7.5}+\frac{(12-13)^2}{13}+\frac{(14-13)^2}{13}+\frac{(13-9.5)^2}{9.5}+\frac{(6-9.5)^2}{9.5}\)

\(=\frac{6.25}{7.5}+\frac{6.25}{7.5}+\frac{1}{13}+\frac{1}{13}+\frac{12.25}{9.5}+\frac{12.25}{9.5}=4.4\)

\(df=(p-1) \cdot (k-1)=1 \cdot 2=2\)

Der kritische \(\chi^2\)-Wert liegt bei \(5.99\). Daher kann die Nullhypothese nicht abgelehnt werden und wir finden global keine signifikante Abhängigkeit zwischen der Stimmung und der Hilfsbereitschaft; oder anders gesagt, die beiden Gruppen (Bedingungen) unterscheiden sich nicht in ihrer Hilfsbereitschaft.


  1. Wie lautet die empirische Effektgrösse \(\hat \omega\) nach Cohen?

Mit Hilfe der Formel erhalten wir einen Wert von \(\hat \omega= \sqrt{4.4/60}=0.27\). Es handelt sich dabei nach Cohen (1988) um einen mittelgrossen Effekt.

Ergänzung: Wenn wir jetzt noch eine Poweranalyse durchführen würden, könnten wir feststellen, dass es eigentlich \(n=212\) Personen bräuchte, um einen solchen Effekt mit einer Wahrscheinlichkeit von \(95 \%\) zu finden, falls ein solcher Effekt in der Population existiert. Unser “Modell” hat also zuwenig Power, um diesen Effekt aufzudecken, falls er existiert.


Sie haben bereits zwölf Übungen absolviert, bravo!

Reuse

Citation

BibTeX citation:
@online{senn2024,
  author = {Senn, Mirjam and Wyssen, Gerda},
  title = {Übung 12},
  date = {2024-12-02},
  url = {https://psylu.github.io/statistik1-hs24/pages/exercises/exercise_12.html},
  langid = {en}
}
For attribution, please cite this work as:
Senn, Mirjam, and Gerda Wyssen. 2024. “Übung 12.” December 2, 2024. https://psylu.github.io/statistik1-hs24/pages/exercises/exercise_12.html.