Wenn Sie wissen wollen, ob zwei kategoriale Merkmale zusammenhängen — Geschlecht und Markenpräferenz, Bildungsabschluss und Wahlverhalten, Standort und Kundenzufriedenheit — ist der Chi-Quadrat-Test das passende Werkzeug. Hier die Methodik mit konkretem Beispiel.
In Umfragen erheben wir häufig kategoriale Daten — Geschlecht, Altersgruppe, Bildungsabschluss, Markenpräferenz, Wahlentscheidung, Wohnort. Die naheliegende Frage in der Auswertung lautet oft: hängen zwei dieser Merkmale zusammen? Bevorzugen Männer wirklich Marke A häufiger als Frauen? Korreliert der Wohnort mit der Wahlpräferenz? Hier kommt der Chi-Quadrat-Test ins Spiel.
Im Unterschied zum t-Test, der Mittelwerte vergleicht, prüft der Chi-Quadrat-Test Häufigkeiten. Wenn Sie zwei Variablen jeweils in Kategorien erhoben haben, lässt sich auf Basis einer Kreuztabelle berechnen, ob die beobachteten Häufigkeitsverteilungen vom statistischen Zufall abweichen.
Was prüft der Chi-Quadrat-Test?
Die Logik ist erstaunlich einfach: Sie zählen, wie oft jede Kombination zweier Merkmale tatsächlich vorkommt, und vergleichen diese tatsächlichen Häufigkeiten mit den Häufigkeiten, die zu erwarten wären, wenn die beiden Merkmale völlig unabhängig voneinander wären. Sind die Abweichungen klein, sind die Merkmale wahrscheinlich unabhängig. Sind sie groß, gibt es einen Zusammenhang.
Der Chi-Quadrat-Wert quantifiziert genau diese Abweichung. Je größer er ist, desto stärker weichen die beobachteten von den erwarteten Häufigkeiten ab — und desto unwahrscheinlicher ist es, dass diese Abweichung nur durch Zufall entstanden ist.
Voraussetzungen
Bevor Sie rechnen, prüfen Sie drei Punkte. Erstens müssen beide Variablen kategorial sein (nominal oder ordinal — bei stetigen Variablen verwenden Sie den t-Test oder die Korrelation). Zweitens müssen die Beobachtungen unabhängig sein: eine Person darf nur einmal in der Tabelle stehen. Drittens darf in keiner Zelle die erwartete Häufigkeit unter 5 liegen — bei kleinen Stichproben oder vielen Kategorien wird der Test sonst unzuverlässig. Faustregel: höchstens 20 % der Zellen dürfen erwartete Werte unter 5 haben, keine darf bei Null oder darunter liegen.
Wenn die letzte Voraussetzung verletzt ist, gibt es Ausweichoptionen: Kategorien zusammenfassen (zwei schwach besetzte Altersklassen werden eine), exakte Tests (Fisher-Exact-Test für 2×2-Tabellen) oder andere Verfahren.
Schritt 1: Kreuztabelle aufstellen
Stellen Sie sich vor: Sie haben in einer Kundenumfrage 200 Personen befragt, ob sie unsere Marke (Marke A) oder die Wettbewerbsmarke (Marke B) bevorzugen — getrennt nach Geschlecht. Die Daten sehen so aus:
| Beobachtet | Männer | Frauen | Zeilensumme |
|---|---|---|---|
| Marke A | 52 | 38 | 90 |
| Marke B | 48 | 62 | 110 |
| Spaltensumme | 100 | 100 | 200 |
Auf den ersten Blick sieht es so aus, als würden Männer Marke A bevorzugen und Frauen Marke B. Aber ist diese Verteilung systematisch oder einfach Stichprobenstreuung?
Schritt 2: Erwartete Häufigkeiten berechnen
Wenn Geschlecht und Markenpräferenz tatsächlich unabhängig wären, müssten sich die Häufigkeiten proportional zur Gesamtverteilung aufteilen. 90 von 200 Befragten bevorzugen insgesamt Marke A — das sind 45 %. Wenn Geschlecht keine Rolle spielt, müssten in jeder Geschlechtsgruppe 45 % Marke A bevorzugen.
Dabei ist Rᵢ die Zeilensumme der Zelle, Cⱼ die Spaltensumme und N die Gesamtsumme. Für die Männer-Marke-A-Zelle: (90 × 100) ÷ 200 = 45.
Die vollständige Tabelle der erwarteten Häufigkeiten sieht so aus:
| Erwartet (bei Unabhängigkeit) | Männer | Frauen |
|---|---|---|
| Marke A | 45 | 45 |
| Marke B | 55 | 55 |
Schritt 3: Chi-Quadrat-Wert berechnen
Für jede Zelle berechnen Sie die quadrierte Abweichung der beobachteten von der erwarteten Häufigkeit, geteilt durch die erwartete Häufigkeit. Dann summieren Sie über alle Zellen.
O steht dabei für die beobachtete (observed), E für die erwartete (expected) Häufigkeit pro Zelle. In unserem Beispiel: (52−45)² ÷ 45 + (38−45)² ÷ 45 + (48−55)² ÷ 55 + (62−55)² ÷ 55 = 1,089 + 1,089 + 0,891 + 0,891 ≈ 3,96.
Schritt 4: Freiheitsgrade und Signifikanzniveau
Der berechnete Chi-Quadrat-Wert ist allein noch nicht aussagekräftig — er muss mit einem kritischen Wert verglichen werden, der zwei Bezugsgrößen berücksichtigt.
Freiheitsgrade. Für eine Kreuztabelle berechnen sie sich als (Anzahl Zeilen − 1) × (Anzahl Spalten − 1). Bei einer 2×2-Tabelle wie unserer: (2−1) × (2−1) = 1 Freiheitsgrad. Bei einer 3×4-Tabelle wären es 6.
Signifikanzniveau. Üblicherweise 5 % (also α = 0,05), in besonders sensiblen Studien 1 %. Das ist die akzeptierte Irrtumswahrscheinlichkeit für die fälschliche Ablehnung der Unabhängigkeits-Hypothese.
In unserem Beispiel: Freiheitsgrad 1, α = 0,05 → kritischer Wert 3,841. Unser berechneter Chi-Quadrat-Wert von 3,96 liegt knapp darüber. Die Nullhypothese „Geschlecht und Markenpräferenz sind unabhängig" wird abgelehnt. Es gibt einen statistisch signifikanten Zusammenhang.
Schritt 5: Stärke des Zusammenhangs einschätzen
Statistische Signifikanz sagt nur, ob ein Zusammenhang existiert — nicht, wie stark er ist. Bei großen Stichproben werden auch sehr kleine Effekte signifikant. Für die Effektgröße verwenden Sie ergänzende Maße:
Phi-Koeffizient (für 2×2-Tabellen) oder Cramérs V (für größere Tabellen). Werte um 0,1 gelten als schwacher, um 0,3 als mittlerer, ab 0,5 als starker Zusammenhang. In unserem Beispiel beträgt Cramérs V ungefähr 0,14 — ein schwacher Zusammenhang, der trotz Signifikanz nicht zu einer Marketing-Kehrtwende führen sollte.
Wann der Chi-Quadrat-Test nicht passt
Der Chi-Quadrat-Test ist auf zwei kategoriale Variablen beschränkt. Sobald Sie mehr als zwei Variablen gleichzeitig untersuchen wollen (Geschlecht × Altersgruppe × Markenpräferenz), brauchen Sie loglineare Modelle. Wenn eine der Variablen ordinal ist und Sie die Ordnung mit auswerten wollen (statt sie zu ignorieren), prüfen Sie den Mantel-Haenszel-Test oder die ordinale Regression.
Und wie oben erwähnt: bei kleinen erwarteten Häufigkeiten wechseln Sie zum Fisher-Exact-Test. Der ist mathematisch eleganter, in der Auswertung aber rechenintensiver — moderne Statistikpakete erledigen das automatisch.
Fazit
Der Chi-Quadrat-Test ist das Standardwerkzeug für die Auswertung von Zusammenhängen zwischen kategorialen Variablen. Er ist methodisch einfach, intuitiv verständlich und in jeder Statistiksoftware verfügbar. Wichtig ist, ihn nicht als Endpunkt zu verstehen: Signifikanz allein sagt nichts über die praktische Relevanz. Erst mit ergänzender Effektgröße (Phi, Cramérs V) wird ein vollständiges Bild daraus.
In QUESTIONSTAR erstellen Sie Kreuztabellen mit zwei Klicks direkt in der Auswertungsansicht — der Chi-Quadrat-Wert, der p-Wert und Cramérs V werden automatisch berechnet und angezeigt.
Quellen
- Bortz, Jürgen, und Nicola Döring: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 4. Auflage. Springer, 2006.
- Agresti, Alan: An Introduction to Categorical Data Analysis. 3. Edition. Wiley, 2018.
- Field, Andy: Discovering Statistics Using IBM SPSS Statistics. 5. Edition. SAGE, 2018.
