QUESTIONSTAR
Methodologie·12. Oktober 2025·13 Min. Lesezeit

Der Chi-Quadrat-Test — Zusammenhänge zwischen kategorialen Merkmalen prüfen

Wann verwenden Sie den Chi-Quadrat-Test — und warum funktioniert hier der t-Test nicht?

Für Praktiker
Der Chi-Quadrat-Test — Zusammenhänge zwischen kategorialen Merkmalen prüfen

Wenn Sie wissen wollen, ob zwei kategoriale Merkmale zusammenhängen — Geschlecht und Markenpräferenz, Bildungsabschluss und Wahlverhalten, Standort und Kundenzufriedenheit — ist der Chi-Quadrat-Test das passende Werkzeug. Hier die Methodik mit konkretem Beispiel.

In Umfragen erheben wir häufig kategoriale Daten — Geschlecht, Altersgruppe, Bildungsabschluss, Markenpräferenz, Wahlentscheidung, Wohnort. Die naheliegende Frage in der Auswertung lautet oft: hängen zwei dieser Merkmale zusammen? Bevorzugen Männer wirklich Marke A häufiger als Frauen? Korreliert der Wohnort mit der Wahlpräferenz? Hier kommt der Chi-Quadrat-Test ins Spiel.

Im Unterschied zum t-Test, der Mittelwerte vergleicht, prüft der Chi-Quadrat-Test Häufigkeiten. Wenn Sie zwei Variablen jeweils in Kategorien erhoben haben, lässt sich auf Basis einer Kreuztabelle berechnen, ob die beobachteten Häufigkeitsverteilungen vom statistischen Zufall abweichen.

Was prüft der Chi-Quadrat-Test?

Die Logik ist erstaunlich einfach: Sie zählen, wie oft jede Kombination zweier Merkmale tatsächlich vorkommt, und vergleichen diese tatsächlichen Häufigkeiten mit den Häufigkeiten, die zu erwarten wären, wenn die beiden Merkmale völlig unabhängig voneinander wären. Sind die Abweichungen klein, sind die Merkmale wahrscheinlich unabhängig. Sind sie groß, gibt es einen Zusammenhang.

Der Chi-Quadrat-Wert quantifiziert genau diese Abweichung. Je größer er ist, desto stärker weichen die beobachteten von den erwarteten Häufigkeiten ab — und desto unwahrscheinlicher ist es, dass diese Abweichung nur durch Zufall entstanden ist.

Voraussetzungen

Bevor Sie rechnen, prüfen Sie drei Punkte. Erstens müssen beide Variablen kategorial sein (nominal oder ordinal — bei stetigen Variablen verwenden Sie den t-Test oder die Korrelation). Zweitens müssen die Beobachtungen unabhängig sein: eine Person darf nur einmal in der Tabelle stehen. Drittens darf in keiner Zelle die erwartete Häufigkeit unter 5 liegen — bei kleinen Stichproben oder vielen Kategorien wird der Test sonst unzuverlässig. Faustregel: höchstens 20 % der Zellen dürfen erwartete Werte unter 5 haben, keine darf bei Null oder darunter liegen.

Wenn die letzte Voraussetzung verletzt ist, gibt es Ausweichoptionen: Kategorien zusammenfassen (zwei schwach besetzte Altersklassen werden eine), exakte Tests (Fisher-Exact-Test für 2×2-Tabellen) oder andere Verfahren.

Schritt 1: Kreuztabelle aufstellen

Stellen Sie sich vor: Sie haben in einer Kundenumfrage 200 Personen befragt, ob sie unsere Marke (Marke A) oder die Wettbewerbsmarke (Marke B) bevorzugen — getrennt nach Geschlecht. Die Daten sehen so aus:

BeobachtetMännerFrauenZeilensumme
Marke A523890
Marke B4862110
Spaltensumme100100200

Auf den ersten Blick sieht es so aus, als würden Männer Marke A bevorzugen und Frauen Marke B. Aber ist diese Verteilung systematisch oder einfach Stichprobenstreuung?

Schritt 2: Erwartete Häufigkeiten berechnen

Wenn Geschlecht und Marken­präferenz tatsächlich unabhängig wären, müssten sich die Häufigkeiten proportional zur Gesamtverteilung aufteilen. 90 von 200 Befragten bevorzugen insgesamt Marke A — das sind 45 %. Wenn Geschlecht keine Rolle spielt, müssten in jeder Geschlechtsgruppe 45 % Marke A bevorzugen.

E_{ij} = \frac{R_i \cdot C_j}{N}Erwartete Häufigkeit pro Zelle

Dabei ist Rᵢ die Zeilensumme der Zelle, Cⱼ die Spaltensumme und N die Gesamtsumme. Für die Männer-Marke-A-Zelle: (90 × 100) ÷ 200 = 45.

Die vollständige Tabelle der erwarteten Häufigkeiten sieht so aus:

Erwartet (bei Unabhängigkeit)MännerFrauen
Marke A4545
Marke B5555

Schritt 3: Chi-Quadrat-Wert berechnen

Für jede Zelle berechnen Sie die quadrierte Abweichung der beobachteten von der erwarteten Häufigkeit, geteilt durch die erwartete Häufigkeit. Dann summieren Sie über alle Zellen.

\chi^2 = \sum_{i,j} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}Chi-Quadrat-Wert

O steht dabei für die beobachtete (observed), E für die erwartete (expected) Häufigkeit pro Zelle. In unserem Beispiel: (52−45)² ÷ 45 + (38−45)² ÷ 45 + (48−55)² ÷ 55 + (62−55)² ÷ 55 = 1,089 + 1,089 + 0,891 + 0,891 ≈ 3,96.

Schritt 4: Freiheitsgrade und Signifikanzniveau

Der berechnete Chi-Quadrat-Wert ist allein noch nicht aussagekräftig — er muss mit einem kritischen Wert verglichen werden, der zwei Bezugsgrößen berücksichtigt.

Freiheitsgrade. Für eine Kreuztabelle berechnen sie sich als (Anzahl Zeilen − 1) × (Anzahl Spalten − 1). Bei einer 2×2-Tabelle wie unserer: (2−1) × (2−1) = 1 Freiheitsgrad. Bei einer 3×4-Tabelle wären es 6.

Signifikanzniveau. Üblicherweise 5 % (also α = 0,05), in besonders sensiblen Studien 1 %. Das ist die akzeptierte Irrtumswahrscheinlichkeit für die fälschliche Ablehnung der Unabhängigkeits-Hypothese.

In unserem Beispiel: Freiheitsgrad 1, α = 0,05 → kritischer Wert 3,841. Unser berechneter Chi-Quadrat-Wert von 3,96 liegt knapp darüber. Die Nullhypothese „Geschlecht und Markenpräferenz sind unabhängig" wird abgelehnt. Es gibt einen statistisch signifikanten Zusammenhang.

Schritt 5: Stärke des Zusammenhangs einschätzen

Statistische Signifikanz sagt nur, ob ein Zusammenhang existiert — nicht, wie stark er ist. Bei großen Stichproben werden auch sehr kleine Effekte signifikant. Für die Effektgröße verwenden Sie ergänzende Maße:

Phi-Koeffizient (für 2×2-Tabellen) oder Cramérs V (für größere Tabellen). Werte um 0,1 gelten als schwacher, um 0,3 als mittlerer, ab 0,5 als starker Zusammenhang. In unserem Beispiel beträgt Cramérs V ungefähr 0,14 — ein schwacher Zusammenhang, der trotz Signifikanz nicht zu einer Marketing-Kehrtwende führen sollte.

Wann der Chi-Quadrat-Test nicht passt

Der Chi-Quadrat-Test ist auf zwei kategoriale Variablen beschränkt. Sobald Sie mehr als zwei Variablen gleichzeitig untersuchen wollen (Geschlecht × Altersgruppe × Markenpräferenz), brauchen Sie loglineare Modelle. Wenn eine der Variablen ordinal ist und Sie die Ordnung mit auswerten wollen (statt sie zu ignorieren), prüfen Sie den Mantel-Haenszel-Test oder die ordinale Regression.

Und wie oben erwähnt: bei kleinen erwarteten Häufigkeiten wechseln Sie zum Fisher-Exact-Test. Der ist mathematisch eleganter, in der Auswertung aber rechenintensiver — moderne Statistikpakete erledigen das automatisch.

Fazit

Der Chi-Quadrat-Test ist das Standardwerkzeug für die Auswertung von Zusammenhängen zwischen kategorialen Variablen. Er ist methodisch einfach, intuitiv verständlich und in jeder Statistiksoftware verfügbar. Wichtig ist, ihn nicht als Endpunkt zu verstehen: Signifikanz allein sagt nichts über die praktische Relevanz. Erst mit ergänzender Effektgröße (Phi, Cramérs V) wird ein vollständiges Bild daraus.

In QUESTIONSTAR erstellen Sie Kreuztabellen mit zwei Klicks direkt in der Auswertungsansicht — der Chi-Quadrat-Wert, der p-Wert und Cramérs V werden automatisch berechnet und angezeigt.

Quellen

  • Bortz, Jürgen, und Nicola Döring: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 4. Auflage. Springer, 2006.
  • Agresti, Alan: An Introduction to Categorical Data Analysis. 3. Edition. Wiley, 2018.
  • Field, Andy: Discovering Statistics Using IBM SPSS Statistics. 5. Edition. SAGE, 2018.