Stichprobengröße berechnen — Formel und Live-Rechner

Wie viele Probanden sind genug? Diese Frage stellt sich jeder, der eine Umfrage plant. Zum Glück hat die Wissenschaft darauf eine Antwort. In diesem Artikel erläutern wir, wie der notwendige Umfang der Stichprobe ermittelt wird — und wie Sie die Stichprobengröße selbst berechnen können.

Wenn Sie an den technischen Details nicht interessiert sind und den Umfang der Stichprobe schnell berechnen wollen, nutzen Sie den Stichprobenrechner von QUESTIONSTAR.

Was ist eine repräsentative Stichprobe?

Wenn wir in einer Umfrage Meinungen, Einstellungen oder Informationen zu Verhaltensweisen abfragen, möchten wir in aller Regel feststellen, wie weit diese in der Gruppe der Menschen verbreitet sind, die uns interessieren.

Das können bestehende oder potenzielle Kunden eines Unternehmens sein, seine Mitarbeiter, die Einwohner einer bestimmten Stadt vor der Bürgermeisterwahl oder die gesamte Bevölkerung eines Landes.
Die Gesamtheit dieser Menschen, deren Meinung uns interessiert, nennt man Grundgesamtheit.

In den meisten Fällen ist es unpraktikabel, jeden zu der Grundgesamtheit gehörenden Menschen zu befragen. Abgesehen davon, dass wir nur in den seltensten Fällen jeden Einzelnen kontaktieren und um Teilnahme bitten können, wäre eine solche Vollerhebung schlicht zu teuer und zu langsam.

Schematische Darstellung Grundgesamtheit und Stichprobe

Deshalb setzte sich die Wissenschaft mit der Frage auseinander, ob und inwiefern es möglich ist, nur einige wenige Menschen aus der Grundgesamtheit zu befragen — und trotzdem Antworten zu bekommen, die für die Grundgesamtheit charakteristisch, also repräsentativ sind.

Diese Teilmenge nennt man Stichprobe. Analog zum Bäcker, der das Brot an verschiedenen Stellen durchsticht, um festzustellen, ob es gleichmäßig gebacken ist, „stechen“ Statistiker in verschiedene Teile der Grundgesamtheit ein, um festzustellen, ob die Menschen darin ähnlich „gebacken“ sind.

Die Antwort der Statistik auf diese Frage war ein klares Jain.

Nein — weil es unmöglich ist, anhand einer Stichprobe auf genau dieselbe Antwort zu kommen wie bei der Befragung der kompletten Grundgesamtheit.

Ja — weil sich mit Hilfe der Wahrscheinlichkeitsrechnung einschätzen lässt, wie stark der echte Wert (z. B. Durchschnittseinkommen oder Anteil derjenigen, die Produkt X präferieren) in der Grundgesamtheit von dem in der Stichprobe ermittelten Wert abweichen kann. Mit anderen Worten: Es lässt sich das Intervall einschätzen, in dem der echte Wert höchstwahrscheinlich liegt.

Voraussetzungen dafür, dass dieses Intervall berechnet werden kann, sind:

Zufällige Stichprobenziehung — jeder Mensch aus der Grundgesamtheit hat dieselbe Chance, in die Stichprobe zu gelangen.
Eine bestimmte Mindestanzahl von Befragten (Stichprobengröße) muss erreicht werden.

Sind beide Voraussetzungen erfüllt, gilt die Stichprobe als repräsentativ für die Grundgesamtheit. Die so gewonnenen Erkenntnisse können wir auf die Grundgesamtheit übertragen — und die Wahrscheinlichkeit angeben, mit der wir sicher sind, dabei keinen Fehler zu machen.

Was passiert, wenn die Stichprobengröße falsch gewählt wird?

Die Folgen einer falschen Wahl der Stichprobengröße sind denkbar einfach:

Ist die Stichprobe zu klein, lassen sich die Umfrageergebnisse nicht auf die Grundgesamtheit verallgemeinern — die Parameter in der Grundgesamtheit lassen sich nicht mit der gewünschten Präzision einschätzen.
Ist die Stichprobe zu groß, schadet das den Ergebnissen zwar nicht, die Kosten der Datenerhebung können aber höher ausfallen als nötig. Besonders spürbar wird das bei der Verwendung von Panels, bei denen jeder Proband mehrere Euro kostet.

Der Ansatz der Fehlerspanne zur Berechnung der Stichprobengröße

Wann immer wir basierend auf einer Stichprobe Aussagen über die Grundgesamtheit treffen, machen wir einen Fehler. Dieser Fehler resultiert daraus, dass wir nicht die komplette Grundgesamtheit, sondern nur einen Teil davon befragen.

Sofern die Stichprobe zufällig gezogen wurde, lässt sich dieser Fehler mit Hilfe der Wahrscheinlichkeitsrechnung berechnen — und der Bereich angeben, in dem sich der wahre Wert in der Grundgesamtheit befindet.

Dieser Bereich heißt Konfidenzintervall und ergibt sich als „gemessener Wert ± Fehlerspanne".

Die Formel zur Berechnung der Fehlerspanne (für unendlich große Grundgesamtheit) sieht wie folgt aus:

E = z\sqrt{\frac{\pi(1-\pi)}{n}}(1)

Dabei ist:

E — Fehlerspanne (in Prozent, ausgedrückt in Dezimalzahlen).

z — die Differenz zwischen dem in der Stichprobe beobachteten Wert und seinem theoretischen Mittelwert, die für das vorgegebene Vertrauensniveau maximal zulässig ist.

Der z-Wert gibt die Breite des Konfidenzintervalls vor — allerdings in Begriffen der Anzahl von Standardabweichungen der Standardnormalverteilung. Alle übrigen Parameter der Formel dienen nur dazu, den z-Wert in die verständlichere Einheit der maximal zulässigen prozentualen Abweichung zu übersetzen.
Z-Werte für verschiedene Vertrauensniveaus lassen sich mit Hilfe der sogenannten z-Tabelle ermitteln. In der Umfrageforschung werden typischerweise folgende Vertrauensniveaus bzw. z-Werte verwendet:

Vertrauensniveau	z-Wert
90 %	1,65
95 %	1,96
99 %	2,58

Höheren Vertrauensniveaus entsprechen höhere z-Werte. Deshalb wird auch die Fehlerspanne für höhere Vertrauensniveaus größer.

π — Anteil des Merkmals in der Grundgesamtheit (in Prozent, ausgedrückt in Dezimalzahlen). Der π-Wert kann zwischen 0 % und 100 % variieren.

In der Regel ist der π-Wert im Vorfeld einer Umfrage nicht bekannt. In solchen Fällen setzt man ihn auf 50 % (0,5). Der Ausdruck π · (1 − π) hat sein Maximum bei π = 0,5 — was den höchsten E-Wert für alle möglichen π-Werte ergibt. Das gewährleistet, dass selbst in ungünstigen Fällen das ermittelte Konfidenzintervall den wahren Wert einschließt bzw. eine ausreichend große Stichprobe generiert wird.
Werte von π, die von 0,5 nach oben oder unten abweichen, produzieren kleinere Fehlerspannen. Bei π = 0 und π = 1 ist die Fehlerspanne gleich 0.
Wenn Sie also vor der Durchführung Ihrer Umfrage den Anteil des interessierenden Merkmals in der Grundgesamtheit kennen, können Sie die Fehlerspanne — und damit auch die erforderliche Stichprobengröße — deutlich reduzieren.

Beispiel. In Ihrer Studie untersuchen Sie, welcher Anteil der Schüler ein eigenes Laptop besitzt. Da darüber im Hinblick auf die definierte Grundgesamtheit noch nichts bekannt ist, nutzen Sie den Wert π = 0,5. Es stellt sich heraus, dass 67,5 % der Befragten diese Frage bejaht haben. Wiederholen Sie die Studie mit derselben Grundgesamtheit, nutzen Sie nun den Wert π = 0,675 — was den notwendigen Stichprobenumfang verringert.

n — Anzahl der befragten Personen, also Stichprobengröße.

Nachdem wir die Bedeutung aller Parameter geklärt haben, lässt sich die Formel umstellen — zur Berechnung der Stichprobengröße:

n = \frac{z^2\pi(1-\pi)}{E^2}(2)

Die Vorgehensweise für die Berechnung der Stichprobengröße ist dann ganz einfach:

Wählen Sie die Fehlerspanne aus, die für die Umfrageergebnisse gelten soll.
Wählen Sie das Vertrauensniveau aus.
Ermitteln Sie den z-Wert, der dem gewählten Vertrauensniveau entspricht.
Ist der Anteil des interessierenden Merkmals in der Grundgesamtheit bekannt, nutzen Sie ihn als π. Andernfalls setzen Sie π = 0,5.
Setzen Sie die Werte in Formel (2) ein und berechnen Sie die Stichprobengröße.

Damit haben Sie die Stichprobengröße für den Fall der unbekannten oder unendlich großen Grundgesamtheit ermittelt.

Stichprobengröße für endliche Grundgesamtheit

In Fällen, in denen die notwendige Stichprobengröße vergleichbar mit dem Umfang der Grundgesamtheit wird, reichen bereits kleinere Stichproben für Repräsentativität aus.

In diesem Fall wird die von der Stichprobe nicht erfasste Varianz des Merkmals vergleichbar mit der erfassten Varianz, sodass die Fehlerspanne um den sogenannten Finite Population Correction (FPC) Faktor nach unten korrigiert werden kann:

\mathrm{FPC} = \sqrt{\frac{N-n}{N-1}}(3)

wobei N für die Größe der Grundgesamtheit steht.

Die Formel zur Berechnung der Fehlerspanne nimmt damit folgende Form an:

E = z\sqrt{\frac{\pi(1-\pi)}{n}}\sqrt{\frac{N-n}{N-1}}(4)

Der Wert von FPC liegt zwischen 0 und 1.

Je näher die Stichprobengröße (n) am Umfang der Grundgesamtheit (N) liegt, desto kleiner wird FPC. Folglich fällt auch die Fehlerspanne kleiner aus.

Je kleiner der Stichprobenumfang im Vergleich zur Grundgesamtheit ist, desto näher liegt FPC bei 1 — der Faktor verliert an Bedeutung, und Formel (4) reduziert sich auf Formel (1).

Die Formel für die Stichprobengröße mit Berücksichtigung von FPC ergibt sich nach Auflösung von Formel (4) nach n:

n = \frac{z^2\pi(1-\pi)N}{z^2\pi(1-\pi) + E^2(N-1)}(5)

Der Umfang der Stichprobe lässt sich analog zur vorherigen Vorgehensweise berechnen:

Ermitteln Sie die Werte für E, z, π und N.
Setzen Sie sie in Formel (5) ein.
Berechnen Sie die notwendige Stichprobengröße.

Alternativ — und besonders hilfreich bei händischer Berechnung — können Sie auch wie folgt vorgehen:

Berechnen Sie die Stichprobengröße für unendliche Grundgesamtheit nach Formel (2).
Wenn die berechnete Stichprobengröße mehr als 5 % (spätestens aber 10 %) der Grundgesamtheit beträgt, berechnen Sie die korrigierte Stichprobengröße nach Formel (6):

n_{corr} = \frac{n}{1 + \frac{n-1}{N}}(6)

n_corr ist der notwendige Stichprobenumfang.

Beispiel. Wir führen eine Mitarbeiterumfrage durch, die repräsentativ für das gesamte Unternehmen sein soll — bei einer Fehlerspanne von 5 % und einem Vertrauensniveau von 95 %. Nach Formel (2) berechnen wir die notwendige Stichprobengröße:
n = (1,96² · 0,5 · 0,5) / 0,05² = 385.
In unserem Unternehmen arbeiten jedoch nur 100 Mitarbeiter. Eine Korrektur ist also notwendig. Nach Formel (6):
n_corr = 385 / (1 + (385 − 1) / 100) = 80.
Im Endeffekt müssen wir 80 Mitarbeiter befragen, damit die Umfrage als repräsentativ für alle Mitarbeiter unseres Unternehmens gelten kann.

Stichprobenrechner von QUESTIONSTAR

Wer die Mathematik nicht von Hand durchgehen will, nutzt den Stichprobenrechner von QUESTIONSTAR — er nimmt Ihnen die Berechnung ab und arbeitet mit allen oben beschriebenen Formeln.

Stichprobenrechner

Eingabe

Fehlerspanne

Konfidenzniveau

Umfang der GrundgesamtheitNicht bekanntBekannt

Anteil des Merkmals in der GrundgesamtheitNicht bekanntBekannt

Notwendige Stichprobengröße

n = 385

Cochran-Formel

p = 0,5 (für maximale Variabilität)

frei zugänglich·ohne Registrierung·ohne Datenspeicherung

Der Rechner ist frei zugänglich, ohne Registrierung und ohne Datenspeicherung. Sie können ihn beliebig oft verwenden — auch für fremde Projekte.