- Kulturelle Merkmale
- Geographische Merkmale
- Demographische Merkmale
- Sozioökonomische Merkmale
Grundlagen der
Umfrageforschung
Marktforschung, Umfragemethodik und ihre praktische Anwendung — vom Forschungsproblem zum Ergebnisbericht.
Grundlagen der Umfrageforschung
Marktforschung, Umfragemethodik und ihre praktische Anwendung — vom Forschungsproblem zum Ergebnisbericht.
Grundlagen der
Umfrageforschung
Marktforschung, Umfragemethodik und ihre praktische Anwendung — vom Forschungsproblem zum Ergebnisbericht.
Kapitel 1 · Einführungskurs
Grundlagen der
Umfrageforschung
Methodisch fundiert. Praktisch anwendbar.
Marktforschung, Umfragemethodik und ihre praktische Anwendung — vom Forschungsproblem zum Ergebnisbericht.
Inhalt
Einführung
Einführung
Was ist Forschung?
Alle systematischen Bestrebungen und Bemühungen, um neue Erkenntnisse für Wissenschaft oder Industrie zu erlangen.
Suche und Sammlung von Informationen und Ideen in Antwort auf eine spezifische Fragestellung.
Umfrage
Umfrage ist eine der populärsten Methoden, primäre Daten zu erheben, wobei der Forscher mit Befragten interagiert, um Informationen über Einstellungen, Meinungen, Wissen und Verhaltensweisen von Menschen zu gewinnen.
Marktforschung
Praktische Nutzung von Umfragen
| Disziplin | Anwendung |
|---|---|
| Soziologie und Politikwissenschaften | Meinungsforschung, Identifikation der Einstellungen von Bevölkerungsgruppen gegenüber sozial bedeutenden Phänomenen, Ereignissen und Fakten; Wahlforschung (z. B. Sonntagsfrage), … |
| Psychologie | Persönlichkeitstests, Intelligenztests, Identifikation individueller Stärken und Schwächen, psychischer Stabilität, kognitiver Störungen, sozialer Einflüsse, … |
| Personalwesen | Messung von Mitarbeiterzufriedenheit, Loyalität, Potenzialen, Persönlichkeitsmerkmalen, Führungsqualitäten, Produktivität, professioneller Eignung, Stressresistenz, Work-Life-Balance, … |
| Marketing | Markt- und Verbraucherforschung, Messung von Imagewahrnehmung, Präferenzen, Zufriedenheit und Loyalität (NPS), Zahlungsbereitschaft; Segmentierung, Positionierung, Preisbestimmung, Werbetests, Usability von Webseiten, … |
| Wissenschaft (im Allgemeinen) | Untersuchung von Beziehungen zwischen zwei oder mehreren Variablen, Faktoren, Phänomenen; Skalen- und Methodenentwicklung für wissenschaftliche und praktische Zwecke, … |
| Bildung | Wissenstests (Multiple-Choice-Prüfungen), Studenten- und Lehrerevaluation; großangelegte Bildungsstudien (z. B. PISA), … |
| … | … und viele weitere Anwendungsfelder |
Prozess der Marktforschung — die „5 D’s"
- Informationsbedarf identifizieren
- Forschungsproblem und -fragen definieren
- Forschungsziele festlegen
- Informationswert prüfen
- Budget
- Datenquellen
- Forschungsmethoden
- Stichprobenplan
- Kontaktmethoden
- Methoden der Datenanalyse
- Daten entsprechend dem Plan erheben
- oder externen Dienstleister beauftragen
- Daten statistisch und subjektiv analysieren
- Antworten und Implikationen ableiten
- Ergebnisse der Datenanalyse formulieren
- Forschungsbericht aufbereiten
Wann sollte man keine Marktforschungsprojekte starten?
| Fall | Kommentar |
|---|---|
| Vage Ziele | Wenn Manager sich nicht darauf einigen können, welche Informationen sie zur Entscheidungsfindung brauchen. Marktforschung hilft nur, wenn sie eine konkrete Frage untersucht. |
| Fixierte Haltung | Wenn die Entscheidung bereits getroffen ist und die Studie nur als „Abstempelung" eines vorgefassten Plans dienen soll. |
| Zu spät | Wenn Ergebnisse zu spät bereitgestellt werden, um die Entscheidung noch beeinflussen zu können. |
| Schlechtes Timing | Wenn ein Produkt in der Degenerationsphase ist, macht es wenig Sinn, neue Produktvariationen zu erforschen. |
| Unzureichende Ressourcen | Es lohnt sich nicht, eine quantitative Studie aufzusetzen, solange keine statistisch signifikante Stichprobe realisierbar ist — oder wenn die Finanzen nicht reichen, die resultierenden Entscheidungen umzusetzen. |
| Kosten überwiegen Vorteile | Der erwartete Informationswert sollte die Kosten der Datenerhebung und -analyse übersteigen. |
| Ergebnisse nicht aktionsfähig | Wenn z. B. psychographische Charakteristiken genutzt werden, die nicht helfen, konkrete Entscheidungen zu treffen. |
| Informationen nicht erforderlich | Wenn entscheidungsrelevante Informationen bereits vorhanden sind. |
Einführung
Typologie der Marktforschung
Marktforschungstypologie nach Zielen
- Welche Gründe könnten hinter der sinkenden Kundenzufriedenheit stecken?
- Was hält Erstkäufer davon ab, erneut zu kaufen?
- Wie sieht der historische Umsatztrend in der Branche aus?
- Wie sind die Einstellungen der Konsumenten gegenüber unserem Produkt?
- Vorhersage der Ergebnisse von Marketing-Aktionen
- Einfluss von Werbeausgaben auf den Umsatz (wieviel bringt ein Werbe-Euro?)
Marktforschungstypologie nach Datenquellen
- Generierung von Daten, die bisher noch nicht vorliegen. Diese Daten werden analysiert und können ggf. vom Forscher veröffentlicht werden.
- Verwendung von zu einem früheren Zeitpunkt erhobenen Daten für den beabsichtigten Untersuchungszweck.
Marktforschungstypologie nach Methodologie
- Beinhaltet Sammlung und Auswertung von Daten
- Erfordert große Datenmengen, verwendet statistische Methoden
- Strebt Repräsentativität der Ergebnisse an
- Versucht Konsumentenverhalten und seine Ursachen zu verstehen
- Schwerpunkt auf Individuen und kleinen Gruppen
- Nicht repräsentativ — eine Sichtweise verstehen, nicht alle
Triangulation
Triangulation — die Kombination von Methoden in der Studie zu demselben Thema.
Robson (1998) · Visocky & Visocky (2009)
ZielWahrheit
Literaturrecherche
Befragung
Interview
Aber in Wirklichkeit ist alles chaotischer.
Umfrage: Messung und Skalierung
Umfrage: Messung und Skalierung
Messung
Messung — Zuweisung von Zahlen oder anderen Symbolen zu Charakteristiken von Objekten nach einer bestimmten, vorgegebenen Regel.
Skalierung
Skalierung — beinhaltet ein Kontinuum, auf dem die Messobjekte angeordnet werden.




Grundlegende Typen von Skalen
- Zahlen dienen lediglich zur Klassifizierung der Objekte
- nicht-kontinuierliche Skala
- Zahlen geben die relativen Positionen der Objekte an
- aber nicht die Größe der Differenz zwischen ihnen
- Unterschiede zwischen Objekten können verglichen werden
- Nullpunkt willkürlich
- Nullpunkt eindeutig festgesetzt
- Verhältnisse der Skalenwerte können berechnet werden
Wichtige Skalen in Marketing
| Skala | Beschreibung | Gängige Beispiele | Beispiele aus Marketing | Statistische Kennzahlen | |
|---|---|---|---|---|---|
| Deskriptive | Induktive | ||||
| Nominalskala | Zuweisung von Zahlen zur Identifikation und/oder Klassifikation von Objekten | Reisepass-Nummer, Nummer vom Fußballspieler, Geschlecht | Brand, Geschlecht, Beruf, Typ des Lokals | Prozentwerte, Mode | Chi-Quadrat, Binomialtest |
| Ordinalskala | Zahlen beschreiben die Rangordnung der Objekte, jedoch nicht das Ausmaß der Unterschiede zwischen ihnen | Schulnoten, Position der Läufer im Marathonlauf | Präferenzranking, Marktposition, soziale Klasse | Perzentile, Median | Rangkorrelationskoeffizient (Spearmans ρ), Friedman-ANOVA |
| Intervallskala | Ermöglicht den Vergleich der Unterschiede zwischen Objekten; Nullpunkt willkürlich | Temperatur (Fahrenheit, Celsius) | Einstellungen, Meinungen, Kaufabsicht, Kundenzufriedenheit, Index-Zahlen | Range, Durchschnitt, Standardabweichung | Produkt-Moment-Korrelation (Pearsons r), t-Tests, ANOVA, Regressions- und Faktorenanalyse |
| Metrische Skala | Nullpunkt ist eindeutig festgelegt; ermöglicht den Vergleich der Abstände zwischen den Messwerten und deren Verhältnisse | Länge, Gewicht, Zeit, Geld | Alter, Umsatz, Einkommen, Kosten, Marktanteil | Geometrisches Mittel, Harmonisches Mittel | Variationskoeffizient |
Typologie von Skalierungsverfahren
Vergleich von Skalierungsverfahren
Der Messwert eines Objekts ergibt sich aus dem direkten Vergleich mit einem anderen Objekt.
Daten können nur als relative Positionen interpretiert werden — nur ordinales Skalenniveau (Rangordnung).
Jedes Objekt wird isoliert beurteilt — also unabhängig von anderen Objekten.
Messergebnisse werden i. d. R. als intervallskaliert oder metrisch gesehen.
Umfrage: Messung und Skalierung
Typologie von Skalierungsverfahren
Vor- und Nachteile von komparativen Skalen
Vorteile
- Geringe Unterschiede zwischen Objekten können registriert werden
- Dieselben bekannten Referenzpunkte für alle Probanden
- Einfach zu verstehen und zu nutzen
- Benötigen weniger theoretische Annahmen
- Reduzieren tendenziell Halo- und Carryover-Effekte
Nachteile
- Lediglich ordinales bzw. Rangordnungs-Skalenniveau → beschränkte Auswahl an statistischen Methoden zur Datenanalyse
- Daten können nur als relative Positionen interpretiert werden
- Unmöglich, über das Set der bewerteten Objekte hinaus zu generalisieren
Komparative Skalen: Paarweise Vergleiche
Paarweise Vergleiche
Probanden wählen aus jeweils zwei Objekten dasjenige aus, das nach ihrer Meinung ein bestimmtes Kriterium am besten erfüllt.
Im Folgenden werden Ihnen zehn Paare von Biermarken vorgelegt. In jedem Paar wählen Sie bitte das Bier aus, welches Sie eher kaufen würden.
Komparative Skalen: Paarweise Vergleiche
Paarweise Vergleiche: Vor- und Nachteile
Vorteile
- Direkter Vergleich und eindeutige Auswahl
- Gut für Blindtests, Produktvergleiche und MDS
- Ermöglicht die Berechnung des prozentualen Anteils der Probanden, die ein Objekt bevorzugen
- Rangordnung kann geschätzt werden (unter Annahme der Transitivität)
- Mögliche Erweiterungen: Alternative „keine Unterschiede", abgestufter Vergleich
Nachteile
- Anzahl der Vergleiche wächst schneller als die Anzahl der Objekte — für n Objekte n(n−1)/2 Vergleiche
- Reihenfolgeeffekte möglich (Einfluss der Präsentationsreihenfolge)
- Aus Präferenz von A über B folgt nicht, dass der Proband A mag
- Wenig realistisch für reale Wahlsituationen mit mehreren Alternativen
- Verletzung der Transitivitätsannahme möglich
Verletzung der Transitivitätsannahme in paarweisen Vergleichen
Derselbe Proband, dieselbe Paarung — und trotzdem widersprüchliche Antworten:
Aus „Apfel ≻ Tomate" und „Tomate ≻ Apfel" lässt sich keine Rangordnung bilden — die Präferenzen sind widersprüchlich (intransitiv).
Verletzung der Transitivität bei Aggregation von Präferenzen
Apfel
Tomate
Orange
Tomate
Orange
Apfel
Orange
Apfel
Tomate
Apfel ≻
Tomate2 : 1
Tomate ≻
Orange2 : 1
Orange ≻
Apfel2 : 1Apfel ≻ Tomate ≻ Orange ≻ Apfel. Apfel wird gleichzeitig am meisten und am wenigsten präferiert — die Gruppenpräferenzen sind inkonsistent!
Komparative Skalen: Rangordnungsverfahren
Rangordnungsverfahren
Probanden bringen mehrere Objekte in eine Reihenfolge — basierend auf einem bestimmten Kriterium.
Ordnen Sie bitte die unten aufgeführten Marken von Erfrischungsgetränken entsprechend Ihrer Präferenzen an. Dafür wählen Sie zunächst die Marke aus, die Sie am meisten präferieren, und weisen Sie ihr den Rangplatz 1 zu. Anschließend weisen Sie den Rangplatz 2 der zweitbesten Marke. Setzen Sie die Bewertung fort, bis Sie allen Marken einen Rangplatz zugewiesen haben. Die letzte, am wenigsten präferierte Marke muss den Rangplatz 5 bekommen.
Keine zwei Marken dürfen denselben Rangplatz erhalten.
Das Kriterium der Präferenz ist ganz Ihnen überlassen. Es gibt keine richtige oder falsche Antworten. Versuchen Sie einfach, konsistent zu sein.
| Marke | Rangplatz |
|---|---|
| Pepsi-Cola | _________ |
| Coca-Cola | _________ |
| Red Bull | _________ |
| Sprite | _________ |
| 7-Up | _________ |
Rangordnungsverfahren: Beispiel




Rangordnungsverfahren: Beispiele
Rangordnungsverfahren: Beispiel
Orange
Kiwi
Apfel
Banane
ErdbeereRangordnungsverfahren: Vor- und Nachteile
Vorteile
- Direkter Vergleich
- Realitätsnäher als paarweise Vergleiche
- Anzahl der Vergleiche ist nur (n − 1)
- Einfacher zu verstehen
- Nehmen weniger Zeit in Anspruch
- Keine nicht-transitiven Antworten
- Daten können in paarweise Vergleiche konvertiert werden
- Gut für Messung von Marken- und Eigenschaftspräferenzen
Nachteile
- Aus Präferenz von A über B folgt nicht, dass der Proband A mag
- Kein Nullpunkt — keine Trennung zwischen Mögen und Nicht-Mögen
- Lediglich ordinale Daten
- Verletzung der Transitivitätsannahme möglich (bei Aggregation)
Komparative Skalen: Konstantsummenverfahren
Konstantsummenverfahren
Probanden verteilen einen fixierten Betrag (z. B. Punkte, Euros, Chips, %) vollständig über ein Set von Objekten — nach einem bestimmten Kriterium.
Unterstehend ist eine Liste von fünf Eigenschaften von Autos aufgeführt. Bitte verteilen Sie 100 Punkte über diese Eigenschaften so, dass die Anzahl der Punkte, die Sie einer Eigenschaft zuweisen, deren relative Wichtigkeit für Sie widerspiegelt. Je mehr Punkte eine Eigenschaft bekommt, desto wichtiger ist sie für Sie. Wenn eine Eigenschaft für Sie unwichtig ist, weisen Sie ihr 0 Punkte zu. Wenn eine Eigenschaft doppelt so wichtig ist wie eine andere, weisen Sie ihr doppelt so viele Punkte zu.
| Eigenschaft | Punkte |
|---|---|
| Geschwindigkeit | 0 |
| Komfort | 15 |
| Getriebetyp (manuell/Automatik) | 5 |
| Kraftstoff (Benzin/Diesel) | 35 |
| Preis | 45 |
| Summe | 100 |
Konstantsummenverfahren: Beispiel der Auswertung
| Attribut | Segment 1 | Segment 2 | Segment 3 |
|---|---|---|---|
| Geschwindigkeit | 0 | 17 | 53 |
| Komfort | 15 | 23 | 30 |
| Getriebe (manuell/Automatik) | 5 | 21 | 10 |
| Kraftstoff (Benzin/Diesel) | 35 | 12 | 7 |
| Preis | 45 | 27 | 0 |
| Summe | 100 | 100 | 100 |
Konstantsummenverfahren: Beispiel
Konstantsummenverfahren: Beispiele
Konstantsummenverfahren: Vor- und Nachteile
Vorteile
- Kann kleine Unterschiede zwischen den Objekten messen, ohne zu viel Zeit zu beanspruchen
- Metrisch skaliert → flexible Auswahl an Analyseverfahren
Nachteile
- Ergebnisse sind auf die Liste der beurteilten Objekte beschränkt — keine Aussagen über Objekte außerhalb der Liste
- Relativ hohe kognitive Belastung der Probanden, insb. bei langen Listen
- Anfällig für Rechenfehler (z. B. Verteilung von 108 oder 94 Punkten)
Komparative Skalen: Q-Sortierung
Q-Sortierung
Rangordnungsverfahren, bei dem Objekte (in Hinblick auf ein bestimmtes Merkmal) in Stapeln sortiert werden. Genutzt, um eine hohe Anzahl an Objekten (60–140) schnell untereinander zu vergleichen.
Die Anzahl der Objekte je Stapel ist so begrenzt, dass alle Stapel zusammen die Form einer Normalverteilung nachbilden.
Das Gesundheitsministerium hat 25 Maßnahmen zur Umsetzung in Krankenhäusern entwickelt. Ordnen Sie diese nach ihrer Wirksamkeit gegen die Infektionsausbreitung ein — bitte nur eine Maßnahme pro Box.
Umfrage: Messung und Skalierung
Typologie von Skalierungsverfahren
Kontinuierliche Ratingskalen
Kontinuierliche Ratingskalen
Probanden bewerten Objekte, indem sie eine entsprechende Position auf einer Linie markieren, die von einem Extrem zum anderen eines bestimmten Kriteriums läuft.
Perception Analyzer
Jeder Teilnehmer dreht während der Reizdarbietung — z. B. einem TV-Werbespot — ein Drehrad. So entsteht eine kontinuierliche Bewertung in Echtzeit, Sekunde für Sekunde — aggregiert über alle Teilnehmer und getrennt nach Segmenten.
Likert-Skala
Likert-Skala
Probanden geben an, inwieweit sie den aufgeführten Aussagen zustimmen — anhand einer 5- oder 7-Punkte-Skala, die von einem Extrem zum anderen reicht.
Im Folgenden sind unterschiedliche Aussagen über „Real" aufgelistet. Bitte geben Sie an, wie stark Sie diesen Aussagen zustimmen:
| Stimme gar nicht zu | Stimme nicht zu | Neutral | Stimme zu | Stimme voll und ganz zu | |
|---|---|---|---|---|---|
| Real verkauft hochwertige Waren | |||||
| Real hat schlechten Service umgekehrt | |||||
| Einkaufen bei Real macht mir Spaß | |||||
| Real bietet eine Mischung aus verschiedenen Marken | |||||
| Die Kreditpolitik in Real ist schrecklich umgekehrt | |||||
| Ich mag die Werbung von Real nicht umgekehrt | |||||
| Die Preise bei Real sind fair |
Wichtig: Die Aussagen 2, 5 und 6 sind umgekehrt formuliert. Vor der Datenanalyse müssen diese Skalen umgekodiert werden — eine höhere Zahl soll stets eine bessere Einstellung bedeuten.
Likert-Skala: Beispiele
unzufrieden
zufrieden
Populäre Likert-Skalen in Marketing
| Konstrukt | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| Einstellung | Sehr schlecht | Schlecht | Weder gut, noch schlecht | Gut | Sehr gut |
| Wichtigkeit | Überhaupt nicht wichtig | Unwichtig | Neutral | Wichtig | Sehr wichtig |
| Zufriedenheit | Sehr unzufrieden | Unzufrieden | Weder zufrieden, noch unzufrieden | Zufrieden | Sehr zufrieden |
| Kaufwahrscheinlichkeit(Kaufabsicht) | Definitiv nicht | Wahrscheinlich nicht | Unentschieden | Wahrscheinlich ja | Auf jeden Fall ja |
| Kaufhäufigkeit | Nie | Selten | Manchmal | Oft | Sehr oft |
| Zustimmung | Trifft überhaupt nicht zu | Trifft eher nicht zu | Teils teils | Trifft eher zu | Trifft voll und ganz zu |
Skalenpunkte von 1 (niedrigste Ausprägung) bis 5 (höchste Ausprägung).
Semantisches Differential
Semantisches Differential
Zweipolige Rating-Skala, deren Extreme mit jeweils gegensätzlichen Adjektiven beschrieben werden. Erlaubt die Messung mehrdimensionaler Einstellungen und deren Profildarstellung.
Wie schätzen Sie das Erscheinungsbild von „Kaufhof" ein? Bitte kreuzen Sie an, inwieweit Sie jeweils mehr zu der einen oder anderen Ausprägung tendieren.
Kaufhof ist …
Hinweis: Die negativen Adjektive erscheinen mal links, mal rechts. So lässt sich nachträglich kontrollieren, ob Probanden gedankenlos immer dieselbe Seite ankreuzen, ohne die Adjektive zu lesen.
Semantisches Differential: Profil
Profildarstellung
Misst Selbsteinschätzung sowie Einstellungen gegenüber Personen oder Produkten. Jeder Punkt entspricht dem Mittelwert oder Median der jeweiligen Skala — die Verbindung der Punkte ergibt das Profil.
Beispielhaftes Profil eines Objekts — sieben Stufen zwischen den gegensätzlichen Polen.
Semantisches Differential: Beispiel
Profil-Vergleich
Semantische Profile der Shampoo-Marken „Herbal Magic" und „Elseve" im Vergleich zum idealen Shampoo aus Sicht der Konsumenten.
Stapel-Skala
Stapel-Skala
Eine unipolare Ratingskala mit 10 Kategorien von −5 bis +5, ohne Neutralpunkt (0).
Sie wird oft als Alternative zum semantischen Differential verwendet, wenn sich kein sinnvolles Paar gegensätzlicher Adjektive finden lässt.
Plus-Zahl = die Phrase trifft zu, Minus-Zahl = sie trifft nicht zu. Je größer der Betrag, desto stärker.
Wie zutreffend beschreiben die folgenden Phrasen das Geschäft „Real"? Wählen Sie pro Phrase eine Zahl zwischen +5 (trifft voll zu) und −5 (trifft gar nicht zu).
Wichtigste nicht-komparative Skalen
| Skala | Beschreibung | Beispiele | Vorteile | Nachteile |
|---|---|---|---|---|
| Kontinuierliche Ratingskalen | Markierung auf einer kontinuierlichen Linie | Reaktion auf TV-Werbespots | Einfach zu bilden | Manuelle (nicht PC-gestützte) Auswertung kann sehr mühsam sein |
| Likert-Skaladiskret | Grad der Zustimmung auf einer Skala von 1 (stimme ganz und gar nicht zu) bis 5 (stimme vollkommen zu) | Messung von Einstellungen | Einfach zu verstehen, zu verwenden und zu bilden | Zeitaufwendiger |
| Semantisches Differentialdiskret | Zweipolige, siebenstufige Ratingskala mit entgegengesetzten Adjektiven an den Polen | Marken-, Produkt- und Firmenimage | Vielseitig | Keine Aussage darüber, ob die Daten intervallskaliert sind |
| Stapel-Skaladiskret | Unipolare Zehn-Punkte-Skala von −5 bis +5 ohne Neutralpunkt (0) | Messung von Einstellungen und Image | Einfach zu konstruieren und in Telefon-Umfragen einzusetzen | Manchmal verwirrend und schwierig anzuwenden |
Konstruktion von diskreten Ratingskalen
Anzahl von Antwortkategorien
Mehr Kategorien erfassen feinere Unterschiede — aber die meisten Probanden kommen nur mit wenigen Kategorien zurecht.
Involvement & Wissen
mehrwenn Probanden an der Bewertung interessiert sind oder über tiefes Wissen zum Objekt verfügen.
Natur der Objekte
mehrwenn feine Unterschiede für die Objekte charakteristisch sind.
Modus der Datenerhebung
wenigerbei Telefoninterviews, wo Skalen schwerer zu überblicken sind.
Datenanalyse
wenigerfür Aggregation & Gruppenvergleiche · mehrfür anspruchsvolle, korrelationsbasierte Statistik.
Balancierte oder nicht-balancierte Skalen
Gerade oder ungerade Anzahl von Antwortkategorien
Ungerade Anzahl — mit Mitte
Gerade Anzahl — ohne Mitte
Die mittlere Option zieht viele Unsichere an — und solche, die ihre Meinung nur ungern offenbaren.
Das kann die Maße der zentralen Tendenz und der Varianz verzerren.
Wollen bzw. brauchen wir „Kontrast" bei kontroversen Einstellungen?
Obligatorische oder nicht-obligatorische Antwort?
Wollen die Probanden nicht antworten — oder haben sie schlicht keine Meinung?
„Weiß nicht" / „Nicht zutreffend"
Filterführung
Gezielt steuern, dass Probanden nur Fragen erhalten, die sie auch beantworten können — statt Antworten zu erzwingen.
Faustregel: Fragen ohne „weiß nicht" liefern tendenziell mehr genaue Daten — aber nur, wenn die Probanden tatsächlich eine Meinung haben.
Beschriftung der Skalenpunkte
Soll jeder Skalenpunkt beschriftet werden — oder reichen einige ausgewählte Punkte?
Alle oder nur einige?
Keine eindeutige Evidenz, dass die Beschriftung aller Punkte besser ist als nur ausgewählter — die Forschung zeigt keinen wesentlichen Unterschied.
Zu viel verwirrt
Zu viele, zu fein differenzierte Labels können Befragte verwirren, wenn sich Begriffe kaum abgrenzen lassen (z. B. „eher positiv" vs. „ziemlich positiv").
Entscheidend: Eindeutigkeit
Ambivalenz vermeiden. Beide Pole klar benennen, bei ungerader Anzahl auch die Mitte — es muss klar sein, welches Kontinuum die Skala abbildet.
Wenig Platz
Reduzierte Beschriftung besonders sinnvoll bei Schiebereglern oder Matrix-Fragen, wo volle Beschriftung schnell unübersichtlich wird.
Wie viel beschriften? — Vier Varianten
Dieselbe Frage: „Wie wahrscheinlich kaufen Sie Produkt A erneut?"
Spitze vs. flache Antwortverteilung
Wie extrem die Endpunkte sprachlich formuliert sind, prägt die Form der Antwortverteilung.
Befragte meiden die Extreme — die Antworten bündeln sich in der Mitte.
Befragte nutzen auch die Endpunkte — die Antworten verteilen sich differenzierter.
Umfrage: Messung und Skalierung
Latente Konstrukte und Multi-Item-Skalen
Latentes Konstrukt
Ein Sachverhalt (z. B. Kundenzufriedenheit), der nicht direkt beobachtbar bzw. messbar ist.
Das heißt nicht, dass er nicht „existiert" — sondern nur, dass er aus anderen, messbaren Sachverhalten (Indikatoren) erschlossen werden kann.
Latente Konstrukte: Hierarchie der Messung
Multi-Item-Skalen: Vorteile
Vorteile
- Möglichkeit zur Beurteilung abstrakter Konzepte
- Verschiedene Facetten des Konstruktes können erfasst werden
- Reduktion der Datendimensionalität durch Aggregation vieler beobachtbarer Sachverhalte zu einem Modell
Multi-Item-Skalen: baue oder klaue
Theorie · Sekundärdaten · qualitative Analyse
Wo findet man fertige Skalen?
marketingscales.com/research
Secure Customer Index
Der Secure Customer Index fasst drei Loyalitäts-Indikatoren zu einer Kennzahl zusammen. Als Secure Customer gilt nur, wer auf allen drei Dimensionen die Top-Stufe (5) wählt — die Schnittmenge. Die Segmente geben jeweils den Anteil (%) der Kunden an.
Sehr zufrieden
Werde definitiv wieder nutzen
Werde definitiv weiterempfehlen
Secure Customer
Quelle: D. Randall Brandt (1996), „Secure Customer Index", Maritz Research
Erweiterter Secure Customer Index von Burke Inc.
Burke erweitert den Secure Customer Index um zwei zusätzliche Loyalitäts-Dimensionen (insgesamt fünf) und verknüpft den in Periode 1 gemessenen Loyalitätsindex mit dem tatsächlichen Share of Wallet in Periode 2 — also dem Anteil der Ausgaben, den der Kunde der Marke widmet.
(0 % – 100 %)
Quelle: Burke Inc. · http://www.burke.com/
Umfrage: Messung und Skalierung
Das True-Score-Modell
Das Ergebnis der Messung ist nicht der wahre Wert einer Charakteristik, sondern nur eine Beobachtung davon.
Reliabilität und Validität
Gibt an, wie zuverlässig ein Messinstrument misst — d. h. wie konsistent die Ergebnisse bei wiederholten Messungen sind.
Kein Zufallsfehler: XR ⟶ 0 ⟹ XO ⟶ XT + XS
Maßzahl ist Cronbachs Alpha (0 ≤ α ≤ 1)
Werte von α ≥ 0,7 gelten als akzeptabel
Gibt an, inwieweit ein Messinstrument auch tatsächlich den Sachverhalt misst, den es messen soll.
Also: inwiefern gemessene Unterschiede tatsächlichen Unterschieden zwischen den Objekten entsprechen (Güte der Messung).
Kein Messfehler: XS ⟶ 0, XR ⟶ 0 ⟹ XO ⟶ XT
Zusammenhang zwischen Reliabilität und Validität
Der Zweck einer Skala ist es, uns zu ermöglichen, die Probanden mit der höchsten Genauigkeit und Reliabilität abzubilden. Wir können nicht das Eine ohne das Andere haben und dabei unseren Daten vertrauen.
Burke, Inc. (2000–2003)
Net Promoter Score® — Prädiktor des Unternehmenswachstums?
„Wie wahrscheinlich ist es, dass Sie Unternehmen/Marke/Produkt X einem Freund, Verwandten oder Kollegen weiterempfehlen werden?"
Quelle: Reichheld, Fred (2003) „One Number You Need to Grow", Harvard Business Review
Net Promoter Score®: Warnung
Obwohl die „Weiterempfehlungs-Frage“ bei weitem die beste Einzelfrage für die Vorhersage von Konsumentenverhalten für eine Reihe von Branchen ist — sie ist nicht die beste Frage für alle Branchen. Deshalb müssen Unternehmen ihre Hausaufgaben machen und die Verbindung zwischen der Antwort und dem darauffolgenden Konsumentenverhalten für ihr Geschäftsfeld empirisch überprüfen.
Fragebogen
Fragebogen
Ein Fragebogen ist eine formalisierte Liste von Fragen, die dazu dient, Informationen von Befragten zu erheben.
Fragetechniken und Befragungstaktik
vs. Offene
Fragen
- Geschlossen: Auswahl aus vorgegebenen Antwortalternativen.
+ einfach zu analysieren, kein kognitiver Stress
− automatische, nicht durchdachte Antworten - Offen: Antwortalternativen nicht vorgegeben.
+ unbegrenzte Möglichkeiten, beansprucht das Gedächtnis
− komplexe Codierung, Verweigerung möglich
vs. Indirekte
Fragen
- Direkt: die Frage zielt unmittelbar auf den interessierenden Sachverhalt.
- Indirekt: der Sachverhalt wird über eine Umweg-Formulierung erschlossen — schont sensible oder schwer artikulierbare Themen.
indirekt: „Welche Getränke bevorzugen Sie zu Mahlzeiten?"
Einfluss der Formulierung auf die Antwort
Gleiche Handlung, andere Formulierung — gegensätzliche Antworten.
Quelle: Noelle-Neumann & Petersen (1998), S. 192 · n = 2100, p < 0,05
Was soll man bei der Entwicklung eines Fragebogens berücksichtigen?
Fragebogen
Fragen stellen

„Nicht jede Frage verdient eine Antwort."
Publius Syrus · Rom, 1. Jh. v. Chr.
Mehrdeutigkeit, Verwirrung und Unklarheit vermeiden
Die sechs W's
Formulieren Sie die Frage in Bezug auf wer, was, wann, wo, warum und wie. Besonders wichtig: wer, was, wann, wo.
„Welche Marke von Shampoo nutzen Sie?" — was ist unklar?
| W | Aspekt | Warum unklar? |
|---|---|---|
| Wer | Bezugsperson | Nicht klar, ob nur der Proband selbst oder sein gesamter Haushalt gemeint ist. |
| Was | Bezugsobjekt | Nicht klar, wie zu antworten ist, falls mehrere Marken genutzt werden. |
| Wann | Bezugszeitraum | Kein Bezugszeitraum angegeben — heute Morgen, diese Woche oder das ganze Jahr? |
| Wo | Situation / Ort | Zu Hause, im Fitness-Studio, im Urlaub, auf Geschäftsreise? |
Antwortalternativen vollständig & eindeutig machen
Für Eindeutigkeit statt Mehrdeutigkeit: alle realistischen Situationen mitdenken und passende Antwortalternativen vorbereiten — inkl. „trifft nicht zu" und Filterführung.
2. „Sind Sie zufrieden mit Ihrer jetzigen Kfz-Versicherung?"
Skalen und Antwortalternativen müssen eindeutig sein
Vage Häufigkeiten
Wörter wie „selten", „manchmal" oder „oft" bedeuten für jeden Probanden etwas anderes. Nutzen Sie konkrete, abgegrenzte Häufigkeitsangaben.
Fachsprache, Slang und Abkürzungen vermeiden
Einfache Wörter
Verwenden Sie einfache, alltägliche Wörter — keine Fachbegriffe, kein Jargon. Jeder Proband muss die Frage sofort verstehen.
Doppelläufige Fragen vermeiden
Ein Aspekt pro Frage
Jede Frage soll sich auf nur einen Aspekt konzentrieren. Sonst weiß man nicht, worauf sich die Antwort bezieht.
2. „Ist Ihrer Meinung nach Coca-Cola erfrischend?"
Führende Fragen vermeiden
Keine Suggestion
Wenn Sie eine bestimmte Antwort wollen, brauchen Sie die Frage nicht zu stellen. Führende Formulierungen lenken den Probanden.
Implizite Annahmen vermeiden
Konsequenzen benennen
Die Antwort soll nicht von stillschweigenden Annahmen über die Konsequenzen abhängen. Machen Sie sie explizit.
Implizite Alternativen vermeiden
Alternativen nennen
Implizite Alternativen sind Antwortmöglichkeiten, die nicht explizit genannt wurden. Machen Sie die Gegenoption sichtbar.
Hypothetische Aussagen nicht als Beweis behandeln
Fakten statt Meinungen
Meinungen und Überzeugungen stellen die realen Fakten oft nur verzerrt dar. Fragen Sie nach beiden Fakten getrennt.
2. „Tragen Sie Pelzkleidung?"
Verallgemeinerungen und Schätzungen vermeiden
Kein Kopfrechnen
Zwingen Sie den Probanden nicht, sein Gedächtnis und seine mathematischen Fähigkeiten anzustrengen. Fragen Sie die Bausteine ab.
2. „Wie viele Mitglieder hat Ihr Haushalt?"
Fragebogen
Bewältigung der mangelnden Antwortfähigkeit



Ist der Proband informiert?
Probanden beantworten Fragen oft, auch wenn sie nicht informiert sind.
Kann der Proband sich erinnern?
Erinnerungsfehler
Mangelnde Erinnerung führt zu Weglassen, Telescoping und Schaffung. Fragen Sie nach typischem Verhalten, nicht nach exakten Zählungen.
Kann der Proband artikulieren?
Hilfsmittel anbieten
Wer seine Antwort nicht formulieren kann, überspringt die Frage oder bricht ab. Bieten Sie Bilder, Schemata oder Beschreibungen zur Auswahl an.
Fragebogen
Bewältigung der mangelnden Antwortbereitschaft
Aufwand reduzieren
Aufwand reduzieren
Minimieren Sie den für die Beantwortung erforderlichen Aufwand. Statt frei zu erinnern, lassen Sie aus einer fertigen Liste auswählen.
Kontext verdeutlichen
Kontext geben
Manche Fragen erscheinen im falschen Kontext unangemessen. Führen Sie sie mit einem erklärenden Statement ein.
Zweck erklären
Zweck legitimieren
Erklären Sie, warum die Informationen benötigt werden — sonst wirken sie aufdringlich.
Fragebogen
Sensible Themen behandeln
Fragebogen
Reihenfolge von Fragen
Trichterung und Verzweigungslogik

Die Frage, zu der verzweigt wird, möglichst nah an der auslösenden Frage platzieren.
Verzweigungen so anordnen, dass Probanden nicht vorhersehen können, welche Zusatzinfos abgefragt werden.
Beispiel: Ablaufplan einer Umfrage

Fragebogen
Eine überzeugende Einleitung gestalten
Pretesten! Pretesten! Pretesten!
Testen Sie den Fragebogen vor dem Einsatz an einer kleinen Stichprobe — und prüfen Sie jeden Aspekt:
Zusammenfassung
Entwickeln Sie einen Ablaufplan der erforderlichen Informationen — ausgehend vom (Markt-)Forschungsproblem.
Ist die Sequenz ausgelegt, werden die Zusammenhänge klar.
Stimmen Sie die erhobenen Daten auf den Informationsbedarf ab.
Legen Sie für jeden Bereich ein klares Ziel fest — daraus ergeben sich die Fragen.
Gehen Sie zurück zum Ablaufplan und fragen Sie zu jeder Information:
„Muss ich das wirklich wissen — und weiß ich, was ich damit tue?"
… statt „Wäre schön zu wissen, brauche ich aber nicht unbedingt."
Stichproben
Dewey Defeats Truman
1948: Die Chicago Daily Tribune verkündet das falsche Wahlergebnis. Präsident Harry Truman schlägt Thomas Dewey — entgegen aller Umfragen.
Grund: voreingenommene, ungenaue Meinungsumfrage.
Auswahl der Stichprobe (Sampling)
Die meisten Umfragen können nicht jede Person befragen. Stattdessen wird eine Stichprobe gezogen und untersucht — diese Prozedur heißt Sampling.
Ist die Stichprobe fehlerhaft gezogen, sind alle Daten nutzlos.
Auswahl der Stichprobe (Sampling)
Aber nicht alle Ausgewählten antworten auch: Wer tatsächlich teilnimmt, sind die Probanden.
Sampling: Zwei grundlegende Methoden
Die Stichprobe wird nach dem persönlichen Urteil des Forschers gezogen — oft aufs Geratewohl (Convenience Sample, z. B. Passanten im Einkaufszentrum).
In der Regel kostengünstig; erlaubt eine grobe Einschätzung der Populationsparameter.
Die Stichprobe wird nach dem Zufallsprinzip ausgewählt.
Erlaubt statistische Verfahren zur Bestimmung der Genauigkeit der geschätzten Populationsparameter sowie zur Beurteilung ihrer Konfidenzintervalle.
Stichproben-Auswahlverfahren
Stichproben
Willkürliche Auswahl
Bei der willkürlichen Auswahl (Auswahl aufs Geratewohl) gelangen die Probanden unkontrolliert in die Stichprobe — meist aus Bequemlichkeit. Oft nur, weil sie zur richtigen Zeit am richtigen Ort sind.
Bewusste Auswahl
Die bewusste Auswahl ist eine Form der willkürlichen Auswahl, bei der Probanden nach dem Ermessen des Forschers in die Stichprobe gelangen.
Quotenplan
Die Stichprobe wird nach vorgegebenen Kontrollmerkmalen (z. B. Geschlecht, Alter, Einkommen) gezogen, sodass sie die Struktur der Grundgesamtheit proportional widerspiegelt. Die Objekte werden meist aufs Geratewohl ausgewählt — sie müssen jedoch den Quotenplan erfüllen.
| Kontrollmerkmal | Grundgesamtheit | Stichprobe | |
|---|---|---|---|
| Anteil % | Anteil % | Anzahl | |
| Geschlecht — männlich | 48 | 48 | 480 |
| weiblich | 52 | 52 | 520 |
| Summe | 100 | 100 | 1000 |
| Alter — 18–30 | 27 | 27 | 270 |
| 31–45 | 39 | 39 | 390 |
| 45–60 | 16 | 16 | 160 |
| über 60 | 18 | 18 | 180 |
| Summe | 100 | 100 | 1000 |
Wird oft in Online-Umfragen verwendet.
Schneeball-Verfahren auch Ketten-Verfahren
Stichproben
Stichproben-Auswahlverfahren
Einfache und systematische Zufallsstichproben
- Jedes Element wird unabhängig von allen anderen ausgewählt. Das bedeutet:
- Jedes Element der Grundgesamtheit hat eine bekannte und gleiche Wahrscheinlichkeit, ausgewählt zu werden.
- Jede mögliche Stichprobe der Größe n hat eine bekannte Wahrscheinlichkeit, tatsächlich gezogen zu werden.
- Zunächst wird ein Startelement zufällig ausgewählt; anschließend wird jedes i-te Element aus dem Stichprobenplan gezogen.
- Der Abstand i ergibt sich aus dem Umfang der Grundgesamtheit N zum Umfang der Stichprobe n: i = N / n
Geschichtete Zufallsstichproben
Die Grundgesamtheit wird zunächst in nicht-überlappende Schichten (Stratas) aufgeteilt. Anschließend wird aus jeder Schicht ein (dis-)proportionaler Anteil zufällig gezogen. Elemente einer Schicht sollten einander ähnlich sein.
| Schicht | A | B | C |
|---|---|---|---|
| Umfang der Grundgesamtheit | 100 | 200 | 300 |
| Stichprobenanteil | ½ | ½ | ½ |
| Stichprobengröße | 50 | 100 | 150 |
| Schicht | A | B | C |
|---|---|---|---|
| Umfang der Grundgesamtheit | 100 | 200 | 300 |
| Stichprobenanteil | ⅕ | ½ | ⅓ |
| Stichprobengröße | 20 | 100 | 100 |
Klumpenstichproben auch Cluster-Stichproben
Die Grundgesamtheit wird in exklusive Klumpen (Cluster) aufgeteilt. Anschließend werden zufällig ganze Cluster ausgewählt, die im vollen Umfang in die Stichprobe gelangen.
Stichproben
Stärken und Schwächen von Stichproben-Auswahlverfahren
| Verfahren | Stärken | Schwächen |
|---|---|---|
| Nicht-zufällige Auswahlverfahren | ||
| Willkürliche Auswahl | Am günstigsten, am wenigsten zeitaufwendig, am bequemsten | Fehlerbehaftet, nicht repräsentativ; nicht empfohlen für deskriptive und kausale Forschung |
| Bewusste Auswahl | Niedrige Kosten, bequem, nicht zeitaufwendig | Subjektiv, Ergebnisse nicht verallgemeinerbar |
| Quotenplan | Bestimmte Charakteristiken der Stichprobe können kontrolliert werden | Fehlerbehaftet, keine Garantie der Repräsentativität |
| Schneeball-Verfahren | Ermöglicht Einschätzung seltener Eigenschaften | Zeitaufwendig in der Feldforschung |
| Zufällige Auswahlverfahren | ||
| Einfache Zufallsstichproben | Leicht verständlich; verallgemeinerbare bzw. repräsentative Ergebnisse | Stichprobenplan schwer zu konstruieren, teuer, geringere Genauigkeit; keine Garantie der Repräsentativität |
| Systematische Zufallsstichproben | Kann Repräsentativität erhöhen; einfacher umzusetzen als einfache Zufallsauswahl | Kann die Repräsentativität abschwächen |
| Geschichtete Zufallsstichproben | Enthält alle wichtigen Subgruppen der Grundgesamtheit; hohe Genauigkeit | Relevante Aufteilungskriterien schwer auszuwählen; mehrere Kriterien nicht praktikabel; teuer |
| Klumpenstichproben | Einfach umzusetzen, kosteneffizient | Ungenau; komplizierte Berechnung und Interpretation der Ergebnisse |
Stichproben
Bestimmung der Stichprobengröße
Die Stichprobengröße hängt nicht von der Größe der Grundgesamtheit ab — sie wird durch die qualitativen Aspekte der Studie bestimmt:
Typische Stichprobengrößen in der Marktforschung
| Typ der Studie | Minimaler Umfang | Typischer Umfang |
|---|---|---|
| Problemidentifizierungs-Studien (z. B. Marktpotenzial) | 500 | 1.000 – 2.000 |
| Problemlösungs-Studien (z. B. Preissetzung) | 200 | 300 – 500 |
| Produkttests | 200 | 300 – 500 |
| Studien auf den Testmärkten | 200 | 300 – 500 |
| TV-/Radio-/Print-Werbung (pro Anzeige) | 150 | 200 – 300 |
| Audit von Test-Märkten | 10 Geschäfte | 10 – 20 Geschäfte |
| Focus-Gruppen | 6 Gruppen | 10 – 15 Gruppen |
Ein Umfrageergebnis — und wie sicher ist es?
nennen Social Media als Haupt-Informationskanal.
Aber wie nah ist dieser Wert am wahren Wert in der Grundgesamtheit?
Die Antwort liefert die Fehlerspanne — und sie bestimmt den nötigen Stichprobenumfang.
Ansatz der Fehlerspanne zur Bestimmung des Stichprobenumfangs
Fehlerspanne ist das Maß der Genauigkeit einer Umfrage.
Je kleiner die Fehlerspanne, desto genauer sind die Schätzungen der Umfrage.
Ansatz der Fehlerspanne: zwei Formeln


Ansatz der Fehlerspanne: zwei Formeln
Ansatz der Fehlerspanne: zwei Formeln
Maximal bei π = 0,5
z-Werte und maximale Fehlerspanne
Mit z = 1,96 und dem Maximum π = 0,5 vereinfacht sich die Formel zu:
… die obere Grenze des Fehlers — unabhängig vom tatsächlichen Anteil π.
Wie hoch ist die Fehlerspanne?
„Aus welchen Quellen beziehen Sie bevorzugt Ihre Informationen?"
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Wie groß muss die Stichprobe sein?
Je höher die gewünschte Genauigkeit, desto größer muss die Stichprobe sein.
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Was, wenn die Grundgesamtheit klein ist?
Ist die Stichprobe größer als 10 % der Grundgesamtheit, sind Korrekturen notwendig.
Sonst überschätzt die Formel den nötigen Umfang — die endliche Grundgesamtheit verringert den tatsächlichen Stichprobenfehler.
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Korrektur des Stichprobenumfangs
Rechnerisch nötig wären n = 10.000 — bei nur 100 Elementen in der Grundgesamtheit:
= 1.000.000 / 10.099 ≈ 99
Mehr als die Grundgesamtheit kann man nicht befragen — die Korrektur bringt den Umfang auf ein realistisches Maß.
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Korrektur bei kleiner Grundgesamtheit: ± 1 %
nkorr=n · Nn + N − 1
= 1.000.000 / 10.099
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Korrektur bei kleiner Grundgesamtheit: ± 5 %
nkorr=n · Nn + N − 1
= 40.000 / 499
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Korrektur bei kleiner Grundgesamtheit: ± 10 %
nkorr=n · Nn + N − 1
= 10.000 / 199
Berechnungen zeigen approximierte Werte für 95 % Vertrauensniveau
Konfidenzintervall und Vertrauensniveau
Ein geschätzter Zahlenbereich zusammen mit der Angabe der Wahrscheinlichkeit, dass dieser Bereich den unbekannten Parameterwert enthält.
Der erwartete Anteil der Intervalle, die bei vielen Stichprobenziehungen den Parameterwert enthalten.
Stichprobe von 30 Personen → Ø 7,5 h. Konfidenzintervall: 7,2 – 7,8 h (Fehlerspanne ± 0,3).
95 % Vertrauensniveau heißt: Würde man die Messung 100-mal mit neuen Stichproben wiederholen, läge der echte Durchschnitt in 95 Fällen in diesem Bereich.
Jeder Balken = ein Konfidenzintervall. Rot = verfehlt den wahren Wert.
Konfidenzintervall, Fehlerspanne und Stichprobenumfang
Je höhere Sicherheit (Vertrauenswahrscheinlichkeit) wir brauchen, desto breiter wird das Konfidenzintervall — und desto höher die Fehlerspanne.


Was die Fehlerspanne-Formel uns sagt
Der einzige Hebel, um die Fehlerspanne zu senken, ist ein größeres n — alles andere ist vorgegeben.
Mehr Sicherheit heißt größeres z → die Fehlerspanne wächst → man braucht ein noch größeres n, um sie wieder zu drücken.
Datenanalyse
Typen von statistischen Analysemethoden
Fasst die Beobachtungen aus der Stichprobe zusammen und stellt sie übersichtlich dar.
Nutzt Kennzahlen, Tabellen, Grafiken und Diagramme zur Beschreibung, Systematisierung, Organisation und Darstellung der erhobenen Daten.
Macht Aussagen über die Generalisierbarkeit von Beobachtungen und Schlussfolgerungen aus Zufallsstichproben auf die Grundgesamtheit.
Beurteilt Beziehungen zwischen Variablen und quantifiziert sie: Stärke und Signifikanz, Vorhersagen und Schätzungen.
Datenanalyse
Datenanalyse
Häufigkeiten und relative Häufigkeiten
Häufigkeitsverteilung gibt zu jedem Wert an, wie oft er in den Daten vorkommt.
Relative Häufigkeit zeigt den Anteil (bzw. Prozent) der Beobachtungen eines Wertes.
| Lieblingsfarbe | Häufigkeit | Relative Häufigkeit |
|---|---|---|
| blau | 10 | 10/26 ≈ 0,38 |
| rot | 3 | 3/26 ≈ 0,12 |
| orange | 1 | 1/26 ≈ 0,04 |
| gelb | 3 | 3/26 ≈ 0,12 |
| grün | 5 | 5/26 ≈ 0,19 |
| rosa | 3 | 3/26 ≈ 0,12 |
| lila | 1 | 1/26 ≈ 0,04 |
| Gesamt | 26 | 1,00 |
Säulendiagramm
Säulenhöhe = Häufigkeit oder relative Häufigkeit
Säulen dürfen sich nicht berühren
Kreisdiagramm
Sollte immer relative Häufigkeiten angeben.
Braucht Beschriftungen — direkt am Diagramm oder in der Legende.
Datenanalyse
Tabellen
| Anzahl der Kinder | Häufigkeit | Relative Häufigkeit |
|---|---|---|
| 1 | 3 | 3/26 ≈ 0,12 |
| 2 | 8 | 8/26 ≈ 0,31 |
| 3 | 10 | 10/26 ≈ 0,38 |
| 4 | 2 | 2/26 ≈ 0,08 |
| 5 | 3 | 3/26 ≈ 0,12 |
Diskrete Variable ist eine quantitative Variable, die entweder eine endliche Anzahl von Werten oder eine unendlich abzählbare Anzahl von Werten (z. B. 0, 1, 2, 3, …) hat.
Manchmal gibt es zu viele Werte, um für jeden Wert eine Zeile zu erstellen. Dann fasst man mehrere Werte zu Gruppen (Klassen) zusammen.
| Punkte in der Prüfung | Häufigkeit | |
|---|---|---|
| Untere Klassengrenze → | 50–59 | 2 |
| Obere Klassengrenze → | 60–69 | 5 |
| 70–79 | 7 | |
| Klassenbreite = 90 − 80 = 10 → | 80–89 | 7 |
| 90–99 | 4 |
Tabellen und Histogramme
| Anzahl der Kinder | Häufigkeit | Relative Häufigkeit |
|---|---|---|
| 1 | 3 | 3/26 ≈ 0,12 |
| 2 | 8 | 8/26 ≈ 0,31 |
| 3 | 10 | 10/26 ≈ 0,38 |
| 4 | 2 | 2/26 ≈ 0,08 |
| 5 | 3 | 3/26 ≈ 0,12 |
| ∅ Zeit unterwegs | Häufigkeit | Relative Häufigkeit |
|---|---|---|
| 16–17,9 | 1 | 1/15 ≈ 0,07 |
| 18–19,9 | 2 | 2/15 ≈ 0,13 |
| 20–21,9 | 1 | 1/15 ≈ 0,07 |
| 22–23,9 | 6 | 6/15 ≈ 0,40 |
| 24–25,9 | 2 | 2/15 ≈ 0,13 |
| 26–27,9 | 1 | 1/15 ≈ 0,07 |
| 28–29,9 | 1 | 1/15 ≈ 0,07 |
| 30–31,9 | 1 | 1/15 ≈ 0,07 |
Histogramm
Ein Histogramm stellt eine klassierte Häufigkeitsverteilung grafisch dar.
Die Höhe jeder Säule entspricht der Häufigkeit (oder relativen Häufigkeit) der Klasse.
Die Breiten sind gleich und die Säulen berühren einander — anders als beim Balkendiagramm.
Frequenz-Polygonzug
Markiere den Mittelpunkt oben auf jeder Säule des Histogramms.
Verbinde die Mittelpunkte mit geraden Linien.
Führe die Linie an beiden Enden auf Null zurück — fertig ist der Polygonzug.
Kumulative Tabellen und Ogiven
zeigt die Summe der Häufigkeiten bis hin und einschließlich der jeweiligen Zeile.
ist der Graph der kumulierten relativen Häufigkeit über alle Klassen.
| ∅ Zeit | Relative Häufigkeit | Kumulierte rel. Häufigkeit |
|---|---|---|
| 16–17,9 | 1/15 ≈ 0,07 | 0,07 |
| 18–19,9 | 2/15 ≈ 0,13 | 0,07+0,13 0,20 |
| 20–21,9 | 1/15 ≈ 0,07 | 0,20+0,07 0,27 |
| 22–23,9 | 6/15 ≈ 0,40 | 0,27+0,40 0,67 |
| 24–25,9 | 2/15 ≈ 0,13 | 0,67+0,13 0,80 |
| 26–27,9 | 1/15 ≈ 0,07 | 0,80+0,07 0,87 |
| 28–29,9 | 1/15 ≈ 0,07 | 0,87+0,07 0,94 |
| 30–31,9 | 1/15 ≈ 0,07 | 0,94+0,07 1,00 |
Datenanalyse
Lagemaße

Einfach zu berechnen: nur aufsummieren und teilen.
Intuitiv – eine Zahl „in der Mitte“; wird von großen Werten nach oben, von kleinen nach unten gezogen.
Kann durch Ausreißer verzogen werden – schlecht bei stark variierenden Daten.
Der Mittelwert von 100, 200 und −300 ist 0. Das ist verwirrend.
ganz wie der Gleichgewichtspunkt
Lagemaße
für ungerade nfür gerade nKann gut mit Ausreißern umgehen – oft die genaueste Abbildung einer Gruppe.
Teilt die Daten in zwei gleich große Gruppen.
Schwieriger zu berechnen: Daten müssen zuvor sortiert werden.
Weniger bekannt; viele verwechseln „Median“ mit „Durchschnitt“.
einer sortierten Liste
Lagemaße
Gut für exklusive Auswahl (diese oder andere; keine Kompromisse) – funktioniert mit nominalen Daten.
Zeigt die Wahl, die die meisten wollten (der Mittelwert führt oft zu einer Wahl, die keiner wollte).
Einfach zu verstehen.
Erfordert mehr Aufwand: man muss die Stimmen zählen.
„Der Sieger nimmt alles“ — es gibt keinen Mittelweg.
unter allen Beobachtungen der Variable





ist
Lagemaße: Mittelwert und Median bestimmen die Form der Verteilung
Streuungsmaße

Varianz

Streuungsmaße
Varianz


Der Mittelwert funktioniert wie ein Gleichgewichtspunkt – die durchschnittliche Abweichung vom Mittelwert ist immer Null.
Bei der Varianz werden alle Abweichungen quadriert, damit negative und positive Abweichungen sich nicht aufheben.

Streuungsmaße
abweichung


Standardabweichung behält die Messeinheiten der Originaldaten.
Quadratzoll
ZollBeziehung zwischen Standardabweichung und Normalverteilung

Standard-
abweichung
Datenanalyse
Kreuztabellen
Kreuztabellen
Kreuztabellen fassen die gemeinsame Verteilung von zwei (oder mehr) diskreten Variablen tabellarisch zusammen.
Sie helfen, den Zusammenhang einer Variablen (z. B. Markentreue) mit einer anderen (z. B. Geschlecht) zu analysieren.
Jede Zelle steht für eine Kombination der Ausprägungen.
Typische Fragestellungen, die eine Kreuztabelle beantwortet:
- Wie viele markentreue Konsumenten sind Männer?
- Hängt die Nutzungshäufigkeit (hoch, mittel, niedrig) eines Produkts mit Outdoor-Aktivitäten (oft, manchmal, selten, nie) zusammen?
- Hängt die Vertrautheit mit einem neuen Produkt mit Alter und Bildungsniveau zusammen?
- Hängt der Besitz eines Produkts mit dem Einkommen (hoch, mittel, niedrig) zusammen?
Kreuztabellen
| Besitz eines teuren Autos | Bildungsgrad | |
|---|---|---|
| Hochschulabschluss | Kein Hochschulabschluss | |
| ja | 32 % | 21 % |
| nein | 68 % | 79 % |
| Gesamt | 100 % | 100 % |
| Anzahl der Fälle | 250 | 750 |
Kreuztabellen
Kreuztabellen
Beziehung
| Besitz eines teuren Autos | Hohes Einkommen | Geringes Einkommen | ||
|---|---|---|---|---|
| Hochschulabschluss | Kein Hochschulabschluss | Hochschulabschluss | Kein Hochschulabschluss | |
| ja | 20 % | 20 % | 40 % | 40 % |
| nein | 80 % | 80 % | 60 % | 60 % |
| Gesamt | 100 % | 100 % | 100 % | 100 % |
| Anzahl der Fälle | 100 | 700 | 150 | 50 |
Kreuztabellen
Zusammenhang
| Verlangen nach Auslandsreisen | Alter | |
|---|---|---|
| Unter 45 | 45 und mehr | |
| ja | 50 % | 50 % |
| nein | 50 % | 50 % |
| Gesamt | 100 % | 100 % |
| Anzahl der Fälle | 500 | 500 |
| Verlangen nach Auslandsreisen | Männlich | Weiblich | ||
|---|---|---|---|---|
| < 45 | ≥ 45 | < 45 | ≥ 45 | |
| ja | 60 % | 40 % | 35 % | 65 % |
| nein | 40 % | 60 % | 65 % | 35 % |
| Gesamt | 100 % | 100 % | 100 % | 100 % |
| Anzahl der Fälle | 300 | 300 | 200 | 200 |
Kreuztabellen
Veränderung
| Gehen häufig in Fast-Food-Restaurants | Familiengröße | |
|---|---|---|
| Small | Large | |
| ja | 50 % | 50 % |
| nein | 50 % | 50 % |
| Gesamt | 100 % | 100 % |
| Anzahl der Fälle | 500 | 500 |
| Gehen häufig in Fast-Food-Restaurants | Geringes Einkommen | Hohes Einkommen | ||
|---|---|---|---|---|
| Small | Large | Small | Large | |
| ja | 50 % | 50 % | 50 % | 50 % |
| nein | 50 % | 50 % | 50 % | 50 % |
| Gesamt | 100 % | 100 % | 100 % | 100 % |
| Anzahl der Fälle | 250 | 250 | 250 | 250 |
Datenanalyse
Datenanalyse
Hypothesentest
Hypothesentest
Ein fünfstufiges Verfahren, das auf Basis einer Stichprobe und mithilfe der Wahrscheinlichkeitstheorie bestimmt, ob eine Hypothese hinreichend begründet ist.
Anders gesagt: eine Methode zu prüfen, ob sich die Ergebnisse einer Zufallsstichprobe auf die Grundgesamtheit übertragen lassen.
Vorgehensweise in fünf Schritten:
- Formulierung einer Nullhypothese und ihrer Alternativhypothese
- Festlegen des Signifikanzniveaus
- Wahl der geeigneten Teststatistik
- Formulierung der Entscheidungsregel
- Berechnung der Kennzahlen aus der Stichprobe und Treffen der Entscheidung
„Menschen sind sich irrtümlicherweise zuversichtlich in ihrem Wissen und unterschätzen die Wahrscheinlichkeit, dass ihre Überzeugungen sich als falsch erweisen. Sie neigen dazu, nur solche Informationen zu suchen, die bestätigen, was sie ohnehin schon glauben."— Max Bazerman
Hypothesentest
| Internetnutzung | Geschlecht | Gesamt | |
|---|---|---|---|
| Männlich | Weiblich | ||
| selten | 5 | 10 | 15 |
| häufig | 10 | 5 | 15 |
| Gesamt | 15 | 15 | n = 30 |
Hypothesentest


Nullhypothese (H₀) ist eine Behauptung des Status quo — dass es keinen Unterschied bzw. keinen Effekt gibt.
Alternativhypothese (H₁) behauptet das Gegenteil — dass es einen Unterschied bzw. einen Effekt gibt.
Hypothesentest
Signifikanz (α) — Wahrscheinlichkeit, dass eine wahre Nullhypothese zurückgewiesen wird.
β — Wahrscheinlichkeit, dass eine falsche Nullhypothese angenommen wird.
| Nullhypothese (H₀) ist wahr | Nullhypothese (H₀) ist falsch | |
|---|---|---|
| Nullhypothese zurückweisen | Fehler 1. ArtFalse positive | Richtige EntscheidungTrue positive |
| Nullhypothese NICHT zurückweisen | Richtige EntscheidungTrue negative | Fehler 2. ArtFalse negative |
Hypothesentest
Analogie: Unschuld in einem Strafprozess.
H₀: Der Angeklagte ist unschuldig.
Signifikanz (α) — Wahrscheinlichkeit, dass eine wahre Nullhypothese zurückgewiesen wird.
β — Wahrscheinlichkeit, dass eine falsche Nullhypothese angenommen wird.
| Nullhypothese (H₀) ist wahr | Nullhypothese (H₀) ist falsch | |
|---|---|---|
| Nullhypothese zurückweisen | Fehler 1. ArtFalse positive | Richtige EntscheidungTrue positive |
| Nullhypothese NICHT zurückweisen | Richtige EntscheidungTrue negative | Fehler 2. ArtFalse negative |
Hypothesentest
Analogie: Rascheln im Gebüsch — ist das ein Löwe?
H₀: Es gibt keinen Löwen im Gebüsch.
Signifikanz (α) — Wahrscheinlichkeit, dass eine wahre Nullhypothese zurückgewiesen wird.
β — Wahrscheinlichkeit, dass eine falsche Nullhypothese angenommen wird.
| Nullhypothese (H₀) ist wahr | Nullhypothese (H₀) ist falsch | |
|---|---|---|
| Nullhypothese zurückweisen | Fehler 1. ArtFalse positive | Richtige EntscheidungTrue positive |
| Nullhypothese NICHT zurückweisen | Richtige EntscheidungTrue negative | Fehler 2. ArtFalse negative |
Hypothesentest
Signifikanz (α) — Wahrscheinlichkeit, dass eine wahre Nullhypothese zurückgewiesen wird.
β — Wahrscheinlichkeit, dass eine falsche Nullhypothese angenommen wird.
Hypothesentest
In unserem Beispiel geht es um die Verteilung nicht-metrischer Variablen (seltene/häufige Internetnutzung; Männer/Frauen) in einer Stichprobe.
| Stichprobe | Anwendung auf | Skalenniveau | Teststatistiken / Kommentare |
|---|---|---|---|
| Eine Stichprobe | Verteilungen | Nicht-metrisch | Kolmogorow-Smirnow- und χ²-Test auf Anpassungsgüte; Runs-Test auf Zufälligkeit; Binomialtest für dichotome Variablen |
| Mittelwerte | Metrisch | t-Test (Varianz unbekannt); z-Test (Varianz bekannt) | |
| Proportionen | Metrisch | z-Test | |
| Zwei unabhängige Stichproben | Verteilungen | Nicht-metrisch | Kolmogorow-Smirnow-Test auf Übereinstimmung von Verteilungen für zwei Stichproben |
| Mittelwerte | Metrisch | Zweistichproben-t-Test; F-Test für Gleichheit von Varianzen | |
| Proportionen | Metrisch, Nicht-metrisch | z-Test; χ²-Test | |
| Rangplätze / Mediane | Nicht-metrisch | Mann-Whitney-U-Test (sensibler als Median-Test) | |
| Gepaarte Stichproben | Mittelwerte | Metrisch | Paardifferenz-t-Test |
| Proportionen | Nicht-metrisch | McNemar-Test für binäre Variablen; χ²-Test | |
| Rangplätze / Mediane | Nicht-metrisch | Wilcoxon-Vorzeichen-Rang-Test (sensibler als Vorzeichentest) |
Hypothesentest
Eine Stichprobe · Verteilung · nicht-metrisch → der χ²-Test auf Anpassungsgüte.
| Stichprobe | Anwendung auf | Skalenniveau | Teststatistiken / Kommentare |
|---|---|---|---|
| Eine Stichprobe | Verteilungen | Nicht-metrisch | Kolmogorow-Smirnow- und χ²-Test auf Anpassungsgüte; Runs-Test auf Zufälligkeit; Binomialtest für dichotome Variablen |
| Mittelwerte | Metrisch | t-Test (Varianz unbekannt); z-Test (Varianz bekannt) | |
| Proportionen | Metrisch | z-Test | |
| Zwei unabhängige Stichproben | Verteilungen | Nicht-metrisch | Kolmogorow-Smirnow-Test auf Übereinstimmung von Verteilungen für zwei Stichproben |
| Mittelwerte | Metrisch | Zweistichproben-t-Test; F-Test für Gleichheit von Varianzen | |
| Proportionen | Metrisch, Nicht-metrisch | z-Test; χ²-Test | |
| Rangplätze / Mediane | Nicht-metrisch | Mann-Whitney-U-Test (sensibler als Median-Test) | |
| Gepaarte Stichproben | Mittelwerte | Metrisch | Paardifferenz-t-Test |
| Proportionen | Nicht-metrisch | McNemar-Test für binäre Variablen; χ²-Test | |
| Rangplätze / Mediane | Nicht-metrisch | Wilcoxon-Vorzeichen-Rang-Test (sensibler als Vorzeichentest) |
Hypothesentest
Die χ²-Teststatistik (Chi-Quadrat) prüft die statistische Signifikanz des in einer Kreuztabelle beobachteten Zusammenhangs.
χ² prüft die Gleichheit von Häufigkeitsverteilungen — welche Häufigkeiten vergleichen wir?
- fe — Häufigkeiten, die wir in den Zellen erwarten würden, wenn es keinen Zusammenhang gäbe.
- fo — tatsächlich beobachtete Häufigkeiten.
Hypothesentest
Hypothesentest

χ² sollte immer nur mit absoluten Häufigkeiten berechnet werden. Liegen die Daten in Prozent (relative Häufigkeiten) vor, müssen sie zuvor in absolute Häufigkeiten umgerechnet werden.
Hypothesentest
TScal — beobachteter (berechneter) Wert der Teststatistik.
TScr — kritischer Wert der Teststatistik für das gewählte Signifikanzniveau.
Hypothesentest
| df | 0,99 | 0,975 | 0,95 | 0,90 | 0,10 | 0,05 | 0,025 | 0,01 |
|---|---|---|---|---|---|---|---|---|
| 1 | — | 0,001 | 0,004 | 0,016 | 2,706 | 3,841 | 5,024 | 6,635 |
| 2 | 0,020 | 0,051 | 0,103 | 0,211 | 4,605 | 5,991 | 7,378 | 9,210 |
| 3 | 0,115 | 0,216 | 0,352 | 0,584 | 6,251 | 7,815 | 9,348 | 11,345 |
| 4 | 0,297 | 0,484 | 0,711 | 1,064 | 7,779 | 9,488 | 11,143 | 13,277 |
| 5 | 0,554 | 0,831 | 1,145 | 1,610 | 9,236 | 11,071 | 12,833 | 15,086 |
| 6 | 0,872 | 1,237 | 1,635 | 2,204 | 10,645 | 12,592 | 14,449 | 16,812 |
| 7 | 1,239 | 1,690 | 2,167 | 2,833 | 12,017 | 14,067 | 16,013 | 18,475 |
| 8 | 1,646 | 2,180 | 2,733 | 3,490 | 13,362 | 15,507 | 17,535 | 20,090 |
| 9 | 2,088 | 2,700 | 3,325 | 4,168 | 14,684 | 16,919 | 19,023 | 21,666 |
| 10 | 2,558 | 3,247 | 3,940 | 4,865 | 15,987 | 18,307 | 20,483 | 23,209 |
Hypothesentest
- H₀ — dass es keinen Zusammenhang gibt — kann nicht zurückgewiesen werden.
- Der Zusammenhang ist auf dem Signifikanzniveau von 0,05 statistisch nicht signifikant.
- Die aus der Stichprobe beobachteten Ergebnisse können nicht auf die Grundgesamtheit verallgemeinert werden.
Hypothesentest
| Internetnutzung | Geschlecht | Gesamt | |
|---|---|---|---|
| Männlich | Weiblich | ||
| selten | 5 | 10 | 15 |
| häufig | 10 | 5 | 15 |
| Gesamt | 15 | 15 | n = 30 |
Wenn die Stichprobe sorgfältig ausgewählt und gezogen wurde, können wir mit 95 % Vertrauenswahrscheinlichkeit behaupten, dass es keinen solchen Zusammenhang gibt.
Ansonsten — wir wissen es nicht.
Datenanalyse
Prüfung der Stärke des Zusammenhangs
χ² prüft nur die Signifikanz eines Zusammenhangs und trifft keine Aussage über seine Stärke.
Einfacher Nachweis: Verdoppelung aller Werte in der Kreuztabelle führt zur Verdoppelung von χ² — der Zusammenhang selbst bleibt aber gleich.
Phi-Koeffizient

Je höher φ, desto stärker ist der Zusammenhang zwischen den Variablen.
Werte > 0,30 werden als substantiell angesehen.
- φ ist nicht standardisiert und hat eine Obergrenze von 1 nur für 2×2-Tabellen; sie hängt von den Tabellendimensionen ab.
- φ-Werte aus verschiedenen Studien können nicht miteinander verglichen werden.
Der Zusammenhang ist nicht besonders stark.
Kontingenzkoeffizient

Je höher C, desto stärker ist der Zusammenhang zwischen den Variablen.
Werte > 0,30 werden als substantiell angesehen.
Obwohl C-Werte die Obergrenze von 1 haben, können sie diese Grenze faktisch nicht erreichen.
- C ist nicht standardisiert und hängt von den Tabellendimensionen ab.
- C-Werte aus verschiedenen Studien können nicht miteinander verglichen werden.
Der Zusammenhang ist nicht besonders stark.
Cramers V

Je höher V, desto stärker ist der Zusammenhang zwischen den Variablen.
Werte > 0,30 werden als substantiell angesehen.
V-Werte haben die Obergrenze von 1, können sie aber ebenfalls faktisch nur bei 2×2-Tabellen erreichen.
- V ist nicht standardisiert und hängt von den Tabellendimensionen ab.
- V-Werte aus verschiedenen Studien können nicht miteinander verglichen werden.
Der Zusammenhang ist nicht besonders stark.
Lambda-Koeffizient

Gibt Aufschluss darüber, inwieweit die Kenntnis der Ausprägung einer Variable bei der Prognose der anderen Variable hilft.
Ist standardisiert zwischen 0 und 1 (1 — fehlerfreie Prognose, 0 — keine Verbesserung der Vorhersage).
λ-Werte aus verschiedenen Studien können miteinander verglichen werden.
Kenntnis vom Geschlecht erhöht die Prognosegenauigkeit um den Faktor 0,333, d.h. 33,3 % Verbesserung.
Lambda-Koeffizient
Summe der maximalen Häufigkeiten aller Spalten
maximaler Gesamtwert einer Zeile
| Internetnutzung | Geschlecht | Gesamt (Zeile) | |
|---|---|---|---|
| Männlich | Weiblich | ||
| r = 1selten | 5 | 10 | 15 |
| r = 2häufig | 10 | 5 | 15 |
| Gesamt (Spalte) | 15c = 1 | 15c = 2 | n = 30 |
Kenntnis vom Geschlecht erhöht die Prognosegenauigkeit um den Faktor 0,333, d.h. 33,3 % Verbesserung.
Datenanalyse
Typen vom Zusammenhang zweier Variablen
Soweit die Daten nicht aus einem kontrollierten Experiment stammen, können wir nur die Existenz einer Beziehung zwischen den Variablen behaupten — nicht jedoch die kausale Richtung dieser Beziehung.
Lineare Korrelation
Zwei Variablen korrelieren positiv, wenn höhere Werte einer Variable höheren Werten der anderen Variable entsprechen.
Zwei Variablen korrelieren negativ, wenn höhere Werte einer Variable niedrigeren Werten der anderen Variable entsprechen.
Positive Korrelation
Negative Korrelation
Linearer Korrelationskoeffizient
- Werte des linearen Korrelationskoeffizienten liegen immer zwischen −1 und 1.
- Bei r = +1 besteht ein vollständig positiver linearer Zusammenhang zwischen den Variablen.
- Bei r = −1 besteht ein vollständig negativer linearer Zusammenhang zwischen den Variablen.
- Je näher r an +1 bzw. −1 liegt, desto stärker der jeweilige Zusammenhang.
- Liegt r nahe 0, gibt es kaum Nachweis für einen linearen Zusammenhang — das bedeutet aber nicht, dass es gar keine Beziehung gibt, eben nur keine lineare.
Linearer Korrelationskoeffizient
Der (Pearsonsche) lineare Korrelationskoeffizient misst die Stärke der linearen Beziehung zwischen zwei Variablen.

Linearer Korrelationskoeffizient
| r-Wert | Interpretation |
|---|---|
| 0 bis 0,3 | Sehr schwach |
| 0,3 bis 0,5 | Schwach |
| 0,5 bis 0,7 | Mittel |
| 0,7 bis 0,9 | Hoch |
| 0,9 bis 1 | Sehr hoch |

| x | y | (xᵢ−x̄) | (yᵢ−ȳ) | (xᵢ−x̄)(yᵢ−ȳ) | (xᵢ−x̄)² | (yᵢ−ȳ)² |
|---|---|---|---|---|---|---|
| 86 | 98 | 12,5 | 13,5 | 168,75 | 156,25 | 182,25 |
| 62 | 70 | −11,5 | −14,5 | 166,75 | 132,25 | 210,25 |
| 52 | 56 | −21,5 | −28,5 | 612,75 | 462,25 | 812,25 |
| 90 | 110 | 16,5 | 25,5 | 420,75 | 272,25 | 650,25 |
| 66 | 76 | −7,5 | −8,5 | 63,75 | 56,25 | 72,25 |
| 80 | 96 | 6,5 | 11,5 | 74,75 | 42,25 | 132,25 |
| 78 | 86 | 4,5 | 1,5 | 6,75 | 20,25 | 2,25 |
| 74 | 84 | 0,5 | −0,5 | −0,25 | 0,25 | 0,25 |
| Mittelwert | 73,5 | 84,5 | ||||
| Summe | 1514 | 1142 | 2062 |

Regressionsanalyse
- Können Werbeausgaben die Absatzänderungen erklären?
- Kann der Marktanteil auf die Größe der Verkaufsabteilung zurückgeführt werden?
- Wird die Qualitätswahrnehmung von Konsumenten von ihrer Wahrnehmung vom Preis beeinflusst?
Regressionsanalyse
Die Regressionsanalyse ist ein mächtiges und flexibles Instrument zur Analyse von assoziativen Beziehungen zwischen einer metrischen abhängigen Variable und einer oder mehreren unabhängigen Variablen.
- die Existenz der Beziehung zu bestimmen,
- die Stärke der Beziehung zu quantifizieren,
- ein mathematisches Modell (Formel) der Beziehung abzuleiten,
- Werte der abhängigen Variable vorherzusagen,
- den Einfluss anderer unabhängiger Variablen zu berücksichtigen.
Regressionsanalyse
Wie viele Produkteinheiten werden wir absetzen, wenn wir €85.000 für die Werbung ausgeben?
| Werbeausgaben, €1.000 | Absatz, €1.000 |
|---|---|
| 40 | 377 |
| 60 | 507 |
| 70 | 555 |
| 110 | 779 |
| 150 | 869 |
| 160 | 818 |
| 190 | 862 |
| 200 | 817 |
- Werbeausgaben erklären 83,6 % der Varianz vom Absatz.
- Jeder zusätzliche in die Werbung investierte Euro bringt €2,82 zusätzlichen Absatz.
- €85.000 Werbeausgaben resultieren in 2,8239 · 85 + 352,07 = 592,1 (Tsd. €) Absatz.
Fortgeschrittene Techniken der Marktforschung
Fortgeschrittene Techniken der Marktforschung
Conjoint-Analyse
Conjoint-Analyse
Die Conjoint-Analyse ist eine Reihe von Techniken, die in der Marktforschung für die Analyse von attributbasierten Präferenzen von Konsumenten eingesetzt werden — d.h. um zu bestimmen, wie wichtig unterschiedliche Produkteigenschaften und Eigenschaftsausprägungen für die Konsumenten sind.
Wie soll unser neues Produkt aussehen?
- Bewertung von ganzheitlichen Objekten
- Dekomposition von Präferenzen
- Segmentierung
- Entwicklung von neuen Produkten
- Preissetzung

Conjoint-Analyse
| ganz und gar nicht wichtig | ausgesprochen wichtig | ||||
|---|---|---|---|---|---|
| Hersteller/Marke | |||||
| Prozessorleistung, GHz | |||||
| Speicher, GB | |||||
| Display-Größe | |||||
| Preis |
Conjoint-Analyse
| ganz und gar nicht wichtig | ausgesprochen wichtig | ||||
|---|---|---|---|---|---|
| Hersteller/Marke | |||||
| Prozessorleistung, GHz | |||||
| Speicher, GB | |||||
| Display-Größe | |||||
| Preis |
Conjoint-Analyse
| ganz und gar nicht wichtig | ausgesprochen wichtig | ||||
|---|---|---|---|---|---|
| Hersteller/Marke | |||||
| Prozessorleistung, GHz | |||||
| Speicher, GB | |||||
| Display-Größe | |||||
| Preis |
Conjoint-Analyse
Relative Wichtigkeiten einzelner Produkteigenschaften können besser gemessen werden, wenn sie von Probanden als einheitliches Stimulus beurteilt werden (CONsidered JOINTly), als wenn jede Eigenschaft isoliert bewertet wird:
- Viele Konsumenten sind nicht in der Lage, die relative Wichtigkeit einzelner Produkteigenschaften zu bestimmen.
- Einzelne Eigenschaften werden isoliert anders wahrgenommen als ihre Kombination, die ein ganzheitliches Produkt ausmacht.
- Die Konstruktion der bevorzugten Eigenschaftskombination belastet die kognitiven Fähigkeiten von Probanden — „alle Eigenschaften sind wichtig“.
- Soziale Erwünschtheit und scharf ausgeprägte Selbsteinschätzung motivieren Probanden, einigen Eigenschaften viel Gewicht zu geben, auch wenn sie keine Rolle spielen (z. B. Umweltfreundlichkeit, Wohlstand, verringerte Bedeutung vom Preis).
- Einige Probanden versuchen absichtlich, die Ergebnisse zu manipulieren, indem sie „vorteilhafte“ Antworten geben (z. B. Überbewertung der Wichtigkeit vom Preis).
Conjoint-Analyse
Fortgeschrittene Techniken der Marktforschung
Marktsimulationen
Angesichts folgender Präferenzwerte — welches Produkt sollten wir auf dem Markt anbieten?
| Produktalternativen | |||
|---|---|---|---|
| Blau | Rot | Gelb | |
| Proband #1 | 50 | 40 | 10 |
| Proband #2 | 0 | 65 | 75 |
| Proband #3 | 40 | 30 | 20 |
| Mittelwert | 30 | 45 | 35 |
Marktsimulationen
Angesichts folgender Präferenzwerte — welches Produkt sollten wir auf dem Markt anbieten?
| Produktalternativen | |||
|---|---|---|---|
| Blau | Rot | Gelb | |
| Proband #1 | 50 | 40 | 10 |
| Proband #2 | 0 | 65 | 75 |
| Proband #3 | 40 | 30 | 20 |
| Mittelwert | 30 | 45 | 35 |
Marktsimulationen
Angesichts folgender Präferenzwerte — welches Produkt sollten wir auf dem Markt anbieten?
| Produktalternativen | Wahl | |||
|---|---|---|---|---|
| Blau | Rot | Gelb | ||
| Proband #1 | 50 | 40 | 10 | Blau |
| Proband #2 | 0 | 65 | 75 | Gelb |
| Proband #3 | 40 | 30 | 20 | Blau |
| Mittelwert | 30 | 45 | 35 | Rot |
Marktsimulationen
Angenommen: 80 % der Kunden bevorzugen runde Dinge, 20 % bevorzugen eckige. Welche Art von Dingen sollten wir auf den Markt bringen?
Die Wahl scheint offensichtlich — gehe dahin, wo die meisten Kunden sind:
es bereits 10 Wettbewerber gibt, die ALLE runde Dinge anbieten?
10 Anbieter kämpfen um dieselben 80 % — die 20 % „eckig" sind völlig unbesetzt.
Warum Marktsimulationen?
Marktsimulationen spiegeln die Realität besser wider als rein datengetriebene Modelle — und liefern Entscheidungen, die im Wettbewerb tatsächlich tragen.
Näher an der Realität
- bilden idiosynkratische Präferenzen von Segmenten und Individuen ab
- berücksichtigen Präferenzen und konkurrierende Angebote am Markt
Nischen statt nur Masse
Kein Zwang, sich auf den „fetten" Teil des Marktes zu fixieren — auch unbesetzte Segmente können guten Profit bringen.
„Versuchslabor"
Eine Vielzahl realer Marktchancen lässt sich risikofrei durchspielen — samt ihrer möglichen Ergebnisse.
Aktionsfähig fürs Management
Die Ergebnisse sind leicht verständlich und lassen sich direkt in Entscheidungen übersetzen.
Was machen Marktsimulationen?
Der grundlegende Prozess läuft für jeden Probanden einzeln ab — und wird anschließend zu Marktanteilen aggregiert:
Was machen Marktsimulationen?
Die Produktwahl je Proband wird durch sogenannte Wahlregeln bestimmt — z. B.:
Regel der ersten Wahl
- Das Produkt mit dem höchsten Nutzen wird gewählt.
- Auswahlwahrscheinlichkeit = 100 % für dieses Produkt, 0 % für alle anderen.
BTL-Modell
- Auswahlwahrscheinlichkeit hängt vom relativen Nutzenanteil am Markt ab.
- Auch Produkte mit geringem Präferenz- bzw. Nutzenwert erhalten eine positive Wahrscheinlichkeit.

Logit-Regel
- Auswahlwahrscheinlichkeit steigt mit zunehmendem Kontrast im Produktnutzen.
- Ermöglicht eine a-priori-Anpassung simulierter an reale Marktanteile.

Fortgeschrittene Techniken der Marktforschung
Marktsegmentierung
Marktsegmentierung bezeichnet die Aufspaltung des „relevanten Marktes" in Gruppen von Konsumenten, die nach innen homogen und nach außen heterogen sind — und bildet die Grundlage einer differenzierten Marktbearbeitung.
Aus einer gemischten Gesamtgruppe werden in sich homogene, untereinander verschiedene Segmente.
Entwicklung effizienter Produktdifferenzierungsstrategien — für eine möglichst optimale Ausschöpfung der Potentiale einzelner Segmente.
Effektive Marktsegmentierung
Sechs Kriterien bestimmen die Effizienz und Wirtschaftlichkeit einer Segmentlösung:
Identifizierbarkeit
Konsumenten lassen sich auf Basis einfach messbarer Variablen identifizieren.
Substantialität
Segmente müssen groß genug sein, um Investitionen amortisieren zu können.
Zugänglichkeit
Gezielte Ansprache bzw. gezielter Einsatz des Marketing-Mix ist möglich.
Stabilität
… über den Zeitraum von Planung, Durchführung und Wirkung segmentspezifischer Maßnahmen.
Verhaltensrelevanz
Einheitliche Reaktion auf segmentspezifische Maßnahmen (z. B. Preisänderung).
Handlungsfähigkeit
Sinnvoll und hilfreich bei der Formulierung des Marketing-Mix.
Typologie von Segmentierungsmerkmalen
- Nutzerstatus & Nutzungssituation
- Nutzungshäufigkeit & -intensität
- Markentreue & -loyalität
- Psychographische Merkmale
- Werte
- Persönlichkeit & Lifestyle
- Nutzenvorstellungen / Produktnutzen
- Einstellungen & Wahrnehmung
- Präferenzen, Motive & Absichten
Nutzen-Segmentierung
Der Nutzen, den Konsumenten von Produkten erwarten, gilt als eines der relevantesten Segmentierungsmerkmale überhaupt:
… Der Nutzen, den Menschen von Produkten erwarten, ist einer der Hauptgründe für die Heterogenität in ihrem Wahlverhalten. Somit ist der Nutzen das relevanteste Segmentierungsmerkmal.
… Nutzen ist eines der beliebtesten Merkmale der Segmentierung — zwecks Marktverständnis, Positionierung, Entwicklung neuer Produktkonzepte sowie Werbe- und Vertriebsstrategien. Das alles aufgrund seiner Aktionsfähigkeit.
Bewertung von Segmentierungsmerkmalen
| Merkmalstyp | Identifizier- barkeit |
Substan- tialität |
Zugäng- lichkeit |
Stabilität | Handlungs- fähigkeit |
Verhaltens- relevanz |
|---|---|---|---|---|---|---|
| 1 · Generelle, beobachtbare | ++ | ++ | ++ | ++ | – | – |
| 2 · Spezifische, beobachtbare | ||||||
| Kauf | + | ++ | – | + | – | + |
| Nutzung | + | ++ | + | + | – | + |
| 3 · Generelle, nicht beobachtbare | ||||||
| Persönlichkeit | ± | – | ± | ± | – | – |
| Lifestyle | ± | – | ± | ± | – | – |
| Psychographische Merkmale | ± | – | ± | ± | – | – |
| 4 · Spezifische, nicht beobachtbare | ||||||
| Psychographische Merkmale | ± | + | – | – | ++ | ± |
| Wahrnehmung | ± | + | – | – | + | – |
| Nutzen bzw. Nutzenvorstellungen | + | + | – | + | ++ | ++ |
| Absichten | + | + | – | ± | – | ++ |
Markiert — die in der Praxis aussichtsreichsten Merkmale: In Kombination decken sie die Segmentierungskriterien am besten ab.
Wie unterscheiden sich die Segmente?
Paradox der Nutzensegmentierung
Bei der Segmentierung nach erwartetem Nutzen muss man klar zwischen zwei Typen von Variablen unterscheiden:
Diskriminierende Variablen
Wichtig, um die Stichprobe in nach innen homogene Segmente zu trennen.
Treiber-Variablen
Wichtig, weil sie den Nutzen bzw. die Eigenschaften darstellen, die Probanden je Segment am meisten verlangen.
Fortgeschrittene Techniken der Marktforschung
Positionierung
Positionierung richtet alle Marketingaktivitäten an den Präferenzstrukturen der potenziellen Kunden aus — unter Berücksichtigung der Wettbewerbsprodukte.
Ziel: die Unternehmensleistungen so zu gestalten, dass die von Kunden wahrgenommenen Ist-Eigenschaften mit den gewünschten Soll-Eigenschaften in Übereinstimmung gebracht werden.
Die Rolle der Wahrnehmung
Dieselben Probanden, dieselben Colas — nur das Wissen um die Marke ändert sich. Die Präferenz kippt:


Blindtest
Probanden wissen nicht, welche Cola sie trinken„Offener" Test
Probanden wissen, welche Cola sie trinkenWahrnehmungskarten
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten bilden die Positionen konkurrierender Produkte, Marken oder Unternehmen in einem „virtuellen" Eigenschaftsraum ab — so, wie Konsumenten die gesamte Produktkategorie wahrnehmen.
Achsen
Die latenten Produkteigenschaften, die zwischen allen Alternativen am besten differenzieren.
Vektoren
Geben Richtung und Stärke wahrgenommener Produkteigenschaften an.
Abstände
Zwischen zwei Alternativen entsprechen dem Grad ihrer wahrgenommenen (Un-)Ähnlichkeit.
Ziel der Positionierung
Ziel der Positionierung ist es, in der Wahrnehmung von Konsumenten eine solche Position einzunehmen, die:
- möglichst nah am Idealpunkt und
- möglichst weit weg von der Konkurrenz ist.
Jede Achse ist eine latente Eigenschaft; jedes Produkt nimmt eine wahrgenommene Position ein.
Wahrnehmungskarte von Sessel-Designs
Wahrnehmungskarten
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten
Wettbewerbsintensität
Je näher die Marken sind, desto ähnlicher sind sie in der Wahrnehmung der Konsumenten — desto stärker („direkter") ist der Wettbewerb.
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten
Eigenschaftsvektoren
Wahrnehmung von Brands durch Konsumenten: Je weiter ein Brand vom Ursprung entlang eines Eigenschaftsvektors entfernt ist, desto stärker ist diese Eigenschaft bei ihm ausgeprägt.
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten
Beziehungen zwischen den Eigenschaften
Je kleiner der Winkel zwischen Eigenschaftsvektoren, desto höher ist deren paarweise Korrelation.
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten
Länge des Eigenschaftsvektors zeigt seinen Differenzierungsgrad
Je länger der Vektor ist, desto stärker differenziert diese Eigenschaft zwischen den Bieren.
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten
Achsen differenzieren am stärksten
Achsen sind „virtuelle" Eigenschaftsvektoren, die am stärksten differenzieren. Ihre Bezeichnung wird meist aus den benachbarten Vektoren abgeleitet.
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
Wahrnehmungskarten
Wahrnehmungskarten und Segmentierung
Einfache Bewertung von Segmentpotenzialen und -attraktivität; einfache Formulierung von Positionierungsstrategien, -aussagen und Werbekampagnen.
Mögliche Themen für Werbekampagnen:
Männern
besonderen
Anlass
Leistungs-Verhältnis
sättigend
Frauen
A
C
B
Beispiel: Wahrnehmungskarte von Schmerzmittel
Prüfen Sie sich:
Beispiel: Wahrnehmungskarte von Schmerzmittel
Prüfen Sie sich:
Wichtigkeit der Wahrnehmung in Positionierung
Kurioser aber typischer Fall
40 Lebensmittel: subjektive Wahrnehmung vs. objektive Eigenschaften.
Wichtigkeit der Wahrnehmung in Positionierung
Kurioser aber typischer Fall
40 Lebensmittel: subjektive Wahrnehmung vs. objektive Eigenschaften.
Die Wahrnehmung bzw. Bewertung vieler Lebensmitteleigenschaften hat oft nichts oder sehr wenig mit dem realen Gehalt dieser Eigenschaften zu tun.
Ergebnisse berichten
Manager sollen den Bericht leicht verstehen, den Ergebnissen vertrauen und wissen, welche Maßnahmen sie ergreifen sollten.
Die letzte Stufe des Forschungsprozesses
Der Bericht ist der am häufigsten unterschätzte Schritt des Forschungsprozesses.
Selbst eine methodisch perfekte Studie verliert ihren Wert, wenn die Ergebnisse schlecht vermittelt werden.
Ergebnisse so darstellen, dass sie unmittelbar in die Entscheidung einfließen — nicht nur zusammenfassen, sondern interpretieren.
Warum Bericht und Präsentation zählen

Nach Projektende bleibt oft nur der schriftliche Bericht — er dient als historischer Beleg der gesamten Studie.

Die Managemententscheidung stützt sich auf den Bericht. Ein schwacher Abschluss entwertet die gesamte vorausgegangene Forschung.

Viele Manager erleben nur Bericht und Vortrag — und bewerten daran die Qualität des gesamten Projekts.

Die Entscheidung für künftige Forschung oder denselben Dienstleister hängt am wahrgenommenen Nutzen.
Vom Datenergebnis zum Follow-up
Die Ergebnisse sollen direkt als Input in die Entscheidungsfindung dienen; wo sinnvoll, werden Schlüsse gezogen und umsetzbare Empfehlungen gegeben.
Kernergebnisse, Schlüsse und Empfehlungen vor dem Schreiben mit den Entscheidungsträgern besprechen — das sichert Passung, Akzeptanz und Liefertermine.
Die typische Gliederung — elf Elemente
- Anschreiben
- Titelblatt
- Inhaltsverzeichnis
- Executive Summary
- Problemdefinition
- Ansatz & Forschungsdesign
- Datenanalyse
- Ergebnisse
- Schlussfolgerungen & Empfehlungen
- Limitationen & Vorbehalte
Was vor dem eigentlichen Bericht steht
Übergibt den Bericht, fasst die Projekterfahrung zusammen (ohne Ergebnisse) und weist auf nötige Folgeschritte hin.
Titel im Manager-Ton statt »Research-Speak«; Angaben zu Forscher und Auftraggeber, Datum.
Haupt- und Unterüberschriften mit Seitenzahlen; danach Verzeichnisse für Tabellen, Grafiken, Anhänge.
Beschreibt knapp Problem, Ansatz und Design und widmet einen Abschnitt den zentralen Ergebnissen, Schlüssen und Empfehlungen. Wird zuletzt geschrieben — erst wenn der gesamte Bericht steht.
Der inhaltliche Kern
Hintergrund, Gespräche mit Entscheidern und Experten, dann klare Management- und Forschungsfrage.
Theoretische Grundlagen, Modelle, Hypothesen; Methoden grafisch und nicht-technisch, Details in den Anhang.
Analyseplan und -techniken begründen, in einfachen Begriffen mit Beispielen erklären.
Längster Teil. Gliederung nach Analyseform, Erhebungsmethode oder Zielen — an den Informationsbedarf gekoppelt.
Nicht bloß zusammenfassen: interpretieren und — wenn möglich — umsetzbare Empfehlungen ableiten.
Grenzen ausgewogen benennen, ohne Vertrauen zu untergraben; Anhang mit Autorisierung, Fragebogen, Stichprobe.
Grundsätze guten Schreibens
Für die Entscheider schreiben; Fachjargon vermeiden, technische Begriffe in den Anhang.
Logische Struktur, Überschriften, kurze klare Sätze; von Außenstehenden gegenlesen lassen.
Sorgfältige Gestaltung; Typografie variieren — aber nur so weit, wie es das Verständnis stützt.
Design, Ergebnisse und Schlüsse korrekt darstellen, nicht den Erwartungen des Managements anpassen.
Schlüsselinfos mit Tabellen/Grafiken verstärken — und Grafiken mit Zitaten zum Leben erwecken.
Alles Unnötige weglassen — Kürze jedoch nie auf Kosten der Vollständigkeit.
»Die Leser Ihrer Berichte sind beschäftigte Menschen — kaum jemand kann Bericht, Kaffee und Wörterbuch gleichzeitig balancieren.«Richtlinien für Tabellen
- Nummer & Titel — eindeutige arabische Nummer, kurzer beschreibender Titel, im Text referenzierbar.
- Anordnung der Daten — nach dem wichtigsten Aspekt ordnen: Zeit, Größenordnung oder alphabetisch.
- Maßeinheit — Basis klar angeben (Spalten- vs. Zeilenprozente, Stichprobengröße).
- Lesehilfen — Linien, Schattierung oder Weißraum führen das Auge über die Zeile.
- Überschriften, Stubs, Fußnoten — Spaltenköpfe, linke Randspalte, erklärende Fußnoten.
- Quelle — bei Sekundärdaten die Datenquelle nennen.
| EMU-Wirkung | Gesamt | Single | Dual | Multiple |
|---|---|---|---|---|
| Bestehende Beziehungen | 46 % | 41 % | 45 % | 48 % |
| Weniger Banken (Eurozone) | 33 % | 31 % | 30 % | 35 % |
| Eine Hauptbank koordiniert | 33 % | 43 % | 39 % | 29 % |
| Weniger Banken je Land | 22 % | 15 % | 17 % | 25 % |
Grafiktypen im Überblick
Geo- und Positionierungskarten zeigen Standorte, Kunden, Wettbewerber — Basis der Geodemografie.
Einfache relative Häufigkeiten. Nicht für Zeitverläufe oder mehrere Variablen.
Verbindet Datenpunkte — ideal für Trends über die Zeit; mehrere Reihen vergleichbar.
Zeigt absolute/relative Größen und Differenzen. Histogramm = vertikale Häufigkeiten.
Wenige Datenpunkte, um Unterschiede zwischen Gruppen qualitativ darzustellen.
Stellen Prozessschritte oder die Verknüpfung qualitativer Ideen dar.
Zwei Regeln, die man nicht vergisst
Für einfache relative Häufigkeiten geeignet — nicht für Zeitverläufe oder Beziehungen zwischen mehreren Variablen.
3D verzerrt relative Größen und verwirrt das Publikum. Programme bieten viele 3D-Optionen — kaum eine stellt Daten klar und unverzerrt dar.
Der Vortrag prägt den ersten Eindruck
Skript/Outline nach dem Bericht, mehrfach proben.
Hintergrund, Interesse und Betroffenheit der Zuhörer kennen.
Flipchart, Projektor, Software — die Botschaft nie aus dem Blick verlieren.
Gestik, Blickkontakt, Lautstärke und Tempo variieren; starker Schluss.

Research Follow-up
Technische Teile erklären, bei der Umsetzung helfen, Folgeprojekte besprechen und Ergebnisse ins MIS/DSS integrieren.
Solange es frisch ist, kritisch fragen: »Hätte man das Projekt effektiver oder effizienter durchführen können?«
Die Qualität der persönlichen Interaktion zwischen Manager und Forschendem prägt die wahrgenommene Qualität des Berichts selbst. Vertrauen beeinflusst Beziehungsqualität, Engagement, Bindung — und letztlich, wie stark die Marktforschung tatsächlich genutzt wird.
Berichte über Länder und Sprachen hinweg
Für Management in verschiedenen Ländern und Sprachen eigene, leserspezifische Versionen — inhaltlich vergleichbar, im Format ggf. unterschiedlich.
Beim Vortrag kulturelle Normen beachten — Humor ist nicht überall angebracht. Empfehlungen ggf. länderspezifisch anpassen.
Parallel gepflegte Sprachversionen (z. B. DE / RU / KZ) sind kein Übersetzungs-, sondern ein Berichtsproblem: feldweise Lokalisierung, vergleichbare Kennzahlen, konsistente Begriffe.
Integrität bei Interpretation und Bericht
der befragten Marktforscher nennen Fragen der Forschungsintegrität als ihr schwierigstes ethisches Problem.
- Relevante Daten ignorieren
- Das Forschungsdesign kompromittieren
- Statistiken bewusst missbrauchen
- Zahlen fälschen oder Ergebnisse verändern
- Ergebnisse zugunsten einer Sichtweise umdeuten
- Informationen zurückhalten
Versuchung widerstehen: Aus uneindeutigen Befunden eine »kohärente, wohlgeformte Geschichte« zu formen, ist befriedigend — aber unethisch. Objektivität wahren, auch wenn nichts Signifikantes herauskommt.
Vom »Push« zum »Pull«
- Gedruckter Bericht, »push«
- Passwortgeschützte Intranet-Berichte
- Erste Multimedia-Reports im Web
- Suchbar, weltweit abrufbar
- Interaktive Dashboards, »pull«
- Echtzeit-Daten & Live-Filter
- Kreuztabellen und Gewichtung on demand
- Verknüpfte Reports, Regeln zur Robustheit
Die wichtigsten Take-aways
Bericht und Präsentation entscheiden über den wahrgenommenen Wert der gesamten Studie.
Ergebnisse als Entscheidungsinput aufbereiten — mit umsetzbaren Empfehlungen.
Jargon vermeiden, klar strukturieren, Text und Visualisierung gegenseitig stützen.
≤ 7 Tortensegmente, Vorsicht bei 3D, Tabellen sauber beschriften.
Der Vortrag lebt vom Vortragenden — nicht von der Folie.
Objektiv bleiben, beim Auftraggeber nachfassen, das eigene Projekt evaluieren.
Über den Autor

Dr. Paul Marx war Professor für Marketing an der Universität Siegen, wo er insbesondere zu E-Commerce, Präferenzmessung, Neue Medien, Big Data und Empfehlungssystemen forschte. Er studierte Aero- und Hydrodynamik sowie Management an der Staatlichen Technischen Universität Nowosibirsk (Russland) und bekleidete anschließend leitende Positionen im Marketing. Im Jahr 2000 zog er nach Deutschland, vertiefte sein Studium der Wirtschaftswissenschaften an der Universität Hannover und gründete den Online-Service für Online-Umfragen eQuestionnaire — heute QUESTIONSTAR. Paul promovierte an der Bauhaus-Universität Weimar und veröffentlichte seine Forschung in führenden internationalen Zeitschriften, u. a. im Journal of Marketing.
Referenzen & Lizenz
- Backhaus, K., Erichson, B., Plinke, W., Weiber, R. (2015): „Multivariate Analysemethoden: Eine anwendungsorientierte Einführung“, Springer Gabler, 14. Auflage.
- Brandt, D. R. (1996): „Secure Customer Index“, Maritz Research.
- Bruner, G. C. (2012): „Marketing Scales Handbook“, Vol. 6.
- Burke, Inc. — burke.com.
- Chuang, S.-C., Chen, H.-C. (2008): International Journal of Design.
- Malhotra, N. K. (2020): „Marketing Research: An Applied Orientation“, Prentice Hall, 6th edition.
- Marx, P. (1979–2026) — eigene internationale Erfahrung.
- Moore, W. L., Pessemier, E. A. (1993), S. 145.
- Myers, J. H. (1996): „Segmentation & Positioning for Strategic Marketing Decisions“, South Western Educ. Pub.
- Noelle-Neumann, E., Petersen, T. (1998): „Alle, nicht jeder. Einführung in die Methoden der Demoskopie“, Springer, S. 192.
- Reichheld, F. (2003): „The One Number You Need to Grow“, Harvard Business Review.
- Reichheld, F., Markey, R. (2011): „The Ultimate Question 2.0“, Harvard Business Review Press.
- Sullivan III, M. (2010): „Statistics: Informed Decisions Using Data“, Pearson, 3rd edition.
- Visocky O'Grady, J. & K. (2009): „The Information Design Handbook“, HOW Books.
- Course „Statistics I“ of Elgin Community College.
Haftungsausschluss: Der Autor sowie affiliierte Personen/Organisationen können für die Verletzung jeglicher Lizenzbedingungen nicht verantwortlich gemacht werden, sofern diese nicht durch ihr aktives Tun verursacht wurden. Markennamen und geschützte Warenzeichen sind Eigentum ihrer jeweiligen Inhaber und werden lediglich beschreibend genannt. Irrtümer vorbehalten.
Diese Präsentation unterliegt der Creative-Commons-Attribution-NonCommercial-ShareAlike-Lizenz, soweit nicht anders angegeben. Jede Nutzung oder Verbreitung erfordert einen Verweis auf diese Präsentation und die explizite Nennung von Dr. Paul Marx und QUESTIONSTAR.