Wahrscheinlichkeitsstichproben und Nicht-Zufallsstichproben sind nicht so unterschiedlich in der Praxis; In beiden Fällen geht es um die Gewichte.
Die Probenahme ist die Grundlagenforschung zu überblicken. Die Forscher stellen fast nie ihre Fragen an alle in ihre Zielgruppe. In dieser Hinsicht sind Umfragen nicht eindeutig. Die meisten Untersuchungen, in der einen oder anderen beinhaltet Probenahme. Manchmal wird diese Abtastung explizit vom Forscher getan; anderen Zeiten ist es passiert implizit. Zum Beispiel, ein Forscher, der ein Laborexperiment auf Studenten in ihrer Universität läuft auch eine Probe genommen. Somit Probenahme ist ein Problem, das in diesem Buch kommt. In der Tat ist einer der häufigsten Bedenken, dass ich über digitale Zeitalter Datenquellen hören ist "sie nicht repräsentativ sind." Da wir in diesem Abschnitt sehen werden, diese Sorge ist sowohl weniger ernst und subtiler als viele Skeptiker erkennen. In der Tat werde ich argumentieren, dass das gesamte Konzept der "Repräsentativität" für das Nachdenken über Wahrscheinlichkeit und nicht-Wahrscheinlichkeit Proben nicht hilfreich ist. Stattdessen ist der Schlüssel, um darüber nachzudenken, wie die Daten gesammelt und wie etwaige Verzerrungen in dieser Datensammlung können rückgängig gemacht werden, wenn Schätzungen.
Derzeit ist die dominante theoretische Ansatz zur Darstellung von Wahrscheinlichkeitsstichproben. Wenn Daten mit einer Wahrscheinlichkeit Probenahmeverfahren gesammelt werden, die perfekt ausgeführt wurde, sind Forscher in der Lage, ihre Daten zu Gewicht, basierend auf dem Weg, dass sie unverzerrte Schätzungen über die Zielpopulation zu machen gesammelt wurden. Doch im Grunde perfekt Wahrscheinlichkeitsstichproben geschieht nie in der realen Welt. Es sind in der Regel zwei Hauptprobleme 1) Unterschiede zwischen der Zielgruppe und der Rahmen Bevölkerung und 2) Nicht-Ansprechen (das sind genau die Probleme, die die Literary Digest Umfrage zerstört). So und nicht als ein realistisches Modell der Wahrscheinlichkeitsstichproben denken, was passiert eigentlich in der Welt, ist es besser, von Wahrscheinlichkeitsstichproben als hilfreich, abstraktes Modell zu denken, ähnlich wie die Art und Weise Physiker über ein reibungs Ball denken eine unendlich lange kullerten Rampe.
Die Alternative zur Wahrscheinlichkeitsstichproben ist nicht Wahrscheinlichkeitsstichproben. Der wesentliche Unterschied zwischen Wahrscheinlichkeit und nicht-Wahrscheinlichkeitsstichproben besteht darin, dass mit einer Wahrscheinlichkeit in der Bevölkerung Abtasten jeder eine bekannte Wahrscheinlichkeit der Aufnahme hat. viele Sorten von Nicht-Zufallsstichproben, und diese Methoden der Datenerhebung werden immer häufiger im digitalen Zeitalter gibt es in der Tat. Aber nicht Wahrscheinlichkeitsstichproben hat einen schrecklichen Ruf unter den Sozialwissenschaftler und Statistiker. In der Tat ist nicht Wahrscheinlichkeitsstichproben mit einigen der dramatischsten Ausfälle der Umfrage Forscher, wie der Literary Digest Fiasko (früher diskutiert) und die falsche Vorhersage über die Präsidentschaftswahlen in den USA im Zusammenhang von 1948 ( "Dewey besiegt Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .
Allerdings ist der richtige Zeitpunkt nicht Wahrscheinlichkeitsstichproben aus zwei Gründen zu überdenken. Zunächst als Wahrscheinlichkeitsstichproben immer schwieriger geworden sind, in der Praxis zu tun, die Linie zwischen Wahrscheinlichkeitsstichproben und nicht-Wahrscheinlichkeitsstichproben verschwimmt. Wenn es hohe Raten von Non-Response (wie es in realen Umfragen sind jetzt), sind die tatsächliche Wahrscheinlichkeit von Einschlüssen für die Befragten nicht bekannt und somit Wahrscheinlichkeitsstichproben und nicht-Wahrscheinlichkeitsstichproben sind nicht so unterschiedlich, wie viele Forscher glauben. In der Tat, wie wir weiter unten sehen werden, verlassen sich beide Ansätze grundsätzlich auf der gleichen Schätzmethode: Post-Schichtung. Zweitens gab es viele Entwicklungen in der Sammlung und Analyse von Nicht-Wahrscheinlichkeitsstichproben gewesen. Diese Methoden sind unterschiedlich genug von den Methoden, die in der Vergangenheit Probleme verursacht, dass ich denke, dass es Sinn für sie zu denken macht als "nicht-Wahrscheinlichkeitsstichproben 2.0." Wir sollten nicht eine irrationale Abneigung gegen nicht-Wahrscheinlichkeit Methoden haben aufgrund von Fehlern, die passiert vor langer Zeit.
Als nächstes, um dieses Argument konkreter zu machen, werde ich Standard-Wahrscheinlichkeitsstichproben und Gewichtung (Abschnitt 3.4.1) überprüfen. Die Schlüsselidee ist, dass, wie Sie Ihre Daten erhoben werden, sollten Auswirkungen, wie Sie Schätzungen vornehmen. Insbesondere dann, wenn jeder die gleiche Wahrscheinlichkeit der Aufnahme nicht hat, sollte dann nicht jeder das gleiche Gewicht haben. Mit anderen Worten, wenn Ihr Probenahme nicht demokratisch ist, dann sollten Sie Ihre Schätzungen nicht demokratisch sein. Nach Gewichtung der Überprüfung, werde ich zwei Ansätze zur Nicht-Wahrscheinlichkeitsstichproben zu beschreiben: eine, die auf Gewichtung konzentriert sich mit dem Problem der wahllos gesammelten Daten (Abschnitt 3.4.2) und eine zu befassen, die mehr Kontrolle darüber, wie die Daten zu platzieren versucht ist gesammelt (Abschnitt 3.4.3). Die Argumente im Haupttext wird im Folgenden mit Worten und Bildern erklärt werden; Leser, die eine mathematische Behandlung möchte sollte auch im technischen Anhang.