Representatioun ass ronn inferences aus Är Interviewten zu Är Populatioun bruecht.
Fir d'Art vu Feele ze verstoen, wat geschitt, wann Dir vun den Interviewten zu der grousser Bevëlkerung ofgeschloss kënnt, kuckt d' Literaresch Digest- Stroossebuerung, déi de Resultat vun de Präsidentschaftswahlen vun 1936 virschreift. Obschonn et méi wéi 75 Joer geschitt ass, ass dëst Debakel nach ëmmer eng wichteg Lektioun fir d'Fuerscher ze léieren.
Literarescht Digest war eng populär Generalzinsblock, an huet ugefaang am Joer 1920 ugefaangen d'Stroosseluweisungen ze viraus fir d'Resultater vun de Presidentialwahlen ze préviséieren. Fir dës Virdeeler ze maachen, si wäerte Wieler a ville Leit schécken an dann einfach d'Stëmme déi zréckkoum. D'litauesch Digest huet stolz matgedeelt datt déi Stëmme déi si kritt hunn, waren net gewiicht, ugepasst oder interpretéiert. Dës Prozedur huet d'Gewënner vun den Wahlen 1920, 1924, 1928 a 1932 virgeworf. 1936, an der Mëtt vun der Great Depression, Literaresch Digest huet Stëmme un 10 Millioune Leit geschéckt, wou d'Nimm ass virun allem aus Telefonsverzeichnisser an Autosmeldung ze kréien. Hei ass wéi se hir Methodologie beschriwwen huet:
"D 'Glatmaschinn vun der DIGESTELLT fiert mat der schneller Präzisioun vun enger Erfahrung vun 30 Joer no, fir Guesswork zu héigen Faktoren ze reduzéieren ... Dës Woch hunn 500 Stéck méi wéi e Véierel vun enger Millioun Adressen de ganzen Dag zerschmiert. All Dag, an engem grousse Raum, héich hanner dem motoriséiertem Fourth Avenue, New York, 400 Aarbechter schlussendlech eng Millioun Stücke vun der gedréckter Matière rutschen - genuch 40 Plaatzen Blödsinn an d'adresséiert Hängelen [sic]. All Stonn, am DIGEST'ES eegene Post Office Substation, dräi Dréiende Portage Metering Maschinnen ofgeséchert an d'wäisselwechte Lännermann ginn; Mataarbechter vun de Posten hunn an e Mailsäck geliwwert; Flott DIGEST-Camionschaergeriichte krute se fir Mail-Zich auszedrécken. . . Déi nächst Äntwerten aus deenen zéng Milliounen de nächste Woch beginn de kommende Gezei vu geote Wielerot, triplécke gepréift, gepréift, fënneffaart a ville klengen a totaliséiert. Wann d'lescht Figur gemaach gouf a kontrolléiert ass, wann d'Vergangenheet e Kritär war, wäert d'Land zu engem Bruch vun 1 Prozent d'aktuell aktuelle Vote vun 40 Milliounen [Wähler] wëssen. "(22. August 1936)
D' Fetishiséierung vun der Gréisst vun der Literarescher Digest ass direkt un all "grouss Daten" Forscher erkennbar. Vun de 10 Millioune Wieler verdeelt, sinn 2,2 Milliounen erstaunn - dat ass ongeféier 1.000 mol méi grouss wéi d'moderne politesch Polluee. Vun dësen 2,4 Milliarden Interviewten war d'Urteel kloer: Alf Landon géif de Besëtzer Franklin Roosevelt besiegen. Mee, tatsächlech huet Roosevelt Landon an engem Äerdrëffer besiegt. Wéi konnt d' Literarescht Digest falsch goën mat esou vill Daten? Un eisem modernen Verständnis vun der Probebunn maacht d' Feeler vun der Literarescher Droge kloer an hëlleft eis ze vermeiden, ähnlech Fehler an der Zukunft ze maachen.
Denkt unerkennzt iwwert d'Probebuër erfuerdert eis fir véier ënnerschiddlech Gruppen vu Leit ze betraff (3.2). Déi éischt Grupp ass déi Zilgrupp ; Dëst ass d'Grupp déi de Fuerscher definéiert als Populatioun vun Interesse. Am Fall vun der Literarescher Digest ass d'Zilbevëlkerung Wieler an de Präsidentschaftswahlen 1936.
No enger Decisioun iwwer eng Zilpopulatioun muss e Fuerschungspersonal eng Lëscht vu Leit entwéckelen, déi fir d'Probabilitéit benotzt ginn. Dës Lëscht gëtt als Samplingframe bezeechent an d'Leit op deem steet d' Frammepopulatioun . Ideal ass d'Zilbezuelung an d'Roudpopulatioun genau d'selwecht, awer an der Praxis ass et net oft de Fall. Zum Beispill am Fall vun der Literarescher Digest ass d'Räichskapell déi 10 Millioune Leit, déi d'Nimm vu meescht Telefonsverzeichnisser an Autosmeldungen hunn. D'Ënnerscheeder tëscht der Zilspopulatioun an der Räichbevëlkerung ginn als Ofdeckungsfehler bezeechent . Ofdeckungsfehler ass net fir Iech selwer Problemer. Allerdéngs kann et zu Versuergungskierper féieren, wann Leit an der fräier Populatioun systematisch ënnerschriwwe vu Leit an der Zilspopulatioun sinn, déi net an der Rouder Bevëlkerung sinn. Dëst ass tatsächlech genee wat an der Literariver Opmierksamkeet geschitt ass. D'Leit an hirer frëndlecher Populatioun hunn e méi wahrscheinlech d'Alf Landon ze ënnerstëtzen, deelweis well se méi räich ginn (Erënnerung datt d'Telefoner an Autos am Joer 1936 relativ nei an deier waren). Also, an der Literariver Digest- Umellung, huet de Versuergungsoffall zu Ofdeckung vu Bias gemaach.
No der Definitioun vum Frame Populatioun ass de nächste Schrëtt fir e Fuerscher fir d' Probe Populatioun auszeschléissen; Dëst sinn d'Leit, déi de Fuerscher ofzespillen hätt an interviewen. Wann d'Prouf verschidde Charakteristiken huet wéi d'Räichbevëlkerung, da kann d' Probenentlech Prouffehler virstellen. Am Fall vun der Literariver Digest Fiasco ass et awer eigentlech keng Probebunn - d'Zäitschrëft, fir jiddfereen an der Friempopulatioun ze kontaktéieren - an duerfir ass et kee Prouffehler. Vill Wëssenschaftler hunn éischter op d'Proufproblem konzentréieren - dat ass typesch déi eenzeg Art vu Feeler, déi duerch de Rand vum Fehler fonnt gëtt, deen an Ëmfroen bericht gouf - awer d' Literarie Digest Fiasco erënnert eis datt mer brauchen fir all Quelle vum Fehler z'iwwerzuel a systematesch ze halen.
Endlech, nodeems Dir e Probe-Populatioun ausgewielt hutt, versprécht e Fuerscher all d'Memberen ze interviewen. Déi Leit, déi erfollegräich erfollegräich sinn, ginn als Interviewte genannt . Ideal ass d'Probebevëlkerung an d'Interviewten genau d'selwecht, awer an der Praxis ass et net korrekt. Dat heescht, d'Leit, déi an der Préifung ausgewielt ginn, deelhuelen heiansdo net matmaachen. Wann d'Leit, déi reagéieren, ënnerschiddlech vun denen, déi net reagéieren, da kann et onregelméisseg Viraussiicht ginn . Nonresponse Viraussetzung war den zweetgrofen Haaptproblem mat der Literariver Dierfer poll. Nëmme 24% vun de Leit, déi e Walot krut kréien, an et huet sech erausgestallt, datt Leit, déi Landon ënnerstëtzt hunn, méi wahrscheinlech ze reagéieren.
Méi wéi nëmmen e Beispill, d'Iddien vun der Representatioun z'ënnerstëtzen, ass d' Literariver Digest- Ëmfank e oftmächstverspriechende Parabel, déi d'Fuerscher iwwer d'Gefaangenheet vun der Happefassaz probéieren. Leider weess ech, datt d'Lektioun datt vill Leit aus dëser Geschicht zéien d'falsch ass. Déi heefegste Moral vun der Geschicht ass, datt d'Fuerscher näischt aus Probéierungsproblemer probéieren (dh Proben ouni streng Wahrscheinlechter Regelen fir d'Participanten auswielen). Mee, wéi ech spéider an dësem Kapitel ze weisen, ass dat net ganz richteg. An ech mengen datt et wierklech zwou Moral sinn fir dës Geschicht; d'Moral, déi haut als si richteg sinn wéi se 1936 waren. E bësse Quantitéit vun ugeklaassten Donnéeën garantéieren net eng gutt Schätzung. Am Allgemengen, huet eng grouss Unzuel vun den Interviewten d'Varianz vun de Schätzunge verringert, awer et zwéngt net onbedéngt d'Viraussetzung. Mat villen Donnéeën kënnen d'Fuerscher heiansdo e genee Schätzung vun der falscher Saach kréien. Si kënne genee vu präzis net exact (McFarland and McFarland 2015) . Déi zweet Haaptstëmmung vun der Literatur Digest Fiasco ass datt d'Fuerscher iwwerzeechnen fir wéi hir Probe gesammelt gouf wann se Schätzungen hunn. An anere Wierder, well de Proufpropositiounsprozess an der Literariver Digest- Umféierung systematesch op e puer Interviewte verschwonnen ass, brauche d'Fuerscher een méi komplexe Schätzungsprozess ze benotzen, deen e puer Respekt'en méi wéi aner gewënscht hunn. Spéider an dësem Kapitel weist ech Iech eng esou sougenannte Prozedur fir d'Gewiicht - post-Stratifikatioun - déi et Iech erlaabt Iech besser Schätzungen aus Azzazardproblemer ze maachen.