Fertsjintwurdiging is it meitsjen inferences fan jo respondinten nei jo doelgroep befolking.
Om te begripen de soarte fan flaters dy't kin barre as inferring fan respondinten nei de gruttere befolking, litte wy beskôgje it Literêr Digest strie poll dy't besocht te foarsizze de útkomst fan de 1936 Amerikaanske Presidential ferkiezing. Hoewol't it wie mear as 75 jier lyn, dat debacle noch hat in wichtige les te learen ûndersikers hjoed.
Literêre Digest wie in populêr algemien-belang tydskrift, en begjint yn 1920 sy begûn running strie polls te foarsizze de útkomsten fan Presidential ferkiezings. Om dizze foarsizzings se soenen stjoere stimbriefkes oan in soad minsken, en dan gewoan Tally op de stimbriefkes dy't werom; Literêre Digest grutsk melde dat de stimbriefkes se krigen waarden net "woegen, oanpast, noch ynterpretearre." Dizze proseduere goed foarsei de winner fan de ferkiezings yn 1920, 1924, 1928 en 1932. yn 1936, yn 'e midden fan' e Grutte Depresje, Literêre Digest stjoerde út stimbriefkes nei 10 miljoen minsken, waans nammen predominately kaam út telefoan triemtafels en auto registraasje records. Hjir is hoe't se beskreaun harren metodyk:
"DE Digest syn glêde-rint masine beweecht mei de swift krektens fan tritich jier 'ûnderfining te ferminderjen guesswork nei hurde feiten. . . .This Wike 500 pennen bekrast út mear as in kwart fan in miljoen adressen in dei. Elke dei, yn in greate keamer heech boppe motor-ribboned Fjirde Avenue, yn New York, 400 arbeiders deftly slide in miljoen stikken fan printe saak-genôch te pave fjirtich stêd blokken-yn 'e oarder envelops [sic]. Elke oere, yn DE Digest'S eigen Post Office Substation, trije toskeratteljen postage Metering masines besegele en stimpele de wite oblongs; betûft postal meiwurkers omdraaid se yn ferbrede mailsacks; float Digest trucks sped se te drukken mail-treinen. . . Folgjende wike, de earste antwurden fan dizze tsien miljoen sil begjinne de ynkommende tij fan Marked stimbriefkes, te wêzen triple-kontrolearre, ferifiearre, fiif-kear cross-Classified en totaled. Doe't de lêste figuer is totted en kontrolearre, as ferline ûnderfining is in kritearium, it lân sil witte nei binnen in fraksje fan 1 persint de eigentlike populêre stimmen fan fjirtich miljoen [kiezers]. "(22 augustus, 1936)
De Digest fan fetishization fan grutte is direkt werkenber foar alle "grutte gegevens" ûndersiker hjoed. Fan de 10 miljoen stimbriefkes ferspraat, in amazing 2,4 miljoen stimbriefkes waarden werom-dat is rûchwei 1.000 kear grutter as moderne politike peilings. Ut dizze 2,4 miljoen respondinten it fonnis wie dúdlik: Literêre Digest foarsei dat de útdager Alf Landon wie hinne te ferslaan de sittende Franklin Roosevelt. Mar, yn feite, it eksakte tsjinoerstelde barde. Roosevelt fersloech Landon yn in ierdferskowing. Hoe koe Literêre Digest gean mis mei sa folle gegevens? Us moderne begryp fan sampling makket Literêre Digest fan flaters dúdlik en helpt ús kommen meitsjen ek flaters yn de takomst.
Thinking dúdlik oer sampling freget ús om beskôgje fjouwer ferskillende groepen fan minsken (Figure 3.1). De earste groep fan minsken is de doelgroep befolking; dit is de groep dy't it ûndersyk definiearret as de befolking fan belang. Yn it gefal fan Literêre Digest de doelgroep befolking wie kiezers yn de 1936 presidintsferkiezings. Nei besluten op in doelgroep befolking, in ûndersiker neist moat it ûntwikkeljen fan in list fan minsken dy't brûkt wurde kin foar sampling. Dizze list wurdt neamd in sampling frame en de befolking op 'e sampling frame hjit it frame befolking. Yn it gefal fan Literêre Digest it frame befolking wie de 10 miljoen minsken waans nammen kamen predominately út telefoan triemtafels en auto registraasje records. It leafst de doelgroep befolking en it frame befolking soe krekt itselde, mar yn de praktyk is dit faak net it gefal. Ferskillen tusken de doelgroep befolking en frame befolking wurde neamd dekking flater. Dekking flater net, troch sels garandearje problemen. Mar, as de minsken yn it frame befolking binne systematysk oars as minsken net yn it frame befolking der sil wêze dekking bias. Dekking flater wie de earste fan 'e grutte gebreken mei it Literêr Digest poll. Se woe leare oer kiezers-dat wie harren doelgroep befolking-mar se oanlein in sampling frame predominately út telefoan triemtafels en auto registries, boarnen dy't oer-fertsjintwurdige rikere Amerikanen dy't mear kâns te stypjen Alf Landon (recall dat beide fan dy technologyen, dy't binne mienskiplike hjoed, wienen relatyf nij op 'e tiid en dat de Amerikaanske wie yn' e midden fan 'e Grutte Depresje).
Nei fêst it frame befolking, de folgjende stap is foar in ûndersiker te selektearjen it sample befolking; dat binne de minsken dy't de ûndersiker sil besykje te ynterviewe. As de stekproef hat ferskate skaaimerken as it frame befolking, dan kinne wy ynfiere sampling flater. Dit is de soarte fan flater kwantifisearre yn 'e marzje fan fersin dat meastentiids begeliedt skattings. Yn it gefal fan de Literêre Digest fiasko, der eins wie gjin sample; se besocht om kontakt elkenien yn it frame befolking. Ek al wie der gjin sampling flater, wie der fansels noch flater. Dat clarifies dat de marzjes fan flaters dy't typysk rapportearre mei skattings út ûndersiken binne meastentiids misleadingly lyts; se net binne alle boarnen fan flater.
Ta beslút, in ûndersiker probearret te ynterviewe elkenien yn de stekproef befolking. Dy minsken dy't suksesfol ynterviewd wurde neamd respondinten. It leafst, it sample befolking en de respondinten soe krekt itselde, mar yn de praktyk is der net-respons. Dat is, minsken dy't selektearre binne yn de stekproef wegerjen mei te dwaan. As de minsken dy't reagearje binne oars fan dyjingen dy't net reagearje, dan der kin net-respons bias. Non-antwurd bias wie de twadde wichtichste probleem mei it Literêr Digest poll. Mar 24% fan de minsken dy't in stimbriefke antwurde, en it die bliken dat minsken dy't stipe Landon wienen mear kâns om te reagearjen.
Beyond krekt as in foarbyld foar ynfiering fan de ideeën fan fertsjintwurdiging, de Literêre Digest poll is in faak-werhelle gelikenis, cautioning ûndersikers oer de gefaren fan haphazard sampling. Spitigernôch, ik tink dat de les dy't in protte minsken lûke út dit ferhaal is de ferkearde ien. De meast foarkommende moraal fan it ferhaal is dat ûndersikers kin net leare neat fan net-kâns gebrûk (dus, fan gebrûk sûnder strang kâns-basearre regels foar selektearjen dielnimmers). Mar, lykas ik sjen letter yn dit haadstik, dat is net hielendal rjocht. Ynstee, ik tink der echt twa moralen oan dit ferhaal; moraal dy't as echte hjoed de dei as hja wienen yn 1936. Earst, in grut bedrach fan haphazardly sammele gegevens sille net garandearje in goede skatting. Twadde, ûndersikers moatte Registrearje foar hoe't harren gegevens waard sammele as se binne meitsjen skattings út it. Yn oare wurden, om't de gegevens samling proses yn it Literêr Digest poll waard systematysk skeane nei guon respondinten, ûndersikers moatte brûke in mear komplekse ynskatting proses dat gewichten guon respondinten mear as oaren. Letter yn dit haadstik, ik lit jim ien sa'n weighting proseduere-post-stratification-dat kinne jo te meitsjen better rûzingen mei net-kâns gebrûk.