Fertsjintwurdiging is it meitsjen inferences fan jo respondinten nei jo doelgroep befolking.
Om de aard fan 'e fouten te begripen dy't kin barre wannear't de respondinten nei de gruttere befolking befetsje, litte wy it Literêre Digest- stoomferhaal beskôgje dy't de útkomst útprate fan' e presidintsferkiezings fan 1936. Hoewol it barde mear as 75 jier lyn, dit debakel hat noch hieltyd in wichtich lessen om ûndersikers te learen.
Literêr Digest wie in populêr-algemien-belangblêd, en begjin 1920 begûn se mei straw pollen te begjinnen om de resultaten fan presidintsferkiezings te foarsizzen. Om dizze predikaasjes te meitsjen, stjoere se ballots nei in protte minsken en dan ferdwine gewoan de ballots dy't weromkamen; Literêre Digest proudly melden dat de stimbriefkes sy krigen wienen net "woegen, oanpast, noch ynterpretearre." Dizze proseduere goed foarsei de winners fan de ferkiezings yn 1920, 1924, 1928 en 1932. Yn 1936, yn 'e midden fan' e Grutte Depresje, Literêre Digest stjoerde stimulâns nei 10 miljoen minsken, wêrfan nammen benammen fan telefoannûmers en auto-registraasjekartnamen kamen. Hjir binne hoe't se harren metodyk beskreau:
"De glêzen rinnende masine fan 'e dikte bewegt mei de snelte prestaasje fan' e tritichjierrige ûnderfining om risseltaten te ferlytsjen nei hurde feiten ... Dizze wike hat 500 pens mear as in fjirde fan in miljoen adressen in dei skrassen. Eltse dei slagget 400 wurken yn in grutte keamer heech boppe de motorfearboaten fan Fourth Avenue, yn New York, mei in soad miljoenen stikken gedruckte saken - genôch om fjirtich stedsblokken te ferpleatsen - yn de adressearre hûzen [sic]. Eltse oere, yn 'e eigenste postoffersstasjon fan' e dichtste, trije rôpjende postoasjemasmaten wurde fersmiten en stekke de wite lengongen; Kwaliteitspost meiwurkers ferflokte har yn mûleklokken; Fleet DIGEST-kamillen spuite se om post-trainingen te ekspresje. . . De kommende wike wurde de earste antwurden fan dizze tsien miljoen begjinne mei de ynkommende tij fan markearre stimmingen, trije-kontrolearre, ferifisearre, fiif kear cross-classified en totaal. As de lêste figuer skreaun is en kontrolearret, as ferline dien is in kritearium, sil it lân binnen in fraksje fan 1 persint witte de aktuele populêre stimming fan fjirtich miljoen [kiezers]. "(22 augustus 1936)
Literatuer Digest's fetishisaasje fan 'e grutte is no fuortendaliks werkenber oan alle "grutte data" -ûndersiker hjoed. Fan 'e 10 miljoen stjoerden fertsjinnen, waarden in geweldige 2,4 miljoen weromjûn - dat is sawat 1000 kear grutter as moderne politike pollen. Fan dizze 2,4 miljoen respondinten wie it bewâld dúdlik: Alf Landon woe de tsjinoerstelde Franklin Roosevelt beslute. Mar feitlik roosevelt fersloech Landon yn in ierdbeving. Hoe kin literêre digest miskien mei safolle gegevens? Us moderne ynterpretaasje fan sampling makket literêre digest's miskien helder en lit ús foarkomme dat jo miskien feiligens yn 'e takomst meitsje.
Tinkendien dúdlik oer sampling fereasket ús om fjouwer ferskate groepen minsken te beskôgjen (sjoch 3.2). De earste groep is de doelgroep populaasje ; Dit is de groep dy't de ûndersiker definieart as de befolking fan belang. Yn it gefal fan Literêre Digest waard de doelgroep befolkingsgroepen yn 'e presidintsferkiezings fan 1936.
Nei it besluten op in doelgroepbefolking moat in ûndersiker in list fan minsken ûntwikkelje dy't brûkt wurde foar sampling. Dizze list wurdt as in sampling-ramt neamd en de minsken dêrfan wurde de kaderbefolking neamd. Ideaallik, de doelgroep en de ramtbefolking soe krekt itselde wêze, mar yn 'e praktyk is dit faak net it gefal. Bygelyks yn 't gefal fan Literary Digest , de ramtbefolking wie de 10 miljoen minsken, wêrfan nammen de nammen foarôfgeand binne fan telefoannûmers en autorideanmelden. De ferskillen tusken de doelgroepbefolking en de kaderbefolking wurde beskôgingsfout neamd. De fersnellingsflater docht, foar himsels, problemen garandearje. It kin lykwols liede ta dekkingfoarsjenning as minsken yn 'e kaderbefolking systematysk ferskille fan minsken yn' e doelbefolking dy't net yn 'e ramtbefolking binne. Dit is feitlik krekt wat barde yn 'e Literêre Digest- fraksje. De minsken yn har kaderbefolking soene mear wierskynlik wêze om Alf Landon te stypjen, foar in part omdat se rykere wurde (tink dat beide tillefoans en automobilen yn 1936 relatyf nije en djoer waarden). Dus, yn 'e Literêre Digest- fraksje, fersnellingsflater liede ta dekking.
Nei it definiearjen fan de ramtbefolking is de folgjende stap foar in ûndersiker om de probleembefolking te selektearjen; Dit binne de minsken dy't de ûndersiker besykje besykje te freegjen. As it probleem ferskillende skaaimerken hat as de ramtbefolking, dan kin sampling problemen-flater ynfiere. Yn 't gefal fan it Literary Digest fiasco, lykwols, wie eins eins gjin sampling - it tydskrift om elkenien yn' e kaderbefolking te kontaktearjen en dêrom wie der gjin problemen foar problemen. In soad ûndersikers tenderen op it probearjen fan problemen op te rjochtsjen - dit is meastentiids de iennichste gefoel fan 'e flater dy't troch de markearring fan' e flater bewarre is yn oersjoggen - mar it Literary Digest fiasco rapportearret ús dat wy alle boarnen fan flater, sawol as willekeurich en systematysk, besjogge.
Uteinlik, nei it selektearjen fan in probleembefolking, besiket in ûndersiker om alle leden te freegjen. Dy minsken dy't mei sukses befetsje binne wurde respondinten neamd. Ideaallik, de problemenbefolking en de respondinten soe krekt itselde wêze, mar yn 'e praktyk is der net-resinsje. Dat is, minsken dy't selektearre binne yn 'e probleem somtiden net meidwaan. As de minsken dy't antwurdzje binne oars dan fan 'e minsken dy't net antwurdzje, dan kin der net- resinsje wêze. Nonresponse foaroardielen wie it twadde haadprobleem mei de Literêre Digest- fraksje. Allinich 24% fan 'e minsken dy't in útstel ûntfangen, antwurden, dat minsken dy't Landon stipe wienen earder leaver te reagearjen.
Boppedat krekt in foarbyld om de ideeën fan fertsjintwurdiging te fieren, is de Literêre Digest- fraksje in oft-werhelle gelikenis, warskôge ûndersikers oer de gefaaringen fan 'e hapazard-sampling. Spitigernôch tink ik dat de leske dat in soad minsken fan dit ferhaal tekene binne de ferkearde. De meast foarkommende morele fan it ferhaal is dat ûndersikers net litte kinne fan problemen net-probabiliteit (dus, problemen sûnder strikte problemen basearre regels foar it selektearjen fan dielnimmers). Mar, as ik letter yn dit haadstik sjen litte sil, is dat net hielendal rjocht. Yn 't lêst tink ik dat der echt twa moraal binne foar dit ferhaal; moralen dy't hjoed-de-dei wier binne sa't se yn 1936 wienen. Earst, in grut bedrach fan sammele gegevens sil gjin goede skatting garandearje. Yn 't algemien fermindere in grut oantal respondinten de ôfwikking fan skatten, mar it makket net de needsaak fan' e foardielen. Mei in protte gegevens kinne ûndersikers faaks in krekte skatting krije fan 'e ferkeard ding; Se kinne krekt ûnkrekt wêze (McFarland and McFarland 2015) . De twadde haadlange fan 'e Literêre Digest fiasco is dat ûndersikers moatte rekkenje moatte hoe't har prestaasje sammele is doe't se skatting meitsje. Mei oare wurden, om't it samplingsproses yn 'e Literêre Digest- pollen systematysk skeakele waard nei inkel respondinten, moasten ûndersikers in kompleetere skattingproses brûke dy't inkele respondinten mear as oaren gewicht wiene. Letter yn dit haadstik sil ik jo ien soart wissingproseduere-post-stratifikaasje sjen litte-dat kin jo meitsje om bettere skatten fan happeproblemen te meitsjen.