Përfaqësimi është bërë për konkluzione nga të anketuarit tuaj të popullsisë tuaj të synuar.
Për të kuptuar llojin e gabimeve që mund të ndodhë kur inferring nga të anketuarit për popullatën më të madhe, le të konsiderojmë zgjedhjet Literary Digest kashte që u përpoq për të parashikuar rezultatin e zgjedhjeve të 1936 US presidenciale. Edhe pse ajo ishte më shumë se 75 vjet më parë, kjo debakli ende ka një mësim të rëndësishëm për të mësuar studiuesit sot.
Letrare Digest ishte një revistë popullor përgjithshëm interes, dhe duke filluar në vitin 1920 ata filluan duke sondazhe kashte për të parashikuar rezultatet e zgjedhjeve presidenciale. Për të bërë këto parashikime se do të dërgojnë votat për shumë njerëz, dhe pastaj thjesht shënoj deri fletët e votimit që janë kthyer, Literary Digest krenari raportuar se votat që ka marrë ishin as "ponderuar, e rregulluar, e as interpretuar." Kjo procedurë saktë parashikoi fituesin e zgjedhjeve në 1920, 1924, 1928 dhe 1932. në vitin 1936, në mes të Depresionit të Madh, Literary Digest dërguar votat në 10 milionë njerëz, emrat e të cilëve kryesisht ka ardhur nga drejtoritë e telefonit dhe të dhënat e regjistrimit të automobilave. Ja se si ata e përshkruan metodologjinë e tyre:
"Lëvizje e qetë, duke i revistës së makinës me saktësi shpejtë të përvojës tridhjetë vjet për të reduktuar supozim për fakte të forta. . . .Kjo Javë 500 stilolapsa gërvishtem më shumë se një e katërta e një milion adresave në ditë. Çdo ditë, në një dhomë të madhe të lartë mbi motor-me shirita katërt Avenue, në New York, 400 punëtorë të deftly rrëshqitje një milion copa të shtypura që, sa të hapë dyzet e qytetit blloqe-në e mbulon trajtuara [sic]. Çdo orë, në vetë të tretet'S Post Office Nënstacioni, tre chattering makina postare matëse mbyllur dhe të vulosur e oblongs bardhë; punonjës të kualifikuar postare kthyer ato në fryrë mailsacks; kamionë Flota tretet ankorua ata të shprehin email-trena. . . Javën e ardhshme, përgjigjet e para nga këto dhjetë milionë do të fillojnë valën hyrje e fletëve të votimit të shënuara, të trefishtë-kontrolluar, verifikuar, pesë-herë ndër-klasifikuar dhe arritën. Kur shifra e fundit është totted dhe kontrollohet, nëse eksperienca e kaluar është një kriter, vendi do të dinë për të brenda një pjesë prej 1 për qind të votave aktuale popullarizuara dyzet milionë [votuesit]. "(22 gusht 1936)
fetishization të madhësisë së Digest është menjëherë të njohur për çdo studiues "të dhënave i madh" sot. Prej 10 milion fletëvotime të shpërndara, një amazing 2.4 milion fletëvotime janë kthyer, kjo është afërsisht 1,000 herë më të mëdha se sondazhet moderne politike. Nga këto 2.4 milionë anketuarve vendimi ishte i qartë: Literary Digest parashikoi se sfiduesi Alf Landon ishte duke shkuar për të mposhtur detyrë Franklin Roosevelt. Por, në fakt, e kundërta e saktë ka ndodhur. Roosevelt mundi Landon në një lumë votash. Si mund Literary Digest shkojnë keq me të dhëna aq shumë? Kuptimi ynë modern i mostrave bën gabime letrare Digest e qartë dhe të na ndihmon të mos bërë gabime të ngjashme në të ardhmen.
Duke menduar në mënyrë të qartë në lidhje me marrjen e mostrave kërkon që ne të marrin në konsideratë katër grupe të ndryshme të njerëzve (Figura 3.1). Grupi i parë i njerëzve është popullata synuar; ky është grupi që hulumtimi përcakton si popullsi e interesit. Në rastin e letrare Digest popullsia objektivi ishte votues në 1936 zgjedhjet Presidenciale. Pas vendosjes në një popullsi të synuar, një studiues tjetër ka nevojë për të zhvilluar një listë të njerëzve që mund të përdoren për marrjen e mostrave. Kjo listë është quajtur një Korniza e mostrës dhe popullsia në kornizën e mostrës është quajtur popullsia frame. Në rastin e letrare Digest popullsia frame ishte 10 milion njerëz emrat e të cilëve erdhën kryesisht nga drejtoritë e telefonit dhe të dhënat e regjistrimit të automobilave. Idealisht popullsia synuar dhe popullata kornizë do të jetë saktësisht e njëjtë, por në praktikë kjo shpesh nuk është rasti. Dallimet në mes të popullsisë së synuar dhe popullatës kornizë quhen gabim mbulimit. Gabim Mbulimi nuk, në vetvete të garantojë probleme. Por, në qoftë se njerëzit në popullatën kuadër janë sistematikisht të ndryshme nga njerëzit jo në popullsinë kornizë nuk do të jetë mbulimi paragjykim. Gabim mbulimi ishte i pari nga të metat më të mëdha me zgjedhjet e Literary Digest. Ata donin për të mësuar në lidhje me votuesit-se ishte objektivi i popullsisë, por ata ndërtuan një kornizë marrjen e mostrave kryesisht nga regjistrat telefonik dhe regjistrat automobilave, burimet që të mbi-përfaqësuar pasura tyre amerikanëve, të cilët ishin më të prirur të mbështesin Alf Landon (kujtojnë se të dyja këto teknologji, të cilat janë të zakonshme sot, kanë qenë relativisht i ri në atë kohë dhe se SHBA ishte në mes të Depresionit të Madh).
Pas përcaktimit popullsinë kornizë, hapi tjetër është për një studiues për të zgjedhur e popullatës mostër; këta janë njerëzit që studiuesi do të bëjnë të pamundurën për të intervistuar. Nëse mostra ka karakteristika të ndryshme nga popullata kornizë, atëherë ne mund të futur gabim mostrave. Ky është lloji i gabimit kuantifikohet në margjina e gabimit që zakonisht shoqëron vlerësimet. Në rastin e fiasko Literary Digest, ka në të vërtetë kishte asnjë mostër; ata u përpoqën për të kontaktuar të gjithë në popullsinë kornizë. Edhe pse nuk ka pasur gabimi, nuk ishte e qartë ende gabim. Kjo sqaron se kufijtë e gabimeve që janë raportuar në mënyrë tipike me vlerësimet nga anketat janë zakonisht gabimisht të vogla; ato nuk përfshijnë të gjitha burimet e gabimit.
Së fundi, një studiues përpiqet të intervistojë të gjithë në popullsinë e mostrës. Ata njerëz që janë intervistuar me sukses janë quajtur të anketuar. Në mënyrë ideale, popullsia mostër dhe të anketuarit do të jetë saktësisht e njëjtë, por në praktikë nuk është jo-përgjigje. Kjo është, njerëz të cilët janë zgjedhur në mostër refuzojnë të marrin pjesë. Në qoftë se njerëzit që përgjigjen janë të ndryshëm nga ata që nuk i përgjigjen, atëherë nuk mund të jetë jo-përgjigje paragjykim. Non-përgjigje paragjykim ishte problemi i dytë kryesor me zgjedhjet e Literary Digest. Vetëm 24% e njerëzve të cilët kanë marrë një fletë votimi u përgjigj, dhe doli se njerëzit që mbështetur Landon kishin më shumë gjasa për t'u përgjigjur.
Përtej vetëm duke qenë një shembull për të futur idetë e përfaqësimit, sondazhi Literary Digest është një shëmbëlltyrë shpesh-përsëritur, duke paralajmëruar studiuesit në lidhje me rreziqet e marrjes së mostrave kuturu. Për fat të keq, unë mendoj se mësimi që shumë njerëz të nxjerrë nga kjo histori është një gabim. Morali më i zakonshëm i tregimit është se studiuesit nuk mund të mësojnë asgjë nga mostrat jo-probabilitetit (dmth, mostrat pa rregulla strikte probabilitetit me bazë për zgjedhjen e pjesëmarrësve). Por, siç do të tregoj më vonë në këtë kapitull, kjo nuk është mjaft e drejtë. Në vend të kësaj, unë mendoj se ka me të vërtetë dy moralit në këtë histori; moralit që janë si të vërtetë sot sa ishin në vitin 1936. Së pari, një sasi të madhe të të dhënave të mbledhura rastisur nuk do të garantojë një vlerësim të mirë. Së dyti, studiuesit duhet të japin llogari për mënyrën se si të dhënat e tyre janë grumbulluar, kur ata janë duke bërë vlerësime prej saj. Me fjalë të tjera, për shkak se procesi i mbledhjes së të dhënave në anketën e Literary Digest ishte anon në mënyrë sistematike në drejtim të disa të intervistuarve, hulumtuesit duhet të përdorni një proces më kompleks vlerësimi se pesha disa të anketuar më shumë se të tjerët. Më vonë në këtë kapitull, unë do t'ju tregoj një të tillë koeficient procedure-pas-shtresimit-që mund të ju mundësojë për të bërë vlerësime të mira me mostrat jo-probabilitetit.