Përfaqësimi është bërë për konkluzione nga të anketuarit tuaj të popullsisë tuaj të synuar.
Në mënyrë që të kuptojmë llojet e gabimeve që mund të ndodhin kur nxirren përfundimisht nga të anketuarit në popullatën më të madhe, le të shqyrtojmë sondazhin e kashtës së Letrës së Digestit që u përpoq të parashikonte rezultatin e zgjedhjeve presidenciale të 1936 në SHBA. Megjithëse ndodhi më shumë se 75 vjet më parë, kjo debacle ende ka një mësim të rëndësishëm për të mësuar kërkuesit sot.
Literary Digest ishte një revistë popullore e interesit të përgjithshëm, dhe duke filluar nga viti 1920 filluan të zhvillojnë sondazhe të kashtëve për të parashikuar rezultatet e zgjedhjeve presidenciale. Për të bërë këto parashikime, ata do të dërgonin fletëvotime në shumë njerëz dhe pastaj thjesht do të mbledhin fletëvotimet që janë kthyer; Literary Digest krenari raportuar se fletët e votimit kanë marrë ishin as "ponderuar, e rregulluar, as interpretuar." Kjo procedurë saktë parashikoi fituesit e zgjedhjeve në vitin 1920, 1924, 1928 dhe 1932. Në vitin 1936, në mes të Depresionit të Madh, letrare Digest dërgoi fletë votimi për 10 milionë njerëz, emrat e të cilëve erdhën kryesisht nga drejtoritë telefonike dhe regjistrimet e automobilave. Ja se si e përshkruan metodologjinë e tyre:
"Makina e rregullt e DIGEST-it lëviz me saktësi të shpejtë të përvojës tridhjetëvjeçare për të zvogëluar supozimet në fakte të vështira ... Këtë javë 500 germa të gërvishtura më shumë se një e katërta e milion adresave në ditë. Çdo ditë, në një sallë të madhe të lartë mbi motor-ribboned Avenue e Katërt, në Nju Jork, 400 punëtorë deftly rrëshqitje një milion copa çështje të shtypura - të mjaftueshme për të hapur katërmbëdhjetë blloqe të qytetit - në envelops drejtuar. Çdo orë, në zyrën postare të zyrës së postës së DIGEST-it, tre makina matëse të gazetave të pllakëzuara vulosën dhe vulosën bobinët; punonjësit e kualifikuar të postës i kthyen ato në paketime të medha; kamionët DIGEST të flotës i shtynë ata për të shprehur trenat e postës. . . Javën e ardhshme, përgjigjet e para nga këto dhjetë milionë do të fillojnë valën hyrëse të fletëvotimeve të shënuara, që do të kontrollohen tre herë, do të verifikohen, pesë herë klasifikohen dhe do të arrijnë në total. Kur shifra e fundit është bërë dhe kontrolluar, nëse përvoja e kaluar është një kriter, vendi do të dijë brenda një fraksioni prej 1 për qind votën aktuale popullore prej dyzet milionë [votuesve]. "(22 gusht 1936)
Fetishizimi i shkrimit letrar të madhësisë është i njohur menjëherë në çdo hulumtues të "të dhënave të mëdha" sot. Nga 10 milion fletëvotimet e shpërndara, u kthyen një mahnitës 2.4 milion - kjo është rreth 1,000 herë më e madhe se sondazhet politike moderne. Nga këto 2.4 milion të anketuar, vendimi ishte i qartë: Alf Landon do të mposhtte Franklin Roosevelt në detyrë. Por, në fakt, Roosevelt mundi Landon në një rrëshqitje të tokës. Si mund të Shkatërrohet Letërsia me të dhëna aq shumë? Mirëkuptimi ynë modern i marrjes së mostrave i bën gabimet e Letërsisë Digest qartë dhe na ndihmon të shmangim gabime të ngjashme në të ardhmen.
Të menduarit qartë rreth marrjes së mostrave kërkon që ne të marrim parasysh katër grupe të ndryshme të njerëzve (figura 3.2). Grupi i parë është popullata e synuar ; ky është grupi që hulumtuesi e përkufizon si popullsi me interes. Në rastin e Digest Literary , popullsia e synuar ishte votuesit në zgjedhjet presidenciale të vitit 1936.
Pas vendosjes për një popullatë të synuar, një studiues duhet të zhvillojë një listë të njerëzve që mund të përdoren për marrjen e mostrave. Kjo listë quhet kornizë e marrjes së mostrave dhe njerëzit në të quhen popullata kornizë . Në mënyrë ideale, popullata e synuar dhe popullata e kornizës do të jenë saktësisht të njëjta, por në praktikë shpesh kjo nuk ndodh. Për shembull, në rastin e Digest Literary , popullsia e kornizës ishte 10 milionë njerëz, emrat e të cilëve erdhën kryesisht nga drejtoritë telefonike dhe regjistrimet e automobilave. Dallimet ndërmjet popullatës së synuar dhe popullatës së kornizës quhen gabime të mbulimit . Gabimi i mbulimit, në vetvete, nuk garanton probleme. Sidoqoftë, kjo mund të çojë në paragjykimin e mbulimit në qoftë se njerëzit në kuadër të popullsisë janë sistematikisht të ndryshëm nga njerëzit në popullatën e synuar që nuk janë në kuadër të popullsisë. Kjo është, në të vërtetë, pikërisht ajo që ndodhi në sondazhin Letërsi Digest . Njerëzit në popullsinë e tyre kanë tendencë të kenë më shumë gjasa të mbështesin Alf Landonin, pjesërisht për shkak se ata ishin më të pasur (kujtoni që të dy telefonat dhe makinat ishin relativisht të reja dhe të shtrenjta në vitin 1936). Pra, në sondazhin e literaturës digest , gabimi i mbulimit çoi në paragjykimin e mbulimit.
Pas përcaktimit të popullatës së kornizës , hapi tjetër është që një studiues të zgjedhë popullatën e mostrës ; këta janë njerëzit që kërkuesi do të përpiqet të intervistojë. Nëse mostra ka karakteristika të ndryshme nga popullata e kornizës, atëherë marrja e mostrave mund të sjellë gabim në marrjen e mostrave . Sidoqoftë, në rastin e fiasko-s të Digestit Letrar , në të vërtetë nuk ekzistonte asnjë mostër - revista për të kontaktuar të gjithë në popullsinë e kornizës - prandaj nuk kishte gabim në mostër. Shumë studiues tentojnë të përqëndrohen në gabimin e mostrave - kjo është zakonisht e vetmja lloj gabimi i kapur nga margjina e gabimit të raportuar në sondazhet - por fiasco i Letërsisë Digest na kujton se ne duhet të marrim në konsideratë të gjitha burimet e gabimeve, të rastësishme dhe sistematike.
Së fundi, pas zgjedhjes së një popullsie të mostrës, një studiues përpiqet të intervistojë të gjithë anëtarët e tij. Ata njerëz që janë intervistuar me sukses quhen të anketuar . Në mënyrë ideale, popullsia e mostrës dhe të anketuarit do të ishin saktësisht të njëjta, por në praktikë nuk ka përgjigje. Kjo është, njerëzit që janë përzgjedhur në mostër ndonjëherë nuk marrin pjesë. Nëse njerëzit që përgjigjen janë të ndryshëm nga ata që nuk përgjigjen, atëherë mund të ketë paragjykime ndaj mosrespektimit . Paragjykimi i parrezikshëm ishte problemi i dytë kryesor me sondazhin e Letërsisë Digest . Vetëm 24% e njerëzve që morën një fletë votimi u përgjigjën dhe doli se njerëzit që mbështetën Landonin kishin më shumë gjasa të përgjigjen.
Përtej vetëm duke qenë një shembull për të prezantuar idetë e përfaqësimit, sondazhi Letërsi Digest është një shëmbëlltyrë shumë e përsëritur, duke paralajmëruar studiuesit për rreziqet e marrjes së mostrave të rastësishme. Për fat të keq, mendoj se mësimi që shumë njerëz nxjerrin nga kjo histori është e gabuar. Morali më i zakonshëm i tregimit është se studiuesit nuk mund të mësojnë asgjë nga mostrat e jo-probabilitetit (p.sh., mostrat pa rregulla të rrepta për probabilitetin për përzgjedhjen e pjesëmarrësve). Por, siç do të tregoj më vonë në këtë kapitull, kjo nuk është fare e drejtë. Në vend të kësaj, unë mendoj se ka vërtet dy morale për këtë histori; morale që janë po aq të vërteta sa ishin në vitin 1936. Së pari, një sasi e madhe e të dhënave të grumbulluara në mënyrë rastësore nuk do të garantojë një vlerësim të mirë. Në përgjithësi, duke pasur një numër të madh të të anketuarve zvogëlon variancën e vlerësimeve, por jo domosdoshmërisht zvogëlon paragjykimin. Me shumë të dhëna, studiuesit ndonjëherë mund të marrin një vlerësim të saktë të gjërave të gabuara; ato mund të jenë saktësisht të pasakta (McFarland and McFarland 2015) . Leksioni i dytë kryesor nga fiasko i Letërsisë Digest është se hulumtuesit duhet të japin llogari për mënyrën e mbledhjes së mostrës së tyre kur bëjnë vlerësime. Me fjalë të tjera, sepse procesi i marrjes së mostrave në anketën e literaturës digest ishte sistemuar në mënyrë sistematike ndaj disa të anketuarve, studiuesit duhet të përdorin një proces më të ndërlikuar vlerësimi që peshonte disa të anketuar më shumë se të tjerët. Më vonë në këtë kapitull, do t'ju tregoj një procedurë të tillë të peshimit - pas shtresëzimit - që mund t'ju lejojë të bëni vlerësime më të mira nga mostrat e rastësishme.