Esindus on umbes tegemise järeldusi oma vastajad oma sihtrühmale.
Selleks, et mõista, millised vead võivad tekkida vastanutest suurema rahvahulga leidmisel, vaatleme Literary Digest'i õlgkülastust, mis püüdis ennustada 1936. aasta USA presidendivalimiste tulemusi. Kuigi see juhtus rohkem kui 75 aastat tagasi, on sellel häbimärgil endiselt oluline õppetöö teadlaste täna õpetamiseks.
Kirjanduslik digest oli populaarne üldist huvi pakkuv ajakiri ning alates 1920. aastast hakkasid presidendivalimiste tulemuste ennustamiseks esikohal küsitlusi tegema. Nende prognooside tegemiseks saadavad nad hääletusvoorud paljudele inimestele ja lihtsalt tagastavad hääletussedelid; Kirjanduslik seade teatas uhkelt, et nende vastuvõetud hääletussedelid ei olnud "kaalutud, kohandatud ega tõlgendatud". See protseduur ennustas valimisi võitjaid 1920., 1924., 1928. ja 1932. aastal. 1936. aastal toimus Suur Depressiooni ajal kirjandus Digest saatis välja hääletussedelid 10 miljonile inimesele, kelle nimed pärinevad valdavalt telefonikataloogidest ja autode registreerimisest. Järgnevalt kirjeldame, kuidas nad kirjeldasid oma metoodikat:
"DIGESTi sileda töötav masin liigub kiirelt täpselt kolmekümne aastase kogemusega, et vähendada ettearvamisi raskete faktidega ... Selle nädala jooksul kanti 500 kirjaga rohkem kui veerand miljonit aadressi päevas. Igal päeval langeb New Yorgis nelja avenüüga mööbliriistu kõrgel asuvas toas 400 inimest libiseda viies miljoneid trükiseid, millest piisab neljakümne linnaploki ehitamiseks adressaatidesse ümbrikesse [sic]. Igal tunnil suleti DIGESTi postkontori alajaamas valge põllega pitseeritud ja tembeldatud kolm postitussalvestusmasinat; kvalifitseeritud postiteenistuse töötajad lükkasid need väljakukkumisteks; Laevastiku DIGEST veoautod sundisid neid väljastama rongipileteid. . . Järgmisel nädalal algavad esimesed vastused kümnest miljonist märgitud hääletussedelitest, kolm korda kontrollitud, kontrollitud, viiekordselt ristklassifitseeritud ja kokku pandud. Kui viimast numbrit on kogutud ja kontrollitud, kui varasem kogemus on kriteerium, saab riik teada, et see on 1 protsendi ulatuses tegelik neljakümne miljoni [valija] populaarne hääletus "(22. august 1936)
Kirjanduse Digest'i suuruse fetishization on koheselt äratuntav tänapäeval mis tahes "suurte andmete" uurijale. 10 miljonist hääletusvoorust tagastati hämmastav 2,4 miljonit tagasi - see on ligikaudu 1000 korda suurem kui tänapäeva poliitilised küsitlused. Neist 2,4 miljonist vastanutest oli kohtuotsus selge: Alf Landon läks võõrustajaks Franklin Roosevelt. Aga tegelikult Roosevelt võitis Landon maalihe. Kuidas võiks kirjandusülevaat mööda minna nii palju andmeid? Meie kaasaegne arusaam proovivõttest muudab Literary Digest'i vead selged ja aitab meil vältida sarnaste vigade tekkimist tulevikus.
Valides proovide võtmist selgelt mõeldes, tuleb meil kaaluda nelja erinevat inimeste rühma (joonis 3.2). Esimene rühm on sihtrühm ; see on rühm, mida teadustöötaja määratleb kui huvipakkuvat elanikkonda. Literary Digest'i puhul oli 1936. aasta presidendivalimistel valijaks sihtrühm.
Pärast sihtrühmas oleva otsuse tegemist peab teadlane välja töötama inimeste nimekirja, mida saab proovide võtmiseks kasutada. Seda loendit nimetatakse valimiraamiks ja selle kohta olevaid inimesi nimetatakse raamistiku hulka . Ideaalis oleks sihtpopulatsioon ja raamistiku populatsioon täpselt sama, kuid tegelikkuses seda sageli ei juhtu. Näiteks Literary Digest'i puhul oli raamistik populatsiooniks 10 miljonit inimest, kelle nimed pärinevad valdavalt telefonikataloogidest ja autode registreerimisest. Sihtpopulatsiooni ja raamipopulatsiooni erinevused on katvusvead . Katvuse viga ei taga iseenesest probleeme. Siiski võib see põhjustada katvuse kõrvalekaldeid, kui inimesed, kes on raamistiku populatsioonis, süstemaatiliselt erinevad sihtrühma kuuluvatest inimestest, kes ei kuulu raamistiku hulka. Tegelikult on see täpselt see, mis juhtus kirjanduslikus kokkuvõttes . Alf Landon toetas neid, kes olid nende raamistikus, osaliselt seetõttu, et nad olid jõukamad (meenutagem, et 1936. aastal olid nii telefonid kui ka autod suhteliselt uued ja kallid). Niisiis, Kirjanduse Digest'i küsitluses, katvusviga viinud katvuse ebaühtlaseks.
Pärast määratledes raami elanikkonnast, on järgmiseks sammuks teadlase Valimi elanikkonnast; need on inimesed, keda uurija üritab intervjuu teha. Kui proovil on erinevad karakteristikud kui raami populatsioon, võib proovide võtmine võtta proovivõtuvea . Kuid Kirjanduslik Digest fiasko puhul ei olnud tegelikult proovide võtmine - ajakiri, mis oleks võinud kokku puutuda kõigi raamistiku populatsioonidega ja seetõttu polnud valikuvea. Paljud uurijad kipuvad keskenduma valimiviga - see on tavaliselt ainus veateade, mida on kogutud vaatluste käigus ilmnenud vigade piirides, kuid kirjanduslik digesti fiasko meenutab meile, et peame kaaluma kõiki juhuslikke ja süstemaatilisi vigu.
Lõpuks üritab teadlane pärast proovi populatsiooni valimist küsitleda kõiki oma liikmeid. Neid inimesi, kes on edukalt intervjueeritud, nimetatakse vastajateks . Ideaalis oleksid valimisse kuulunud inimesed ja vastajad täpselt samad, kuid tegelikkuses on vastamata vastus. See tähendab, et valimisse valitud inimesed mõnikord ei osale. Kui reageerivad inimesed erinevad sellest, kes ei reageeri, siis võib olla vastamatajätmine . Mittekohustuslik kõrvalekalle oli Literary Digest'i küsitluse teine peamine probleem. Vastanud vastasid vaid 24% hääleõigust saanud inimestest, ja selgus, et Landonit toetavad inimesed reageerisid tõenäolisemalt.
Edaspidi, kui esindus ideede tutvustamiseks on näide, on kirjandusteooria küsitlus korduvalt korduv tähendus, mis paneb teadlased juhusliku proovide võtmise ohtu. Kahjuks arvan, et õppetund, mida paljud inimesed sellest lugu juurutavad, on vale. Kõige tavalisemateks moraaliks on see, et teadlased ei saa midagi õppida mittetundlikest proovidest (st proovid, mille puhul osalejad ei vali tõenäoliselt põhinevaid reegleid). Aga nagu ma seda peatükis hiljem näitan, pole see päris õige. Selle asemel arvan, et sellele lolle on tõesti kaks moraali; mis on tänapäeval tõsi, nagu nad olid 1936. aastal. Esiteks ei taga suur hulk kogemata kogutud andmeid hea hinnangu. Üldiselt vähendab arvukate vastajate hulk hinnangute erinevust, kuid see ei vähenda tingimata eelarvamusi. Paljude andmetega saavad teadlased mõnikord vale asja täpselt hinnata; need võivad olla täpselt ebatäpsed (McFarland and McFarland 2015) . Teine peamine õppetund Literary Digest'i fiaskoost on see, et teadlased peavad arvestama, kuidas nende proovi kogutakse hinnangute tegemisel. Teisisõnu, kuna mõne küsitluse puhul oli süstemaatiliselt mõne vastaja seas valimisprotsess Literary Digest'i küsitlustes, oli teadlastel vaja kasutada keerukamat hindamisprotsessi, mis kaalus mõne vastaja rohkem kui teised. Selles peatükis hiljem näitan teile ühte sellist kaaluprotsenti - pärast stratifitseerimist - see võimaldab teil parematest hinnangutest juhuslikest proovidest teha.