Predstavljanje je o tome da zaključke iz svojih ispitanika za ciljanu populaciju.
Da bismo razumjeli vrstu pogrešaka koje se mogu dogoditi kada zaključujemo od ispitanika prema većem broju stanovnika, razmotrimo ispitivanje slamčica " Literary Digest" koje je pokušalo predvidjeti ishod predsjedničkih izbora u SAD-u 1936. godine. Iako se to dogodilo prije više od 75 godina, ovaj debakl još uvijek ima važnu lekciju kako bi danas podučavao istraživače.
Literarni Digest bio je popularni časopis općeg interesa, a od 1920. počeo je voditi ankete kako bi predvidjeli ishode predsjedničkih izbora. Da bi napravili ta predviđanja, oni bi poslali glasačke listiće puno ljudi, a zatim jednostavno skupili glasačke listiće koji su vraćeni; Književni Digest ponosom izvijestio da su glasački listići su primili bile ni „weighted, prilagođen niti interpretirane.” Ovaj postupak točno predvidio pobjednike izbora 1920., 1924., 1928. i 1932. Godine 1936., u jeku Velike depresije, Književni Digest je uputio glasačke listiće na 10 milijuna ljudi, čiji su nazivi uglavnom bili iz telefonskih imenika i evidencija registracije automobila. Evo kako su opisali svoju metodologiju:
"DIGEST-ov glatki stroj se kreće brzinom preciznosti tridesetogodišnjeg iskustva kako bi se smanjila nagađanja na teške činjenice ... Ovaj tjedan 500 pisama izgubilo je više od četvrt milijuna adresa dnevno. Svakodnevno, u velikoj sobi visokoj iznad četvrte Avencije s motornim vrpcama, u New Yorku, 400 radnika savjesno gurnulo milijun komada tiskanice - dovoljno da se poploši četrdesetak gradskih blokova - u adresirane obloge [sic]. Svaki sat, u vlastitoj podstanici poštanskih ureda DIGEST-a, tri bijesna automatska mjerna stroja zapečatili su i zapečatio bijele oblonge; obučeni zaposleni u poštanskim poslovima pretvorili su ih u sablasne poštanske sandučiće; flote DIGEST kamioni su ih potjerali da izraze vlakove za poštu. , , Sljedeći tjedan prvi će odgovori od tih deset milijuna započinjati dolaznu plimu označenih glasačkih listića, koji će biti trostruko provjereni, provjereni, peterostruki unakrsni i ukupni. Kada se zadnja slika ukaže i provjerava, ako je iskustvo prošlo kriterij, zemlja će znati unutar djelića od 1 posto stvarnog popularnog glasovanja od četrdeset milijuna [birača]. "(22. kolovoza 1936.)
Fetiširanje veličine Literary Digest odmah je prepoznatljiv bilo kojem istraživačima "velikih podataka". Od 10 milijuna glasačkih listića, iznenađujuće 2,4 milijuna je vraćeno - to je otprilike 1000 puta veće od suvremenih političkih anketa. Od tih 2,4 milijuna ispitanika, presuda je bila jasna: Alf Landon je bio idući u poraziti sadašnje Franklin Roosevelt. Ali, zapravo, Roosevelt je porazio Landona u klizi. Kako bi Književni Digest mogao pogriješiti s toliko mnogo podataka? Naše suvremeno razumijevanje uzorkovanja čini pogreške u književnom Digestu i pomaže nam da izbjegnemo slične pogreške u budućnosti.
Jasno razmišljanje o uzorkovanju zahtijeva da razmotrimo četiri različite skupine ljudi (slika 3.2). Prva skupina je ciljana populacija ; to je skupina koju istraživač definira kao stanovništvo od interesa. U slučaju Literary Digest , ciljna populacija bila je biračica na predsjedničkim izborima 1936. godine.
Nakon odlučivanja o ciljanoj populaciji, istraživač treba razviti popis ljudi koji se mogu koristiti za uzorkovanje. Ovaj se popis naziva okvir za uzorkovanje i ljudi na njemu nazivaju se populacija okvira . Idealno, ciljana populacija i populacija okvira bili bi jednaki, ali u praksi to često nije slučaj. Na primjer, u slučaju Literary Digest , populacija okvira bila je 10 milijuna ljudi čija su imena došla uglavnom iz telefonskih imenika i evidencija registracije automobila. Razlike između ciljane populacije i populacije okvira nazivaju se pogreške pokrivanja . Pogreška pokrivenosti sama po sebi ne jamči probleme. Međutim, to može dovesti do poremećaja pokrivanja ako se ljudi u populaciji okvira sustavno razlikuju od ljudi u ciljnoj populaciji koji nisu u populaciji okvira. To je, zapravo, upravo ono što se dogodilo u anketi Književna analiza . Ljudi u njihovom populacijskom okviru imali su veću vjerojatnost za podršku Alf Landon, dijelom zbog toga što su bili bogatiji (podsjetimo da su oba telefona i automobili relativno novi i skupi 1936.). Dakle, u ispitivanju Literary Digest , pokrivenost pogreške dovela je do poremećaja pokrivanja.
Nakon definiranja populacije okvira , sljedeći korak je da istraživač odabere uzorak populacije ; to su ljudi koje će istraživač pokušati razgovarati. Ako uzorak ima različite karakteristike od populacije okvira, tada uzorkovanje može uvesti pogrešku uzorkovanja . U slučaju književnog probijanja fiasco, međutim, zapravo nije bilo uzorkovanja - časopis da bi se kontaktirao svatko u populaciji okvira - pa stoga nije bilo pogrešaka u uzorkovanju. Mnogi su se istraživači usredotočili na pogrešku uzorkovanja - to je obično jedina vrsta pogreške zahvaćena granicom pogreške koja je zabilježena u anketama - ali književni Digest fiasco nas podsjeća da moramo uzeti u obzir sve izvore pogrešaka, kako slučajnih tako i sustavnih.
Konačno, nakon odabira populacije uzoraka, istraživač pokušava intervjuirati sve svoje članove. Oni koji se uspješno intervjuiraju zovu se ispitanici . U idealnom slučaju, populacija uzorka i ispitanici bili bi jednaki, ali u praksi nema odgovora. To jest, ljudi koji su odabrani u uzorku ponekad ne sudjeluju. Ako ljudi koji reagiraju razlikuju se od onih koji ne reagiraju, može doći do neodržavanja pristranosti . Neizvjesnost pristranosti bila je drugi glavni problem s ispitivanjem Literary Digest . Samo 24% ispitanika odgovorilo je, a ispostavilo se da su ljudi koji su podržali Landon imali veću vjerojatnost da će odgovoriti.
Osim što je primjer predstavljanja ideja o zastupljenosti, anketa Književna analiza često je ponovljena parabola, upozoravajući istraživače o opasnostima slučajnog uzorkovanja. Nažalost, mislim da je lekcija koju mnogi ljudi izvuče iz ove priče pogrešna. Najčešći je moral priče da istraživači ne mogu ništa naučiti iz uzoraka ne-vjerojatnosti (tj. Uzoraka bez stroga pravila temeljenog na vjerojatnosti za odabir sudionika). Ali, kao što ću kasnije pokazati u ovom poglavlju, to baš i nije u redu. Umjesto toga, mislim da za ovu priču zapravo postoje dva morala; morala koji su danas jednaki kao što su bili 1936. godine. Prvo, velika količina slučajno prikupljenih podataka neće jamčiti dobru procjenu. Općenito, velik broj ispitanika smanjuje varijancu procjena, ali ne nužno smanjuje pristranost. S puno podataka, istraživači ponekad mogu dobiti preciznu procjenu pogrešne stvari; oni mogu biti upravo netočni (McFarland and McFarland 2015) . Druga glavna lekcija iz knjige Literary Digest fiasco je da istraživači moraju uzeti u obzir kako je njihov uzorak sakupljen prilikom procjene. Drugim riječima, budući da je proces uzorkovanja u anketi Literary Digest bio sustavno nagnut prema nekim ispitanicima, istraživači su trebali koristiti složeniju procjenu koja je nekolicinu ispitanika ponderirala više od drugih. Kasnije u ovom poglavlju prikazat ću vam jedan takav postupak ponderacije - post-stratifikacija - koji vam može omogućiti bolje procjene iz slučajnih uzoraka.