Atstovavimas yra apie priėmimo išvadas iš savo respondentų savo tikslinę gyventojų.
Norint suprasti klaidas, kurios gali atsirasti, kai respondentai atpažįsta didesnius gyventojus, pažiūrėkime į literatūros apžvalgos šiaudų apklausą, kuri bandė prognozuoti 1936 m. JAV prezidento rinkimų rezultatus. Nors tai įvyko daugiau nei prieš 75 metus, ši krizė dar turi svarbią pamoką šiandien mokslininkams mokyti.
"Literary Digest" buvo populiarus visuotinės svarbos žurnalas, o nuo 1920 m. Pradėjo veikti šiaudų apklausa, skirta numatyti prezidento rinkimų rezultatus. Norėdami atlikti šias prognozes, jie išsiųs biuletenius daugybei žmonių, o tada tiesiog suskaičiuosite biuletenius, kurie buvo grąžinti; "Literary Digest" išdidžiai pranešė, kad jų gauti balsai nebuvo nei "sveriami, nei pakoreguoti, nei suprasti". Ši procedūra tinkamai numatė rinkėjų nugalėtojai 1920, 1924, 1928 ir 1932 m. 1936 m. Didžiosios depresijos, literatūros "Digest" išsiuntė balsus 10 milijonams žmonių, kurių pavadinimai daugiausia buvo iš telefonų knygų ir automobilių registracijos įrašų. Štai kaip jie aprašė savo metodiką:
"Sklandžiai veikianti" DIGEST "mašina juda su greitu trisdešimties metų patirtimi, kad sumažintų spąstus sunkiais faktais ... Šią savaitę 500 nešvarumų sušvirkšti daugiau nei ketvirtadalio milijono adresų per dieną. Kiekvieną dieną didžiojoje patalpoje, aukštyje virš keturiosios abriaunos aušintuvo, Niujorke, 400 darbininkų pėdsakai nuslydo milijoną spausdintų daiktų, pakankamai išdėstytų keturiasdešimt miesto blokų, į adresuotus vokus [sic]. Kiekvieną valandą "The DIGEST" pašto skyriuje pastatytos trys bagažinės pašto dėžutės užantspaudavo ir užantspaudavo baltąsias įtvaras; kvalifikuojami pašto darbuotojai juos apversdavo į iškilusius laiškus; Laivyno DIGEST sunkvežimiai paskatino juos išreikšti pašto traukinius. . . Kitą savaitę pirmieji atsakymai iš šių dešimčių milijonų prasidės atvykstančiuose pažymėtuose biuleteniuose, bus trigubai patikrinti, patikrinti, penkis kartus suskirstyti į kategorijas ir surinkti. Kai paskutinysis skaičius buvo surinktas ir patikrintas, jei ankstesnė patirtis yra kriterijus, šalis žinotų, kad mažesnė nei 1 proc. Dalis iš tikrųjų balsuoja už keturiasdešimt milijonų rinkėjų "(1936 m. Rugpjūčio 22 d.).
Šiandien " Literature Digest" dydžio fetišizmas yra akivaizdžiai atpažįstamas bet kokiam "didžiųjų duomenų" mokslininkui. Iš 10 milijonų išleistų balsų buvo grąžintas nuostabus 2,4 milijono, ty maždaug 1000 kartų didesnis už šiuolaikines politines apklausas. Iš šių 2,4 mln. Respondentų nuosprendis buvo aiškus: Alfas Landonas ketino nugalėti dabartinį Frankliną Rooseveltą. Tačiau, tiesą sakant, Rooseveltas nugalėjo Landoną nuošliauže. Kaip literatūrinė santrauka gali būti klaidinga dėl tiek daug duomenų? Mūsų šiuolaikinis pavyzdžių supratimas daro aiškią " Literary Digest" klaidą ir padeda išvengti panašių klaidų ateityje.
Aiškiai galvodamas apie atranką, reikia atsižvelgti į keturias skirtingas žmonių grupes (3.2 pav.). Pirmoji grupė yra tikslinė populiacija ; tai grupė, kurią tyrėjas apibrėžia kaip interesų grupę. " Literary Digest" atveju 1936 m. Prezidento rinkimuose buvo skirta rinkėjų tikslinė populiacija.
Pasirenkant tikslinę grupę, mokslininkas turi parengti žmonių, kuriuos galima naudoti mėginių ėmimui, sąrašą. Šis sąrašas vadinamas atrankos rėmeliu, o jame esantys žmonės vadinami karkaso gyventojais . Idealiu atveju tikslinė populiacija ir rėmo populiacija būtų visiškai tokia pati, tačiau praktiškai tai dažnai nėra taip. Pavyzdžiui, " Literary Digest" atveju rėminė gyventojų dalis buvo 10 milijonų žmonių, kurių vardus daugiausia sudarė telefonų knygos ir automobilių registracijos įrašai. Skirtumai tarp tikslinės populiacijos ir rėminės populiacijos vadinami aprėpties klaida . Apimties klaida savaime nesuteikia problemų. Tačiau tai gali lemti aprėpties šališkumą, jei žmonės, esantys rėminėje populiacijoje, sistemingai skiriasi nuo tikslinės populiacijos žmonių, kurie nėra pagrindiniai gyventojai. Tiesą sakant, tai yra tai, kas nutiko apklausoje " Literatūrinis Digestas" . Žmonės savo rėmuose vis labiau linkę palaikyti Alfą Landoną iš dalies todėl, kad jie buvo turtingesni (prisiminti, kad 1936 m. Telefonai ir automobiliai buvo palyginti nauji ir brangūs). Taigi, apklausoje " Literatūros apžvalga" aprėpties klaida paskatino aprėpties šališkumą.
Nustačius rėmo populiaciją , kitas žingsnis yra tyrėjo pasirinkimas imties populiacijai ; tai žmonės, kurių tyrėjas bandys apklausti. Jei mėginys turi kitokias charakteristikas negu rėmo populiacija, mėginių ėmimo paklaida gali būti imama. Vis dėlto " Literary Digest" fiasko atveju iš tikrųjų nebuvo atrinktų mėginių - žurnalas susisiekdavo su visais rėmo gyventojais, todėl nebuvo klaidų. Daugelis tyrėjų linkę sutelkti dėmesį į atrankos paklaidą - tai dažniausiai yra vienintelė klaidų rūšis, užfiksuota apklausose aptikta klaidos riba, tačiau " Fiction of Literary Digest" primena mums, kad turime atsižvelgti į visus atsitiktinius ir sisteminius klaidų šaltinius.
Galiausiai, atrinkdamas imties populiaciją, tyrėjas bando apklausti visus savo narius. Tie žmonės, kurie sėkmingai apklausti, vadinami respondentais . Geriausia būtų, kad imties dalis ir respondentai būtų visiškai tokie patys, tačiau praktikoje nėra atsakymo. Tai reiškia, kad kartais asmenys, atrinkti atrankoje, nedalyvauja. Jei respondentai skiriasi nuo tų, kurie neatsako, gali būti neatsiejama neigiama reakcija. Neatsakymo šališkumas buvo antroji pagrindinė " Literary Digest" apklausos problema. Tik 24 proc. Balsavusių žmonių atsakė, o paaiškėjo, kad žmonės, kurie palaikė Landoną, labiau reagavo.
Be tik pavyzdžio, kaip pristatyti atstovavimo idėjas, literatūrinės santraukos apklausa yra dažnai pasikartojanti palyginimu, įspėja mokslininkus apie atsitiktinių mėginių ėmimo pavojų. Deja, manau, kad pamoka, kurią daugelis žmonių remiasi iš šios istorijos, yra klaidinga. Dažniausiai pasakojama moralė yra tai, kad mokslininkai negali nieko išmokti iš neprognozuojamų pavyzdžių (ty mėginių be griežtų tikimybe pagrįstų dalyvių atrankos taisyklių). Tačiau, kaip aš paaiškinsiu vėliau šiame skyriuje, tai nėra visiškai teisinga. Vietoj to, aš manau, kad tikrai yra du moralės šios istorijos; Šie moralės principai šiandien yra tokie patys kaip ir 1936 m. Pirma, didelė dalis netyčia surinktų duomenų negarantuoja gero įvertinimo. Apskritai, jei daug respondentų sumažina įverčių skirtumus, tai nebūtinai sumažina šališkumą. Su daugybe duomenų mokslininkai kartais gali gauti tikslų neteisingo dalyko įvertinimą; jie gali būti tiksliai netikslūs (McFarland and McFarland 2015) . Antroji pagrindinė " Literary Digest" fiasko pamoka yra ta, kad mokslininkams reikia atsiskaityti, kaip apskaičiuoti jų mėginį. Kitaip tariant, kadangi mėginių ėmimo procesas literatūros santraukų apklausoje buvo sistemingai nukreiptas į kai kuriuos respondentus, mokslininkams reikėjo taikyti sudėtingesnį vertinimo procesą, kuris kai kuriems respondentams pasiskirstė labiau nei kiti. Vėliau šiame skyriuje parodysiu vieną tokią svorio procedūrą - po stratifikacijos - tai leis jums atlikti geresnius apskaičiavimus, naudodamiesi atsitiktiniais pavyzdžiais.