Pārstāvība ir par padarot secinājumus no saviem respondentiem, lai jūsu mērķa populācijā.
Lai saprastu, kāda veida kļūdām, kas var notikt, ja izsecinot no respondentiem uz lielāku iedzīvotāju, pieņemsim apsvērt Literary Digest salmu aptauju, kas mēģināja prognozēt iznākumu 1936 ASV prezidenta vēlēšanās. Lai gan tas bija vairāk nekā pirms 75 gadiem, šī sagrāve joprojām ir svarīga mācība mācīt pētniekus šodien.
Literary Digest bija populārs vispārējas intereses žurnāls, un sākot ar 1920. viņi sāka darboties salmu aptaujas prognozēt rezultātus prezidenta vēlēšanām. Lai veiktu šos paredzējumus viņi sūtīs balsojumos, lai daudz cilvēku, un pēc tam vienkārši sakrīt up balsojumos, kas tika atdoti; Literary Digest lepni ziņoja, ka balsojumos viņi saņēma bija ne "svērtas, mainīt, ne arī interpretēt." Šī procedūra ir pareizi prognozēt uzvarētāju no vēlēšanām 1920., 1924., 1928. un 1932. gadā 1936, vidū Lielās depresijas, Literary Digest izsūtīja balsojumos līdz 10 miljoniem cilvēku, kuru vārdi galvenokārt nāca no telefona abonentu un automobiļu reģistrācijas ierakstiem. Lūk, kā viņi apraksta savu metodiku:
"Šķelšanas s netraucētu mašīna kustas ar ātru precizitāti trīsdesmit gadu pieredzi, lai mazinātu minējumus uz cieto faktiem. . . .Tas Nedēļā 500 pildspalvas saskrāpēts vairāk nekā ceturtdaļu miljonu adrešu dienā. Katru dienu, lielā telpā augstu virs dzinēju ribboned Fourth Avenue, Ņujorkā, 400 strādnieki veikli slīdēt miljons gabalu iespieddarbi, pietiekami, lai bruģētu četrdesmit pilsētas kvartālu-Into adresēta apņem [sic]. Katru stundu, īssavilkumā pašas Post Office apakšstacijas, trīs tērzēja pasta mērīšanas iekārtas aizzīmogo un apzīmogo balto oblongs; kvalificēti pasta darbinieki Pagriezts tos uztūcis mailsacks; flote Digest automašīnas sped viņiem izteikt pasta vilcieniem. . . Nākamnedēļ, pirmie atbildes no šiem desmit miljoniem sāksies ienākošo gaita atzīmētajiem balsojumos, lai būtu triple-pārbaudīti, pārbaudīti, piecas reizes pārrobežu klasificēts un sasniedza. Kad pēdējais skaitlis ir totted un pārbaudīta, ja iepriekšējā pieredze ir kritērijs, valsts zinās saskaņā daļu 1 procentu faktiskais tautas balsojums četrdesmit miljoni [vēlētāju]. "(Augusts 22, 1936)
Šķelšanas s fetishization izmērs ir uzreiz atpazīstams jebkuram "lielo datu" pētniece šodien. No 10 miljoniem balsojumos izplatīt, pārsteidzošs 2,4 miljoni balsojumos tika atdoti, kas ir aptuveni 1000 reižu lielāks nekā mūsdienu politisko aptaujas. No šiem 2,4 miljoniem respondentiem spriedums bija skaidrs: Literary Digest prognozēja, ka Challenger Alf Landon gatavojas uzvarēt vēsturiskais Franklins Rūzvelts. Bet, patiesībā, tieši pretējo noticis. Roosevelt sakāva Landon kādā nogruvums. Kā varētu Literary Digest iet greizi ar tik daudz datu? Mūsdienu izpratne par paraugu ņemšanas padara literārās Digest s kļūdas skaidra un palīdz mums izvairīties no līdzīgas kļūdas nākotnē.
skaidri domāt par paraugu ņemšanu liek mums apsvērt četras dažādas cilvēku grupas (3.1 attēls). Pirmā cilvēku grupa ir mērķgrupa; šī ir grupa, ka pētījums ir definēta kā iedzīvotāju interesēs. Attiecībā uz literārās Digest mērķgrupa bija vēlētāji 1936 prezidenta vēlēšanās. Pēc lēmuma pieņemšanas par mērķa populāciju, pētnieks blakus ir nepieciešams izstrādāt sarakstu ar cilvēkiem, ko var izmantot paraugu ņemšanai. Šis saraksts ir sauc par izlases rāmis un iedzīvotāji par izlases pamatu sauc rāmis iedzīvotāju. Attiecībā uz literārās Digest rāmis iedzīvotāju bija 10 miljoni cilvēku, kuru vārdi nāca galvenokārt no telefona abonentu un automobiļu reģistrācijas ierakstiem. Ideālā mērķauditoriju un rāmis iedzīvotāji būtu tieši tāds pats, bet praksē tas bieži vien nav tas gadījums. Atšķirības starp mērķa grupu un rāmis iedzīvotāju sauc segums kļūda. Pārklājums kļūda nav, pats par sevi garantē problēmas. Bet, ja cilvēki rāmja iedzīvotājiem ir sistemātiski atšķiras no cilvēkiem ne rāmja iedzīvotājiem būs pārklājums aizspriedumiem. Pārklājums kļūda bija pirmā no galvenajiem trūkumiem ar Literary Digest aptaujā. Viņi vēlējās uzzināt par vēlētāju-kas bija viņu mērķa populācija, bet tie būvēti izlases rāmis pārsvarā no telefona abonentu un automobiļu reģistriem, avotiem, kas pārstāvēti bagātāka amerikāņi, kas biežāk atbalsta Alf Landon (atgādināt, ka abas šīs tehnoloģijas, kas ir bieži šodien, bija salīdzinoši jauns tajā laikā, un ka ASV bija vidū Lielās depresijas).
Pēc definējot rāmja iedzīvotājus, nākamais solis ir pētnieks, lai izvēlētos paraugu iedzīvotājus; tie ir cilvēki, kas pētniekam mēģinās intervēt. Ja paraugs ir atšķirīgas īpašības nekā rāmja iedzīvotājiem, tad mēs varam ieviest izlases kļūda. Tas ir sava veida kļūda kvantitatīvi, kļūda, kas parasti pavada aplēses. Attiecībā uz Literary Digest fiasko, tur tiešām nebija paraugs; viņi mēģināja sazināties ikvienam rāmja populācijā. Kaut gan nebija izlases kļūda, tur bija acīmredzami vēl kļūda. Tas precizē, ka kļūdu rezerves, kas parasti ziņots aplēsēm aptaujās parasti ir maldinoši neliels; tie neietver visus kļūdu avotus.
Visbeidzot, pētnieks mēģina intervēt visus parauga populācijā. Tiem cilvēkiem, kas veiksmīgi aptaujātie sauc respondenti. Ideālā gadījumā izlases iedzīvotāji un respondenti būtu tieši tāds pats, bet praksē ir ne-reakcija. Tas nozīmē, ka cilvēki, kuri ir iekļauti izlasē atsakās piedalīties. Ja cilvēki, kas reaģē atšķiras no tiem, kuri nereaģē, tad tur var būt neatbildētības aizspriedumiem. Non-atbilde neobjektivitāti bija otrais galvenā problēma ar Literary Digest aptaujā. Tikai 24% no cilvēkiem, kuri saņēmuši balsošanu atbildēja, un izrādījās, ka cilvēki, kas atbalstīja Landon biežāk atbildēt.
Vairs nav tikai piemērs, lai ieviestu idejas pārstāvības, literārā Digest aptauja ir bieži atkārto līdzībā, brīdinot pētniekiem par briesmām nejaušs paraugus. Diemžēl, es domāju, ka mācība, ka daudzi cilvēki izdarīt no šī stāsta ir nepareizi vienu. Visbiežākās stāsts morāles ir tā, ka zinātnieki nevar iemācīties kaut ko no ne-varbūtības paraugu (ti, paraugu bez stingriem varbūtības balstītu noteikumu atlases dalībnieki). Bet, kā es jums parādīs vēlāk šajā nodaļā, tas nav gluži pareizi. Tā vietā, es domāju, ka ir tiešām divi tikumību uz šo stāstu; tikumību, kas ir tikpat patiess šodien kā tas bija 1936. Pirmkārt, liels daudzums haphazardly savākto datu negarantē labu novērtējumu. Otrkārt, pētniekiem ir nepieciešams, lai ņemtu vērā to, kā viņu dati tika apkopoti, ja tie rada aplēses no tā. Citiem vārdiem sakot, jo datu vākšanas process Literary Digest aptaujā tika sistemātiski asimetrisks uz dažiem respondentiem, pētniekiem nepieciešams izmantot sarežģītāku aprēķinu process, atsvari daži respondenti vairāk nekā citi. Vēlāk šajā nodaļā, es jums parādīs vienu šāda sadale procedūra post-noslāņošanos-kas var ļauj jums veikt labākus aplēses ar trešajām izlasēm pēc varbūtības.