Ordezkaritza inferentziak egiteko zure inkestatuen zure xede-populazioari buruz da.
Inkestatuek biztanleria handiago batetik inbokatzeko duten akats motak ulertzeko, kontuan hartu Literary Digest last inkestak 1936ko Estatu Batuetako hauteskunde presidentetzarako hauteskundeak aurreikusten saiatu zela. Duela 75 urte baino gehiago gertatu zen arren, debakle horrek ikasgai garrantzitsu bat ere badu gaur ikertzaileei irakasteko.
Literal Digest izen handiko interes orokorreko aldizkaria izan zen, eta 1920an hasitako hauteskundeetako hauteskundeen emaitzen aurreikustea erabaki zuten. Aurreikuspen horiek egiteko, botoiak jende asko bidali eta itzuliko diren agiriak besterik ez dituzte egin; Literary Digestek harro azaldu zuen jaso zituzten botoiak ez zirela "pisutsuak, egokituak eta ez interpretatuak". Prozedura honek hauteskundeak irabazi zituen 1920, 1924, 1928 eta 1932. urteetan. 1936an, Depresio Handiaren erdian Literatur Digest- ek 10 milioi pertsonari eman zituen botoiak, izenak nagusiki telefono bidezko direktorioak eta automobil erregistroen erregistroetatik. Hona hemen metodologia nola deskribatu duten:
"DIGEST-en makina leuneko makina hogeita hamar urtetako esperientzia azkar zehaztasunez mugitzen da asmakuntza gogorretara murrizteko ... Aste honetan, 500 boligrafo daude egun bat milioi bat egun baino gehiagoz. Egunero, New York-eko Fourth Avenue moto-zintaz hornitutako gela handi batean, 400 langileek milako bat pieza inprimatu dituzte, berrogei hiriko blokeak askatzeko nahikoa. Ordu bakoitzean, THE DIGEST'S Post Office Subportuan, hiru txat-puntuzko makina-makina zigilatu eta zigilatu zintzilikario zuriak; posta-langile kualifikatuek mailsack-ak lapurtu zituzten; Ibilgailuak DIGEST kamioiek mail-trenak adierazi zituzten. . . Hurrengo astean, hamar milioi hauen lehenengo erantzunek markatutako baloreen sarrerarekin hasiko dira, triple-checked, egiaztatutakoak, bost aldiz zeharkatu eta guztirakoak. Azken irudia totted eta egiaztatzen denean, iraganeko esperientzia irizpide bat bada, herrialdeak% 1eko ehuneko baten barruan jakingo du berrogei milioi [hautesleek] botoaren benetako botoa "(1936ko abuztuaren 22an).
Literary Digest-en tamaina fetitxizazioa gaur egun "big datu" ikertzaile ezaguna da. 10 milioi boto banatu ziren 2,4 milioi harritu ziren, inkesta politiko modernoak baino 1.000 aldiz handiagoa. 2.4 milioi hautagairen artean, epaia argi zegoen: Alf Landon-ek Franklin Roosevelt arduraduna zen. Baina, hain zuzen ere, Rooseveltek Landon garaitu zuen lurraldea. Nola izan liteke Literal Digest okerreko datuekin? Laginketa modernoen ulermena Literatur Digestaren akatsak argi eta garbi egiten ditu eta etorkizunean antzeko akatsak saihesten laguntzen digu.
Laginketaren inguruko pentsamenduak lau pertsona talde desberdin aztertu behar ditu (3.2 irudia). Lehen taldea xede-populazioa da ; hau da, ikerlariek interes-talde gisa definitzen duen taldea. Literary Digest-en kasuan, biztanleen xedea izan zen hautesleek 1936ko hauteskunde presidentzialetan.
Helburuko biztanle bat aukeratuz gero, ikertzaileak laginketa egiteko erabil daitezkeen pertsonen zerrenda bat garatu behar du. Zerrenda honek laginketa-marko bat deitzen zaio eta horren gainean jendeak markoaren populazioa deitzen zaie. Egokiena, helburuko biztanleria eta markoaren biztanleria berdinak izango lirateke, baina praktikan askotan ez da kasua. Adibidez, Literary Digest- en kasuan, markoaren biztanleria 10 milioi pertsona izan ziren, izenak nagusiki telefono bidezko direktorioak eta automobil erregistroen erregistroen arabera. Helburuko biztanleriaren eta markoaren biztanleriaren arteko desberdintasunak estaldura-errorea deritzo. Estaldura-akatsak ez du bere burua bermatzen arazoak. Hala eta guztiz ere, estalduraren alborapena eragin dezake, markoaren biztanleria pertsonek etengabeko biztanlerian dauden pertsonen helburuko biztanleek ez dute sistematikoki bereizten. Hau da, hain zuzen ere, Literary Digest inkestan gertatu zena. Adiskidetasuneko jendeak Alf Landon babesten zuen, neurri handi batean aberatsagoak zirelako (gogorarazi telefonoak eta automobilak nahiko berria eta garestia zela 1936an). Beraz, Literary Digest-en inkestan, estaldura-erroreak estaldura-alborapena ekarri zuen.
Markoaren biztanleria definitu ondoren, hurrengo urratsa ikertzaileak lagineko populazioa hautatzeko da; Hauek dira ikertzaileak elkarrizketak egiten saiatuko diren pertsonak. Laginaren fotograma-biztanleria baino ezaugarri desberdinak baditu, laginketa-errorea laginketa- metodoa erabil daiteke. Literary Digest fiasco kasuan, ordea, ez zen benetan laginketa-aldizkaria markoaren biztanle guztiekin harremanetan jarri zen, eta, beraz, laginketa-errorerik ez zegoen. Ikertzaile askok laginketa-errorea izaten dute, hau da, errore-marjina inkestetan jasotako errore mota bakarra izan ohi da, baina Literal Digest fiasco gogorarazten digu errore-iturri guztiak kontuan hartu behar direla, ausaz eta sistematikoki.
Azkenean, lagin-populazioa hautatu ondoren, ikertzaile batek kide guztiak elkarrizketatu nahi ditu. Arrakastatsuak diren pertsonek galdetu diete inkestatuei . Egokiena, lagineko biztanleria eta inkestatuek berdinak izango lirateke, baina praktikan ez dago erantzunik. Hau da, laginean hautatutako pertsonak batzuetan ez dira parte hartzen. Erantzuten duten pertsonak ez badira erantzuten ez dutenak, orduan ez dago erantzunik . Ez da erantzunik izan literatura Digest inkestaren bigarren arazoa. Bakarrik boto bat jaso zuten pertsonen% 24k erantzun zuen, eta ondorioz, Landonek onartzen zituenak erantzun zitzaizkien.
Errepresentazio ideiak aurkezten dituen adibide bat besterik ez bada ere, Literary Digest inkestaren parabola errepikatzen da, eta ikertzaileek zalantzak argitzen dituzte. Zoritxarrez, uste dut jende askok istorio hau marrazten duen ikasgai okerra dela. Istorioaren ohikoena da ikertzaileek probabilitate ez-lagin batetik ezer ikasteko (hau da, parte-hartzaileak hautatzeko probabilitate estandar zorrotzak dituzten laginak). Baina kapitulu honetan azalduko dudan bezala, hori ez da nahiko zuzena. Horren ordez, uste dut istorio honi bi morala direla benetan. 1936an zeuden benetako egiatasuna bezain moralak. Lehenik eta behin, datu ugari biltzen dituen datuek ez dute aurrekontu onik bermatuko. Oro har, inkestatu kopuru handi batek estimazioen bariantza murrizten du, baina ez du derrigorrez alborapena murrizten. Datu asko dutenez, ikertzaileek okerreko gauza batzuen aurrekontu zehatza lor dezakete batzuetan; zehaztugabeak izan daitezke (McFarland and McFarland 2015) . Literary Digest fiasco-ren bigarren ikasgai nagusia ikertzaileek zenbatespena egiteko nola egin zuten aztertu behar dute. Beste era batera esanda, Literary Digest inkestaren laginketa prozesua inkestatu batzuen sistematikoki desitxuratu zenez, ikertzaileek estimatuagoak izan behar zituzten prozesu konplexuagoak erabili behar izan zituzten, besteak beste batzuek baino gehiagok. Geroago, kapitulu honetan, pisu-prozedura bat (post-estratifikazioa) esango dizut, haphazard laginak kalkulu hobeak egiteko.