Ordezkaritza inferentziak egiteko zure inkestatuen zure xede-populazioari buruz da.
Ordena horretan denean biztanleria handiago inkestatuen abiatuta inferentziak gerta daiteke, akats mota ulertzeko, kontuan hartu dezagun Literatur Digest lasto inkesta hori 1936ko AEBetako presidentetzarako hauteskunde emaitza aurreikusteko saiatu. Duela 75 urte baino gehiago izan arren, debacle hau oraindik ikasgai garrantzitsu bat ikertzaile irakasteko gaur.
Literatur Digest popular interes orokorreko aldizkari bat izan zen, eta 1920an hasita lasto galdeketen exekutatzen Hauteskunde emaitzei iragartzea hasi ziren. Iragarpen horiek egiteko Boto bidali dute litzateke jende asko, eta, ondoren, besterik gabe, Tally sortu boto hori itzuli ziren; Literatur Digest harro du hori jaso zuten boto ari ez "haztatuta, egokitu, ezta interpretatu." Prozedura hau behar bezala iragarri irabazlea 1920, 1924, 1928 eta 1932. 1936an hasi hauteskundeetako, Depresio Handiaren erdian, Literatura Digest bida- Boto 10 milioi pertsona beren izenak gehienbat telefono direktorioak eta automobil erregistro batetik zetorren. Hona hemen bere metodologia nola deskribatzen dute:
"Digest en lasterka leun-makina hogeita hamar urteko esperientzia doitasun sorbeltz batera mugitzen hechos zaila guesswork murrizteko. . . .Hau Astean 500 boligrafoak urratzen out milioi bat helbideak laurden bat egun bat baino gehiago. Egunero, gela handi bat gainetik motor-ribboned Laugarren Avenue handiko, New York-en, 400 langile deftly irristatu milioi materia-nahikoa inprimatutako berrogei hiria bloke-batean jorratzen inguratzen [sic] pave pieza bat. Orduro, bilduma propioa Post Office azpiestazioa ere, hiru kalakari frankeoa metering makinak zigilatu eta oblongs zuria zapaltzen zuten; kualifikatua postal langile iraulita horiek mailsacks mamelonar sartu; flota DIGEST kamioi sped mail-trenak adierazteko horiek. . . Hurrengo astean, hamar horiek milioitik lehen erantzunak sarrerako markatutako Boto marea hasiko dira, hirukoitzak-checked, egiaztatu, bost aldiz mugaz sailkatuak eta bosna izan. Noiz azken zifra ditu totted dira, eta egiaztatu, iraganeko esperientzia irizpide bat bada, herrialdea ez da ehuneko 1 berrogei milioi [hautesleen] popular benetako botoa zati bat barruan jakitea. "(Abuztuak 22, 1936)
Laburtua-en tamaina fetitxe da berehala ezagutzeko edozein "big datuak" ikertzailea da gaur. Of 10 milioi boto banatuta, harrigarria 2,4 milioi boto itzuli-ari ziren gutxi gorabehera inkestetan politiko modernoa baino 1.000 aldiz handiagoa. 2,4 milioi inkestatuen horiek epaia argia izan zen: Literatur Digest iragarri Challenger Alf Landon zela dagokie Franklin Roosevelt garaitzeko joan. Baina, hain zuzen ere, kontrakoa zehatza gertatu. Roosevelt garaitu Landon luizi batean. Nola liteke Literatur Digest joan datu hainbeste gaizki? Gure laginketa ulertzeko modernoan egiten Literatur Digest akatsak argi eta antzeko akatsak egiteko etorkizunean saihesteko laguntzen digu.
argi pentsatzeko laginketa buruz lau pertsona talde ezberdinak (3.1 irudia), kontuan hartu behar dugu. Jende lehen taldea Xede Biztanleriaren da; hau taldearen ikerketa interes biztanleriaren gisa definitzen duen. Literatur Digest kasuan helburu biztanleriaren 1936ko presidentetzarako hauteskundeetan hautesleek zen. biztanleria erabakitzeko ondoren, ikertzaile baten ondoan dagoela laginketa erabili ahal izango diren pertsonen zerrenda garatzeko. Zerrenda honek laginketa-marko bat deitzen da eta laginketa markoan biztanleriaren markoa biztanleriaren deritzo. Literatur Digest kasuan markoa biztanleria du, 10 milioi pertsona beren izenak gehienbat dugunik telefono direktorioak eta automobil erregistro zen. Egokiena xede-biztanleria eta markoa biztanleriaren bera izango litzateke, baina praktikan hau da, askotan ez da kasua. Xede-biztanleriaren eta biztanleria markoaren arteko desberdintasunak deitzen dira estaldura error. Estaldura error ez du, berez, arazo bermatzen. Baina, markoa biztanleriaren pertsonen sistematikoki pertsona desberdinak dira bada ez markoa populazioan dago estaldura alborapena izango da. Estaldura error Literatur Digest inkesta batera akats nagusietako lehena izan zen. hautesleen-zela ezagutu nahi dute beren xede biztanleria-baina laginketa-marko bat eraiki zuten gehienbat telefono direktorioak eta automobil erregistro, iturrietatik hori baino ordezkapen wealthier estatubatuar gehiago litekeena onartzen Alf Landon (abisuaren teknologia horiek biak izan zinen, diren ohikoa gaur egun, nahiko berriak izan ziren garai hartan eta AEBetako Depresio Handiaren erdian zela).
Markoa biztanleria zehaztu ondoren, hurrengo urratsa ikertzailea da lagina populazioaren hautatzeko da; horiek ikertzailearen elkarrizketatu saiatuko dira pertsonak dira. Lagina markoa biztanleriaren baino ezaugarri ezberdinak badu, lagin-akatsa aurkeztu ahal izango dugu. Errore mota akats-marjina hori normalean bidelagun kalkuluen zenbatzen da. Literatur Digest fiasco kasuan, ez zen benetan lagina ez; denek harremanetan marko populazioan saiatu ziren. ez zen lagin-akatsa ez zuen arren, ez zen, jakina, oraindik error. Hau argitzen akatsak marjinak direla normalean estimazioekin du inkestetatik izan ohi dira misleadingly txiki; ez dute akats-iturri guztiak, besteak beste.
Azkenik, ikertzaile bat guztiontzat elkarrizketatzeko lagina populazioaren saiakerak. Arrakastaz elkarrizketatu dira pertsona horiek inkestatuen deitzen dira. Ahal izanez gero, lagina populazioaren eta inkestatuen bera izango litzateke, baina praktikan ez-erantzuna. Hau da, nor dira laginean hautatutako pertsona ukatzeko parte hartzeko. Erantzun duten pertsonen erantzuten ez duten horiek desberdinak dira, orduan ez-erantzuna bias izan daiteke. Ez-erantzuna bias Literatur Digest inkesta batera bigarren arazo nagusia zen. boto bat jaso duten pertsonen% 24 bakarrik erantzun, eta horrexegatik da onartzen Landon pertsonak ziren gehiago litekeena erantzuteko.
Adibide bat besterik ez errepresentazio-ideia aurkeztu izatetik haratago, Literatur Digest inkesta oft-errepikatu parabola bat da, Ostolaza laginketa arriskuei buruz ikertzaileek cautioning. Zoritxarrez, ikasgaia jende askok istorio hau marraztu hori oker bat dela uste dut. Istorioaren morala ohikoena da, ikertzaileek ezin ez-probabilitatea laginak ezer ikasi (hau da, laginak probabilitatea oinarritutako arauak zorrotz gabe, parte-hartzaile aukeratzeko). Baina, kapitulu honetan, geroago I erakutsiko gisa, hori ez da nahiko eskubidea. Horren ordez, ez dira benetan istorio hau bi moralaren uste dut; Hori egia da gaur ziren 1936ko Lehen bezala moralaren, haphazardly bildutako datu-kopuru handi bat ez da ona estimazio bat bermatu. Bigarren, ikertzaileek nola euren datuak bildu zen, kalkuluen egiten ari dira bertatik kontuan izan behar. Beste era batera esanda, datu bilketa Literatur Digest inkesta en prozesua zen sistematikoki inkestatuen batzuk aldera okertu delako, ikertzaileek zenbatespen prozesua konplexuagoa besteak baino pisuak inkestatuen batzuk gehiago erabili behar. Geroago, kapitulu honetan, besteak beste, ponderazio bat prozedura-postestratifikazioa-ez-probabilitatea laginekin kalkuluen hobeto egiteko aukera ematen erakutsi dut.