Iyada oo tijaabada aan jaaniska, miisaanka tirtireyso karaa dhabtii keena habka sampling wareegay.
In si la mid ah in cilmi miisaan jawaabaha ka tijaabada ixtimaalka, waxay sidoo kale miisaan kartaa jawaabaha ka baarka aan jaaniska. Tusaale ahaan, sida kale si CPS, qiyaasi in aad kaalinta xayeysiis banner on kumanaan websites inay qortaan ka qaybgalayaasha sahanka ah in la qiyaaso heerka shaqo la'aanta. Dabcan, aad noqon lahayd ka walaacsan in celceliska fudud ee aad muunad u noqon lahaa qiyaas wanaagsan oo heerka shaqo la'aanta. Your shaki malaha waa sababta oo ah waxaad u malaynaysaa in dadka qaar ka mid ah waxay u badan tahay in ay buuxiso baadhitaan badan kuwa kale. Tusaale ahaan, dadka aan waqti badan ma qaataan on web waa yar tahay in ay buuxiso sahanka.
Sida aan ku arkay qaybta ugu dambaysa, si kastaba ha ahaatee, haddaynu og nahay sida saamiga loo doortay-sida aan la ixtimaalka tijaabada-ka dibna waxaan ku laaban karaa dhabtii keena habka ururinta. Nasiib darro, marka la-baarka aan jaaniska u shaqeeya, garan mayno sida saamiga loo doortay. Laakiin, waxaan ka dhigi kara fikrado ku saabsan habka sampling ka dibna codsan miisaan si la mid ah. Haddii fikrado kuwan sax yihiin, markaas miisaan ku laaban doonaa dhabtii ay keento habka ururinta.
Tusaale ahaan, qiyaasi in ay jawaab u xayeysiis banner aad, aad qorteen 100,000 jawaabaha. Si kastaba ha ahaatee, waad rumaysan weydeen in 100,000 jawaabaha waa muunad fudud oo kadiska ah ee dadka waaweyn American. Dhab ahaantii, marka aad is barbar jawaabaha aad dadka Maraykanka, waxaad ka heli in dadka ka soo dalalka qaar ka mid ah (tusaale ahaan, New York) waa dad ka badan-matalayay iyo in laga soo saaray dalalka qaar ka mid ah (tusaale ahaan, Alaska) waa-wakiil ka yar. Sidaas darteed, heerka shaqo la'aanta ee aad saamiga u badan tahay inuu noqon qiyaasta xun ee heerka shaqo la'aanta ee dadka la bartilmaameedsanayo.
Hal hab oo guntimihii dhalanrog ku dhacay habka sampling waa inuu ku meeleeyo miisaanno in qof kasta; miisaanka hoose in ay dadka ka soo dalalka la taliya-matalayay in tijaabada (tusaale ahaan, New York) iyo miisaanka sare dadka ka dalalka la hoos-matalayay in tijaabada (tusaale ahaan, Alaska). More si gaar ah, miisaanka jawab kasta waxaa la xiriira ay baahsanaanta in aad qaraabo shaybaarkaaga ay baahsanaanta in dadka Mareykanka. Nidaamka miisaan Tan waxa loo yaqaan post-stratification, iyo fikradda ah oo miisaankeedu yahay waa idin xusuusiyo tusaale ee Qaybta 3.4.1 halkaas oo jawaabeyaasha ka Rhode Island la siiyay miisaan yar tahay jawaabaha ka California. Post-stratification u baahan tahay in aad ogaato oo ku filan in ay ku riday jawaabaha aad kooxo iyo in la ogaado tirada dadka bartilmaameedka koox kasta.
Inkasta oo miisaan ee muunad jaaniska iyo muunad aan jaaniska waa xisaab ahaan la mid ah (eeg lifaaqa farsamo), ay si fiican u shaqeeyaan xaalado kala duwan. Haddii cilmi-leeyahay saamiga kaamil ah jaaniska (ie, ma caymiska baadi iyo ma non-jawaab), ka dibna miisaan soo saari doonaa qiyaaso aan eex lahayn ee dhammaan sifooyin in kiisaska oo dhan. Tani waxay damaanad teori xoog badan tahay sababta u dooda ee tijaabada ixtimaalka helin si soo jiidasho leh. Dhinaca kale, baarka aan jaaniska miisaan soo saari doonaa oo kaliya qiyaasta aan eex lahayn ee dhammaan sifooyin haddii propensities jawaabta waa isku mid u ah qof kasta oo koox kasta. In si kale loo dhigo, dib u malaynaya inuu naga tusaale ahaan, iyadoo la isticmaalayo post-stratification soo saari doonaa qiyaaso aan eex lahayn haddii qof walba oo New York ayaa jaaniska la mid ah ka qayb iyo qof kasta oo Alaska ayaa jaaniska la mid ah ka qayb iyo wixii la mid ah. Malo Tan waxaa loo yaqaannaa ku malo dhqaalaha-jawaab-propensities-gudahood-kooxaha, iyo waxa ay kaalin muhiim ah ka og haddii post-stratification si fiican leh baarka aan jaaniska shaqeyn doonaan.
Nasiib darro, in our tusaale ahaan, siday maleeyeen dhqaalaha-jawaab-propensities-gudahood-kooxo u muuqataa uma badna in uu noqdo mid run ah. Taasi waa, waxa ay u muuqataa uma badna in qof walba ee Alaska ayaa jaaniska la mid ah in ay aad sahanka. Laakiin, waxaa jira seddex dhibcood muhiim ah in aad maskaxda ku hayso oo ku saabsan post-stratification, kuwaas oo dhammaantood ka dhigi in ay u muuqato in ka badan rajo.
First, malo dhqaalaha-jawaab-propensities-gudahood-kooxo sii xannibo sida tirada kooxaha kordhay. Oo, cilmi aan ku koobnayn oo kaliya kooxo oo ku salaysan aragti hal juqraafi. Tusaale ahaan, waxaan abuuri kari lahaa kooxo ku salaysan gobolka, da'da, jinsiga, iyo heerka waxbarashada. Waxa ay u muuqataa dheeraad ah loo xannibo in ay jirto propensities jawaab dhqaalaha group of 18-29 gudahood, ka qalin dhaddig, college ku nool Alaska ka badan kooxda oo dhan dadka ku nool Alaska gudahood. Sidaas darteed, sida tirada kooxaha loo isticmaalo post-stratification kordho, malo loo baahan yahay si ay u taageeraan waxaa sii macquul ah. Marka la eego xaqiiqda, waxa ay u muuqataa sida cilmi-a doonayo in la abuuro tiro badan oo kooxaha post-stratification. Laakiin, sida tirada kooxaha kordho, cilmi kulanaa dhibaato kala duwan: sparsity xogta. Haddii ay jiraan kaliya tiro yar oo ah dadka koox kasta, ka dibna qiyaasta uu noqon doono ka badan aan la hubin, iyo in kiiska xad dhaaf ah marka ay jirto koox u leedahay jawaab bixiyayaasha lahayn, markaas waa post-stratification gebi jabo. Waxaa jira laba siyaabood oo ka mid ah xiisadda soo jireenka ah ee u dhexeeya this plausibility ee malo homogeneous- jawaab-dalalkaasi-gudahood-kooxo iyo baahida loo qabo tirada muunad macquul ah in koox kasta. Mid ka mid ah hab waa inay u soo guuraan model badan oo casri ah tirakoobka xisaabinta miisaanka oo kale waa in la soo uruuriyo, muunad weyn dheeraad ah oo kala duwan, kaas oo ka caawisaa loo xaqiijiyo tirada muunad macquul ah in koox kasta. Oo, mararka qaarkood cilmi labada sameeyo, sidii aan ku tilmaami doonaa si faahfaahsan hoos ku.
tixgelin A labaad markii la post-stratification ka baarka aan jaaniska u shaqeeya waa in male ah dhqaalaha-jawaab-dalalkaasi-gudahood-kooxaha waa horeba si joogto ah la sameeyey markii la falanqeeyo tijaabada ixtimaalka. Sababta in loo baahan yahay malo this for tijaabada ixtimaalka in dhaqanka waa in tijaabada ixtimaalka leedahay non-jawaab, iyo habka ugu badan ee la qabsado, waayo, non-jawaabta waa post-stratification sida kor lagu sharaxay. Dabcan, oo kaliya sababtoo ah cilmi badan oo ka dhigi malo gaar ah macnaheedu ma aha in aad aad u samayn. Laakiin, waxa aanu ka dhigan tahay in marka la barbar-baarka aan jaaniska in tijaabada ixtimaalka ku dhaqanka, waa in aan maanka ku hayo in labada ku xiran fikrado iyo macluumaad kaabayaal ah si ay u soo saaraan qiyaasaha. In goobaha ugu macquul ah, waxaa si fudud yahay ma hab malo-free in ka baxayn.
Ugu dambeyntii, haddii aad daryeeli ku saabsan mid ka mid ah qiyaasta gaar ahaan-in tusaale ahaan shaqo la'aanta our heerka-ka dibna aad u baahan tahay xaalad nugul yihiin dhqaalaha-jawaab-dalalkaasi-gudahood-kooxaha malo. Gaar ahaan, aadan u baahnayn in loo qaato in qof walba uu leeyahay dalalkaasi isla jawaab, waxa kaliya ee aad u baahan tahay in loo qaato in uu jiro xiriir u dhaxeeya dalalkaasi iyo jawaab iyo heerka shaqo la'aanta koox kasta gudahood. Dabcan, xataa xaaladan taagta daran ma qaban doonaan xaaladaha qaar ka mid ah. Tusaale ahaan, qiyaasi qiyaasayo saamiga of Americans in shaqada iskaa wax u qabso ku sameeyo. Haddii dadka shaqada iskaa wax u qabso ku sameeyo waxay u badan tahay in ay ku heshiiyaan in ay baadhitaan, ka dibna cilmi doonaa nidaamsan badan-qiyaaso qadarka tabarucid, xataa haddii ay sameeyaan hagaajin post-stratification, natiijo ah oo uu soo mareysa daraasado muujiyeen by Abraham, Helms, and Presser (2009) .
Sida aan horeba u sheegay, tijaabada non-itimaalka waxaa loo arki karaa shaki weyn by saynisyahano bulshada, in qayb ka mid ah sababta oo ah doorkooda qaar ka mid ah fashilaad ugu ceeb in maalmaha hore ee cilmi baadhitaan. Tusaale A oo nadiif ah inta aan la Timid baarka aan jaaniska waa cilmi of Wei Wang, David Rothschild, Sharad Goel, iyo Andrew Gelman in si sax ah soo kabsaday natiijada doorashada US 2012 isticmaalayo muunad non-itimaalka ee isticmaala American Xbox a Xarafka muunad go'aansatay non-random of Americans (Wang et al. 2015) . Cilmi baadhayaashu waxay qorteen jawaabeyaasha nidaamka ciyaaraha XBox, iyo sida aad ka fili karto, muunad Xbox u buunbuunin lab iyo buunbuunin oo dhallinyaro ah; 18 - jirka ah 29 sano ka samaysan 19% ka mid ah codbixiyayaasha, laakiin 65% saamiga Xbox iyo rag ka samaysan 47% oo ka mid ah codbixiyayaasha iyo 93% muunadda Xbox (Jaantuska 3.4). Sababtoo ah oo ka mid ah dadka eexasho xoog, xogta Xbox cayriin ahaa tilmaame saboolka ah ee soo noqoto doorashada. Waxaa saadaaliyay guul xooggan ee Mitt Romney badan Barack Obama. Mar kale, tani waa tusaale kale oo khataraha cayriin, baarka aan jaaniska unadjusted oo waa garabaka ku Buuqa Suugaanta Dhayjast.
Si kastaba ha ahaatee, Wang iyo asxaabtii ay ka war hayaan dhibaatooyinka iyo isku dayeen in ay miisaan jawaabay in la saxo nidaamka ururinta. Gaar ahaan, waxay ku foom dheeraad ah oo casri ah oo ka mid ah-stratification post inaan idiin sheegay oo ku saabsan. Waxaa xusid mudan qayb dheeraad ah oo ku saabsan qaabka barashada sababtoo ah waxay dhistaa dareen ku saabsan post-stratification, iyo version gaar ah Wang iyo asxaabtii isticmaalo waa mid ka mid ah hababka ugu xiiso leh baarka aan jaaniska miisaan.
In tusaale fudud oo ku saabsan qiyaasidda shaqo la'aanta qaybta 3.4.1, waxaan kala qaybiyey dadka kooxo ku salaysan gobolka aad deggan tahay. Marka la barbardhigo, Wang iyo shaqaalaheeda kala qaybiyey dadka galay galay 176.256 kooxaha qeexay: jinsiga (2 qaybood), jinsi (4 qaybood), da'da (4 qaybood), waxbarashada (4 qaybood), gobolka (51 qaybood), ID xisbiga (3 qaybood), fikirka (3 qaybood) iyo 2008 cod (3 qaybood). Iyada oo kooxaha ka badan, cilmi rajaynayeen in ay noqon badan tahay in koox kasta gudahood, dalalkaasi iyo jawaab ahaa uncorrelated taageero for Obama lahaa. Next, halkii dhismaha miisaanka heer shakhsi, sida aan ku sameeyey naga tusaale ahaan, Wang iyo asxaabtii isticmaalo model ah oo adag in la qiyaaso tirada dadka koox kasta in u codeyn lahaa Obama. Ugu dambayntii, ay weheliso qiyaasta group of taageero la size loo yaqaan ee koox kasta in ay soo saaraan, kuwaas oo ah heerka guud ahaan lagu qiyaasay taageero. In si kale loo dhigo, waxay kor u jartey dadka kooxo kala duwan, lagu qiyaasay taageerada for Obama koox kasta, ka dibna qaatay celcelis ah miisaan leh ee qiyaasaha kooxda in ay soo saaraan qiyaasta guud.
Sidaas darteed, dhibaatada ugu weyn ee ay hab waa in la qiyaaso taageerada for Obama in kasta oo ka mid ah 176.256 kooxaha. Inkasta oo ay guddi ka mid ah 345.858 ka qaybgalayaasha u gaar ah, tiro ka weyn by heerka codbixinta doorashada, waxaa jiray kuwo badan, kooxo badan kaas oo Wang iyo asxaabtii lahaa ku dhowaad ma ka jawaabay. Sidaa darteed, in la qiyaaso taageerada in koox kasta ay isticmaali farsamo la yiraahdo dhaca multilevel la post-stratification, oo cilmi affectionately wac Mr. P. Aasaasiyan, in la qiyaaso taageerada for Obama gudahood koox gaar ah, barkadaha Mr. P. macluumaad badan oo ka si dhow kooxaha la xiriira. Tusaale ahaan, ka fiirso caqabad ku ah la qiyaasayo taageero ee Obama iyo dhaddigba, Hispanics, inta u dhaxaysa 18-29 sano jir, kuwaas oo ka qalin jaamacad, kuwaas oo ka diiwaangashan xisbiga, kuwaas oo is-aqoonsado sida qunyar, iyo kuwa u codeeyeen Obama ee 2008. Tani waa koox aad iyo aad u gaarka ah, iyo waxa suurto gal ah in uu jiro qofna in saamiga la astaamahaan. Sidaa darteed, si ay u sameeyaan qiyaasta ku saabsan kooxdan, barkadaha Mr. P. wada qiyaastay dadka ka koox aad u la mid ah.
Isticmaalka istaraatijiyad falanqaynta this, Wang iyo asxaabtii ay awoodaan in ay isticmaalaan XBox muunad aan jaaniska in ay aad u dhow la qiyaaso taageerada guud ahaan in Obama helay doorashada 2012 (Jaantuska 3.5). Dhab ahaantii qiyaasta waxay ahaayeen badan oo sax ah ka badan wadar ahaan labada lug ah ee doorashada opinion dadweynaha. Sidaas darteed, haddii ay taasi ku, miisaan-gaar ah Mr. P.-u muuqataa in ay shaqo fiican qaban saxo eexasho ee xogta aan jaaniska; eexasho in ay yihiin la arki karo marka aad eegto qiyaasta ka data Xbox unadjusted.
Waxaa jira laba casharada ugu muhiimsan ee laga daraasadda of Wang iyo shaqaalaheeda. First, baarka aan jaaniska unadjusted keeni kartaa in qiyaasta xun; tani waa waano in cilmi badan ka maqlay hor. Si kastaba ha ahaatee, casharka labaad waa in tijaabada non-itimaalka, marka si habboon loo miisaamaa, dhab ahaan soo saari kartaa qiyaasta xad wanaagsan. Dhab ahaantii, qiyaasaha waxay ahaayeen badan oo sax ah ka badan qiyaasaha ka soo pollster.com, eegitaanka ah ee dheeraad ah oo loo tiriyey doorashada dhaqanka.
Ugu dambeyntii, waxaa jira xadeynta muhiim ah in waxa aan ka baran karno this mid waxbarasho oo gaar ah. Just, sababtoo ah post-stratification sidoo shaqeeyay kiiskan gaarka ah, ma jiraan wax damaanad in ay si fiican u shaqeyn doonaa mararka kale. Dhab ahaantii, doorashada laga yaabaa in ay yihiin mid ka mid ah goobaha ugu fudud sababtoo ah pollsters ayaa lagu baranayay doorashooyinka muddo ku dhow 100 sano, waxaa jira joogta ah war celin (waxa aan arki karnaa kuwaas oo ku guuleystay doorashada), iyo aqoonsiga xisbiga iyo sifooyinka dadka waa xad saadaal ah ee cod-bixinta. Halkaa marka ay marayso, waxaan haysan aragtida adag iyo waayo-aragnimo taaban karo in ay ogaadaan marka miisaami dheellitirka baarka aan jaaniska soo saari doonaa qiyaasta ku filan sax ah. Mid ka mid ah wax waa cad yahay, si kastaba ha ahaatee, waa haddii ay khasab in aad la-baarka aan jaaniska u shaqeeyaan, ka dibna ay jirto sabab xoog leh ay aaminsan yihiin in qiyaasaha hagaajiyay ka khayr badan qiyaasta aan beddelo noqon doonaa.