Lifaaqan, waxaan ku tilmaami doonaa qaar ka mid ah fikradaha cutubka ee foomka waxoogaa xisaab ah. Hadafka halkan waa inuu kaa caawiyo inaad ku raaxaysato qoraalka iyo qaabka xisaabeed ee ay isticmaalaan cilmi baarayaasha sahanka si aad uga gudubto qaar ka mid ah qalab farsamo oo ku qoran mawduucyadan. Waxaan bilaabi doonaa iyada oo la soo saarayo tijaabinta sifeynta, ka dibna u gudubka suurtogalnimada sifeyn la'aanta jawaab la'aan, iyo ugu dambeyntii, sifududnaanta aan la xariirin.
Saameynta tijaabada ah
Tusaale ahaan, aynu eegno yoolka lagu qiyaaso heerka shaqo la'aanta ee Maraykanka. Ha \(U = \{1, \ldots, k, \ldots, N\}\) ahaan dadka bartilmaameedka oo ha \(y_k\) by qiimaha variable natiijada qofka ugu \(k\) . Tusaalahan \(y_k\) waxa weeye haddii qofku \(k\) yahay shaqo la'aan. Ugu dambeyntii, u daa \(F = \{1, \ldots, k, \ldots, N\}\) noqonayaan dadweynaha, taas oo loogu talagalay macquulnimada la mid ah sida la beegsanayo dadweynaha.
Naqshad sameynta aasaasiga ah waa tijaabo sahlan oo aan la beddelin. Xaaladdan, qof kastaa wuxuu u eg yahay in lagu daro tusaalaha \(s = \{1, \ldots, i, \ldots, n\}\) . Marka xogta la ururiyo naqshadeynta tijaabada, cilmi-baarayaashu waxay ku qiyaasaan heerka shaqo la'aanta ee dadwaynaha leh macnaheedu:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
halkaas \(\bar{y}\) waa heerka shaqo la'aanta ee dadka iyo \(\hat{\bar{y}}\) oo ah qiyaasta heerka shaqo la'aanta (the \(\hat{ }\) caadi ahaan waa loo isticmaalo in lagu tilmaamo qiyaasaha).
Xaqiiq ahaan, cilmi-baarayaashu marar dhif ah ayay isticmaalaan tijaabada sahlan ee aan lahayn beddelaad. Sababaha kala duwan (mid ka mid ah oo aan ku sharaxi doono daqiiqad), cilmi-baarayaashu waxay inta badan abuuraan shaybaarka oo ay ka mid yihiin dhacdooyinka sinnaan la'aanta ah. Tusaale ahaan, cilmi baarayaashu waxay dooran karaan dadka ku nool Florida iyada oo ay dhici karto in ay ka sii darayso ka midka dadka dadka degan California. Xaaladdan, saamiga macnaheedu waa (eq. 3.1) ma noqon karto qiyaas fiican. Taa bedelkeeda, marka ay jiraan caqabado aan kala sooc lahayn oo lagu daro, cilmi baarayaashu waxay isticmaalaan
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
halkaas \(\hat{\bar{y}}\) oo ah qiyaasta heerka shaqo la'aanta iyo \(\pi_i\) waa qof \(i\) 's itimaalka ee ka mid noqoshada. Dhaqanka caadiga ah ka dib, waxaan ku wici doonaa qiyaasaha eq. 3.2 qiyaasaha Horvitz-Thompson. Qiyaasaha Horvitz-Thompson waa mid aad u faa'iido badan, sababtoo ah waxay u horseedeysaa qiyaasta caqabadaha ah ee loogu talagalay naqshadeynta wax- (Horvitz and Thompson 1952) . Sababtoo ah qiyaasaha Horvitz-Thompson si joogta ah ayuu u soo baxaa, waa waxtar in la ogaado in dib loo qori karo
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
halkaa \(w_i = 1 / \pi_i\) . Sida eq. 3.3 wuxuu muujinayaa, qiyaasaha Horvitz-Thompson waa miisaan culus oo macnaheedu yahay miisaanku si khaas ah u la xidhiidha suurtogalnimada xulashada. Si kale haddii loo dhigo, qofka oo yareynaya qofku waa inuu ku jiraa sambalka, miisaankana waa inuu qofku helaa qiyaasta.
Sidii hore loo sharraxay, cilmi-baarayaashu waxay inta badan tijaabiyaan dadka qaba itimaalka sinaan la'aanta. Hal tusaale oo ah naqshad keeni karta isdhexgalka sinaan la'aanta ah ee ka mid noqoshadu waa mid la xaddiday sameysashada , taas oo muhiim u ah in la fahmo sababtoo ah waxay si dhow ula xiriirtaa habka qiyaasida ee loo yaqaano dib u dhigista . Qaybta tijaabada ah ee cilmi-baarista, cilmi-baaruhu wuxuu kala-jajabinayaa dadweynaha bartilmaameedka ah \(H\) kooxo isku-dhafan oo dhexdhexaad ah. Kooxahan waxaa loo yaqaan ' strata' waxaana lagu tilmaamaa \(U_1, \ldots, U_h, \ldots, U_H\) . Tusaale ahaan, strata ayaa sheegaysa. Tirada kooxaha ayaa lagu tilmaamaa \(N_1, \ldots, N_h, \ldots, N_H\) . Cilmi-baaruhu wuxuu rabi karaa inuu isticmaalo tijaabo-samaynta si loo hubiyo in ay haysato dad ku filan gobol kasta si loo sameeyo qiyaas heer-goboleed oo ku saabsan shaqo la'aanta.
Marka dadwaynuhu ay u kala qaybsamaan dabeecadaha , waxay ku qaadaan in cilmi-baaruhu uu doorto tijaabo sahlan oo aan lahayn beddelka cabbirka \(n_h\) , oo si madaxbannaan leh uga soocaya qayb kasta. Dheeraad ah, u qaadan in qof kasta oo lagu soo xushay tusaalaha uu noqonayo jawaab celiye (Anigu waxaan qaban doonaa jawaab aan ku jirin qaybta soo socota). Xaaladdan oo kale, suurtagalnimada ah in lagu daro waa
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Sababtoo ah caqli-celiyadani way kala duwanaan kartaa qof ahaan, marka la sameeyo qiyaasta naqshadeynta tijaabada, cilmi-baarayaashu waxay u baahan yihiin miisaan kasta oo jawaab celin ah oo ka soo jeeda marxaladda ay suuragal tahay in lagu daro isticmaalka qiyaasaha Horvitz-Thompson (eq 3.2).
Inkasta oo qiyaasaha Horvitz-Thompson uu yahay mid aan caddaalad ahayn, cilmi-baarayaashu waxay soo saari karaan qiyaas sax ah (ie, kala-duwanaansho hoose) qiyaasaha iyaga oo adeegsanaya macluumaadka caawiye . Dadka qaar waxay u arkaan in la yaab leh in tani ay run tahay xitaa marka ay jirto imtixaan sinnaan ah oo dhammaystiran. Farsamooyinkaan oo adeegsanaya macluumaad farsamo ayaa muhiim u ah sababtoo ah, marka aan soo bandhigi doono, macluumaadka gargaarka ah waxay muhiim u tahay sameynta qiyaasaha tijaabooyinka itimaalka ee leh jawaab-celin aan ka jawaab celin iyo shay aan ka dhicin.
Mid ka mid ah farsamada caamka ah ee isticmaalka macluumaadka gargaarka ah waa dib u dhigis . Ka dhig, tusaale ahaan, in cilmi baaruhu uu ogaado tirada raga iyo dumarka mid kasta oo ka mid ah 50 dawladood; waxaynu u sheegi karnaa tirada kooxdan sida \(N_1, N_2, \ldots, N_{100}\) . Si loo soo ururiyo xogtan sirta ah, cilmi-baaruhu wuxuu u qaybin karaa qaybaha kooxo \(H\) koox (xaaladdan 100), qiyaas kasta u qoondeeya koox kasta, ka dibna samee celcelis culeys leh oo kooxdani ka dhigan tahay:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Qiyaas ahaan, qiyaasaha eq. 3.5 waxay u badan tahay inay saxsan tahay sababtoo ah waxay isticmaashaa macluumaadka dadweynaha ee la \(N_h\) - qiyaasta saxda ah haddii tijaabada aan ku dhicin in la doorto. Mid ka mid ah habka aad uga fekereyso waxa weeye in dib-u-dhiska ka dib uu u dhigmaa qiyaasta qaabaynta ka dib marka xogta hore loo soo ururiyey.
Gebogebada, qaybtan ayaa ku qeexday naqshado dhowr ah: Sampling random sampling iyada oo aan beddelayn, samaynta habdhaqanka sinnaan la'aanta, iyo qalloocinta tijaabada. Waxay sidoo kale ku qeexday laba fikradood oo muhiim ah oo ku saabsan qiyaasta: qiyaasaha Horvitz-Thompson iyo dib u dhiska. Si aad u qeexdo qeexida rasmiga ah ee naqshadaynta tijaabada ah, fiiri cutubka 2aad ee Särndal, Swensson, and Wretman (2003) . Si daaweyn rasmi ah oo dhammeystiran oo tijaabo ah oo loo qaabeeyey, fiiri qaybta 3.7 ee Särndal, Swensson, and Wretman (2003) . Faahfaahin farsamo ee qiyaasaha Horvitz-Thompson, eeg Horvitz and Thompson (1952) , Overton and Stehman (1995) , ama qeybta 2.8 ee @ sarndal_model_2003. Si daaweyn rasmi ah ee dib loo dhigo, arag Holt and Smith (1979) , Smith (1991) , Little (1993) , ama qaybta 7.6 ee Särndal, Swensson, and Wretman (2003) .
Saacad-qaadidda tijaabinta iyadoo aan wax jawaab ah bixin
Ku dhawaad dhammaan baaritaanada dhabta ah waxay leeyihiin jawaab aan sal lahayn; taas oo ah, qof kasta oo ka mid ah dadku muujiin su'aal kasta. Waxaa jira laba nooc oo ah noocyada ugu muhiimsan ee jawaabcelin la'aanta: sheyga jawaabcelin la'aanta iyo cutubka aan jawaab celinta ahayn . Qeyb ka mid ah jawaabcelinta jawaabcelinta, jawaabeyaasha qaarkood ma ka jawaabaan waxyaabaha qaarkood (tusaale ahaan, mararka qaar jawaab bixiyeyaashu ma rabaan inay ka jawaabaan su'aalaha ay u arkaan xasaasiyad). Qaybta aan jawaab celinta ahayn, dadka qaarkiis ee loo doorto muunada muunada ah kama jawaabaan baaritaanka. Labada sababood ee ugu badan ee jawaab-celinta unugga ayaa ah in qofka aan la baarin karin lala xiriiri karo qofkii tusaalaha la soo xiriiray laakiin uu diido inuu kaqeybqaato. Qaybtani, waxaan diiradda saari doonaa cutubka aan jawaab celinta ahayn; akhristayaasha xiiseynaya qodobka jawaab celin la'aanta waa in ay arkaan Little iyo Rubin (2002) .
Cilmi-baadhayaashu waxay inta badan ka fikiraan baaritaano la xiriira unugta aan jawaab-celin ahayn sida habka qayb-qaadashada laba-marxaladood. Marxaladda koowaad, cilmi-baaruhu wuxuu doortaa maaddo \(s\) sida qof kasta uu leeyahay suurtogalnimada in lagu daro \(\pi_i\) (halka \(0 < \pi_i \leq 1\) ). Kadib, marxaladda labaad, dadka lagu doorto maaddo waxay ka jawaabaan suurtagalnimada \(\phi_i\) (meesha \(0 < \phi_i \leq 1\) ). Qaab-hawleedka laba-marxaladani waxay natiijooyinka ugu dambeysa ee jawaab-celiyeyaashu \(r\) Farqi weyn oo u dhexeeya labadan heer ayaa ah in cilmi-baarayaashu ay xakameyaan habka loo dooranayo saamiga, laakiin ma ayan xakameynin kuwa ka mid ah kuwa la baaray ee noqda jawaab celin. Isku-duwashada labadaas hab-raaca, waxay u badan tahay in qofku uu noqon doono jawaab celiye
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Si aan u fududeyno, waxaan tixgelin doonaa kiiska naqshadeynta asalka ah ee tijaabada asaasiga ah aan la bedelin. Haddii cilmi-dooran uu doorto miisaanka cabbirka \(n_s\) ee keena \(n_r\) jawaabaha, iyo haddii cilmi- \(n_r\) jawaab-celin mana isticmaali karo celceliska jawaab-celiyeyaasha, markaa qiyaasta qiyaasta waxay noqon doontaa:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
halkaa \(cor(\phi, y)\) xidhiidhka dadwaynaha ee dhexdhexaadka ah ee u dhaxeeya jawaab celinta iyo natiijada (tusaale ahaan, xaaladda shaqo la'aanta), \(S(y)\) waa isbedelka tirada dadka ee natiijada (tusaale, shaqo la'aanta \(S(\phi)\) waa isbedelka qiyaasta dadweynaha ee macaamiisha jawaabta, iyo \(\bar{\phi}\) waa macnaha (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) celinta dadka (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7 waxay muujinaysaa in jawaab-celin aan la soo saarin aysan soo bandhigi doonin xag-jirnimo haddii mid ka mid ah shuruudaha soo socda la buuxiyo:
Nasiib darro, xaaladahan midkoodna uma muuqdaan. Waxay u muuqataa inaan la aqbali Karin inaysan jirin isbeddel xaalad shaqo ama in aysan jirin wax isbeddel ah oo ku imanaya qaababka jawaabta. Sidaas darteed, ereyga muhiimka ah ee eq. 3.7 waa xidhiidhka: \(cor(\phi, y)\) . Tusaale ahaan, haddii dadka shaqo la'aanta ah ay u badan tahay inay wax ka qabtaan, markaa qiimaha shaqada ee la qiyaasi doono ayaa sare u kacaya.
Hadafka lagu sameeyo qiyaasta marka aysan jirin jawaabcelin waa in la isticmaalo macluumaad faahfaahsan. Tusaale ahaan, hal waddo oo aad isticmaali karto macluumaad farsamaysan waa dib u dhigid (dib u fiiri qiyaasta 3.5 ka kor). Waxaa soo baxday in khilaafka qeexida qiyaasaha ka dambeeya uu yahay:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
halkaas \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , iyo \(\bar{\phi}^{(h)}\) waxaa lagu qeexay sida kor ku xusan, laakiin waxay ku xaddidan tahay dadka ku jira kooxda \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Sidaas awgeed, guud ahaan mamnuucistu way yar yahiin haddii foorishada koox kasta oo ka dambeeya ay ka yar tahay. Waxaa jira laba siyaabood oo aan jeclaan lahaa in aan ka fekero ku samaynta kooxo yar-yar ee koox kasta oo dib u dhigis ah. Marka hore, waxaad rabtaa inaad isku daydo inaad sameysid kooxo isku dhafan oo ah halka ay jirto kala duwanaansho yaraanta jawaab celinta ( \(S(\phi)^{(h)} \approx 0\) ) iyo natiijada ( \(S(y)^{(h)} \approx 0\) ). Marka labaad, waxaad rabtaa inaad sameysid kooxo halka dadka aad arkeysid ay la mid yihiin dadka aadan arkeynin ( \(cor(\phi, y)^{(h)} \approx 0\) ). Isbarbar dhigista eq. 3.7 iyo eq. 3.8 waxay kaa caawineysaa in la caddeeyo marka goosashadu dib u dhigi karto yareyn kara qaylada sababtoo ah jawaab la'aan.
Gebogebada, qaybtan ayaa bixisay qaab loogu talagalay sameynta saami-celinta iyada oo aan wax jawaab ah lagusoo bandhigin oo muujinaysa khiyaaliinta in jawaab-celin la'aanta ay soo bandhigi karto labadaba iyadoon la samaynin iyo dib-u-hagaajinta dib-u-dhiska. Bethlehem (1988) wuxuu bixiyaa kala-soocidda khalkhalka oo sababay waxyaabo aan loo baahneyn oo loogu talagalay naqshadaynta guud ee tijaabada. Wixii faahfaahin dheeraad ah ee ku saabsan isticmaalka dib u dhigista si aad u hagaajisid jawaab celinta, fiiri Smith (1991) iyo Gelman and Carlin (2002) . Qalabaynta ka dib waa qayb ka mid ah qoyska farsamooyinka guud ee lagu magacaabo qiyaasaha qiyaasaha, fiiri Zhang (2000) daaweynta dhererka dhererka iyo Särndal and Lundström (2005) si loogu daaweeyo muddada dheer. Wixii dheeraad ah ee hababka kale ee miisaaman ee loogu talagalay dib-u-habeyn la'aanta jawaab-celinta, fiiri Kalton and Flores-Cervantes (2003) , Brick (2013) , iyo Särndal and Lundström (2005) .
Saamaynta aan la ixtiraameynin
Saamaynta aan la ixtiraameynin waxaa ka mid ah noocyo badan oo kala duwan (Baker et al. 2013) . Fiirinta gaar ahaan shaxda dadka isticmaala Xbox ee ay wadaagaan Wang iyo asxaabta (W. Wang et al. 2015) , waxaad ka fakari kartaa nooca noocaas ah mid ka mid ah qaybta ugu muhiimsan ee naqshadaynta tijaabada aan ahayn \(\pi_i\) ( cilmi-baaristu-u-qaadista suurogalnimada ah ee isku-darid) laakiin waa \(\phi_i\) (jawaab-celinta jawaab-celinta jawaab-celinta). Dabcan, tani maahan habboon sababtoo ah \(\phi_i\) lama garanayo. Laakiin, sida Wang iyo asxaabtooyu muujiyeen, noocan oo kale ah ee tijaabada ah-xataa xitaa sheyga samaynta oo leh khaladaad ciriiri ah oo baahsan-uma baahnin in ay noqoto mid cilad-darro ah haddii cilmi-baaruhu uu hayo macluumaad wanaagsan oo wanaagsan iyo habka wanaagsan ee xisaabinta si loo xisaabiyo dhibaatooyinkaas.
Bethlehem (2010) waxay ku fidisaa qaar badan oo ka mid ah qodobbada kor ku xusan ee ku saabsan dib-u-dhigidda si ay ugu jiraan labadaba jawaab-celinta iyo khaladaadka caymiska. Marka laga soo tago dib u dhigista, farsamooyinka kale ee lagu shaqeynayo shaybaarro aan dhici (Ansolabehere and Rivers 2013; ??? ) shaybaarka ixtimaalka ee khaladaadka caynsanaanta iyo jawaab celin la'aanta-ku (Ansolabehere and Rivers 2013; ??? ) saamiga (Ansolabehere and Rivers 2013; ??? ) , miisaanka miisaan ahaaneed (Lee 2006; Schonlau et al. 2009) , iyo kalibration (Lee and Valliant 2009) . Mid ka mid ah mawduuc guud oo ka mid ah farsamooyinkan waa isticmaalka macluumaadka caawinta.