Hauv tsab ntawv no, kuv yuav qhia txog qee cov tswv yim ntawm tshooj me ntsis hauv daim ntawv me me. Lub hom phiaj ntawm no yog los pab kom koj xis nrog lub cim thiab lej los siv los ntawm cov neeg tshawb fawb soj ntsuam kom koj hloov tau rau qee cov ntaub ntawv tshaj tawm sau rau cov ncauj lus no. Kuv yuav pib los ntawm qhov qhia txog qhov yuav tshwm sim, tom qab ntawd yuav tsiv mus rau qhov tshwm sim ntawm qhov tsis muaj tseeb, thiab thaum kawg, tsis muaj kev txwv qiv.
Probability sampling
Ua ib qho piv txwv, cia peb xav txog lub hom phiaj ntawm kwv yees qhov kev poob hauj lwm hauv Tebchaws Meskas. Cia \(U = \{1, \ldots, k, \ldots, N\}\) cov phiaj pejxeem thiab cia \(y_k\) los ntawm tus nqi ntawm qhov txawv ntawm qhov txawv ntawm tus neeg \(k\) . Hauv no piv txwv \(y_k\) yog seb tus neeg \(k\) yog poob hauj lwm. Thaum kawg, cia \(F = \{1, \ldots, k, \ldots, N\}\) yog cov ncej pejxeem, uas rau lub hom phiaj ntawm simplicity yog assumed yuav tsum tau tib yam li cov phiaj pejxeem.
Ib qho qauv tsim qauv yog yooj yim random sampling tsis hloov. Hauv qhov no, txhua tus neeg yuav tsum sib npaug nrog cov qauv \(s = \{1, \ldots, i, \ldots, n\}\) . Thaum cov ntaub ntawv muab khaws cia nrog qhov qauv tsim no, ib tug neeg tshawb xyuas yuav kwv yees qhov nyiaj poob hauj lwm ntawm cov neeg ua hauj lwm nrog cov qauv txhais tau tias:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
qhov twg \(\bar{y}\) yog qhov nyiaj poob hauj lwm hauv cov pejxeem thiab \(\hat{\bar{y}}\) yog qhov kwv yees ntawm cov nyiaj poob hauj lwm (lub \(\hat{ }\) yog feem ntau siv los qhia tus kwv yees).
Nyob hauv kev tseeb, cov kws tshawb fawb tsis tshua siv yooj yim random sampling yam tsis hloov. Vim muaj ntau yam (ib qho ntawm kuv yuav piav qhia hauv ib pliag), cov neeg tshawb xyuas feem ntau tsim cov qauv nrog cov tsis muaj txiaj ntsig ntawm cov menyuamuas. Piv txwv, cov kws tshawb nrhiav yuav xaiv cov neeg nyob hauv Florida nrog ntau dua qhov muaj feem cuam tshuam nrog cov neeg hauv California. Hauv qhov no, cov qauv txhais tau tias (piv txwv 3.1) yuav tsis yog tus paub kwv yees zoo. Xwb, thaum muaj qhov tsis zoo ntawm kev xam nrog, cov kws tshawb fawb siv
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
qhov twg \(\hat{\bar{y}}\) yog qhov kwv yees ntawm kev poob hauj lwm thiab \(\pi_i\) yog tus neeg \(i\) qhov yuav tshwm ntawm cov menyuamuas. Ua raws li kev xyaum, Kuv mam li hu tus kwv yees hauv eq. 3.2 qhov kev kwv yees Horvitz-Thompson. Cov kev ntsuas Horvitz-Thompson yog qhov tseem ceeb heev vim tias nws ua rau kev kwv yees ncaj ncees rau txhua qhov kev tsim qauv tsim (Horvitz and Thompson 1952) . Vim tias qhov kev ntsuas Horvitz-Thompson los txog li niaj zaus, nws yog ib qho zoo uas yuav tau pom tias nws tuaj yeem rov sau dua
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
qhov twg \(w_i = 1 / \pi_i\) . Raws li eq. 3.3 Tshawb fawb, qhov kev kwv yees Horvitz-Thompson yog qhov hnyav hnyav uas txhais tau hais tias qhov luj yog qhov cuam tshuam txog qhov yuav tau xaiv. Hauv lwm cov ntsiab lus, qhov tsawg dua tus neeg yuav tsum tau muab tso rau hauv tus qauv, qhov hnyav dua uas tus neeg yuav tsum tau txais hauv qhov kwv yees.
Raws li tau piav qhia ua ntej, cov neeg tshawb nrhiav feem ntau ua rau cov tib neeg tsis muaj txiaj ntsim ntawm kev nkag rau hauv. Ib qho piv txwv ntawm cov qauv tsim muaj peev xwm ua rau tsis muaj txiaj ntsig ntawm kev xam nrog rau yog cov qauv qis , uas yog qhov tseem ceeb los nkag siab vim tias nws muaj kev txheeb ze rau txoj cai kwv yees hu ua post-stratification . Hauv kev ua qauv zoo, tus kws tshawb fawb faib cov pej xeem rau hauv \(H\) kom haum thiab ua pab pawg. Cov pawg no yog hu ua strata thiab qhia tau tias \(U_1, \ldots, U_h, \ldots, U_H\) . Hauv qhov ua piv txwv no, cov strata yog cov xeev. Qhov loj me ntawm cov pawg raug qhia \(N_1, \ldots, N_h, \ldots, N_H\) . Tus kws tshawb fawb yuav xav siv cov qauv qis qis dua kom paub tseeb tias nws muaj cov neeg txaus hauv txhua lub xeev los ua qhov ntsuas kev poob hauj lwm hauv xeev.
Thaum cov pejxeem tau faib ua txoj hlua , xav tias tus neeg tshawb nrhiav xaiv ib qho yooj yim random qauv tsis hloov ntawm me me \(n_h\) , ntawm nws tus kheej ntawm txhua tus qauv. Tsis tas li ntawd, xav tias txhua tus uas raug xaiv hauv tus qauv ua tus neeg teb (Kuv mam li kho tsis tau cov lus teb rau ntu txuas ntxiv). Hauv qhov no, qhov yuav tshwm ntawm kev xam nrog yog
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Vim tias qhov tshwm sim no sib txawv ntawm ib tus neeg mus rau ib tus neeg, thaum ua qhov kev ntsuas los ntawm qhov kev tsim qauv no, cov neeg tshawb nrhiav yuav tsum muaj qhov hnyav rau txhua tus neeg teb los ntawm qhov lawv tsis muaj feem cuam tshuam ntawm Horvitz-Thompson tus kws ntsuas (nqe 3.2).
Txawm hais tias qhov kev ntsuas Horvitz-Thompson tsis yog kev txiav txim siab, cov neeg tshawb nrhiav tau tsim muaj tseeb (piv txwv tias, txo qis tshaj) kwv yees los ntawm kev muab cov qauv nrog cov ntaub ntawv pab txhawb . Qee leej neeg pom nws tsimnyog tias qhov no yog qhov tseeb txawm tias thaum muaj qhov ua tau zoo tshaj plaws yog qhov sampling. Cov tswv yim no uas siv cov ntaub ntawv pabcuam yog qhov tseemceeb tshwjxeeb vim tias, kuv yuav qhia tom qab, cov ntaub ntawv pabcuam yog qhov tseemceeb rau kev sojntsuam los ntawm cov qauv qee zaum uas tsis muaj cov lus nug thiab cov uas tsis muaj kev vam meej.
Ib qho txheej txheem rau kev siv cov ntaub ntawv pab yog tom qab stratification . Xav txog, piv txwv, tias ib tug neeg tshawb nrhiav paub tus naj npawb ntawm cov txiv neej thiab poj niam hauv txhua ntawm 50 lub xeev; peb tuaj yeem pom cov pawg tsawg tsawg li no \(N_1, N_2, \ldots, N_{100}\) . Txhawm rau muab cov ntaub ntawv no tso nrog tus qauv, tus kws tshawb fawb tau faib cov qauv ua ke rau pawg \(H\) pawg (hauv qhov no 100), ua ib qho kev kwv yees rau txhua pab pawg, thiab tsim qhov nruab nrab ntawm cov pawg no txhais tias:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Roughly, tus kwv yees hauv eq. 3.5 yog qhov zoo tshaj vim tias nws siv cov ntaub ntawv pej xeem paub-qhov \(N_h\) -yog kwv yees kwv yees yog tias ib qho qauv coj ua tsis zoo yuav raug xaiv. Ib txoj kev xav txog nws yog qhov post-stratification zoo ib yam li approximating stratification tom qab cov ntaub ntawv twb tau sau.
Hauv qab no, tshooj no tau piav txog ob peb qhov qauv tsim: qhov yooj yim random sampling yam tsis muaj kev hloov, piv nrog qhov tsis zoo, thiab sampling qauv. Nws kuj tau piav txog ob lub tswv yim tseem ceeb txog kev kwv yees: tus txheeb xyuas Horvitz-Thompson thiab tom qab stratification. Yog xav paub ntxiv txog cov qauv kev tsim qauv, saib tshooj 2 ntawm Särndal, Swensson, and Wretman (2003) . Rau kev kho mob ntxiv ntawm kev soj ntsuam, saib sab 3.7 ntawm Särndal, Swensson, and Wretman (2003) . Rau kev piav qhia txog cov cuab yeej ntawm Horvitz-Thompson, xam Horvitz and Thompson (1952) , Overton and Stehman (1995) , los yog ntu 2.8 ntawm @ sarndal_model_2003. Rau kev kho mob ntxiv tom qab stratification, saib Holt and Smith (1979) , Smith (1991) , Little (1993) , los yog seem 7.6 ntawm Särndal, Swensson, and Wretman (2003) .
Kev muaj peev xwm ua piv txwv nrog cov lus qhia tsis suav
Yuav luag tag nrho cov ntawv tshawb fawb tiag tiag tsis muaj lus nug; uas yog, tsis yog txhua tus neeg hauv cov qauv pejxeem teb txhua lo lus nug. Nws muaj ob hom ntsiab lus ntawm kev tsis koom: cov ntsiab lus tsis muab xa tawm thiab tsev neeg tsis tuaj yeem hais lus . Hauv cov lus tsis sau ua ntaub ntawv, qee cov neeg teb tsis teb cov khoom (piv txwv li, qee zaum cov neeg teb tuaj tsis xav teb cov lus nug uas lawv xav tau). Hauv ib lub tsev hais plaub, ib txhia neeg uas raug xaiv rau cov qauv pej xeem tsis teb rau daim ntawv tshawb fawb txhua. Qhov ob feem ntau yog vim li cas ho tsis tuaj yeem hais tias tus neeg tsis tuaj yeem hu tsis tau thiab tus neeg raug xa mus cuag tab sis tsis kam koom nrog. Hauv tshooj no, kuv yuav tsom ncaj qha rau cov lus nug hauv tsev; Cov neeg nyiam nyeem ntawv tsis xav ua lus nug yuav tsum pom Little thiab Rubin (2002) .
Cov neeg tshawb nrhiav feem ntau xav txog kev tshawb fawb nrog chav tsev uas tsis teb raws li txheej txheem ob-theem. Hauv thawj theem, tus neeg tshawb nrhiav xaiv tus qauv \(s\) xws tias txhua tus neeg muaj qhov yuav tshwm ntawm kev xam nrog \(\pi_i\) (qhov twg \(0 < \pi_i \leq 1\) ). Tom qab ntawd, nyob rau theem ob, cov neeg uas raug xaiv los ua tus qauv ua ke nrog qhov muaj tseeb \(\phi_i\) (qhov twg \(0 < \phi_i \leq 1\) ). Qhov txheej txheem ob theem no tau tshwm sim nyob rau hauv cov txheej txheem zaum kawg \(r\) . Ib qho tseem ceeb sib txawv ntawm cov theem ob yog tias cov neeg tshawb xyuas tswj cov txheej txheem xaiv cov qauv, tab sis lawv tsis tswj cov neeg uas tau kuaj los ua cov neeg teb. Muab cov txheej txheem ob los ua ke, qhov tshwm sim uas ib tus neeg yuav yog tus neeg teb tuaj
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
For the sake of simplicity, Kuv mam li xav txog cov ntaub ntawv qhov twg tus thawj qauv tsim yog yooj yim random sampling tsis hloov. Yog tias tus neeg tshawb nrhiav xaiv tus qauv ntawm qhov loj \(n_s\) uas yields \(n_r\) neeg teb, thiab yog tus neeg tshawb xyuas ignores non-response thiab siv cov lus teb ntawm cov neeg tuaj teb, ces qhov kev tsis haum siab yuav:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
\(cor(\phi, y)\) yog qhov kev sib txheeb ntawm cov pejxeem ntawm cov lus teb thiab qhov tshwm sim (piv txwv li, kev poob haujlwm), \(S(y)\) yog qhov txawv ntawm pejxeem ntawm qhov kev ua tiav (piv txwv li, kev poob hauj lwm (feem pua), \(S(\phi)\) yog pej xeem sib txawv ntawm cov lus teb, thiab \(\bar{\phi}\) yog pejxeem txhais cov lus teb (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7 qhia tau hais tias tsis yog lub ntsiab lus tsis qhia yuav tsis qhia kev tawm tsam yog tias ib qho ntawm cov hauv qab no tau ua tiav:
Hmoov tsis, tsis muaj ib yam ntawm cov kev mob no zoo nkaus li. Nws zoo li tsis paub tias yuav tsis muaj kev hloov hauv kev ua haujlwm lossis tsis muaj qhov hloov ntawm cov lus teb. Yog li, lub ntsiab lus tseem ceeb hauv eq. 3.7 yog qhov sib txheeb sib txuas: \(cor(\phi, y)\) . Piv txwv, yog hais tias cov neeg uas tsis muaj hauj lwm ntau dua yuav teb, ces cov nyiaj tau los ua hauj lwm yuav nce siab dua.
Tus tswv yim tsim los ua kev kwv yees thaum tsis muaj lus nug yog siv cov ntaub ntawv pab cuam. Piv txwv, ib txoj hauv kev uas koj tuaj yeem siv cov ntaub ntawv pabcuam yog tom qab stratification (nco qab txog qis tshaj 3.5 los saum toj no). Nws hloov tawm hais tias kev tsis ncaj ncees ntawm qhov kev soj ntsuam tom qab-yog qhov:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
\(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , \(\bar{\phi}^{(h)}\) yog txhais raws li saum toj no, tiam sis txwv rau cov neeg hauv pab pawg \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Yog li, txhua qhov kev tsis txaus siab yuav yog me me yog tias kev tsis ncaj ncees hauv txhua tus neeg tau txais kev pabcuam tom qab yog tsawg. Muaj ob txoj hauv kev uas kuv nyiam xav txog kev ua kom muaj kev sib thooj me me hauv txhua pawg neeg tom qab. Ua ntej, koj xav sim ua hom pawg homogeneous qhov twg muaj qhov txawv me ntsis hauv qhov kev sib txuas lus teb ( \(S(\phi)^{(h)} \approx 0\) ) thiab qhov tshwm sim ( \(S(y)^{(h)} \approx 0\) ). Qhov thib ob, koj xav ua ib pawg twg cov neeg koj pom yog zoo li cov neeg uas koj tsis pom ( \(cor(\phi, y)^{(h)} \approx 0\) ). Sib piv eq. 3.7 thiab eq. 3.8 pab qhia ntxiv thaum thaij-stratification tuaj yeem txo qhov kev tuaj yeem tshwm sim los ntawm kev tsis qhib lus.
Qhov xaus, nqe lus no tau muab ib qho qauv rau kev sib tw piv nrog qhov tsis teb thiab qhia txog kev tsis ncaj ncees uas tsis muaj leej twg xa tuaj yeem qhia ob leeg tsis muaj thiab nrog kev hloov kho tom qab. Bethlehem (1988) muaj kev sib haum xeeb ntawm kev tsim txom vim los ntawm nonresponse rau kev tsim qauv dav dav ntxiv. Yog xav paub ntau tshaj ntxiv rau kev siv txoj haujlwm tom qab lawb ntawv los kho cov lus qhib, saib Smith (1991) thiab Gelman and Carlin (2002) . Tom qab-stratification yog ib feem ntawm tsev neeg ntawm kev paub ntau hu ua calibration estimators, saib Zhang (2000) rau kev kho mob ntev ntev thiab Särndal and Lundström (2005) rau kev kho mob ntev phau ntawv. Xav paub ntxiv txog lwm txoj kev hnyav rau kev kho kom tsis pub dhau, saib Kalton and Flores-Cervantes (2003) , Brick (2013) , thiab Särndal and Lundström (2005) .
Cov tsis muaj kev txwv qiv
Cov tsis muaj kev txwv qee yam muaj xws li ntau yam kev tsim qauv (Baker et al. 2013) . Tsom ntsoov rau ntawm tus qauv ntawm Xbox cov neeg siv los ntawm Wang thiab cov npoj yaig (W. Wang et al. 2015) , koj tuaj yeem xav tias cov qauv ntawm cov qauv no yog qhov uas qhov tseem ceeb ntawm tus qauv tsim tsis yog qhov \(\pi_i\) ( tus neeg tshawb nrhiav-uas muaj peev xwm ua rau ntawm Txuas) tab sis tus \(\phi_i\) (tus cev lus teb rau cov lus teb). Teb zoo! Lus hauv no teb Lawm, qhov no tsis zoo tagnrho vim hais tias cov \(\phi_i\) yog tsis paub. Tab sis, raws li Wang thiab cov npoj yaig cov tsom, qhov hom kev xaiv ntawm no-txawm yog los ntawm ib qho qauv ntawm qhov kev pabcuam yuam kev-tsis tas yuav muaj kev puas tsuaj yog tias tus neeg tshawb xyuas muaj cov ntaub ntawv zoo thiab cov qauv zoo rau nyiaj rau cov teebmeem no.
Bethlehem (2010) muab ntau yam ntawm cov khoom xyaw saum toj hais txog qhov kev lag luam tawm tom qab kom muaj ob qho kev tsis sib txuas lus thiab kev ua yuam kev. Ntxiv nrog rau kev tawm qauv, lwm cov tswv yim rau kev ua hauj lwm nrog cov qauv tsis muaj kev txwv-thiab kev sib tw ua piv txwv nrog cov kev pab them nqi kho mob thiab kev tsis suav cov qauv-piv txwv (Ansolabehere and Rivers 2013; ??? ) , qhab-nees qhov hnyav (Lee 2006; Schonlau et al. 2009) , thiab calibration (Lee and Valliant 2009) . Ib qho ntsiab lus ntawm cov tswv yim no yog kev siv cov ntaub ntawv ntiag tug.