Di vê dezgehan de, ez ê hin fikrên ji beşa piçûktirek formek mathematîkî binirxîne. Armanca vê armanca ku hûn bi bi rexnekirin û çarçoveya mathematîkî re ji hêla lêkolînerên lêkolîneran ve tê bikaranîn da ku hûn di van mijaran de nivîsînek hin tiştên din ên teknîkî bêne çêkirin. Ez ê ji hêla pêvajoya nimûneya pêvajoyê ve tê destpêkirin, paşê bi hûrgelan re mimkunek bi neferansî re bigihîne, û dawiyê, nimûne nehêle.
Nimûne dabeşkirin
Wek mînak mînakek bisekin, em armanca wê armanca rêjeya rêjeya bêkariyê li Dewletên Yekbûyî bifikirin. Bila \(U = \{1, \ldots, k, \ldots, N\}\) nifûsa hedef be û bila \(y_k\) bi nirxa encama encamê ji bo kesê \(k\) . Di vê nimûne \(y_k\) ye ka kîjan kes \(k\) ne bêkar e. Di dawiyê de, bila \(F = \{1, \ldots, k, \ldots, N\}\) be ku mirovên çarçoveyê bibin, ji bo ku ji bo riya hêsantir wekhevî wek wekheviya hedef be.
Pêşniyarek nimûne ya nimûne bêyî sepandinek hêsan e ku bêyî guhertin. Di vê rewşê de, her kes wekhev e ku di nimûnerê \(s = \{1, \ldots, i, \ldots, n\}\) . Dema ku danûstandinên bi dîzmûriya vê samplingê têne damezirandin, lêkolîner dikarin nirxandina nifûsa bêkariyê bi nimûne wateya nirxandin:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
Gava \(\bar{y}\) nifûsa bêkariyê ye û \(\hat{\bar{y}}\) nirxa nirxa rêjeya betaliyê (ya \(\hat{ }\) tê bikaranîn ku nimûne an estimator).
Di rastiyê de, lêkolîner kêm caran bêyî sefandinên hêsantir bikar tînin. Ji bo celeb sedemên (yek ji kîjan ez di demekê de binihêrim), lêkolîner caran gelek bi hûrgelên nehevalî yên tevlêbûnê pêk tê. Ji bo nimûne, lêkolîner dikarin mirovên li Floridaê bi zêdebûna tevlêbûna tevlêbûna mirovên ji Kîlîtayê re bijartin. Di vê rewşê de, nimûne wateya (eq. 3.1.) Dibe ku texmînek baş nabe. Di şûna de, gava ku derfetên nerazîbûnê nebin, lêkolîner bikar tînin
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
Gava ku \(\hat{\bar{y}}\) \(\pi_i\) rêjeya bêkariyê û \(\pi_i\) kesek e \(i\) heye. Li gorî pratîka standard, ez ê estimator eq li eq. 3.2 estimatorê Horvitz-Thompson. Estimator-Horvitz-Thompson pir baş e ku ji ber nimûne nimûne nimûne ya nimûne (Horvitz and Thompson 1952) hemî (Horvitz and Thompson 1952) nirxên bêbawer dibe. Ji ber ku estimatorê Horvitz-Thompson pir caran gelek caran tête, ew e ku alîkarî ku ew dikare bi re-nivîsîn
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
cihê \(w_i = 1 / \pi_i\) . Wek eq 3.3 nîşan dide, estimatorê Horvitz-Thompson nimûne pîvanek giran e ku wateya ku şevên bi veguhestina pêkanîna hilbijartinê ve girêdayî ye. Bi awayekî din, dibe ku kesek kêmtir e ku di nav nimûne, bêtir giraniya ku mirov divê bi texmînan bigirin.
Wekî ku berî gotinê, lêkolîneran pir caran mirovên ku bi hûrgelên unequal ên tevlêbûna tevlîhev dikin dikin. Yek ji mînaka design ku dikare ji bo hember newekhevîya qaîl rê mînakan tewqtewqî, ku girîng e ku fêm bikin, ji ber ku ji nêz ve bi prosedûra estimation ya bi navê post-asûna related e. Li ser sampled stratified, lêkolînerê nifûsa target target veguherîne \(H\) komên bi taybetî û komên paqij. Ev komên strata tê gotin û wekî \(U_1, \ldots, U_h, \ldots, U_H\) . Di vê nimûne de, strata dewletan ne. \(N_1, \ldots, N_h, \ldots, N_H\) komên wekî \(N_1, \ldots, N_h, \ldots, N_H\) têne nîşankirin. Lêkolînerê dibe ku dixwaze ku ji bo her dewleta ku ji bo asta asta betaliyê ya dewleta dewletê çêbikin, ji bo ku ji bo ku hebûna wê tête pejirandin, tedbîrên stratkirî bikar bînin.
Gava ku nifûsa veşartî di strata deverê de , wisa difikire ku lêkolînerê bêyî \(n_h\) , bi serbixwe her \(n_h\) . Wekî din, bisekinin ku her kes di nav nimûne hilbijarte bersiv e, (Ez ê di beşa paşê de bersivê ne bersiv bide). Di vê rewşê de, derfeta tevlêbûnê ye
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Ji ber ku ev pêbawer dikarin ji kesê kesê re cûda dibe, dema ku nirxandina vê pîşesaziya vê samplingê, lêkolîner divê hewce dikin ku her bersivker ji hêla veguhestina wan vebûna tevlêkirina bikaranîna Horvitz-Thompson estimator (eq. 3.2).
Tevî ku estimatorê Horvitz-Thompson ne bi awayek e, lêkolîner dikarin dikarin texmînkirina bi mînakek bi rexneyek zûtir rastîn (hilberînek kêmtir) hilberînin. Hinek kes şaş dikin ku ev jî rast e ku çiqas hebûna nimûne ya tamperestî bi temam kirine rast e. Ev teknolojiyên karanîna karanîna karûbarê alîkarî bi taybetî girîng in, ji ber ku ez ê paşê nîşanî, agahdariya alîkarî girîng e ku ji bo nimûneyên hûrgelan û nerazîbûna nerazîbûnên nimûneyên nimûne yên nimûneyên nimûne.
Yek ji teknîkî gelemperî ji bo bikaranîna agahdariya alîkarî ye piştî post-stratification . Bifikirin, ji bo nimûne, ku lêkolînerê hejmarek jinên 50-dewletan de hejmarek mêr û jinan dizane; Em dikarin sîteyên van \(N_1, N_2, \ldots, N_{100}\) ku \(N_1, N_2, \ldots, N_{100}\) . Ji bo agahdariya vê alîkariyê bi tevlîhevkirina hevkariyê re, lêkolîner dikare tevlîhevên \(H\) komên (100 di vê rewşê de) parve bikin.
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Heya, estimator eq e. 3.5 dibe ku bêtir rast e ku ji ber agahdariya nifûsa naskirî tê bikaranîn- \(N_h\) nirxên rastîn heger hebek nimûne bête hilbijartin. Wê awayê ku ji bo ramana wê de ye ku piştî post-stratejiyê piştî ku danûstandinên danûstandinan têne şandin, stratejîk nêzîk e.
Di encamê de, ev beşek çend designên nimûneyên şêlan diyar kirin: nimûneyên bêhnav ên bêyî ku veguhastin, nimûne bi nimûne neyekhevî, û nimûneyên stratified. Her weha du fikrên sereke di derbarê estimasyonê de tê gotin: Hêza Horvitz-Thompson û piştî post-stratification. Ji bo Särndal, Swensson, and Wretman (2003) nimûneyên nimûne yên nimûne yên Särndal, Swensson, and Wretman (2003) ji bo Särndal, Swensson, and Wretman (2003) beşa duyemîn binêrin. Ji bo tedbîrên tedawî û temamî yên tedbîrên Särndal, Swensson, and Wretman (2003) beşa 3.7 ya Särndal, Swensson, and Wretman (2003) . Ji bo şirovekirina teknolojiyên Horvitz-Thompson, Horvitz and Thompson (1952) , Overton and Stehman (1995) , an jî beşa 2.8 ya @ sarndal_model_2003. Ji bo tedbîrên piçûktir ên fermî, Holt and Smith (1979) , Smith (1991) , Little (1993) , an Särndal, Swensson, and Wretman (2003) 7.6 ya Särndal, Swensson, and Wretman (2003) .
Nermalbûna pêşniyarê bi neferansê
Bi tevahî lêkolînên rastîn nerazîbûn; Ew e, her kes di nav nimûneyên gelan de her pirsî bersiv dike. Du du celebên neferansî hene: naveroka neferansî û yekîneyên neferansî . Di naverokê de, bersiva hin bersivên hin tiştan bersiv nakin (wek nimûne, carinan bersivkaran naxwazin pirsên ku ew hestyar binirxînin). Di beşa neferansê de, hinek kesên ku ji bo niştecîhên bijartî têne hilbijartin, lêgerîna lêkolînê her tiştî ne. Du sedemên gelemperî ji bo yekîtiyê ne ku ew kes nikare têkiliyek neyê têkilî kirin û kesek nimûne pêwendî peywendî lê belê beşdarî beşdar bibin. Di vê beşê de, ez ê li yekînponse yekem li ser bala xwe bikim; Xwendekarên ku ji ber ku nehêbarkirî nexwazin divê biçûk û Rubin (2002) .
Lêkolîneran pir caran li ser bersivên ku bi yekseriya nimûne pêvajoyek nimûne du-qonaxa nirxandin difikirin. Di qonaxa pêşîn de, lêkolînerê nimûne \(s\) nimûne wekî ku her kes bi derheqê \(\pi_i\) (( \(0 < \pi_i \leq 1\) ). Piştre, di duyemîn duyemîn de, ku kesên di navnîşan de hatine hilbijartin bi probability \(\phi_i\) ( \(0 < \phi_i \leq 1\) bersiva bersivê. Ev encamên du qonaxê di encamên dawî yên bersivên \(r\) . Di navbera her du qonaxên girîng de ev e ku lêkolînerên pêvajoyên hilbijartinê kontrol bikin, lê ew ne kontrol dikin ku ji wan kesên ku têne tevlîhev têne nirxandin. Di van du pêvajoyan de hevgirtin pêk bînin, hebe ku kes dê bersivger be
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Ji bo ji bo simplicity, ez ê ku li ku designa nimûne ya nimûne bêyî şûna nimûneya bîhnfireh a bêyî veguherîn e, bifikirin. Heke lêkolînvanek nimûne nimûne \(n_s\) \(n_r\) , û heger lêkolîner neyek bersiva bersiva bersivên \(n_r\) û bikar tîne, wê hingê nirxên texmîn wê bibe:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
Li vir ku \(cor(\phi, y)\) têkiliya nifşî ya di navbera bersiva pêvajoyê û encam de (nimûne, statuya bêkariyê), \(S(y)\) nifûsa vakslêdanê ya nirxandina standard (mînak, bêkariyê ye) statuya), \(S(\phi)\) nifûsa vakslêdanê ya bersivê standard, û \(\bar{\phi}\) nifûsa bersivê bersiva bersivê ye (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7 nîşan dide ku neresponse dê biasibînin eger yek ji mercên jêrîn peyda bibin:
Mixabin, yek ji van şertên mumkun dibe. Ew xuya dibe ku dibe ku tu cûda nabe ku di warê karkerê karker de hebe an naveroka nerazîbûnê tune. Ji ber vê yekê, termê sereke di eq. 3.7 peywendîdar e: \(cor(\phi, y)\) . Ji bo nimûne, eger mirovên ku bêkariyê bêtir bersiva wan in, wê paşê rêjeya karê karê texmîn wê bi hûrgelan re bibin.
Bêguman ku nirxandina nexşandî ye ku hejmareke agahdariya alîkariyê bikar bînin. Ji bo nimûne, yek awayek ku hûn dikarin agahdariya alîkarî bikar bînin, piştî post-stratification (eşkere bistînin. Ew xuya dike ku ji hêla nirxandina post-stratejîk ve ye:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
ku \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) û \(\bar{\phi}^{(h)}\) ji jorê ve têne diyarkirin, lê di nav komên \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Ji ber vê yekê, alîgirên tevayî dê heke heke ku li grûpa her post-stratejiyê piçûk e. Du awayên ku ez dixwazim li ser ramana piçûk di nav her post-stratasyonê de difikirim. Pêşîn, hûn dixwazin ku hewldanên komên homogeneous ên ku li bersivê pir kêmtir bersiva ( \(S(\phi)^{(h)} \approx 0\) ) û encamê ( \(S(y)^{(h)} \approx 0\) ). Ya duyemîn, hûn dixwazin ku komên ku hûn dibînin ku mirovên ku hûn nebînin mîna mirovên ku hûn nabînin ( \(cor(\phi, y)^{(h)} \approx 0\) ). Eq Comparing 3.7 û eq. 3.8 alîkarî dike ku dema paşdirêjkirina paşdewletî dikare ji hêla neferansê kêmasî bi kêm kêm bikin.
Di encamê de, vê beşê ji bo bersîvkirina nimûne ya nimûne ya nimûne ya nimûne a modela ku pêşkêşkirineke paşdewletî û bêyî peyda-stratîsyonê dikare hemî nîqaş bikin. Bethlehem (1988) ji bo pêşniyarên nimûneyên gelemperî yên bêhtir ji bo nerazîbûnê ji ber ku derfetên berfireh ji bo derheqê berbiçav dike. Ji bo bêtir stratejiya post-stratîkkirina ku ji bo nehêbekirinê veguherîne, Smith (1991) û Gelman and Carlin (2002) . Post-stratification beşek malbata gelemperî ya teknolojî ku bi navê estimatorên kalibrasyonê tê gotin, li Zhang (2000) ji bo dermankirina gotara derman û Särndal and Lundström (2005) ji bo dermankirina pirtûka pirtûkê bibînin. Ji bo bêtir li ser rêbazên nirxandina din ên din ên ji bo neferansê re, hûn Kalton and Flores-Cervantes (2003) , Brick (2013) , û Särndal and Lundström (2005) .
Nimûne nehêlê ne
Nimûne nehêlên ne-nehêl ên celebên celeb ên mezin (Baker et al. 2013) designer (Baker et al. 2013) . Bi taybetî li ser nimûneyên Xbox-ê bikarhênerên Wang û hevalên xwe (W. Wang et al. 2015) , (W. Wang et al. 2015) , hûn dikarin vê ramanê bifikirin ku wekî beşek sereke ya sêwirîna sampling ne ne \(\pi_i\) lêkolîner- \(\phi_i\) tevlêbûna tevlêbûnê) lê \(\phi_i\) (bersivên bersiva bersiva respondent-driven). Bi taybetî, ev idol nayê ku ji \(\phi_i\) ne diyar e. Lê belê, wekî Wang û hevalên xwe nîşanî, ev nimûne nîşana nimûne-her weha ji hêla çewtiyek tedbîra pir bi pirrjimariyek pir giran-hewce nebe-hewce nebe ku eger lêkolîner xwedî agahdariya alîkarî be û modela statîstîkek baş e ku ev pirsgirêkên hesab bide.
Bethlehem (2010) ji piraniya derheqên derheqê li ser stratejiya paşnavê dide ku ji bo çewtiyên nerazîbûn û herduyan şandin. Ji bilî peyda-stratificationê, teknolojiyên din ên ku bi nimûneyên nehêş-ne-anî û -pêşkêşiya nerazîbûnê re bi şaşiyên şert û neferpek-nimûne (Ansolabehere and Rivers 2013; ??? ) , pîvana pîvandinê (Lee 2006; Schonlau et al. 2009) , û calibration (Lee and Valliant 2009) (Lee 2006; Schonlau et al. 2009) û (Lee and Valliant 2009) . Di nav van teknîkî de di mijara hevpeymanek hevpar de agahdariya agahdariya alîkariyê ye.