У овом додатку, неке идеје из поглавља ћу описати у нешто већој математичкој форми. Циљ је да вам помогне да се у потпуности освестиш на математичком оквиру и математичком оквиру које користе истраживачи истраживања, тако да можете прећи на неки од више техничких материјала написаних на овим темама. Почећу са увођењем узорковања вјероватности, а затим прелазим на узорковање вјероватноће са непреспонама, и коначно, узимање узорака без вероватноће.
Узимање узорака вероватноће
Као примјер, размислимо о циљу процјене стопе незапослености у Сједињеним Државама. Нека је \(U = \{1, \ldots, k, \ldots, N\}\) циљна популација и пустите \(y_k\) по вредности варијабле исхода за особу \(k\) . У овом примеру \(y_k\) је ли особа \(k\) незапослена. На крају, дозволите да \(F = \{1, \ldots, k, \ldots, N\}\) буде популација кадрова, која се због једноставности претпоставља да је иста као циљна популација.
Основни дизајн узорка је једноставно случајно узорковање без замене. У овом случају, свака особа је једнако вероватно укључена у узорак \(s = \{1, \ldots, i, \ldots, n\}\) . Када се подаци сакупљају овим дизајном узорка, истраживачи могу проценити стопу незапослености становништва са узорком:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
где је \(\bar{y}\) стопа незапослености у популацији и \(\hat{\bar{y}}\) је процена стопе незапослености ( \(\hat{ }\) је најчешће користи се за означавање процењивача).
У стварности, истраживачи ретко користе једноставно случајно узорковање без замене. Из разних разлога (од којих ћу једнога описати за тренутак), истраживачи често стварају узорке са неједнаким вјероватноћама инклузије. На пример, истраживачи би могли изабрати људе на Флориди са већом вјероватноћом укључивања од људи у Калифорнији. У овом случају, средња вредност узорка (екв. 3.1) можда није добра процена. Уместо тога, када постоје неједнаке вјероватноће инклузије, истраживачи користе
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
где је \(\hat{\bar{y}}\) процена стопе незапослености, а \(\pi_i\) је вероватноћа укључивања особе \(i\) . Пратећи стандардну праксу, позваћу процењивач у екв. 3.2 Хорвитз-Тхомпсонова процена. Хорвитз-Тхомпсон естиматор је изузетно користан јер води до непристрасних процена за било који дизајн вероватноће узорковања (Horvitz and Thompson 1952) . Због тога што се Хорвитз-Тхомпсон процењивач појављује тако често, корисно је приметити да се може поново написати као
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
где \(w_i = 1 / \pi_i\) . Као ек. 3.3 открива, Хорвитз-Тхомпсонова процена је пондерисани узорак где је тежина обрнуто повезана са вероватноћом селекције. Другим речима, мања је вероватноћа да се особа укључи у узорак, већа тежина коју особа треба добити у процени.
Као што је раније описано, истраживачи често узоркују људе са неједнаким вероватноћама инклузије. Један пример дизајна који може довести до неједнаке вероватноће укључивања јесте стратифицирано узорковање , што је важно схватити зато што је уско повезано с процедуром процјене која се зове пост-стратификација . У стратификованом узимању узорака, истраживач раздваја циљну популацију у \(H\) међусобно искључиве и исцрпљујуће групе. Ове групе се називају страта и означене су као \(U_1, \ldots, U_h, \ldots, U_H\) . У овом примеру, слојеви су државе. Величине група означене су као \(N_1, \ldots, N_h, \ldots, N_H\) . Истраживач би можда желео да користи стратификовано узорковање како би се осигурало да има довољно људи у свакој држави да изврши процјену незапослености на државном нивоу.
Када популација буде подељена у слојеве , претпоставимо да истраживач бира једноставни случајни узорак без замене величине \(n_h\) , независно од сваког слоја. Даље, претпоставимо да сви који су изабрани у узорку постају испитаници (ја ћу се носити са неодговором у следећем одељку). У овом случају, вероватноћа укључивања је
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Због тога што ове вероватноће могу да варирају од особе до особе, када се процењује из овог дизајна узорака, истраживачи морају да тежину сваком испитанику инверзно од своје вероватноће укључивања користећи Хорвитз-Тхомпсон процењивач (екв 3.2).
Иако је Хорвитз-Тхомпсонова процјена непристрасна, истраживачи могу произвести прецизније процјене (тј. Ниже варијансе) комбиновањем узорка са помоћним информацијама . Неки људи чине изненађујуће што је то тачно чак и када је савршено изведено узорковање вероватноће. Ове технике користећи помоћне информације су нарочито важне, јер, као што ћу вам показати касније, помоћне информације су од критичног значаја за израду процјена из узорака вјероватноће са нонреспонсе и из узорака који нису вјеројатни.
Једна уобичајена техника за кориштење помоћних информација је пост-стратификација . Замислите, на примјер, да истраживач зна број мушкараца и жена у свакој од 50 држава; можемо означити ове величине групе као \(N_1, N_2, \ldots, N_{100}\) . Да комбинује ове помоћне информације са узорком, истраживач може поделити узорак у \(H\) групе (у овом случају 100), направити процену за сваку групу, а затим креирати пондерисани просек ових група значи:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Грубо, процењивач у екв. 3.5 вероватно ће бити тачнији јер користи познате податке о популацији - \(N_h\) - да ли су тачне процјене ако се случајно изабере неуравнотежени узорак. Један од начина размишљања о томе је да пост-стратификација је као апроксимација стратификације након што су подаци већ прикупљени.
У закључку, овај одељак описао је неколико модела узорковања: једноставно случајно узорковање без замена, узорковање са неједнаком вероватноћом и стратифицирано узорковање. Такође описује две главне идеје о процени: Хорвитз-Тхомпсонову процјену и пост-стратификацију. За формалнију дефиницију дизајна вероватноће узимања узорака погледајте поглавље 2 Särndal, Swensson, and Wretman (2003) . За формалније и потпуније третирање стратификованог узимања узорака, погледајте поглавље 3.7 Särndal, Swensson, and Wretman (2003) . За технички опис својстава Хорвитз-Тхомпсоновог процењивача погледајте Horvitz and Thompson (1952) , Overton and Stehman (1995) , или одјељак 2.8 с @ сарндал_модел_2003. За формални третман пост-стратификације погледајте Holt and Smith (1979) , Smith (1991) , Little (1993) , или одјељак 7.6 Särndal, Swensson, and Wretman (2003) .
Вероватноћа узимања узорака са нонреспонсе
Скоро сва реална истраживања немају одговор; то јест, нису сви у популацији узорака одговорили на сва питања. Постоје две главне врсте нонреспонсе: ставка нонреспонсе и јединица нонреспонсе . У предмету не одговара, неки испитаници не одговарају на неке ставке (нпр. Понекад испитаници не желе одговорити на питања која сматрају осјетљивим). У јединици без одговора, неки људи који су изабрани за популацију узорака уопће не одговарају на анкету. Два најчешћа разлога за неподношење јединице су да се узоркована особа не може контактирати и контактирати узорка, али одбија да учествује. У овом одељку ћу се усредсредити на јединицу која не одговара; Читаоци који су заинтересовани за непостојање ставке требали би видети Литтле анд Рубин (2002) .
Истраживачи често размишљају о истраживањима са јединичним неодговором као двостепеном процесу узорковања. У првој фази истраживач одабире узорак \(s\) тако да свака особа има вероватноћу укључивања \(\pi_i\) (где \(0 < \pi_i \leq 1\) ). Затим, у другој фази, људи који су изабрани у узорак реагују са вероватноћом \(\phi_i\) (где \(0 < \phi_i \leq 1\) ). Овај двостепени процес резултира финалним скупом испитаника \(r\) . Важна разлика између ове двије фазе је да истраживачи контролишу процес селекције узорка, али не контролишу који од испитаних људи постаје испитаника. Спајање ова два процеса, вероватноћа да ће неко бити испитаник јесте
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Ради једноставности, размотрићу случај где је оригинални дизајн узорка једноставан случајни узорак без замене. Ако истраживач одабере узорак величине \(n_s\) који даје испитаника \(n_r\) , а ако истраживач игнорише неодговор и користи средину испитаника, онда би пристрасност процјене била:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
где је \(cor(\phi, y)\) популацијска корелација између склоности одговора и исхода (нпр. статус незапослености), \(S(y)\) је стандардна девијација становништва у исходу (нпр. незапосленост статус), \(S(\phi)\) је популацијско стандардно одступање од склоности одговора, а \(\bar{\phi}\) је склоност популацијског одговора популације (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Ек. 3.7 показује да непоправљивање неће увести пристрасност ако је испуњен неки од следећих услова:
Нажалост, ни један од ових услова није вјероватан. Изгледа да је неупотребљиво да неће бити варирања у статусу запослености или да неће бити варијација у пропустима одговора. Дакле, кључни израз у једн. 3.7 је корелација: \(cor(\phi, y)\) . На примјер, уколико су људи без посла, вјероватније ће реаговати, онда ће процијењена стопа запослености бити пристрасна на горе.
Трик за израду процена када постоји непоновљивост је кориштење помоћних информација. На пример, један начин на који можете да користите помоћне информације је пост-стратификација (рецимо еквивалент 3.5 са горње стране). Испоставља се да је пристрасност пост-стратификационог процењивача:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
где је \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) и \(\bar{\phi}^{(h)}\) су дефинисани као горе, али ограничени на људе у групи \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Према томе, укупна пристрасност ће бити мала ако је пристрасност у свакој пост-стратификационој групи мала. Постоје два начина на која волим да размишљам о томе да у свакој пост-слојевитој групи постигнемо пристрасност. Прво, желите покушати да формирате хомогене групе у којима постоји мало варијације у склоности одговора ( \(S(\phi)^{(h)} \approx 0\) ) и исход ( \(S(y)^{(h)} \approx 0\) ). Друго, желите да формирате групе где људи који видите су попут људи који не видите ( \(cor(\phi, y)^{(h)} \approx 0\) ). Упоређивање ек. 3.7 и екв. 3.8 помаже у разјашњавању када пост-стратификација може смањити пристрасност проузроковану нонреспонсе.
У закључку, овај одељак је обезбедио модел за узорковање вероватноће са неодазивањем и показао је пристрасност да нонреспонсе може увести и без и са пост-стратификационим прилагођавањем. Bethlehem (1988) нуди извођење пристрасности проузроковане непоправљивошћу за општије пројекте узорковања. Више о коришћењу пост-стратификације да би се прилагодили за не-одговор, погледајте Smith (1991) и Gelman and Carlin (2002) . Пост-стратификација је део општије породице технике под називом процена калибрације, види Зханг (2000) за третирање дужине Särndal and Lundström (2005) за третман дужине књиге. Више о другим методама пондерирања за прилагођавање за неодговоре, погледајте Kalton and Flores-Cervantes (2003) , Brick (2013) , и Särndal and Lundström (2005) .
Узимање узорака без вероватноће
Узорковање без вероватноће укључује велики број дизајна (Baker et al. 2013) . Фокусирајући се конкретно на узорак корисника Ксбок-а од стране Ванг-а и колега (W. Wang et al. 2015) , можете замислити ту врсту узорка као један где кључни дио дизајна узорака није \(\pi_i\) ( вероватноћа укључивања која је истраживала истраживач), али \(\phi_i\) (пропозиције одговора на упитнике). Наравно, ово није идеално јер су \(\phi_i\) непознати. Али, како су показали Ванг и колеге, ова врста опт-ин узорка - чак и из оквира узорка са огромном грешком покрића - не мора бити катастрофална ако истраживач има добре помоћне информације и добар статистички модел који објашњава ове проблеме.
Bethlehem (2010) проширује многе од горе наведених изјава о пост-стратификацији како би обухватиле и грешке у неизвршењу и покривању. Поред пост-стратификације, друге технике за рад са узорцима који нису вероватноћи и узорцима вероватноће са грешкама покривености и непонављањем укључују узорак узорка (Ansolabehere and Rivers 2013; ??? ) , пондер тежине склоности (Lee 2006; Schonlau et al. 2009) и калибрацију (Lee and Valliant 2009) . Једна заједничка тема међу овим техникама је употреба помоћних информација.