V tem dodatku bom nekatere ideje iz poglavja opisal v nekoliko bolj matematični obliki. Cilj je pomagati vam, da se udobno ujemate z zapisom in matematičnim okvirom, ki ga uporabljajo raziskovalci raziskovalcev, da boste lahko prešli na nekaj bolj tehničnih gradiv, napisanih na teh temah. Začel bom z uvajanjem vzorčenja verjetnosti, nato pa prestaviti na verjetnostno vzorčenje z nonresponse, in končno, vzorčenje brez verjetnosti.
Vzorčenje verjetnosti
Kot primer, razmislimo o cilju ocenjevanja stopnje brezposelnosti v Združenih državah. Naj bo ciljna populacija \(U = \{1, \ldots, k, \ldots, N\}\) in pustimo \(y_k\) po vrednosti \(y_k\) spremenljivke za osebo \(k\) . V tem primeru \(y_k\) je, ali je oseba \(k\) brezposelna. Na koncu pa naj bo populacija slik, ki naj bi bila zaradi preprostosti enaka ciljni populaciji. V tem primeru velja, da je \(F = \{1, \ldots, k, \ldots, N\}\) .
Osnovna zasnova je enostavno naključno vzorčenje brez zamenjave. V tem primeru je vsaka oseba enako verjetno vključena v vzorec \(s = \{1, \ldots, i, \ldots, n\}\) . Ko se podatki zbirajo s to zasnovo vzorcev, lahko raziskovalci ocenijo stopnjo brezposelnosti prebivalstva s povprečnim vzorcem:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
kjer je \(\bar{y}\) stopnja brezposelnosti v populaciji in \(\hat{\bar{y}}\) je ocena stopnje brezposelnosti ( \(\hat{ }\) pogosto ki se uporablja za označevanje ocenjevalca).
V resnici raziskovalci redko uporabljajo enostavno naključno vzorčenje brez zamenjave. Raziskovalci zaradi različnih razlogov (od katerih jih bom opisal v nekaj trenutkih) pogosto ustvarjajo vzorce z neenakimi verjetnostmi vključitve. Na primer, raziskovalci lahko izberejo ljudi na Floridi z večjo verjetnostjo vključitve kot ljudje v Kaliforniji. V tem primeru vzorčna srednja vrednost (ekv. 3.1) morda ni dobra ocena. Namesto tega, kadar obstajajo neenake verjetnosti vključevanja, uporabljajo raziskovalci
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
kjer je \(\hat{\bar{y}}\) ocena stopnje brezposelnosti in \(\pi_i\) verjetnost vključitve osebe \(i\) . Po standardni praksi kličem ocenjevalca v ekv. 3.2 ocenjevalec Horvitz-Thompson. Ocenjevalec Horvitz-Thompson je izredno uporaben, saj vodi do nepristranskih ocen za vsako verjetnostno vzorčenje (Horvitz and Thompson 1952) . Ker se ocenjevalec Horvitz-Thompson pojavlja tako pogosto, je koristno opaziti, da ga je mogoče ponovno napisati kot
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
kjer je \(w_i = 1 / \pi_i\) . Kot eq. 3.3 razkriva, da je Horvitz-Thompsonov ocenjevalec ponderirani vzorec, ki pomeni, da so uteži povezani z verjetnostjo izbire. Z drugimi besedami, manj verjetno je, da se oseba vključi v vzorec, večja je teža, ki jo mora oseba pridobiti v oceni.
Kot je bilo že opisano, raziskovalci pogosto vzorčijo ljudi z neenakimi verjetnostmi vključitve. Eden od primerov oblikovanja, ki lahko povzroči neenake verjetnosti vključitve, je stratificirano vzorčenje , kar je pomembno razumeti, ker je tesno povezano s postopkom ocenjevanja, ki se imenuje post-stratifikacija . Pri stratificiranem vzorčenju raziskovalec razdeli ciljno populacijo v \(H\) medsebojno izključne in izčrpne skupine. Te skupine so imenovani plasti ter so označeni kot \(U_1, \ldots, U_h, \ldots, U_H\) . V tem primeru so stratumi stanja. Velikosti skupin so označene kot \(N_1, \ldots, N_h, \ldots, N_H\) . Raziskovalec bi morda želel uporabiti stratificirano vzorčenje, da bi zagotovil, da ima v vsaki državi dovolj ljudi, da pripravijo oceno brezposelnosti na državni ravni.
Ko prebivalstvo razdelimo na sloje , predpostavimo, da raziskovalec izbere preprost naključni vzorec brez zamenjave velikosti \(n_h\) , neodvisno od vsakega sloja. Nadalje, predpostavimo, da bodo vsi, ki so bili izbrani v vzorcu, postali anketiranci (obravnaval bom neodgovor v naslednjem poglavju). V tem primeru je verjetnost vključitve
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Ker se te verjetnosti lahko razlikujejo od posameznika do posameznika, pri ocenjevanju tega vzorca vzorcev morajo raziskovalci tehtati vsakega anketiranca z inverzno verjetnostjo vključitve z uporabo ocenjevalca Horvitz-Thompson (ekv. 3.2).
Čeprav je ocenjevalec Horvitz-Thompson nepristranski, lahko raziskovalci s kombinacijo vzorca s pomožnimi informacijami izdelajo bolj natančne (tj. Nižje variance) ocene. Nekaterim ljudem je presenetljivo, da je to res, tudi če je popolnoma izvedeno verjetnostno vzorčenje. Te tehnike, ki uporabljajo pomožne informacije, so še posebej pomembne, ker bodo, kot bom pokazal kasneje, pomožne informacije kritične za izdelavo ocen iz verjetnostnih vzorcev z nonresponse in iz vzorcev, ki niso verjetni.
Ena pogosta tehnika za uporabo pomožnih informacij je post-stratifikacija . Predstavljajte si, na primer, da raziskovalec pozna število moških in žensk v vsaki od 50 držav; te velikosti lahko označimo kot \(N_1, N_2, \ldots, N_{100}\) . Če želite združiti te pomožne informacije z vzorcem, lahko raziskovalec razdeli vzorec v skupine \(H\) (v tem primeru 100), naredite oceno za vsako skupino in nato ustvarite tehtano povprečje teh skupin:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Približno, ocenjevalec v ekv. 3.5 je verjetno bolj natančen, ker uporablja znane podatke o prebivalstvu - \(N_h\) - za pravilne ocene, če se izbere neuravnoteženi vzorec. Eden od načinov razmišljanja o tem je, da je post-stratifikacija podobna aproksimaciji stratifikacije, potem ko so podatki že zbrani.
Na koncu je ta oddelek opisal nekaj modelov vzorčenja: preprosto naključno vzorčenje brez zamenjave, vzorčenje z neenako verjetnostjo in stratificirano vzorčenje. Opisal je tudi dve glavni ideji o oceni: Horvitz-Thompsonov ocenjevalec in post-stratifikacijo. Za bolj formalno opredelitev modelov verjetnosti vzorčenja glej poglavje 2 Särndal, Swensson, and Wretman (2003) . Za bolj formalno in celovito obravnavo stratificiranega vzorčenja glej poglavje 3.7 Särndal, Swensson, and Wretman (2003) . Za tehnični opis lastnosti ocenjevalca Horvitz-Thompson glej Horvitz and Thompson (1952) , Overton and Stehman (1995) ali oddelek 2.8 s @ sarndal_model_2003. Za bolj formalno obravnavo post-stratifikacije glej Holt and Smith (1979) , Smith (1991) , Little (1993) ali oddelek 7.6 Särndal, Swensson, and Wretman (2003) .
Vzorčenje verjetnosti z nonresponse
Skoraj vse realne raziskave nimajo odgovora; to pomeni, da ne vsakdo v vzorčni populaciji odgovori na vsa vprašanja. Obstajata dve glavni vrsti nonresponse: element nonresponse in enota nonresponse . V postavki nonresponse nekateri anketiranci ne odgovarjajo na nekatere elemente (npr. Včasih anketiranci ne želijo odgovoriti na vprašanja, za katera menijo, da so občutljiva). V enoti brez odgovora nekateri ljudje, ki so bili izbrani za vzorčno populacijo, sploh ne odzivajo na raziskavo. Dva najpogostejša razloga za neodgovor na enoto sta, da vzorčeni osebi ni mogoče vzpostaviti stika z osebo, ki je vzorčena, vendar noče sodelovati. V tem oddelku se bom osredotočil na enote, ki ne odgovarjajo; bralci, ki jih zanimajo elementi nonresponse, bi morali videti Little in Rubin (2002) .
Raziskovalci pogosto razmišljajo o raziskavah z neodgovorov na enoto kot dvostopenjskem postopku vzorčenja. V prvi fazi raziskovalec izbere vzorec \(s\) tako, da ima vsaka oseba verjetnost vključitve \(\pi_i\) (kjer \(0 < \pi_i \leq 1\) ). Nato v drugi fazi ljudje, ki so izbrani v vzorec, odgovorijo z verjetnostjo \(\phi_i\) (kjer \(0 < \phi_i \leq 1\) ). Ta dvostopenjski proces ima za posledico zadnjo skupino anketirancev \(r\) . Pomembna razlika med tema fazama je, da raziskovalci nadzorujejo postopek izbire vzorca, vendar ne nadzorujejo, kateri od teh vzorčenih ljudi postane vprašani. Z združitvijo teh dveh procesov je verjetnost, da bo nekdo odgovoren
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Zaradi preprostosti bom preučil primer, v katerem je prvotna zasnova vzorca enostavno naključno vzorčenje brez zamenjave. Če raziskovalec izbere vzorec velikosti \(n_s\) ki daje anketirancem \(n_r\) , in če raziskovalec ne upošteva neodgovora in uporablja sredino anketirancev, je pristranskost ocene:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
kjer je \(cor(\phi, y)\) populacijska korelacija med nagnjenostjo odziva in izidom (npr. status brezposelnosti), \(S(y)\) je populacijsko standardno odstopanje izida (npr. status), \(S(\phi)\) je populacijski standardni odklon odzivne nagnjenosti, in \(\bar{\phi}\) je nagnjenost populacijske povprečne odzivnosti (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7 kaže, da neizgovor ne bo uvajal pristranskosti, če je izpolnjen kateri koli od naslednjih pogojev:
Na žalost se zdi, da noben od teh pogojev ni verjeten. Zdi se nejasno, da ne bo nobenih sprememb v zaposlitvenem statusu ali da ne bo nobenih sprememb v odzivnosti odzivnosti. Tako je ključni izraz v ekv. 3.7 je korelacija: \(cor(\phi, y)\) . Na primer, če so ljudje tisti, pri katerih je večja verjetnost, da bodo brezposelni odgovorili, se bo ocenjena stopnja zaposlenosti nagnila navzgor.
Trik za izdelavo ocen, ko je neponovljiva, je uporaba pomožnih informacij. Na primer, en način, na katerega lahko uporabite pomožne informacije, je post-stratifikacija (opomba 3.5 zgoraj). Izkazalo se je, da je pristranskost ocenjevalca po stratifikaciji:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
kjer je \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , in \(\bar{\phi}^{(h)}\) so opredeljeni kot zgoraj, vendar so omejeni na osebe v skupini \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Tako bo splošna pristranskost majhna, če je pristranskost v vsaki post-stratifikacijski skupini majhna. Obstajata dva načina, na katera želim razmišljati o tem, da bi bila pristnost majhna v vsaki skupini po razslojevanju. Najprej si želite poskusiti oblikovati homogene skupine, kjer obstaja majhna razlika v odzivnosti ( \(S(\phi)^{(h)} \approx 0\) ) in rezultat ( \(S(y)^{(h)} \approx 0\) ). Drugič, želite oblikovati skupine, v katerih so ljudje, ki jih vidite, podobni ljudem, ki jih ne vidite ( \(cor(\phi, y)^{(h)} \approx 0\) ). Primerjava eq. 3.7 in ekv. 3.8 pomaga pojasniti, kdaj post-stratifikacija lahko zmanjša pristranskost, ki jo povzroči nonresponse.
Na koncu je ta oddelek zagotovil vzorec za vzorčenje verjetnosti z neodgovorov in pokazal pristranskost, ki jo lahko ponovite, ne da bi se uvedli, in brez prilagoditev po postratitvi. Bethlehem (1988) ponuja izpeljavo pristranskosti, ki jo povzroči nonresponse, za bolj splošne vzorčne vzorce. Če želite več uporabiti post-stratifikacijo, da se prilagodite za neodgovor, glejte Smith (1991) in Gelman and Carlin (2002) . Post-stratifikacija je del bolj splošne družine tehnik, imenovane kalibracijske cenilke, glej Zhang (2000) za obdelavo dolžine Särndal and Lundström (2005) za obdelavo po dolžini. Za več o drugih metodah ponderiranja za prilagajanje za nenadzorovanje glej Kalton and Flores-Cervantes (2003) , Brick (2013) ter Särndal and Lundström (2005) .
Vzorčenje brez verjetnosti
Vzorčenje brez verjetnosti vključuje veliko različnih modelov (Baker et al. 2013) . Če se posebej osredotočimo na vzorec uporabnikov Xboxa Wanga in sodelavcev (W. Wang et al. 2015) , lahko tovrstni vzorec razmislite kot enega, kjer ključni del vzorčenja ni \(\pi_i\) ( raziskovalna pogonska verjetnost vključitve), temveč \(\phi_i\) (odzivnost usmerjene odzivnosti odgovorov). Seveda to ni idealno, ker sta \(\phi_i\) neznani. Toda, kot je pokazal Wang in sodelavci, takšen opt-in vzorec - tudi iz vzorčnega okvira z ogromno pokritostjo pokritosti - ni nujno katastrofalen, če ima raziskovalec dobre dodatne informacije in dober statistični model, ki upošteva te težave.
Bethlehem (2010) razširi mnoge od zgornjih izpeljank o post-stratifikaciji tako, da vključujejo napake brez odziva in pokritja. Poleg tega, da post-stratifikacije, druge tehnike za delo z ne-verjetnosti vzorci-in verjetnostnih vzorcev z napakami pokritost in neodgovorov-vključevati ujemanja vzorca (Ansolabehere and Rivers 2013; ??? ) , nagnjenost rezultat tehtanja (Lee 2006; Schonlau et al. 2009) in kalibracijo (Lee and Valliant 2009) . Med temi tehnikami je ena glavna tema uporabe pomožnih informacij.