U ovom dodatku opisujem neke od ideja iz poglavlja u malo više matematičkom obliku. Cilj je ovdje da vam pomogne da se uklopite u zapisnik i matematički okvir koji koriste istraživači istraživanja tako da se možete prebaciti na neki više tehničkih materijala napisanih na tim temama. Početi ću uvođenjem uzorka vjerojatnosti, a zatim se prebaciti na uzorkovanje vjerojatnosti s neodgovorenim, i konačno, uzorkovanje ne-vjerojatnosti.
Vjerojatnost uzorkovanja
Kao izvodni primjer, razmotrimo cilj procjene stope nezaposlenosti u Sjedinjenim Američkim Državama. Neka \(U = \{1, \ldots, k, \ldots, N\}\) bude ciljna populacija i neka \(y_k\) po vrijednosti varijable ishoda za osobu \(k\) . U ovom primjeru \(y_k\) je li osoba \(k\) nezaposlena. Konačno, neka \(F = \{1, \ldots, k, \ldots, N\}\) bude populacija okvira, koja se zbog jednostavnosti pretpostavlja da je ista kao ciljna populacija.
Temeljni uzorak uzorkovanja jednostavan je slučajni uzorak bez zamjene. U ovom slučaju, svaka će osoba jednako vjerojatno biti uključena u uzorak \(s = \{1, \ldots, i, \ldots, n\}\) . Kada se podaci prikupljaju uz ovaj uzorak, istraživači mogu procijeniti stopu nezaposlenosti stanovništva uz uzorak srednje vrijednosti:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
gdje je \(\bar{y}\) stopa nezaposlenosti u populaciji i \(\hat{\bar{y}}\) procjena stope nezaposlenosti \(\hat{ }\) koristi se za označavanje procjenitelja).
U stvarnosti, istraživači rijetko koriste jednostavno slučajno uzorkovanje bez zamjene. Zbog raznih razloga (jedan od kojih ću opisati u jednom trenutku), istraživači često stvaraju uzorke s nejednakim vjerojatnostima uključivanja. Na primjer, istraživači bi mogli odabrati ljude na Floridi s većom vjerojatnošću uključivanja od ljudi u Kaliforniji. U ovom slučaju, srednja vrijednost uzorka (ekv. 3.1) možda nije dobra procjena. Umjesto toga, kada postoje nejednake vjerojatnosti uključivanja, istraživači koriste
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
gdje je \(\hat{\bar{y}}\) procjena stope nezaposlenosti i \(\pi_i\) je vjerojatnost uključivanja osobe \(i\) . Nakon standardne prakse nazvat ću procjenu u eq. 3.2 procjenitelj Horvitz-Thompson. Horvitz-Thompsonov procjenitelj izuzetno je koristan jer vodi nepristranim procjenama za bilo koji probni uzorak uzorkovanja (Horvitz and Thompson 1952) . Budući da se procjenjivač Horvitz-Thompson javlja tako često, korisno je primijetiti da se može ponovno napisati kao
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
gdje je \(w_i = 1 / \pi_i\) . Kao ekv. 3.3 otkriva, Horvitz-Thompsonov procjenitelj je ponderirani uzorak u kojem su ponderi inverzno povezani s vjerojatnosti odabira. Drugim riječima, manje je vjerojatno da će osoba biti uključena u uzorak, to je veća težina koju bi ta osoba trebala dobiti u procjeni.
Kao što je ranije opisano, istraživači često uzorkuju ljude s nejednakim vjerojatnostima uključivanja. Jedan primjer dizajna koji može dovesti do nejednakih vjerojatnosti inkluzije je slojeviti uzorak , što je važno razumjeti jer je usko povezan s postupkom procjene koji se zove poststratifikacija . U stratificiranom uzorkovanju, istraživač dijeli ciljnu populaciju u \(H\) međusobno ekskluzivne i iscrpne skupine. Te se skupine nazivaju slojevi i označene su kao \(U_1, \ldots, U_h, \ldots, U_H\) . U ovom primjeru, slojevi su stanja. Veličine grupa su označene kao \(N_1, \ldots, N_h, \ldots, N_H\) . Istraživač bi možda želio koristiti slojevito uzorkovanje kako bi se osiguralo da ima dovoljno ljudi u svakoj državi kako bi procijenila nezaposlenost na državnoj razini.
Kada se stanovništvo razdijeli u slojeve , pretpostavimo da istraživač odabire jednostavni slučajni uzorak bez zamjene veličine \(n_h\) , neovisno o svakoj slojevima. Nadalje, pretpostavimo da svi odabrani u uzorku postaju ispitanik (obraćat ću se neodgovorom u sljedećem odjeljku). U ovom slučaju vjerojatnost uključivanja jest
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Budući da se te vjerojatnosti mogu razlikovati od osobe do osobe, pri izradi procjene iz ovog uzorka uzorka, istraživači trebaju težiti svakom ispitaniku inverznom vjerojatnosti uključivanja koristeći Horvitz-Thompsonov procjenitelj (npr. 3.2).
Iako je procjenitelj Horvitz-Thompson nepristran, istraživači mogu proizvesti točniju procjenu (tj. Nižu varijancu) kombiniranjem uzorka s pomoćnim informacijama . Neki ljudi smatraju da je iznenađujuće što je to točno čak i kada se savršeno izvodi uzorkovanje vjerojatnosti. Te tehnike koje koriste pomoćne informacije su osobito važne jer, kao što ću kasnije pokazati, pomoćne informacije kritične su za izradu procjena iz uzoraka vjerojatnosti s neodgovorenim i uzorcima ne-vjerojatnosti.
Jedna uobičajena tehnika za korištenje pomoćnih informacija je poststratifikacija . Zamislite, na primjer, da istraživač zna broj muškaraca i žena u svakoj od 50 država; te veličine grupe možemo označiti kao \(N_1, N_2, \ldots, N_{100}\) . Da biste kombinirali ove pomoćne podatke s uzorkom, istraživač može podijeliti uzorak u \(H\) grupe (u ovom slučaju 100), izraditi procjenu za svaku grupu, a zatim stvoriti ponderirani prosjek ovih skupina znači:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Očito, procjenitelj u eq. 3.5 vjerojatno će biti točnije jer koristi poznate informacije o populaciji - \(N_h\) - ispraviti procjene ako se odabere neuravnoteženi uzorak. Jedan od razloga za razmišljanje je da je poststratifikacija slična približavanju stratifikacije nakon prikupljanja podataka.
Zaključno, ovaj odjeljak opisao je nekoliko nacrta uzoraka: jednostavni slučajni uzorak bez zamjene, uzorkovanje s nejednake vjerojatnosti i slojeviti uzorak. Također je opisao dvije glavne ideje o procjeni: procjenjivač Horvitz-Thompson i post-stratifikacija. Za formalniju definiciju projekata uzorkovanja vjerojatnosti, pogledajte 2. poglavlje Särndal, Swensson, and Wretman (2003) . Za formalnije i potpunije postupanje slojevitim uzorkovanjem, pogledajte odjeljak 3.7 Särndal, Swensson, and Wretman (2003) . Za tehnički opis svojstava procjenitelja Horvitz-Thompson vidi Horvitz and Thompson (1952) , Overton and Stehman (1995) , ili odjeljak 2.8 od @ sarndal_model_2003. Za formalniji tretman poststratifikacije, vidi Holt and Smith (1979) , Smith (1991) , Little (1993) ili odjeljak 7.6 Särndal, Swensson, and Wretman (2003) .
Sposobnost uzorkovanja s neodgovorenim
Gotovo sve prave ankete nemaju odgovornost; to jest, nisu svi u populaciji uzorka odgovorili na svako pitanje. Postoje dvije glavne vrste neodržavanja: nedopuštena stavka i neodržavanje jedinice . U nedostatku stavke neki ispitanici ne odgovaraju na neke stavke (npr. Ponekad ispitanici ne žele odgovoriti na pitanja koja smatraju osjetljivima). U jedinici odgovora, neki ljudi koji su odabrani za populaciju uzoraka uopće ne odgovaraju na anketu. Dva najčešća razloga za neodgovorene jedinice su da se uzorkovana osoba ne može kontaktirati, a kontakt osoba se kontaktira, ali odbija sudjelovati. U ovom odjeljku usredotočit ću se na neodržavanje jedinice; čitatelji zainteresirani za neodržavanje stavke trebali bi vidjeti Little i Rubin (2002) .
Istraživači često razmišljaju o anketama s jediničnim neodgovorom kao dvostupanjskom procesu uzorkovanja. U prvoj fazi istraživač odabire uzorak \(s\) tako da svaka osoba ima vjerojatnost uključivanja \(\pi_i\) (gdje \(0 < \pi_i \leq 1\) ). Zatim, u drugoj fazi, ljudi koji su odabrani u uzorak reagiraju s vjerojatnosti \(\phi_i\) (gdje \(0 < \phi_i \leq 1\) ). Ovaj proces u dva stupnja rezultira konačnim skupom ispitanika \(r\) . Važna razlika između tih dvaju stadija jest da istraživači kontroliraju proces odabira uzorka, ali ne kontroliraju koji od tih uzoraka ljudi postaju ispitanici. Stavljajući ova dva procesa zajedno, vjerojatnost da će netko biti ispitanik jest
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Zbog jednostavnosti razmotrit ću slučaj gdje je originalni uzorak jednostavni slučajni uzorak bez zamjene. Ako istraživač odabere uzorak veličine \(n_s\) koji daje ispitanika \(n_r\) , a ako istraživač zanemari neodgovor i koristi srednju vrijednost ispitanika, pristranost procjene bit će:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
gdje je \(cor(\phi, y)\) populacijska korelacija između sklonosti odaziva i ishoda (npr. statusa nezaposlenosti), \(S(y)\) je standardna devijacija populacije ishoda (npr. status) \(S(\phi)\) je populacija standardno odstupanje sklonost za odgovor, i \(\bar{\phi}\) je srednja vrijednost populacije odgovor sklonošću (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Jed. 3.7 pokazuje da neodržavanje neće uvesti pristranost ako je zadovoljen bilo koji od sljedećih uvjeta:
Nažalost, niti jedan od tih uvjeta nije vjerojatno. Čini se nevjerojatnim da neće biti nikakvih promjena u statusu zaposlenosti ili da neće biti varijacija u sklonosti odgovoru. Dakle, ključni pojam u eq. 3.7 je korelacija: \(cor(\phi, y)\) . Na primjer, ako su ljudi koji su nezaposleni imaju veću vjerojatnost da će odgovoriti, tada će procijenjena stopa zaposlenosti biti pristran prema gore.
Trik za izradu procjena kada je neodgovoreno je korištenje pomoćnih informacija. Na primjer, jedan od načina na koji možete upotrijebiti pomoćne informacije jest naknadno raslojavanje (podsjetnik iz gornjeg dijela 3.5). Ispada da je pristranost poststratifikacijskog procjenitelja:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
gdje \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , i \(\bar{\phi}^{(h)}\) su definirani kao gore, ali su ograničeni na ljude u skupini \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Dakle, ukupna pristranost će biti mala ako je pristranost u svakoj post-stratification grupa je mala. Postoje dva načina na koje volim razmišljati o izradi pristranosti male u svakoj post-stratifikacijskoj grupi. Prvo, želite pokušati formirati homogene skupine gdje postoji malo varijacija u sklonosti odaziva ( \(S(\phi)^{(h)} \approx 0\) ) i ishod ( \(S(y)^{(h)} \approx 0\) ). Drugo, želite stvoriti grupe u kojima ljudi koje vidite su poput ljudi koje ne vidite ( \(cor(\phi, y)^{(h)} \approx 0\) ). Usporedba eq. 3.7 i ekv. 3.8 pomaže razjasniti kada post-stratifikacija može smanjiti pristranost uzrokovanu neodgovorom.
Zaključno, ovaj odjeljak je osigurao model za uzorkovanje vjerojatnosti s neodgovorom i pokazao pristranost koju neodredba može uvesti i bez i s post-stratifikacijskim prilagodbama. Bethlehem (1988) nudi deriviranje pristranosti uzrokovanog neodgovorom za općenitije uzorke uzorkovanja. Više o korištenju post-stratifikacije kako bi se prilagodilo neodgovoru, vidjeti Smith (1991) i Gelman and Carlin (2002) . Post-stratifikacija je dio općenitijih tehnika zvanih kalibracijskih procjenjivača, vidi Zhang (2000) za tretman duljine Särndal and Lundström (2005) za tretman dužine knjiga. Za više o ostalim metodama ponderiranja za prilagodbu Kalton and Flores-Cervantes (2003) , pogledajte Kalton and Flores-Cervantes (2003) , Brick (2013) i Särndal and Lundström (2005) .
Uzorkovanje ne-vjerojatnosti
Uzorkovanje bez vjerojatnosti obuhvaća veliku raznolikost dizajna (Baker et al. 2013) . S obzirom na uzorak korisnika Xboxa, Wang i suradnici (W. Wang et al. 2015) , možete misliti na takav uzorak kao onaj u kojem ključni dio dizajna uzorka nije \(\pi_i\) ( vjerojatnost inkluzije koju pokreće istraživačica), ali je \(\phi_i\) (odgovori odgovora na ispitanike). Naravno, to nije idealno jer su \(\phi_i\) nepoznati. Ali, kao što su Wang i kolege pokazali, ova vrsta opt-in uzorka - čak i iz okvira uzorkovanja s ogromnom pokrivenom pogreškom - ne mora biti katastrofalna ako istraživač ima dobre pomoćne informacije i dobar statistički model koji će uzeti u obzir ove probleme.
Bethlehem (2010) proširuje mnoge od gore navedenih derivata o post-stratifikaciji kako bi uključili i neodrediti i pokrivenost pogrešaka. Osim post-stratifikacije, druge tehnike za rad s uzorcima ne-vjerojatnosti - i uzorci vjerojatnosti s pogreškama pokrivanja i neodredbi - uključuju podudaranje uzoraka (Ansolabehere and Rivers 2013; ??? ) , težina ponderiranja sklonosti (Lee 2006; Schonlau et al. 2009) i kalibracija (Lee and Valliant 2009) . Jedna od zajedničkih tema među ovim tehnikama je uporaba pomoćnih informacija.