U ovom dodatku, neke ideje iz poglavlja ću opisati u nešto većoj matematičkoj formi. Cilj je da vam pomogne da se uklopite sa notacijom i matematičkim okvirom koje koriste istraživači istraživanja, tako da možete preći na neki od više tehničkih materijala napisanih na ovim temama. Počeću sa uvođenjem uzorkovanja verovatnoće, a zatim prelazim na uzorkovanje verovatnoće ne-odgovora, i konačno, uzimanje uzoraka bez verovatnoće.
Uzorkovanje verovatnoće
Kao primjer, razmislimo o cilju procjene stope nezaposlenosti u Sjedinjenim Državama. Neka \(U = \{1, \ldots, k, \ldots, N\}\) biti ciljna populacija i pustite \(y_k\) po vrijednosti ishodne varijable za osobu \(k\) . U ovom primeru \(y_k\) je li osoba \(k\) nezaposlena. Na kraju, dozvolite da \(F = \{1, \ldots, k, \ldots, N\}\) bude populacija kadrova, koja se zbog jednostavnosti pretpostavlja da je ista kao ciljna populacija.
Osnovni dizajn uzorka je jednostavno slučajno uzorkovanje bez zamene. U ovom slučaju, svaka osoba je jednako verovatno uključena u uzorak \(s = \{1, \ldots, i, \ldots, n\}\) . Kada se podaci sakupljaju ovim dizajnom uzorka, istraživači mogu proceniti stopu nezaposlenosti stanovništva sa uzorkom:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
gdje je \(\bar{y}\) stopa nezaposlenosti u populaciji i \(\hat{\bar{y}}\) je procena stope nezaposlenosti ( \(\hat{ }\) je često koristi se za označavanje procenjivača).
U stvarnosti, istraživači retko koriste jednostavno slučajno uzorkovanje bez zamene. Iz raznih razloga (od kojih ću jednoga opisati za trenutak), istraživači često stvaraju uzorke sa nejednakim vjerovatnoćama inkluzije. Na primjer, istraživači bi mogli odabrati ljude na Floridi sa većom vjerovatnoćom uključivanja od ljudi u Kaliforniji. U ovom slučaju, srednja vrednost uzorka (ekv. 3.1) možda nije dobra procena. Umesto toga, kada postoje nejednake vjerovatnoće inkluzije, istraživači koriste
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
gde je \(\hat{\bar{y}}\) procjena stope nezaposlenosti, a \(\pi_i\) je verovatnoća uključivanja osobe \(i\) . Prateći standardnu praksu, pozvaću procenjivač u ekv. 3.2 Horvitz-Thompsonova procena. Horvitz-Thompsonova procjena je izuzetno korisna jer vodi do nepristrasnih procjena za bilo koji dizajn verovatnoće uzorkovanja (Horvitz and Thompson 1952) . Zbog toga što se Horvitz-Thompsonova procjena pojavljuje tako često, korisno je primetiti da se može ponovo napisati kao
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
gdje \(w_i = 1 / \pi_i\) . Kao eq. 3.3 otkriva, Horvitz-Thompsonova procena je ponderisani uzorak, gdje su tegovi obrnuti u odnosu na verovatnoću selekcije. Drugim rečima, manja je verovatnoća da se osoba uključi u uzorak, to je veća težina koju osoba treba da proceni.
Kao što je ranije opisano, istraživači često uzimaju ljude sa nejednakim verovatnoćama inkluzije. Jedan primer dizajna koji može dovesti do nejednake verovatnoće uključivanja jeste stratificirano uzorkovanje , što je važno shvatiti zato što je usko povezano s procedurom procjene koja se zove post-stratifikacija . U stratifikovanom uzimanju uzoraka, istraživač razdvaja ciljanu populaciju u \(H\) međusobno isključive i iscrpljujuće grupe. Ove grupe se nazivaju strata i označene su kao \(U_1, \ldots, U_h, \ldots, U_H\) . U ovom primeru, slojevi su države. Veličine grupa označene su kao \(N_1, \ldots, N_h, \ldots, N_H\) . Istraživač bi možda želeo da koristi stratifikovano uzorkovanje kako bi se osiguralo da ima dovoljno ljudi u svakoj državi da izvrši procjenu nezaposlenosti na državnom nivou.
Kada stanovništvo bude podeljeno u slojeve , pretpostavimo da istraživač bira jednostavni slučajni uzorak bez zamjene veličine \(n_h\) , nezavisno od svakog sloja. Dalje, pretpostavimo da svi koji su odabrani u uzorku postanu ispitanici (ja ću se nositi sa neodgovorom u sledećem odeljku). U ovom slučaju verovatnoća uključivanja je
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Zbog toga što ove vjerovatnoće mogu da variraju od osobe do osobe, kada se procenjuje od ovog dizajna uzoraka, istraživači moraju da težinu svakom ispitaniku uzimaju u obzir njihovu verovatnoću uključivanja koristeći Horvitz-Thompson procenjivač (ekv 3.2).
Iako je Horvitz-Thompsonova procjena nepristrasna, istraživači mogu da proizvedu preciznije (tj. Manje varijanse) procene kombinujući uzorak sa pomoćnim informacijama . Neki ljudi čine iznenađujuće što je to istina čak i kada se savršeno izvrsi probno uzorkovanje. Ove tehnike koristeći pomoćne informacije su naročito važne, jer, kao što ću vam pokazati kasnije, pomoćne informacije su od kritičnog značaja za izradu procjena iz uzoraka vjerovatnoće sa nonresponse i iz uzoraka koji nisu vjerojatni.
Jedna uobičajena tehnika za korištenje pomoćnih informacija je post-stratifikacija . Zamislite, na primjer, da istraživač zna broj muškaraca i žena u svakoj od 50 država; možemo označiti ove veličine grupe kao \(N_1, N_2, \ldots, N_{100}\) . Da kombinuje ove pomoćne informacije sa uzorkom, istraživač može podeliti uzorak u \(H\) grupe (u ovom slučaju 100), napraviti procjenu za svaku grupu, a zatim kreirati ponderisani prosek ovih grupa znači:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Grubo, procenjivač u ekv. 3.5 verovatno će biti tačniji jer koristi poznate podatke o populaciji - \(N_h\) - u ispravne procjene ako se slučajno izabere neuravnoteženi uzorak. Jedan od načina razmišljanja o tome je da post-stratifikacija je kao aproksimacija stratifikacije nakon što su podaci već prikupljeni.
U zaključku, ovaj odeljak opisao je nekoliko modela uzorkovanja: jednostavno slučajno uzorkovanje bez zamjene, uzimanje uzoraka sa nejednakom verovatnoćom i stratificirano uzorkovanje. Takođe su opisane dve glavne ideje o proceni: Horvitz-Thompsonova procjena i post-stratifikacija. Za formalniju definiciju dizajna verovatnoće uzimanja uzoraka pogledajte poglavlje 2 Särndal, Swensson, and Wretman (2003) . Za formalnije i potpunije tretiranje stratifikovanog uzimanja uzorka, pogledajte poglavlje 3.7 Särndal, Swensson, and Wretman (2003) . Za tehnički opis svojstava Horvitz-Thompsonove procjene pogledajte Horvitz and Thompson (1952) , Overton and Stehman (1995) , ili dio 2.8 sarndal_model_2003. Za formalni tretman post-stratifikacije pogledajte Holt and Smith (1979) , Smith (1991) , Little (1993) , ili odjeljak 7.6 Särndal, Swensson, and Wretman (2003) .
Verovatnoća uzimanja uzoraka sa neodgovorima
Skoro sva realna istraživanja nemaju odgovor; to jest, ne svi u populaciji uzoraka odgovore na svako pitanje. Postoje dve glavne vrste nonresponse: stavka nonresponse i jedinica nonresponse . U predmetu ne odgovara, neki ispitanici ne odgovaraju na neke stavke (npr. Ponekad ispitanici ne žele odgovoriti na pitanja koja smatraju osjetljivim). U jedinici bez odgovora, neki ljudi koji su odabrani za populaciju uzoraka uopće ne odgovaraju na anketu. Dva najčešća razloga za neponovljivost jedinice su da se uzorkovana osoba ne može kontaktirati, a osoba uzorka je kontaktirana, ali odbija da učestvuje. U ovom odeljku ću se usredsrediti na jedinstvenu nesaglasnost; Čitaoci koji su zainteresovani za nepostojanje predmeta trebali bi videti Little and Rubin (2002) .
Istraživači često razmišljaju o istraživanjima sa jediničnim neodgovorom kao dvostepenom procesu uzorkovanja. U prvoj fazi istraživač odabire uzorak \(s\) tako da svaka osoba ima verovatnoću uključivanja \(\pi_i\) (gde \(0 < \pi_i \leq 1\) ). Zatim, u drugoj fazi, ljudi koji su odabrani u uzorku reaguju sa verovatnoćom \(\phi_i\) (gde \(0 < \phi_i \leq 1\) ). Ovaj dvostepeni proces rezultira finalnim skupom ispitanika \(r\) . Važna razlika između ove dve faze je da istraživači kontrolišu proces selekcije uzorka, ali ne kontrolišu koji od ispitanih ljudi postaje ispitanika. Objedinjavanje ova dva procesa, verovatnoća da će neko biti ispitanik jeste
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Radi jednostavnosti, razmotriću slučaj gde je originalni dizajn uzorka jednostavan slučajni uzorak bez zamene. Ako istraživač odabere uzorak veličine \(n_s\) koji daje ispitanika \(n_r\) , a ako istraživač ignoriše neodgovor i koristi sredinu ispitanika, onda bi pristrasnost procjene bila:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
gde je \(cor(\phi, y)\) populacijska korelacija između sklonosti odgovora i ishoda (npr. status nezaposlenosti), \(S(y)\) je stanovniško standardno odstupanje ishoda status), \(S(\phi)\) je standardna devijacija populacije sklonosti odgovora, a \(\bar{\phi}\) je populaciona srednja sklonost odgovora (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7 pokazuje da ne-odgovor neće uvesti pristrasnost ako je ispunjen bilo koji od sljedećih uslova:
Nažalost, ni jedan od ovih uslova nije vjerovatan. Čini se da je neupotrebljivo da neće doći do varijacije u statusu zaposlenosti ili da neće biti variranja u propustima odgovora. Dakle, ključni izraz u jedn. 3.7 je korelacija: \(cor(\phi, y)\) . Na primjer, ako su ljudi bez posla, vjerovatnije će se reagovati, onda će procijenjena stopa zaposlenosti biti pristrasna.
Trik za izradu procjena kada nema odgovora je korištenje pomoćnih informacija. Na primjer, jedan način na koji možete koristiti pomoćne informacije je post-stratifikacija (recimo ekvivalent 3.5 sa gornje strane). Ispostavlja se da je pristrasnost post-stratifikacionog procjenitelja:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
gde je \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) i \(\bar{\phi}^{(h)}\) su definisani kao gore, ali ograničeni na ljude u grupi \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Prema tome, ukupna pristrasnost će biti mala ako je pristrasnost u svakoj post-stratifikacionoj grupi mala. Postoje dva načina na koje volim da razmišljam o tome da se pristrasnost u svakoj grupi post-stratifikacije smanji. Prvo, želite pokušati da formirate homogene grupe u kojima postoji malo varijacije u sklonosti odgovora ( \(S(\phi)^{(h)} \approx 0\) ) i ishod ( \(S(y)^{(h)} \approx 0\) ). Drugo, želite da formirate grupe gde ljudi koji vidite su poput ljudi koji ne vidite ( \(cor(\phi, y)^{(h)} \approx 0\) ). Upoređivanje eq. 3.7 i ekv. 3.8 pomaže u razjašnjavanju kada post-stratifikacija može smanjiti pristrasnost prouzrokovanu nonresponse.
U zaključku, ovaj odeljak je obezbedio model za uzorkovanje verovatnoće sa neodazivanjem i pokazao je pristrasnost da nonresponse može uvesti i bez i sa post-stratifikacionim prilagođavanjem. Bethlehem (1988) nudi izvođenje pristrasnosti prouzrokovane neponavljanjem za opštije projekte uzorkovanja. Više o korišćenju post-stratifikacije da bi se prilagodili za nonresponse, pogledajte Smith (1991) i Gelman and Carlin (2002) . Post-stratifikacija je deo opštije porodice tehnika pod nazivom kalibracijske procjene, vidi Zhang (2000) za tretiranje dužine Särndal and Lundström (2005) za tretman dužine knjige. Više o drugim metodama ponderiranja za prilagođavanje za ne-odgovor, pogledajte Kalton and Flores-Cervantes (2003) , Brick (2013) i Särndal and Lundström (2005) .
Uzimanje uzoraka bez verovatnoće
Uzorkovanje bez verovatnoće uključuje veliki broj dizajna (Baker et al. 2013) . Fokusirajući se konkretno na uzorak korisnika Xbox-a od strane Wang-a i kolega (W. Wang et al. 2015) , možete zamisliti tu vrstu uzorka kao jedan gde ključni dio dizajna uzoraka nije \(\pi_i\) ( istraživačka verovatnoća uključivanja), ali \(\phi_i\) (propozicije odgovora na upitnike). Naravno, ovo nije idealno jer su \(\phi_i\) nepoznati. Ali, kako su pokazali Wang i kolege, ova vrsta opt-in uzorka - čak i iz okvira uzorka sa ogromnom greškom pokrića - ne mora biti katastrofalna ako istraživač ima dobre pomoćne informacije i dobar statistički model koji objašnjava ove probleme.
Bethlehem (2010) proširuje mnoge od gore navedenih izjava o post-stratifikaciji kako bi obuhvatile greške u neizvršavanju i pokrivanju. Pored post-stratifikacije, druge tehnike za rad sa uzorcima koji nisu vjerojatni - i uzorci verovatnoće sa greškama pokrivanja i neponavljanje - obuhvataju uzorkovanje uzoraka (Ansolabehere and Rivers 2013; ??? ) , težina rezultata sklonosti (Lee 2006; Schonlau et al. 2009) i kalibraciju (Lee and Valliant 2009) . Jedna zajednička tema među ovim tehnikama je upotreba pomoćnih informacija.