Šajā papildinājumā es raksturojošu dažas no nodaļas idejām nedaudz matemātiskā formā. Mērķis šeit ir palīdzēt jums apmierināties ar apzīmējumu un matemātisko sistēmu, ko izmanto aptaujas pētnieki, lai jūs varētu pāriet uz vairākiem tehniskiem materiāliem, kas rakstīti šajās tēmās. Es sākšu, ieviešot varbūtības paraugu, pēc tam pārejiet uz varbūtības paraugu ar neatbildēšanu un, visbeidzot, ne varbūtības izlasi.
Varbūtības pārbaude
Piemēram, apsveriet mērķi novērtēt bezdarba līmeni Amerikas Savienotajās Valstīs. Let \(U = \{1, \ldots, k, \ldots, N\}\) ir mērķa populācija un let \(y_k\) par rezultāta mainīgo lielumu personai \(k\) . Šajā piemērā \(y_k\) ir tas, vai persona \(k\) ir bezdarbnieks. Visbeidzot, let \(F = \{1, \ldots, k, \ldots, N\}\) ir rāmju populācija, kas vienkāršības labad tiek uzskatīta par tādu pašu kā mērķa populāciju.
Pamata paraugu ņemšanas plāns ir vienkārša nejauša paraugu ņemšana bez aizstāšanas. Šajā gadījumā katra persona ir vienlīdz iespējams iekļauta paraugā \(s = \{1, \ldots, i, \ldots, n\}\) . Kad dati tiek savākti ar šo paraugu ņemšanas plānu, pētnieki var novērtēt iedzīvotāju bezdarba līmeni ar izlases nozīmīgumu:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
kur \(\bar{y}\) ir bezdarba līmenis iedzīvotāju skaitā un \(\hat{\bar{y}}\) ir aplēse par bezdarba līmeni ( \(\hat{ }\) parasti ko izmanto, lai norādītu novērtējumu).
Patiesībā pētnieki reti izmanto vienkāršu nejaušo paraugu ņemšanu bez aizstāšanas. Dažādu iemeslu dēļ (kuru vienu es īsumā aprakstīšu) pētnieki bieži veido paraugus ar nevienlīdzīgām iekļaušanas iespējām. Piemēram, pētnieki varētu atlasīt cilvēkus Floridā ar lielāku iekļaušanas varbūtību nekā Kalifornijas iedzīvotāji. Šajā gadījumā parauga vidējais lielums (3.1. Ekvivalents), iespējams, nav labs novērtētājs. Tā vietā, kad pētnieki lieto nevienlīdzīgas iekļaušanas iespējamības
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
kur \(\hat{\bar{y}}\) ir bezdarba līmeņa novērtējums un \(\pi_i\) ir personas \(i\) iekļaušanas varbūtība. Pēc standarta prakses es zvanu novērtējumā eq. 3.2 Horvitz-Tomsona novērtēšanas rīks. Horvitz-Thompsona novērtējums ir ārkārtīgi noderīgs, jo tas noved pie neobjektīviem aprēķiniem jebkurai varbūtības paraugu veidošanai (Horvitz and Thompson 1952) . Tā kā Horvitz-Thompson aprēķinātājs tiek parādīts tik bieži, ir lietderīgi atzīmēt, ka to var pārrakstīt kā
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
kur \(w_i = 1 / \pi_i\) . Kā ekv. 3.3. Atklāj, ka Horvitz-Thompson novērtējums ir svērtais izlases lielums, kur svari ir apgriezti saistīti ar atlases varbūtību. Citiem vārdiem sakot, jo mazāk ticams, ka persona tiek iekļauta izlasē, jo lielāka nozīme šai personai jāiegūst tāmē.
Kā aprakstīts iepriekš, pētnieki bieži izlasa cilvēkus ar nevienlīdzīgām iekļaušanas iespējām. Viens dizaina piemērs, kas var izraisīt nevienlīdzīgas iekļaušanas iespējamību, ir stratificēts paraugu ņemšana , kas ir svarīgi saprast, jo tas ir cieši saistīts ar aplēses procedūru, ko sauc pēc stratifikācijas . Stratēģiskā paraugu ņemšanā pētnieks sadalās mērķa populācijā \(H\) savstarpēji izslēdzošās un izsmeļošās grupās. Šīs grupas sauc par slāņiem un tiek norādītas kā \(U_1, \ldots, U_h, \ldots, U_H\) . Šajā piemērā slāņi ir stāvokļi. Grupu izmēri tiek norādīti kā \(N_1, \ldots, N_h, \ldots, N_H\) . Pētnieks varētu vēlēties izmantot stratificētu paraugu ņemšanu, lai pārliecinātos, ka viņai katrā valstī ir pietiekami daudz cilvēku, lai veiktu valsts līmeņa bezdarba aplēses.
Kad iedzīvotāji ir sadalīti slāņos , pieņemsim, ka pētnieks izvēlas vienkāršu izlases paraugu, nemainot izmēru \(n_h\) neatkarīgi no katra slāņa. Turklāt pieņemsim, ka visi izlasē atlasītie kļūst par respondentu (nākamajā sadaļā es izskatīšu atbildi). Šajā gadījumā iekļaušanas varbūtība ir
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Tā kā šīs varbūtības var atšķirties no cilvēka uz cilvēku, novērtējot šo paraugu ņemšanas plānu, pētniekiem ir jānovērtē katrs respondents, ņemot vērā viņu iekļaušanas varbūtību, izmantojot Horvitz-Thompsona novērtēšanas metodi (3.2.
Lai gan Horvitz-Thompson novērtējuma objekts ir objektīvs, pētnieki var iegūt precīzākas (ti, zemākas dispersijas) aprēķinus, apvienojot paraugu ar papildu informāciju . Daži cilvēki pārsteidz to, ka tas ir taisnība pat tad, ja ir pilnīgi izpildīta varbūtības izlase. Šīs metodes, kas izmanto papildinformāciju, ir īpaši svarīgas, jo, kā parādīšu vēlāk, papildu informācija ir būtiska, lai veiktu aprēķinus no varbūtības paraugiem ar nereaģēšanas un ne varbūtības paraugiem.
Viena izplatīta paņēmienu izmantot papildu informāciju ir stratifikācija pēc stratifikācijas . Iedomājieties, piemēram, ka pētnieks zina vīriešu un sieviešu skaitu katrā no 50 valstīm; mēs varam apzīmēt šos grupas lielumus kā \(N_1, N_2, \ldots, N_{100}\) . Lai apvienotu šo palīginformāciju ar paraugu, pētnieks var sadalīt paraugu \(H\) grupās (šajā gadījumā 100), aprēķināt katru grupu un pēc tam izveidot šo grupu vidējo svērto vērtību:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Aptuveni, novērtējums eq. 3.5, visticamāk, būs precīzāka, jo tajā tiek izmantota zināma populācijas informācija - \(N_h\) - pareizi aprēķini, ja tiek izvēlēts nesabalansēts paraugs. Viens veids, kā domāt par to, ir tas, ka pēc stratifikācijas tāpat kā stratifikācijas tuvināšana pēc tam, kad dati jau ir savākti.
Noslēgumā šī sadaļa ir aprakstījusi dažus paraugu ņemšanas veidus: vienkārša nejauša paraugu ņemšana bez nomaiņas, paraugu ņemšana ar nevienlīdzīgu varbūtību un stratificētu paraugu ņemšana. Tajā ir arī aprakstītas divas galvenās idejas par novērtēšanu: Horvitza-Tomsona novērtēšanas un pēcslāņošanās metodika. Lai iegūtu formālāku varbūtības paraugu ņemšanas modeļu definīciju, sk. Särndal, Swensson, and Wretman (2003) 2. nodaļu. Lai iegūtu formālāku un pilnīgāku stratifikācijas paraugu apstrādi, skatīt Särndal, Swensson, and Wretman (2003) 3.7. Särndal, Swensson, and Wretman (2003) . Horvitz-Thompson novērtējuma tehnisko raksturojumu skatīt Horvitz and Thompson (1952) , Overton and Stehman (1995) vai @ sarndal_model_2003 2.8. Särndal, Swensson, and Wretman (2003) post-stratifikācijas metodes skat. Holt and Smith (1979) , Smith (1991) , Little (1993) vai Särndal, Swensson, and Wretman (2003) 7.6.
Varbūtības pārbaude ar nereaģēšanu
Gandrīz visiem reāliem apsekojumiem nav atbildes; tas ir, ne visi izlases iedzīvotāji atbild uz visiem jautājumiem. Pastāv divi galvenie nereaģēšanas veidi: vienuma neatbildēšana un vienības neatbildēšana . Neatbildes gadījumā daži respondenti neatbild uz dažiem jautājumiem (piemēram, dažreiz respondenti nevēlas atbildēt uz jautājumiem, kurus viņi uzskata par jutīgiem). Neatbildētā vienībā daži cilvēki, kuri ir atlasīti izlases iedzīvotājiem, vispār neatsaucas uz aptauju. Diviem visbiežāk sastopamiem nereaģēšanas vienības iemesliem ir tas, ka ar atlasi nesaistīto personu nevar sazināties, un ar personu, kas izlases veidā, sazinās, bet atsakās piedalīties. Šajā sadaļā es pievērsos vienības neatbildei; lasītājiem, kuri interesējas par preces neatbildēšanu, vajadzētu redzēt Little un Rubin (2002) .
Pētnieki bieži vien domā par aptaujām ar vienības neatsaucēšanu kā divpakāpju paraugu ņemšanas procesu. Pirmajā posmā pētnieks izvēlas paraugu \(s\) tādā veidā, ka katrai personai ir iekļaušanas varbūtība \(\pi_i\) (kur \(0 < \pi_i \leq 1\) ). Tad otrajā posmā cilvēki, kas atlasīti paraugā, reaģē ar varbūtību \(\phi_i\) (kur \(0 < \phi_i \leq 1\) ). Šis divpakāpju process nosaka galīgo respondentu kopumu \(r\) . Svarīga atšķirība starp šiem diviem posmiem ir tas, ka pētnieki kontrolē parauga atlases procesu, bet viņi nekontrolē, kurš no šiem atlasītajiem cilvēkiem kļūst par respondentiem. Izmantojot šos divus procesus kopā, ir iespējamība, ka kāds būs atbildētājs
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Vienkāršības labad es izskatīšu gadījumu, kad oriģināla parauga dizains ir vienkārša nejauša paraugu ņemšana bez nomaiņas. Ja pētnieks izvēlas izmēru \(n_s\) kas dod \(n_r\) respondentus un ja pētnieks ignorē atbildi, un izmanto respondentu vidējo, tad aprēķinu novirze būs:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
kur \(cor(\phi, y)\) ir iedzīvotāju korelācija starp atbildes tendenci un rezultātu (piemēram, bezdarba statuss), \(S(y)\) ir iznākuma iedzīvotāju standarta novirze (piemēram, bezdarbs statuss), \(S(\phi)\) ir iedzīvotāju standarta novirze atbildes tendencei, un \(\bar{\phi}\) ir iedzīvotāju vidējā atbildes tendence (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) . (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7. Punktā parādīts, ka neatbildēšana neievieš neobjektivitāti, ja ir izpildīts kāds no šiem nosacījumiem:
Diemžēl neviens no šiem nosacījumiem šķiet iespējams. Šķiet neticami, ka nodarbinātības statusa atšķirības netiks mainītas vai ka atbildes tendences atšķiras. Tādējādi galvenais termins ekv. 3.7. Ir korelācija: \(cor(\phi, y)\) . Piemēram, ja cilvēki, kuri ir bezdarbnieki, visticamāk reaģēs, tad paredzamais nodarbinātības līmenis tiks novirzīts uz augšu.
Triks aprēķinu veikšanai, ja nav atbildes, ir izmantot palīginformāciju. Piemēram, viens no veidiem, kā jūs varat izmantot papildu informāciju, ir stratifikācija pēc stratifikācijas (atsaukums, sk. 3.5 no augstāk). Izrādās, ka pēc stratifikācijas novērtējuma novirze ir:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
kur \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , un \(\bar{\phi}^{(h)}\) ir definēti kā iepriekš, bet tikai cilvēkiem grupā \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Tādējādi kopējais neobjektivitātes līmenis būs mazs, ja katrā posmā pēc stratifikācijas grupas neobjektivitāte ir maza. Ir divi veidi, kā man patīk domāt par to, ka katrā posmā stratifikācijas grupā ir mazs aizspriedumi. Pirmkārt, jūs vēlaties mēģināt veidot viendabīgas grupas, kurās reakcijas tendence ir maza ( \(S(\phi)^{(h)} \approx 0\) ) un rezultāts ( \(S(y)^{(h)} \approx 0\) ). Otrkārt, jūs vēlaties veidot grupas, kurās cilvēki, kurus redzat, ir cilvēki, kurus jūs neredzat ( \(cor(\phi, y)^{(h)} \approx 0\) ). Salīdzinot ekv. 3.7 un ekv. 3.8. Palīdz noskaidrot, kad post stratifikācija var samazināt neobjektivitāti, ko izraisa nereaģēšana.
Nobeigumā, šajā sadaļā ir sniegts paraugs varbūtības paraugu ņemšanai ar atbildi bez atbildes un parādīts neobjektivitāte, ka nereaģēšanas iespēja var tikt ieviesta gan bez stratifikācijas pielāgojumiem, gan pēc tam. Bethlehem (1988) ir iegūta neobjektivitāte, kas izraisa nereaģēšanu, lai iegūtu vispārīgākus paraugu ņemšanas veidus. Plašāk par post stratifikācijas izmantošanu, lai pielāgotos nereaģēšanai, skatīt Smith (1991) un Gelman and Carlin (2002) . Post-stratifikācija ir daļa no vispārīgākas metodes paņēmieniem, ko sauc par kalibrēšanas novērtējumiem, skat. Zhang (2000) par izstrādājuma garuma apstrādi un Särndal and Lundström (2005) par grāmatas garuma ārstēšanu. Plašāku informāciju par citām vērtēšanas metodēm, lai pielāgotu nereaģēšanas rezultātiem, skatiet Kalton and Flores-Cervantes (2003) , Brick (2013) un Särndal and Lundström (2005) .
Ne varbūtība paraugu ņemšana
Varbūtēju nejaušu paraugu ņemšana ietver milzīgu dizainparaugu daudzveidību (Baker et al. 2013) . Īpaši koncentrējoties uz Wang un tā kolēģu Xbox lietotāju atlasi (W. Wang et al. 2015) , jūs varat domāt par šāda veida paraugu kā tādu, kurā paraugu ņemšanas dizaina galvenā daļa nav \(\pi_i\) ( pētnieku orientēta iekļaušanas iespējamība), bet \(\phi_i\) (respondentu orientētās atbildes ieceres). Protams, tas nav ideāli, jo \(\phi_i\) nav zināmi. Bet, kā parādīja Wangs un viņa kolēģi, šāds izvēles paraugs - pat no paraugu ņemšanas rāmja ar milzīgu pārklājuma kļūdu - nedrīkst būt katastrofāls, ja pētniekam ir laba palīginformācija un labs statistikas modelis, kas ņem vērā šīs problēmas.
Bethlehem (2010) paplašina daudzus no iepriekš minētajiem atvasinājumiem pēc stratifikācijas, iekļaujot gan neatsaucības, gan pārklājuma kļūdas. Papildus stratifikācijai pēc pēcapstrādes, citas metodes, kas paredzētas darbam ar nevēlamu paraugu un varbūtības paraugiem ar pārklājuma kļūdām un nereaģēšanas rezultātiem, ietver paraugu saskaņošanu (Ansolabehere and Rivers 2013; ??? ) , tendenciālo rezultātu svērumu (Lee 2006; Schonlau et al. 2009) un kalibrēšana (Lee and Valliant 2009) . Viena no šo paņēmienu kopīgām tēmām ir palīginformācijas izmantošana.