Shënimet matematikore

Në këtë shtojcë, unë do të përshkruaj disa nga idetë e kapitullit në një formë pak më matematikore. Qëllimi këtu është t'ju ndihmojë të merrni rehat me kuadrin e notimit dhe matematikën e përdorur nga hulumtuesit e anketës në mënyrë që të mund të kaloni në disa materiale më teknike të shkruara në këto tema. Unë do të filloj duke prezantuar mostrimin e probabilitetit, pastaj të shkoj në marrjen e probabilitetit me mosresponse, dhe së fundi, mostrimin e jo-probabilitetit.

Mostrimi i probabilitetit

Si shembull drejtues, le të shqyrtojmë qëllimin e vlerësimit të shkallës së papunësisë në Shtetet e Bashkuara. Le \(U = \{1, \ldots, k, \ldots, N\}\) të jetë në popullsinë e synuar dhe le \(y_k\) nga vlera e rezultatit variabël për personin e \(k\) . Në këtë shembull \(y_k\) është nëse personi \(k\) është i papunë. Fundi, le \(F = \{1, \ldots, k, \ldots, N\}\) të jetë popullsia frame, i cili për shkak të thjeshtësisë është supozuar të jenë të njëjta si popullatës objektiv.

Një dizajn bazë i marrjes së kampioneve është thjeshtë mostrimi i rastësishëm pa zëvendësim. Në këtë rast, secili person ka të ngjarë të përfshihet në shembullin \(s = \{1, \ldots, i, \ldots, n\}\) . Kur të dhënat mblidhen me këtë dizajn të mostrave, hulumtuesit mund të vlerësojnë shkallën e papunësisë së popullsisë me të thotë mostër:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

ku \(\bar{y}\) është norma e papunësisë në popullsi dhe \(\hat{\bar{y}}\) është vlerësimi i shkallës së papunësisë \(\hat{ }\) përdoret për të treguar një vlerësues).

Në të vërtetë, studiuesit rrallë përdorin mostrat e thjeshta të rastësishme pa zëvendësim. Për një sërë arsyesh (një nga të cilat unë do të përshkruaj në një moment), studiuesit shpesh krijojnë mostra me probabilitete të pabarabarta të përfshirjes. Për shembull, studiuesit mund të zgjedhin njerëz në Florida me probabilitet më të lartë të përfshirjes sesa njerëzit në Kaliforni. Në këtë rast, kampioni do të thotë (eq. 3.1) nuk mund të jetë një vlerësues i mirë. Në vend të kësaj, kur ka mundësi të pabarabarta të përfshirjes, hulumtuesit përdorin

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

ku \(\hat{\bar{y}}\) është vlerësimi i shkallës së papunësisë dhe \(\pi_i\) është probabiliteti i përfshirjes së personit \(i\) . Duke ndjekur praktikën standarde, unë do ta quaj vlerësuesin në eq. 3.2 vlerësuesi Horvitz-Thompson. Vlerësuesi i Horvitz-Thompson është jashtëzakonisht i dobishëm për shkak se ajo çon në vlerësime të paanshme për çdo probabilitet të modelimit (Horvitz and Thompson 1952) . Për shkak se vlerësuesi Horvitz-Thompson vjen aq shpesh, është e dobishme të vërehet se mund të ri-shkruhet si

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

ku \(w_i = 1 / \pi_i\) . Si eq. 3.3 zbulon, vlerësuesi Horvitz-Thompson është një mostër e ponderuar e mostrës ku peshat janë të lidhura në mënyrë inversi me probabilitetin e përzgjedhjes. Me fjalë të tjera, sa më pak gjasa që një person të përfshihet në mostër, aq më shumë peshë duhet të marrë personi në vlerësim.

Siç është përshkruar më herët, kërkuesit shpeshherë i provojnë njerëzit me probabilitete të pabarabarta të përfshirjes. Një shembull i një dizajni që mund të çojë në probabilitete të pabarabarta të përfshirjes është mostrimi i stratifikuar , i cili është i rëndësishëm për t'u kuptuar sepse është i lidhur ngushtë me procedurën e vlerësimit të quajtur post-stratifikim . Në mostrimin e stratifikuar, një studiues e ndan popullsinë e synuar në grupe të ekskluzivisht dhe tërësisht të përjashtuar \(H\) . Këto grupe quhen shtresa dhe tregohen si \(U_1, \ldots, U_h, \ldots, U_H\) . Në këtë shembull, shtresat janë shtete. Madhësitë e grupeve tregohen si \(N_1, \ldots, N_h, \ldots, N_H\) . Një studiues mund të dëshirojë të përdorë mostrat e shtresuara për të siguruar që ajo të ketë njerëz të mjaftueshëm në çdo shtet për të bërë vlerësime të nivelit shtetëror të papunësisë.

Sapo popullata është ndarë në shtresa , supozoni se hulumtuesi zgjedh një mostër të thjeshtë të rastësishme pa zëvendësimin e madhësisë \(n_h\) , pavarësisht nga çdo shtresë. Më tej, supozoni se të gjithë të zgjedhurit në mostër bëhen të anketuar (do të trajtoj jo përgjigje në seksionin tjetër). Në këtë rast, probabiliteti i përfshirjes është

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

Për shkak se këto probabilitete mund të ndryshojnë nga personi në person, kur bëjnë një vlerësim nga kjo dizajn model, hulumtuesit duhet të peshojnë secilin të anketuar me anën e kundërt të probabilitetit të tyre të përfshirjes duke përdorur vlerësuesin Horvitz-Thompson (p.sh. 3.2).

Edhe pse vlerësuesi Horvitz-Thompson është i paanshëm, hulumtuesit mund të prodhojnë vlerësime më të sakta (domethënë, variancë më të ulët) duke kombinuar mostrën me informacionin ndihmës . Disa njerëz e gjejnë të habitshme që kjo është e vërtetë edhe kur ekziston ekzaminimi i probabilitetit të përkryer. Këto teknika duke përdorur informacionin ndihmës janë veçanërisht të rëndësishme sepse, siç do të tregoj më vonë, informacionet ndihmëse janë kritike për të bërë vlerësime nga mostrat e probabilitetit me mosresponse dhe nga mostrat e jo-probabilitetit.

Një teknikë e zakonshme për shfrytëzimin e informacionit ndihmës është post-stratifikimi . Imagjinoni, për shembull, se një studiues e di numrin e burrave dhe grave në secilën prej 50 shteteve; ne mund të tregojmë këto madhësi të grupit si \(N_1, N_2, \ldots, N_{100}\) . Për të kombinuar këtë informacion ndihmës me mostrën, hulumtuesi mund të ndajë mostrën në grupet \(H\) (në këtë rast 100), të bëjë një vlerësim për secilin grup dhe pastaj të krijojë një mesatare të ponderuar të këtyre mjeteve në grup:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

Përafërsisht, vlerësuesi në eq. 3.5 ka të ngjarë të jetë më i saktë për shkak se përdor informacionin e njohur të popullsisë- \(N_h\) - për të korrigjuar vlerësimet nëse \(N_h\) një mostër e pabalancuar. Një mënyrë për të menduar për këtë është se pas-stratifikimi është si përafrimi i shtresimit pasi të dhënat tashmë janë mbledhur.

Si përfundim, ky seksion ka përshkruar disa dizenjime mostrimi: mostrimi i thjeshtë i rastësishëm pa zëvendësime, marrja e mostrave me probabilitet të pabarabartë dhe mostrimi stratifikuar. Gjithashtu ka përshkruar dy ide kryesore rreth vlerësimit: vlerësuesi Horvitz-Thompson dhe post-stratifikimi. Për një përkufizim më formal të modeleve të mostrimit të probabilitetit, shih kapitullin 2 të Särndal, Swensson, and Wretman (2003) . Për një trajtim më formal dhe të plotë të mostrave të shtresuara, shih seksionin 3.7 të Särndal, Swensson, and Wretman (2003) . Për një përshkrim teknik të vetive të vlerësuesit të Horvitz-Thompson, shih Horvitz and Thompson (1952) , Overton and Stehman (1995) , ose pjesa 2.8 e @ sarndal_model_2003. Për një trajtim më formal të post-stratifikimit, shih Holt and Smith (1979) , Smith (1991) , Little (1993) , ose seksioni 7.6 i Särndal, Swensson, and Wretman (2003) .

Marrja e probabilitetit me mosrezultim

Pothuajse të gjitha sondazhet reale nuk kanë përgjigje; që është, jo të gjithë në popullatën e mostrës i përgjigjen çdo pyetjeje. Ekzistojnë dy lloje kryesore të mospërmbushjes: mosresponimi i artikullit dhe mospërmbushja e njësisë . Në mosrezultim të artikullit, disa të anketuar nuk u përgjigjen disa artikujve (p.sh. ndonjëherë të anketuarit nuk duan t'u përgjigjen pyetjeve që i konsiderojnë të ndjeshme). Në mungesën e njësisë, disa njerëz që janë përzgjedhur për popullatën e mostrës nuk i përgjigjen aspak pyetjes. Dy arsyet më të zakonshme për mosrezultim të njësisë janë që personi i përzgjedhur nuk mund të kontaktohet dhe personi i mostrës të kontaktohet, por refuzon të marrë pjesë. Në këtë seksion, unë do të përqendrohem në mungesën e njësisë; lexuesit e interesuar për mosresponse të artikullit duhet të shohin Little dhe Rubin (2002) .

Hulumtuesit shpesh mendojnë për sondazhet me mos-përgjigjen e njësisë si proces dy mostësh. Në fazën e parë, hulumtuesi zgjedh një mostër \(s\) tillë që çdo person ka një probabilitet të përfshirjes \(\pi_i\) (ku \(0 < \pi_i \leq 1\) ). Pastaj, në fazën e dytë, njerëzit që përzgjidhen në mostër përgjigjen me probabilitet \(\phi_i\) (ku \(0 < \phi_i \leq 1\) ). Ky proces në dy faza rezulton në grupin përfundimtar të të anketuarve \(r\) . Një ndryshim i rëndësishëm midis këtyre dy fazave është se hulumtuesit kontrollojnë procesin e përzgjedhjes së mostrës, por ato nuk e kontrollojnë se cili prej këtyre njerëzve të kampionuar bëhet anketues. Duke vënë këto dy procese së bashku, probabiliteti që dikush do të jetë i anketuar është

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

Për hir të thjeshtësisë, unë do të shqyrtoj rastin kur dizajni origjinal i mostrës është thjeshtë mostrimi i rastësishëm pa zëvendësim. Nëse një studiues zgjedh një mostër të madhësisë \(n_s\) që jep përgjigjet e të anketuarve \(n_r\) , dhe nëse hulumtuesi injoron \(n_r\) dhe përdor mesataren e të anketuarve, atëherë paragjykimi i vlerësimit do të jetë:

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

ku \(cor(\phi, y)\) është korrelacioni i popullsisë midis prirjes së përgjigjes dhe rezultatit (p.sh. statusi i papunësisë), \(S(y)\) është devijimi standard i popullsisë i rezultatit statusi), \(S(\phi)\) është devijimi standard i popullsisë së prirjes së përgjigjes dhe \(\bar{\phi}\) është tendenca e përgjigjes mesatare të popullsisë (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .

Eq. 3.7 tregon se mospërmbushja nuk do të vendosë paragjykime nëse plotësohen kushtet e mëposhtme:

  • Nuk ka asnjë ndryshim në statusin e papunësisë \((S(y) = 0)\) .
  • Nuk ka variacion në përgjigjen e prirjeve \((S(\phi) = 0)\) .
  • Nuk ka korrelacion midis prirjes së përgjigjes dhe statusit të papunësisë \((cor(\phi, y) = 0)\) .

Për fat të keq, asnjë nga këto kushte nuk duket e mundshme. Duket e paimagjinueshme se nuk do të ketë ndryshime në statusin e punësimit ose se nuk do të ketë ndryshime në prirjet e përgjigjes. Kështu, termi kryesor në eq. 3.7 është korrelacion: \(cor(\phi, y)\) . Për shembull, nëse njerëzit janë që të papunët kanë më shumë gjasa të përgjigjen, atëherë shkalla e parashikuar e punësimit do të jetë e njëanshme.

Mashtrimi për të bërë vlerësime kur ka mosrespektim është që të përdoren informatat ndihmëse. Për shembull, një mënyrë në të cilën ju mund të përdorni informacione ndihmëse është post-stratifikimi (kujtohet ekuilibri 3.5 nga lart). Rezulton se paragjykimi i vlerësuesit të pas-stratifikimit është:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

\(cor(\phi, y)^{(h)}\) \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) dhe \(\bar{\phi}^{(h)}\) janë definuar si më sipër, por janë të kufizuara për njerëzit në grupin \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Pra, paragjykimi i përgjithshëm do të jetë i vogël nëse paragjykimet në secilin grup pas-stratifikues janë të vogla. Ka dy mënyra që më pëlqen të mendoj për bërjen e paragjykimeve të vogla në secilin grup pas-stratifikues. Së pari, doni të provoni të formoni grupe homogjene ku ka pak ndryshime në prirjen e përgjigjes ( \(S(\phi)^{(h)} \approx 0\) ) dhe rezultati ( \(S(y)^{(h)} \approx 0\) ). Së dyti, ju doni të krijoni grupe ku njerëzit që shihni janë si njerëzit që nuk shihni ( \(cor(\phi, y)^{(h)} \approx 0\) ). Krahasimi i eq. 3.7 dhe eq. 3.8 ndihmon në sqarimin kur post-stratifikimi mund të zvogëlojë paragjykimet e shkaktuara nga mosrespektimi.

Në përfundim, ky seksion ka dhënë një model për marrjen e mostrave të probabilitetit me mosgjigje dhe ka treguar paragjykimin që mospërmbushja mund të prezantojë si pa dhe me rregullime pas shtresëzimit. Bethlehem (1988) ofron një rrjedhje të paragjykimeve të shkaktuara nga mosrespektimi për hartime më të përgjithshme të mostrave. Për më shumë në përdorimin e post-stratifikimit për t'u përshtatur për mospërmbushje, shih Smith (1991) dhe Gelman and Carlin (2002) . Pas-stratifikimi është pjesë e një familjeje më të përgjithshme të teknikave të quajtura vlerësues të kalibrimit, shih Zhang (2000) për një trajtim të gjërë të artikullit dhe Särndal and Lundström (2005) për një trajtim gjatësi librash. Për më shumë mbi metodat e tjera të peshës për rregullimin e Kalton and Flores-Cervantes (2003) , shih Kalton and Flores-Cervantes (2003) , Brick (2013) dhe Särndal and Lundström (2005) .

Mostrimi i jo-probabilitetit

Mostrimi i jo-probabilitetit përfshin një larmi të madhe hartash (Baker et al. 2013) . Duke u ndalur në mënyrë specifike në mostrën e përdoruesve të Xbox nga Wang dhe kolegët (W. Wang et al. 2015) , ju mund të mendoni për atë lloj të mostrës si një ku pjesa kryesore e dizajnit të mostrimit nuk është \(\pi_i\) ( probabiliteti i përfshirjes së drejtuar nga hulumtuesi), por \(\phi_i\) (prirjet e përgjigjeve të drejtuara nga respondenti). Natyrisht, kjo nuk është ideale sepse \(\phi_i\) janë të panjohur. Por, siç treguan Wang dhe kolegët, ky lloj kampioni i zgjedhjes - madje edhe nga një kornizë marrjeje me gabim të madh mbulimi - nuk duhet të jetë katastrofike nëse hulumtuesi ka informacione të mira ndihmëse dhe një model të mirë statistikor për t'i llogaritur këto probleme.

Bethlehem (2010) shtrin shumë prej prejardhjeve të mësipërme rreth post-stratifikimit për të përfshirë edhe mungesën e përgjigjeve dhe gabimet e mbulimit. Përveç post-stratifikimit, teknikat e tjera për të punuar me mostrat e jo-probabilitetit - dhe mostrat e probabilitetit me gabime të mbulimit dhe mosresponse - përfshijnë përputhjen e mostrës (Ansolabehere and Rivers 2013; ??? ) , ponderimi i rezultatit të prirjes (Lee 2006; Schonlau et al. 2009) dhe kalibrimi (Lee and Valliant 2009) . Një temë e përbashkët midis këtyre teknikave është përdorimi i informacionit ndihmës.