Во овој прилог, јас ќе ги опишам некои од идеите од ова поглавје во малку повеќе математичка форма. Целта е да ви помогнеме да се чувствувате удобно со нотација и математичка рамка што ја користат истражувачите за истражување, така што ќе можете да преминете на некои од техничките материјали напишани на овие теми. Јас ќе започнам со воведување на земање примероци на веројатност, потоа преминете кон земање на веројатност со nonresponse, и конечно, земање примероци од не-веројатност.
Веројатност за земање мостри
Како водечки пример, да ја разгледаме целта за проценка на стапката на невработеност во САД. Дозволете \(U = \{1, \ldots, k, \ldots, N\}\) биде целна популација и да ја \(y_k\) вредноста на исходната променлива за лицето \(k\) . Во овој пример \(y_k\) е дали лицето \(k\) е невработено. Конечно, дозволете \(F = \{1, \ldots, k, \ldots, N\}\) биде популација на рамки, која заради едноставноста се претпоставува дека е иста како целната популација.
Основен дизајн за земање примероци е едноставно случајно земање мостри без замена. Во овој случај, секој човек е подеднакво веројатно да биде вклучен во примерокот \(s = \{1, \ldots, i, \ldots, n\}\) . Кога податоците се собираат со овој дизајн на земање примероци, истражувачите може да ја проценат стапката на невработеност на населението со просечна вредност на примерокот:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
каде што \(\bar{y}\) е стапката на невработеност кај населението и \(\hat{\bar{y}}\) е проценката на стапката на невработеност (најчесто \(\hat{ }\) што се користи за да укаже на проценител).
Во реалноста, истражувачите ретко користат едноставно случаен примерок без замена. Од разни причини (од кои еден ќе го опишам за момент), истражувачите често создаваат примероци со нееднакви веројатности за вклучување. На пример, истражувачите може да изберат луѓе во Флорида со поголема веројатност за вклучување од луѓето во Калифорнија. Во овој случај, средната вредност на примерокот (пример 3.1) можеби не е добра проценка. Наместо тоа, кога постојат нееднакви веројатности за вклучување, истражувачите ги користат
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
каде што \(\hat{\bar{y}}\) е проценката на стапката на невработеност и \(\pi_i\) е веројатноста за вклучување на лицето \(i\) . Следејќи ја стандардната практика, ќе ја наречам проценувачот во eq. 3.2 проценка на Хорвиц-Томпсон. Пресметката на Хорвиц-Томпсон е исклучително корисна бидејќи води кон непристрасни проценки за секој модел на веројатноста за земање мостри (Horvitz and Thompson 1952) . Бидејќи проценувачот Хорвиц-Томпсон се појавува толку често, корисно е да се забележи дека може да се препише повторно како
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
каде \(w_i = 1 / \pi_i\) . Како eq. 3.3 открива, проценката на Хорвиц-Томпсон е умерена мостра, каде што тежините се обратно поврзани со веројатноста за селекција. Со други зборови, толку е помала веројатноста дека лицето треба да биде вклучено во примерокот, толку поголема тежина треба да ја добие лицето во проценката.
Како што беше опишано претходно, истражувачите често ги тестираат луѓето со нееднакви веројатности за вклучување. Еден пример за дизајн кој може да доведе до нееднакви веројатности за вклучување е стратифицирано земање мостри , што е важно да се разбере, бидејќи е тесно поврзано со постапката за проценка наречена пост-стратификација . Во стратифицирано земање примероци, истражувачот ја дели целната популација во \(H\) меѓусебно исклучиви и исцрпни групи. Овие групи се нарекуваат страти и се означени како \(U_1, \ldots, U_h, \ldots, U_H\) . Во овој пример, страниците се држави. Големините на групите се означени како \(N_1, \ldots, N_h, \ldots, N_H\) . Истражувачот може да сака да користи стратифицирано земање примероци со цел да се осигура дека таа има доволно луѓе во секоја држава да ги направи проценките на невработеноста на ниво на држава.
Откако населението е поделено на слоеви , претпостави дека истражувачот избира едноставен случаен примерок без замена на големина \(n_h\) , независно од секој слој. Понатаму, да претпоставиме дека сите избрани во примерокот стануваат испитаници (јас ќе се справи со не-одговор во следниот дел). Во овој случај, веројатноста за вклучување е
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Бидејќи овие веројатности можат да варираат од човек до човек, кога се прави проценка од овој дизајн на земање примероци, истражувачите треба да го измерат секој испитаник со инверзна веројатност за вклучување користејќи го проценувачот Хорвиц-Томпсон (еквивалент 3.2).
Иако проценката на Хорвиц-Томпсон е непристрасна, истражувачите можат да произведат попрецизни (т.е. пониски варијанси) проценки со комбинирање на примерокот со помошни информации . Некои луѓе сметаат дека е изненадувачки дека ова е точно, дури и кога има совршено извршено земање мостри. Овие техники кои користат помошни информации се особено важни, бидејќи, како што ќе покажам подоцна, помошни информации се критични за правење проценки од примероците за веројатност со nonresponse и од неверојатните примероци.
Една честа техника за користење на помошни информации е пост-стратификација . Замислете, на пример, дека истражувачот го знае бројот на мажи и жени во секоја од 50-те држави; можеме да ги означиме овие големини на групите како \(N_1, N_2, \ldots, N_{100}\) . За да ги комбинира овие помошни информации со примерокот, истражувачот може да ја подели примерокот во \(H\) групи (во овој случај 100), да направи проценка за секоја група, а потоа да создаде пондериран просек од овие групи значи:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Грубо, проценувачот во eq. 3.5 веројатно е попрецизно бидејќи ги користи познатите информации за населението - \(N_h\) - за точни проценки дали се избира неурамнотежен примерок. Еден начин да се размислува за тоа е дека пост-стратификацијата е како приближување на стратификацијата откако податоците се собрани.
Како заклучок, овој дел опишува неколку модели за земање примероци: едноставно случајно земање примероци без замена, земање примероци со нееднаква веројатност и стратифицирано земање примероци. Исто така, опишани се две главни идеи за проценка: проценката на Хорвиц-Томпсон и пост-стратификацијата. За поформална дефиниција на дизајнот на веројатноста за земање примероци, видете поглавје 2 од Särndal, Swensson, and Wretman (2003) . За поформален и целосен третман на стратифицирано земање примероци, види дел 3.7 од Särndal, Swensson, and Wretman (2003) . За технички опис на својствата на проценувачот Хорвиц-Томпсон, видете Horvitz and Thompson (1952) , Overton and Stehman (1995) , или дел 2.8 од @ sarndal_model_2003. За поформален третман на пост-стратификација, видете Holt and Smith (1979) , Smith (1991) , Little (1993) или делот 7.6 од Särndal, Swensson, and Wretman (2003) .
Веројатност со земање примероци со нереакција
Речиси сите вистински истражувања немаат одговор; што е, не секој во популацијата на примероци одговара на секое прашање. Постојат два главни вида на nonresponse: елемент nonresponse и единица nonresponse . Во ставката што не е одговорено, некои испитаници не одговараат на некои ставки (на пример, понекогаш испитаниците не сакаат да одговорат на прашањата што ги сметаат за чувствителни). Во единечен одговор, некои луѓе кои се избрани за популацијата на примероци воопшто не одговараат на истражувањето. Двете најчести причини за неподнесувањето на единицата се дека лицето за кое се зема примерокот не може да се контактира и примерокот е контактиран, но одбива да учествува. Во овој дел, јас ќе се фокусирам на единечна неприфаќање; читателите кои се заинтересирани за предметот нереагирање треба да ги видат Литл и Рубин (2002) .
Истражувачите често размислуваат за истражувања со единечен одговор како процес на земање мостри во две фази. Во првата фаза, истражувачот избира примерок \(s\) така што секој човек има веројатност за вклучување \(\pi_i\) (каде \(0 < \pi_i \leq 1\) ). Потоа, во втората фаза, луѓето кои се избрани во примерокот одговараат со веројатност \(\phi_i\) (каде \(0 < \phi_i \leq 1\) ). Овој двостепен процес резултира со конечниот сет на испитаници \(r\) . Важна разлика помеѓу овие две фази е дека истражувачите го контролираат процесот на селектирање на примерокот, но тие не контролираат кој од овие испитани луѓе станува испитаник. Ставањето на овие два процеси заедно, веројатноста дека некој ќе биде испитаник е
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Заради едноставност, ќе го разгледам случајот каде оригиналниот примерок е едноставно случајно земање примероци без замена. Ако истражувач избира примерок од големината \(n_s\) кој дава \(n_r\) испитаниците, а ако истражувачот игнорира неодговор и користи средната вредност од испитаниците, а потоа пристрасност на проценка ќе биде:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
каде што \(cor(\phi, y)\) е корелација на популацијата помеѓу склоноста на одговор и исходот (на пример, статусот на невработеност), \(S(y)\) е популациско стандардно отстапување на исходот статус), \(S(\phi)\) е популационата стандардна девијација на склоноста на одговор, а \(\bar{\phi}\) е популационата средна склоност за одговор (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Eq. 3.7 покажува дека nonresponse нема да воведе пристрасност ако се исполнети било кој од следните услови:
За жал, ниту еден од овие услови не е веројатен. Се чини неверојатно дека нема да има варијации во статусот на вработување или дека нема да има варијации во склоностите за одговор. Така, клучниот термин во eq. 3.7 е корелација: \(cor(\phi, y)\) . На пример, ако луѓето се оние кои невработените имаат поголема веројатност да одговорат, тогаш проценетата стапка на вработеност ќе биде пристрасна нагоре.
Трикот за правење проценки кога постои несогласување е да се користат помошни информации. На пример, еден начин на кој можете да користите помошни информации е пост-стратификација (повлекување на пример 3.5 од погоре). Излегува дека пристрасноста на процесите за пост-стратификација е:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
каде што \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , и \(\bar{\phi}^{(h)}\) се дефинирани како погоре, но ограничени на луѓе во групата \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Така, целокупната пристрасност ќе биде мала ако пристрасноста во секоја група за пост-стратификација е мала. Постојат два начини на кои сакам да размислувам за да ја направам пристрасноста мала во секоја пост-стратификација група. Прво, сакате да се обидете да формирате хомогени групи каде што има мала варијација во склоноста на одговор ( \(S(\phi)^{(h)} \approx 0\) ) и исходот ( \(S(y)^{(h)} \approx 0\) ). Второ, сакате да формирате групи каде што луѓето што ги гледате се како луѓе што не ги гледате ( \(cor(\phi, y)^{(h)} \approx 0\) ). Споредба на eq. 3.7 и eq. 3.8 помага да се разјасни кога пост-стратификација може да ја намали пристрасноста предизвикана од nonresponse.
Како заклучок, овој дел има обезбедено модел за земање примероци со неодговор и покажа пристрасност дека nonresponse може да се воведе и без и со прилагодувања по стратификација. Bethlehem (1988) нуди деривација на пристрасност предизвикана од nonresponse за поопштите модели за земање примероци. За повеќе за користење на пост-стратификација за да се приспособат за нереагирање, види Smith (1991) и Gelman and Carlin (2002) . Пост-стратификација е дел од поопштата фамилија на техники наречени проценки за калибрација, видете Zhang (2000) за третман на должината на Särndal and Lundström (2005) за третман со должина на книга. За повеќе информации за други методи на мерење за приспособување за неприфаќање видете ги Kalton and Flores-Cervantes (2003) , Brick (2013) , и Särndal and Lundström (2005) .
Примероци од не-веројатност
Не земајќи примероци од веројатност вклучува голем број дизајни (Baker et al. 2013) . Фокусирајќи се конкретно на примерокот од корисниците на Xbox од Ванг и неговите колеги (W. Wang et al. 2015) , можете да помислите на тој вид примерок како оној каде клучниот дел од примерокот не е \(\pi_i\) ( веројатноста за инклузија управувана од истражувачот), но \(\phi_i\) (склоностите на одговорот на одговор на испитаниците). Се разбира, ова не е идеално бидејќи \(\phi_i\) се непознати. Но, како што покажаа Ванг и неговите колеги, овој вид на одлука за избор, дури и од рамка за земање примероци со огромна грешка во покривањето, не треба да биде катастрофална ако истражувачот има добри помошни информации и добар статистички модел за да ги објасни овие проблеми.
Bethlehem (2010) проширува многу од горенаведените деривации во врска со пост-стратификацијата за да ги вклучи и грешките за неприфаќање и покривање. Во прилог на пост-стратификација, други техники за работа со примероци со неверојатност и веројатност со грешки при покривање и нереагирање вклучуваат примерок за појавување (Ansolabehere and Rivers 2013; ??? ) , тежината на склоност на склоност (Lee 2006; Schonlau et al. 2009) и калибрација (Lee and Valliant 2009) . Една честа тема меѓу овие техники е употребата на помошни информации.