In hierdie bylaag sal ek sommige van die idees uit die hoofstuk in 'n bietjie meer wiskundige vorm beskryf. Die doel hier is om jou te help om gemaklik te raak met die notasie en wiskundige raamwerk wat deur navorsingsnavorsers gebruik word, sodat jy kan oorgaan na meer tegniese materiaal wat op hierdie onderwerpe geskryf is. Ek sal begin met die waarskynlikheid steekproefneming, dan beweeg na waarskynlikheid steekproefneming met nonresponse, en uiteindelik, nie-waarskynlikheid steekproefneming.
Waarskynlikheidsteekproefneming
As 'n voorbeeld gee ons die doel om die werkloosheidskoers in die Verenigde State te skat. Laat \(U = \{1, \ldots, k, \ldots, N\}\) die teikenpopulasie wees en laat \(y_k\) die waarde van die uitkomsveranderlike vir die persoon \(k\) . In hierdie voorbeeld is \(y_k\) of persoon \(k\) werkloos is. Laastens, laat \(F = \{1, \ldots, k, \ldots, N\}\) die raambevolking wees, wat vir die vereenvoudiging daarvan aanvaar word as die teikenpopulasie.
'N Basiese steekproefontwerp is eenvoudig ewekansige steekproefneming sonder vervanging. In hierdie geval is elke persoon ewe waarskynlik ingesluit in die voorbeeld \(s = \{1, \ldots, i, \ldots, n\}\) . Wanneer die data by hierdie steekproefontwerp ingesamel word, kan 'n navorser die bevolkingswerkloosheidskoers met die steekproefgemiddelde beraam:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
waar \(\bar{y}\) is die werkloosheidsyfer in die bevolking en \(\hat{\bar{y}}\) is die skatting van die werkloosheidsyfer (die \(\hat{ }\) is algemeen gebruik om 'n beramer aan te dui).
In werklikheid gebruik navorsers selde eenvoudige ewekansige steekproefneming sonder vervanging. Om verskeie redes (waarvan ek in 'n oomblik beskryf), skep navorsers dikwels monsters met ongelyke waarskynlikheid van insluiting. Byvoorbeeld, navorsers kan mense in Florida kies met groter waarskynlikheid van insluiting as mense in Kalifornië. In hierdie geval is die monster gemiddelde (vergelyk 3.1) dalk nie 'n goeie beramer nie. In plaas daarvan, wanneer daar ongelyke waarskynlikheid van insluiting is, gebruik navorsers
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
waar \(\hat{\bar{y}}\) is die skatting van die werkloosheidskoers en \(\pi_i\) is persoon \(i\) se waarskynlikheid van insluiting. Na standaard praktyk sal ek die skatter in eq noem. 3.2 die Horvitz-Thompson beramer Die Horvitz-Thompson beramer is uiters nuttig omdat dit lei tot onbevooroordeelde ramings vir enige waarskynlikheidsteekproefontwerp (Horvitz and Thompson 1952) . Omdat die Horvitz-Thompson-skatter so gereeld opduik, is dit nuttig om op te let dat dit her-geskryf kan word as
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
waar \(w_i = 1 / \pi_i\) . Soos eq. 3.3 onthul, die Horvitz-Thompson beramer is 'n geweegde steekproefgemiddelde waar die gewigte omgekeerd verband hou met die waarskynlikheid van seleksie. Met ander woorde, hoe minder waarskynlik 'n persoon in die steekproef ingesluit moet word, hoe meer gewig moet die persoon in die skatting kry.
Soos vroeër beskryf, ondersoek navorsers dikwels mense met ongelyke waarskynlikheid van insluiting. Een voorbeeld van 'n ontwerp wat kan lei tot ongelyke waarskynlikheid van insluiting is gestratifiseerde steekproefneming , wat belangrik is om te verstaan omdat dit nou verwant is aan die skattingsprosedure wat na stratifikasie genoem word . In die gestratifiseerde steekproef verdeel 'n navorser die teikenpopulasie in \(H\) onderling uitsluitende en uitputtende groepe. Hierdie groepe word strata genoem en word aangedui as \(U_1, \ldots, U_h, \ldots, U_H\) . In hierdie voorbeeld is die strata state. Die groottes van die groepe word aangedui as \(N_1, \ldots, N_h, \ldots, N_H\) . 'N Navorser wil dalk gestratifiseerde steekproefneming gebruik om seker te maak dat sy genoeg mense in elke staat het om op die vlak van werkloosheid op staatsvlak te werk.
Sodra die bevolking in strata verdeel is, neem aan dat die navorser 'n eenvoudige ewekansige steekproef kies sonder om die grootte \(n_h\) , onafhanklik van elke strata, te vervang. Veronderstel verder dat almal wat in die steekproef gekies word, 'n respondent word (ek sal nie-reaksie hanteer in die volgende afdeling). In hierdie geval is die waarskynlikheid van insluiting
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Omdat hierdie waarskynlikhede van persoon tot persoon kan wissel, moet navorsers elke respondent weeg deur die inverse van hul waarskynlikheid van insluiting deur die Horvitz-Thompson-beramer te gebruik (verg. 3.2).
Alhoewel die Horvitz-Thompson beramer onbevooroordeel is, kan navorsers meer akkurate (dws laer afwykings) ramings produseer deur die steekproef met hulpinligting te kombineer. Sommige mense vind dit verbasend dat dit waar is, selfs wanneer daar 'n perfek uitgevoerde waarskynlikheidsteekproefneming is. Hierdie tegnieke wat hulpinligting gebruik, is veral belangrik omdat, soos ek later sal wys, hulpinligting van kritieke belang is om ramings uit waarskynlikheidsmonsters met nieresponse en nie-waarskynlikheidsmonsters te maak.
Een algemene tegniek vir die gebruik van hulpinligting is post-stratifikasie . Stel jou byvoorbeeld voor dat 'n navorser die aantal mans en vroue in elk van die 50 state ken; ons kan hierdie \(N_1, N_2, \ldots, N_{100}\) as \(N_1, N_2, \ldots, N_{100}\) . Om hierdie hulpinligting met die steekproef te kombineer, kan die navorser die monster in \(H\) groepe verdeel (in hierdie geval 100), 'n raming vir elke groep maak en dan 'n geweegde gemiddelde van hierdie groep beteken:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Roughly, die beramer in eq. 3.5 is waarskynlik meer akkuraat omdat dit die bekende bevolkingsinligting gebruik - die \(N_h\) - om skattings te korrigeer as 'n ongebalanseerde monster voorkom. Een manier om daaroor te dink, is dat post-stratifikasie is soos die benadering van stratifikasie nadat die data reeds ingesamel is.
Ten slotte het hierdie afdeling 'n paar steekproefontwerpe beskryf: eenvoudige ewekansige steekproefneming sonder vervangings, steekproefneming met ongelyke waarskynlikheid en gestratifiseerde steekproefneming. Dit het ook twee hoofgedagtes oor skatting beskryf: die Horvitz-Thompson-skatter en na-stratifikasie. Vir 'n meer formele definisie van waarskynlikheidsteekproefontwerpe, sien hoofstuk 2 van Särndal, Swensson, and Wretman (2003) . Vir 'n meer formele en volledige behandeling van gestratifiseerde steekproefneming, sien afdeling 3.7 van Särndal, Swensson, and Wretman (2003) . Vir 'n tegniese beskrywing van die eienskappe van die Horvitz-Thompson-skatter, sien Horvitz and Thompson (1952) , Overton and Stehman (1995) , of afdeling 2.8 van @ sarndal_model_2003. Vir meer formele behandeling van post-stratifikasie, sien Holt and Smith (1979) , Smith (1991) , Little (1993) , of afdeling 7.6 van Särndal, Swensson, and Wretman (2003) .
Waarskynlikheid steekproefneming met nonresponse
Byna alle werklike opnames het nie-respons; dit is nie, nie almal in die steekproefbevolking beantwoord elke vraag nie. Daar is twee hoofsoorte nonresponse: item nonresponse en unit nonresponse . In item nonresponse beantwoord sommige respondente nie sekere items nie (bv. Soms wil respondente nie vrae beantwoord wat hulle sensitief ag nie). In die eenheid nie-antwoord reageer sommige mense wat vir die steekproefbevolking gekies is, glad nie op die opname nie. Die twee mees algemene redes vir die nie-response van die eenheid is dat die gemonsterde persoon nie gekontak kan word nie en die monsterpersoon gekontak word, maar weier om deel te neem. In hierdie afdeling sal ek fokus op eenheidsresponse nie; Lesers wat belangstel in item nonresponse moet Little and Rubin (2002) .
Navorsers dink dikwels aan opnames met eenheids-nie-respons as 'n twee-stadium monsternemingsproses. In die eerste fase kies die navorser 'n monster \(s\) sodat elke persoon 'n waarskynlikheid van insluiting \(\pi_i\) (waar \(0 < \pi_i \leq 1\) ). Dan, in die tweede fase, reageer mense wat in die monster gekies is, met waarskynlikheid \(\phi_i\) (waar \(0 < \phi_i \leq 1\) ). Hierdie twee-stadium proses lei tot die finale stel respondente \(r\) . 'N Belangrike verskil tussen hierdie twee stadiums is dat navorsers beheer oor die proses om die steekproef te kies, maar hulle beheer nie watter van die gesampliseerde mense respondente word nie. Om hierdie twee prosesse saam te voeg, is die waarskynlikheid dat iemand 'n respondent sal wees
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Ter wille van eenvoud, sal ek die geval oorweeg waar die oorspronklike steekproefontwerp eenvoudige ewekansige steekproefneming is sonder vervanging. As 'n navorser kies 'n monster van grootte \(n_s\) dat opbrengste \(n_r\) respondente, en indien die navorser ignoreer nie-reaksie en gebruik die gemiddelde van die respondente, dan is die vooroordeel van raming sal wees:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
waar \(cor(\phi, y)\) die bevolkingskorrelasie tussen die reaksiebenigdheid en die uitkoms (bv. werkloosheidstatus) is, is \(S(y)\) die populasie standaardafwyking van die uitkoms status), \(S(\phi)\) is die populasie standaard afwyking van die respons geneigdheid, en \(\bar{\phi}\) is die populasie gemiddelde respons geneigdheid (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Aand. 3.7 toon dat nonresponse nie vooroordeel sal voorstel indien aan enige van die volgende voorwaardes voldoen word nie:
Ongelukkig lyk nie een van hierdie toestande waarskynlik nie. Dit lyk onwaarskynlik dat daar geen verandering in werkstatus sal wees nie of dat daar geen variasie sal wees in reaksie benaderings nie. Dus, die sleutel term in eq. 3.7 is die korrelasie: \(cor(\phi, y)\) . Byvoorbeeld, as mense wat werkloos is, meer geneig is om te reageer, sal die beraamde indiensnemingskoers opwaarts bevooroordeeld wees.
Die truuk om ramings te maak wanneer daar geen antwoord is, is om hulpinligting te gebruik. Byvoorbeeld, een manier waarop u hulpinligting kan gebruik, is na stratifikasie (herroep eq. 3.5 van bo). Dit blyk dat die vooroordeel van die post-stratifikasie beramer is:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
waar \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) \(S(\phi)^{(h)}\) , en \(\bar{\phi}^{(h)}\) word hierbo gedefinieer, maar beperk tot mense in groep \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Die algehele vooroordeel sal dus klein wees as die vooroordeel in elke post-stratifikasiegroep klein is. Daar is twee maniere waarop ek dink om die vooroordeel klein te maak in elke post-stratifikasiegroep. Eerstens wil jy probeer om homogene groepe te vorm waar daar min variasie is in reaksiepropositeit ( \(S(\phi)^{(h)} \approx 0\) ) en die uitkoms ( \(S(y)^{(h)} \approx 0\) ). Tweedens wil jy groepe vorm waar die mense wat jy sien, is soos die mense wat jy nie sien nie ( \(cor(\phi, y)^{(h)} \approx 0\) ). Vergelyk eq. 3.7 en eq. 3.8 help verduidelik wanneer post-stratifikasie die vooroordeel wat veroorsaak word deur nonresponse kan verminder.
Ten slotte het hierdie afdeling 'n model vir waarskynlikheidsteekproefneming met nie-respons verskaf en die vooroordeel wat nieresponse albei kan voorstel sonder en met stratifikasieaanpassings, getoon. Bethlehem (1988) bied 'n afleiding van die vooroordeel wat veroorsaak word deur nie-respons vir meer algemene steekproefontwerpe. Vir meer inligting oor die gebruik van post-stratifikasie om aan te pas vir nieresponse, sien Smith (1991) en Gelman and Carlin (2002) . Na-stratifikasie is deel van 'n meer algemene familie van tegnieke genaamd kalibrasieskattings, sien Zhang (2000) vir 'n Särndal and Lundström (2005) behandeling en Särndal and Lundström (2005) vir 'n Särndal and Lundström (2005) behandeling. Vir meer oor ander Kalton and Flores-Cervantes (2003) vir aanpassing vir Kalton and Flores-Cervantes (2003) , kyk Kalton and Flores-Cervantes (2003) , Brick (2013) , en Särndal and Lundström (2005) .
Nie-waarskynlikheid steekproefneming
Nie-waarskynlikheidsteekproefneming sluit 'n groot verskeidenheid ontwerpe in (Baker et al. 2013) . Fokus spesifiek op die monster van Xbox-gebruikers deur Wang en kollegas (W. Wang et al. 2015) . Jy kan aan die soort monster dink as een waar die sleutel deel van die steekproefontwerp nie die \(\pi_i\) die navorser-gedrewe waarskynlikheid van insluiting), maar die \(\phi_i\) (die respondent-gedrewe reaksie benaderings). Natuurlik is dit nie ideaal nie omdat die \(\phi_i\) onbekend is. Maar, soos Wang en kollegas het getoon, moet hierdie soort opt-in monster - selfs uit 'n steekproefraam met groot dekking fout - nie katastrofies wees as die navorser goeie hulpinligting en 'n goeie statistiese model het om hierdie probleme te verantwoord nie.
Bethlehem (2010) brei baie van die bogenoemde afleidings uit oor post-stratifikasie om beide nieresponse- en dekkingfoute in te sluit. Behalwe vir post-stratifikasie, is ander tegnieke vir die werk met nie-waarskynlikheid monsters- en waarskynlikheidsmonsters met dekking foute en nonresponse-steekproef-ooreenstemming (Ansolabehere and Rivers 2013; ??? ) , geneigdheid telling gewig (Lee 2006; Schonlau et al. 2009) , en kalibrasie (Lee and Valliant 2009) . Een algemene tema onder hierdie tegnieke is die gebruik van die hulpinligting.