Amb mostres no probabilístiques, els pesos poden desfer les distorsions causades pel procés de mostreig assumit.
De la mateixa manera que els investigadors ponderar respostes de mostres de probabilitat, també poden ponderar respostes de mostres no probabilístiques. Per exemple, com una alternativa als CPS, imagini que ha col·locat anuncis de pancarta en milers de llocs web per reclutar els participants d'una enquesta per estimar la taxa d'atur. Naturalment, seria escèptic que la mitjana simple de la mostra seria una bona estimació de la taxa d'atur. El seu escepticisme és probablement perquè vostè pensa que algunes persones tenen més probabilitats de completar l'enquesta que altres. Per exemple, les persones que no passen molt de temps a la web són menys propensos a completar l'enquesta.
Com hem vist a l'apartat anterior, però, si sabem com es va seleccionar la mostra, com ho fem amb una probabilitat de mostres, llavors podem desfer les distorsions causades pel procés de mostreig. Per desgràcia, quan es treballa amb mostres no probabilístiques, no sabem com es va seleccionar la mostra. No obstant això, podem fer suposicions sobre el procés de mostreig i després aplicar la ponderació de la mateixa manera. Si aquestes suposicions són correctes, llavors la ponderació serà desfer les distorsions causades pel procés de mostreig.
Per exemple, imagina que en resposta a les seves bàners, que va reclutar 100.000 enquestats. No obstant això, vostè no creu que aquests 100.000 enquestats són una mostra aleatòria simple dels adults nord-americans. De fet, quan es compara als enquestats que la població dels Estats Units, es troba que la gent d'alguns estats (per exemple, Nova York) estan excessivament representats i que la gent d'alguns estats (per exemple, Alaska) estan poc representades. Per tant, la taxa d'atur de la mostra és probable que sigui una mala estimació de la taxa d'atur en la població objectiu.
Una manera de desfer la distorsió que va succeir en el procés de mostreig és assignar pesos a cada persona; pesos més baixos a la gent dels estats que estan representats excessivament en la mostra (per exemple, Nova York) i els pesos més alts per a la gent dels estats que estan poc representats a la mostra (per exemple, Alaska). Més específicament, el pes de cada enquestat es relaciona amb la seva prevalença en la mostra en relació amb la seva prevalença en la població nord-americana. Aquest procediment de ponderació s'anomena post-estratificació, i la idea d'un pes que ha de recordar l'exemple en la secció 3.4.1, on es van donar els enquestats de Rhode Island menys pes que els enquestats de Califòrnia. Postestratificación requereix que es conegui prou com per posar els enquestats en grups i conèixer la proporció de la població objectiu en cada grup.
Tot i que la ponderació de la mostra de probabilitat i de la mostra no probabilística són els mateixos matemàticament (vegeu l'apèndix tècnic), que funcionen bé en diferents situacions. Si l'investigador té una mostra de probabilitat perfecta (és a dir, sense l'error de cobertura i no hi ha falta de resposta), llavors la ponderació produirà estimacions objectives per a tots els trets en tots els casos. Aquesta garantia sòlida teòrica és la raó per defensors de mostres de probabilitat troben tan atractives. D'altra banda, les mostres no probabilístiques de ponderació només produiran estimacions objectives per a tots els trets si les propensions de resposta són els mateixos per a tots els membres de cada grup. En altres paraules, pensant a tornar al nostre exemple, l'ús de l'estratificació posterior produirà estimacions insesgades si tothom a Nova York té la mateixa probabilitat de participar i tothom a Alaska té la mateixa probabilitat de participar i així successivament. Aquesta suposició es diu el supòsit de resposta-propensions homogenis dins d'altres grups, i té un paper clau en saber si postestratificación funcionarà bé amb les mostres no probabilístiques.
Per desgràcia, en el nostre exemple, sembla poc probable que sigui cert el supòsit homogènia-resposta-propensions-intra-grups. És a dir, sembla poc probable que tots a Alaska té la mateixa probabilitat d'estar en la seva enquesta. No obstant això, hi ha tres punts importants a tenir en compte sobre l'estratificació posterior, tots els quals fan que sembli més prometedor.
En primer lloc, l'assumpció homogènia-resposta-propensions-intra-grups es torna més plausible com el nombre de grups augmenta. I, els investigadors no es limiten a grups simplement sobre la base d'una sola dimensió geogràfica. Per exemple, podríem crear grups basats en l'estat, edat, sexe i nivell d'educació. Sembla més plausible que no hi ha propensions de resposta homogènies en el grup de 18-29, els graduats de sexe femení, de la universitat que viuen a Alaska que dins del grup de les persones que viuen a Alaska. Per tant, com el nombre de grups utilitzats per increments posteriors a l'estratificació, els supòsits necessaris per a donar-li suport ser més raonable. Tenint en compte aquest fet, sembla que un investigador es vulgui crear un gran nombre de grups de post-estratificació. Però, com el nombre de grups augmenta, els investigadors troben amb un problema diferent: escassetat de dades. Si hi ha només un petit nombre de persones en cada grup, a continuació, les estimacions són més incerts, i en el cas extrem en què hi ha un grup que no té els enquestats, a continuació, després de l'estratificació trenca completament. Hi ha dues maneres de sortir d'aquesta tensió inherent entre la plausibilitat de la hipòtesi de resposta homogeneous - tendència-intra-grups i la demanda de mides de les mostres raonables en cada grup. Un mètode consisteix a passar a un model estadístic més sofisticat per al càlcul dels pesos i l'altre és recollir una mostra més diversa gran, el que ajuda a assegurar mides de les mostres raonables en cada grup. I, de vegades fan els investigadors tant, com vaig a descriure amb més detall a continuació.
Una segona consideració quan es treballa amb l'estratificació posterior de les mostres no probabilístiques és que el suposat homogènia-resposta-propensió-dins-grups que ja es fa amb freqüència en l'anàlisi de mostres de probabilitat. La raó per la qual és necessària aquesta hipòtesi per a mostres de probabilitat en la pràctica és que les mostres de probabilitat tenen de no resposta, i el mètode més comú per ajustar per la falta de resposta és posterior a l'estratificació com s'ha descrit anteriorment. Per descomptat, només perquè molts investigadors fan un determinat supòsit no vol dir que vostè ha de fer-ho també. No obstant això, sí que significa que en comparar les mostres no probabilístiques de mostres de probabilitat en la pràctica, cal tenir en compte que tots dos depenen de suposicions i informació auxiliar per tal de produir estimacions. En els entorns més realistes, simplement no hi ha aproximació lliure de la suposició que la inferència.
Finalment, si es preocupen per una estimació, en particular, en el nostre exemple, la desocupació de la velocitat, llavors necessita una condició més feble que de resposta-propensió dins d'altres grups homogenis suposició. En concret, no cal suposar que tothom té la mateixa propensió a respondre, només ha d'assumir que no hi ha una correlació entre la propensió de resposta i taxa d'atur dins de cada grup. Per descomptat, fins i tot aquesta condició més feble no donarà en algunes situacions. Per exemple, imagina l'estimació de la proporció de nord-americans que fan treball voluntari. Si les persones que fan treball voluntari són més propensos a estar d'acord en estar en una enquesta, a continuació, els investigadors tindran sistemàticament sobre-estimar la quantitat de treball voluntari, fins i tot si ho fan ajustos posteriors a l'estratificació, un resultat que s'ha demostrat empíricament per Abraham, Helms, and Presser (2009) .
Com he dit abans, les mostres no probabilístiques són vistos amb gran escepticisme pels científics socials, en part a causa del seu paper en alguns dels fracassos més embarassos en els primers dies de la recerca mitjançant enquestes. Un clar exemple de fins on hem arribat amb les mostres no probabilístiques és la investigació de Wei Wang, David de Rothschild, Sharad Goel, i Andrew Gelman que es va recuperar correctament el resultat de les eleccions dels Estats Units 2012 utilitzant una mostra no probabilística dels usuaris d'Amèrica Xbox -a mostra decididament no aleatòria dels nord-americans (Wang et al. 2015) . Els investigadors van reclutar als enquestats del sistema de jocs Xbox, i com era d'esperar, la mostra Xbox esbiaixats masculins i esbiaixats jove: 18 - i 29 anys representen el 19% de l'electorat però el 65% de la mostra Xbox i els homes el 47% de l'electorat i el 93% de la mostra de Xbox (Figura 3.4). A causa d'aquestes fortes tendències demogràfiques, les dades de Xbox prima era un mal indicador de resultats de l'elecció. Es va predir una forta victòria de Mitt Romney sobre Barack Obama. Un cop més, aquest és un altre exemple dels perills de, les mostres no probabilístiques no ajustats primeres i és una reminiscència del fiasco resum literari.
No obstant això, Wang i els seus col·legues van ser conscients d'aquests problemes i van tractar de ponderar els enquestats per corregir el procés de mostreig. En particular, s'utilitza una forma més sofisticada de la post-estratificació del que et vaig parlar. Val la pena aprendre una mica més sobre el seu enfocament, ja que es basa la intuïció sobre el post-estratificació, i la versió particular Wang i col · legues utilitzat és un dels enfocaments més interessants a les mostres no probabilístiques de ponderació.
En el nostre exemple senzill sobre com es calcula la desocupació a la Secció 3.4.1, es va dividir la població en grups basats en l'estat de residència. Per contra, Wang i els seus col·legues van dividir a la població en en 176.256 grups definits per: el gènere (2 categories), raça (4 categories), l'edat (4 categories), l'educació (4 categories), estatal (51 categories), Identificació de les parts (3 categories), la ideologia (3 categories) i 2008 vot (3 categories). Amb més grups, els investigadors esperaven que seria cada vegada més probable que dins de cada grup, la propensió resposta va ser correlacionat amb el suport a Obama. A continuació, en lloc de la construcció de pesos a nivell individual, com ho vam fer en el nostre exemple, Wang i els seus col·legues van utilitzar un model complex per estimar el percentatge de persones en cada grup de votar per Obama. Finalment, es combinen aquestes estimacions de grups de suport amb la mida conegut de cada grup per a produir un nivell global estimada de suport. En altres paraules, es procedeix al picat de la població en diferents grups, van estimar que el suport a Obama en cada grup, i després van prendre una mitjana ponderada de les estimacions del grup per produir una estimació global.
Per tant, el gran repte en el seu enfocament és estimar el suport a Obama en cada un d'aquests grups 176.256. Malgrat la seva panell va incloure a 345,858 participants únics, un nombre enorme per als estàndards d'enquestes electorals, hi havia molts, molts grups per als que Wang i els seus col·legues tenien gairebé cap enquestats. Per tant, per estimar el suport en cada grup es van utilitzar una tècnica anomenada regressió multinivell amb el post-estratificació, que els investigadors anomenen afectuosament el Sr. P. En essència, per estimar el suport a Obama dins d'un grup específic, el Sr. P. piscines informació de moltes grups relacionats estretament. Per exemple, consideri el desafiament d'estimar el suport a Obama entre els hispans femenins, entre 18-29 anys d'edat, que són graduats universitaris, que estan registrats els demòcrates, que s'identifiquen com a moderats, i que van votar per Obama el 2008. Aquest és un grup molt, molt específic, i és possible que no hi ha ningú a la mostra amb aquestes característiques. Per tant, per fer estimacions sobre aquest grup, el Sr. P. piscines estima juntes de la gent en grups molt similars.
Utilitzant aquesta estratègia d'anàlisi, Wang i els seus col·legues van ser capaços d'usar la mostra no probabilística XBox per estimar molt de prop el suport general que va rebre Obama en les eleccions de 2012 (Figura 3.5). De fet les seves estimacions van ser més precises que un agregat d'enquestes d'opinió pública. Per tant, en aquest cas, la ponderació de forma específica el Sr. P.-sembla fer una bona feina de corregir els biaixos en les dades no probabilístic; biaixos que són visibles quan es mira a les estimacions de les dades no ajustats Xbox.
Hi ha dues classes principals de l'estudi de Wang i els seus col·legues. En primer lloc, les mostres no probabilístiques no ajustats poden conduir a estimacions dolentes; aquesta és una lliçó que molts investigadors han sentit abans. No obstant això, la segona lliçó és que les mostres no probabilístiques, quan es ponderen adequadament, poden produir realment molt bones estimacions. De fet, les seves estimacions van ser més precises que les estimacions de pollster.com, una agregació de les enquestes electorals més tradicionals.
Finalment, hi ha limitacions importants en el que podem aprendre d'aquest estudi específic. El fet que l'estratificació posterior va funcionar bé en aquest cas particular, no hi ha cap garantia que funcionarà bé en altres casos. De fet, les eleccions són potser un dels ajustos més fàcils perquè els enquestadors han estat estudiant les eleccions per gairebé 100 anys, no hi ha informació periòdica (podem veure qui guanya les eleccions), i la identificació de les parts i les característiques demogràfiques són relativament predictiu de la votació. En aquest punt, ens falta la teoria i l'experiència empírica sòlida per saber quan pesant ajustos en mostres no probabilístiques produiran estimacions prou precises. Una cosa que està clar, però, és si es veuen obligats a treballar amb mostres no probabilístiques, llavors no hi ha raó de pes per creure que les estimacions ajustades seran millors que les estimacions no ajustades.