Laj dijital la ap fè echantiyon pwobabilite nan pratik pi rèd epi li kreye nouvo opòtinite pou echantiyon ki pa pwobabilite.
Nan istwa a nan echantiyon, te gen de apwòch konkiran: metòd pou pran echantiyon pwobabilite ak ki pa Peye-probabilite metòd. Malgre ke tou de apwòch yo te itilize nan jou yo byen bonè nan echantiyon, pran echantiyon pwobabilite rive domine, ak anpil chèchè sosyal yo anseye yo wè echantiyon ki pa Peye-probabilite ak dout gwo. Sepandan, jan mwen pral dekri anba a, chanjman ki fèt pa laj dijital vle di ke li se tan pou chèchè yo rekonsidere echantiyon ki pa Peye-probabilite. An patikilye, pran echantiyon pwobabilite ki te vin difisil fè nan pratik, ak echantiyon ki pa Peye-probabòl ki te resevwa pi vit, pi bon mache, ak pi bon. Pi vit ak pi bon mache sondaj yo pa sèlman fini nan tèt yo: yo pèmèt nouvo opòtinite tankou sondaj pi souvan ak pi gwo gwosè echantiyon. Pou egzanp, lè l sèvi avèk metòd ki pa pwobabilite Kowoperatif Kongrè a Eleksyon Etid (CCES) se kapab gen apeprè 10 fwa plis patisipan pase etid pi bonè lè l sèvi avèk probabilite echantiyon. Sa a pi gwo echantiyon pèmèt chèchè politik yo etid varyasyon nan atitid ak konpòtman atravè gwoup ak kontèks sosyal. Pli lwen, tout echèl sa a ajoute san yo pa diminye nan bon jan kalite a nan estimasyon (Ansolabehere and Rivers 2013) .
Kounye a, apwòch dominan nan echantiyon pou rechèch sosyal se probabilite echantiyon . Nan echantiyon pwobabilite, tout manm nan popilasyon an sib gen yon li te ye, pwobabilite nonzero pou yo te echantiyon, ak tout moun ki echantiyon reponn a sondaj la. Lè kondisyon sa yo satisfè, elegant rezilta matematik ofri garanti provable sou kapasite yon chèchè pou itilize echantiyon an pou fè enferans sou popilasyon sib la.
Nan mond reyèl la, sepandan, kondisyon ki kache rezilta sa yo matematik yo raman te rankontre. Pou egzanp, gen souvan erè pwoteksyon ak nonresponse. Poutèt pwoblèm sa yo, chèchè souvan gen pou anplwaye yon varyete ajisteman estatistik pou yo ka fè enferans nan echantiyon yo nan popilasyon sib yo. Kidonk, li enpòtan pou distenge probabilite problenm nan teyori , ki gen gwo garanti teyorik, ak probabilite echantiyon an nan pratik , ki ofri pa gen okenn garanti sa yo ak depann sou yon varyete ajisteman estatistik.
Apre yon sèten tan, diferans ki genyen ant echantiyon probabilite nan teyori ak probabilite echantiyon nan pratik yo te ogmante. Pou egzanp, pousantaj san repons yo te piti piti ogmante, menm nan bon kalite, sondaj chè (figi 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . Pousantaj san repons yo pi wo nan sondaj telefòn komèsyal yo - pafwa menm kòm yon wo 90% (Kohut et al. 2012) . Sa yo ogmante nan nonresponse menase bon jan kalite a nan estimasyon paske estimasyon yo de pli zan pli depann sou modèl yo statistik ke chèchè sèvi ak ajiste pou nonresponse. Pli lwen, sa yo diminye nan bon jan kalite te rive malgre efò de pli zan pli chè pa chèchè sondaj yo kenbe pousantaj repons segondè. Gen kèk moun ki gen krentif pou tandans sa yo jimo nan diminye bon jan kalite ak ogmante pri menase fondasyon an nan rechèch sondaj (National Research Council 2013) .
An menm tan an ke gen te ap grandi difikilte pou metòd pou pran echantiyon pwobabilite, te gen tou te enteresan devlopman nan ki pa Peye-probabilite metòd metòd . Gen yon varyete de estil nan ki pa Peye-probabilite metòd metòd, men bagay la yon sèl ke yo gen an komen se yo ke yo pa ka fasil anfòm nan matematik la nan probabilite echantiyon (Baker et al. 2013) . Nan lòt mo, nan ki pa Peye-probabilite metòd metòd pa tout moun gen yon pwobabilite li te ye ak nonzero nan enklizyon. Ki pa Peye-pwobabilite metòd pran echantiyon yo gen yon repitasyon terib nan mitan chèchè sosyal yo epi yo asosye ak kèk nan echèk ki pi dramatik nan chèchè sondaj, tankou fyasko la Digest literè (diskite pi bonè) ak "Dewey Dezyèm Truman," prediksyon an kòrèk sou US la eleksyon prezidansyèl nan 1948 (figi 3.6).
Yon fòm ki pa Peye-probabilite echantiyon ki se patikilye adapte a laj dijital la se itilize nan panno sou entènèt . Chèchè yo itilize panno sou entènèt depann sou kèk founisè panèl-anjeneral yon konpayi, gouvènman, oswa inivèsite-yo konstwi yon gwo, divès gwoup moun ki dakò sèvi kòm repond pou sondaj yo. Patisipan yo panèl sa yo souvan rekrite lè l sèvi avèk yon varyete metòd ad hoc tankou anons sou entènèt banyè. Lè sa a, yon chèchè ka peye founisè panèl la pou aksè a yon echantiyon nan moun ki repond ak karakteristik vle (egzanp, reprezantan nasyonalman nan adilt). Panno sa yo sou entènèt se metòd ki pa pwobabilite paske se pa tout moun gen yon li te ye, pwobabilite nonzero nan enklizyon. Malgre ke pa gen okenn pwobabilite sou entènèt panno yo deja ke yo te itilize pa chèchè sosyal (egzanp, CCES la), gen toujou kèk deba sou bon jan kalite a nan estimasyon ki soti nan yo (Callegaro et al. 2014) .
Malgre sa yo deba, mwen panse ke gen de rezon ki fè tan an se bon pou chèchè sosyal rekonsidere echantiyon ki pa Peye-probabilite. Premyèman, nan laj dijital la, te gen anpil devlopman nan koleksyon an ak analiz echantiyon ki pa pwobabilite yo. Metòd sa yo ki pi avanse yo diferan ase nan metòd ki te lakòz pwoblèm nan tan lontan an ke mwen panse ke li fè sans yo panse a yo kòm "ki pa Peye-probabilite echantiyon 2.0." Rezon ki fè an dezyèm poukisa chèchè yo ta dwe rekonsidere echantiyon ki pa Peye-probabilite se paske probabilite echantiyon nan pratik yo vin de pli zan pli difisil. Lè gen gwo pousantaj nan repons ki pa repons-kòm gen nan sondaj reyèl kounye a-pwobablite aktyèl yo nan enklizyon pou repond yo pa li te ye, e konsa, echantiyon pwobabilite ak echantiyon ki pa Peye-probabilite yo pa menm jan diferan kòm chèchè anpil kwè.
Kòm mwen te di pi bonè, echantiyon ki pa pwobabilite yo ap wè ak dout gwo pa chèchè sosyal anpil, an pati paske nan wòl yo nan kèk nan echèk ki pi anbarasan nan jou yo byen bonè nan rechèch sondaj. Yon egzanp klè nan ki jan lwen nou te vini ak echantiyon ki pa pwobabilite se rechèch la pa Wei Wang, David Rothschild, Sharad Goel, ak Andrew Gelman (2015) ki kòrèkteman refè rezilta a nan 2012 US eleksyon an lè l sèvi avèk yon echantiyon ki pa pwobabilite nan Ameriken Xbox itilizatè-yon echantiyon dezièmman nonrandom nan Ameriken yo. Chèchè yo rekrite repond nan sistèm bank bank XBox la, ak jan ou ta ka atann, echantiyon an Xbox fose ti gason ak koud jèn: 18- a 29-ane-fin vye granmoun fè moute 19% nan elektora a men 65% nan echantiyon an Xbox, ak moun fè 47% nan elektora a men 93% nan echantiyon an Xbox (figi 3.7). Paske nan sa yo dezi demografik fò, done yo anvan tout koreksyon Xbox te yon endikatè pòv nan retounen eleksyon. Li prevwa yon viktwa fò pou Mitt Romney sou Barack Obama. Ankò, sa a se yon lòt egzanp nan danje ki genyen nan echantiyon kri, unadjusted ki pa pwobabilite ak se okoumansman de fyasko nan Digest literè .
Sepandan, Wang ak kòlèg li yo te okouran de pwoblèm sa yo epi yo te eseye ajiste pou pwosesis san tiyo echantiyon yo lè yo fè estimasyon yo. An patikilye, yo itilize post-stratifikasyon , yon teknik ki tou lajman itilize ajiste echantiyon pwobabilite ki gen erè pwoteksyon ak ki pa repons.
Lide prensipal la nan pòs-stratifikasyon se yo sèvi ak enfòmasyon oksilyè sou popilasyon an sib ede amelyore estimasyon an ki soti nan yon echantiyon. Lè w ap itilize estatistik pou fè estimasyon ki soti nan echantiyon ki pa pwobabilite yo, Wang ak kolèg koupe popilasyon an nan diferan gwoup, estime sipò pou Obama nan chak gwoup, ak Lè sa a, te pran yon mwayèn weighted nan gwoup la estime yo pwodwi yon estimasyon an jeneral. Pou egzanp, yo te kapab fann popilasyon an nan de gwoup (gason ak fanm), estime sipò pou Obama nan mitan gason ak fanm, ak Lè sa a estime an jeneral sipò pou Obama pa pran yon mwayèn filye yo nan lòd yo kont pou lefèt ke fanm fè up 53% nan elektora a ak gason 47%. Apeprè, pòs-stratifikasyon ede kòrèk pou yon echantiyon dezekilib pa pote nan enfòmasyon oksilyè sou gwosè yo nan gwoup yo.
Kle pou pòs-stratifikasyon se pou fòme gwoup dwa yo. Si ou ka koupe popilasyon an nan gwoup omojèn sa yo ki pwopans yo repons yo se menm bagay la pou tout moun nan chak gwoup, Lè sa a, pòs-stratifikasyon ap pwodwi estimasyon san patipri. Nan lòt mo, pòs-stratifye pa sèks yo pral pwodwi estime san patipri si tout moun gen repons lan prospesi ak tout fanm gen menm repons lan repons. Sa a se sipozisyon yo rele omojèn-repons-propensité yo-nan-gwoup sipozisyon, epi mwen dekri li yon ti jan pi plis nan nòt yo matematik nan fen chapit sa a.
Natirèlman, li sanble fasil ke pwopozisyon yo pral menm bagay la pou tout moun ak tout fanm. Sepandan, sipozisyon yo omojene-repons-propensité-nan-gwoup yo vin pi plis posib kòm kantite gwoup ogmante. Apeprè, li vin pi fasil yo koupe popilasyon an nan gwoup omojèn si ou kreye plis gwoup. Pou egzanp, li ta ka sanble implausible ke tout fanm gen menm repons lan repons, men li ta ka sanble pi plis posib ke gen repons lan menm repons pou tout fanm ki gen laj 18-29, ki gradye nan kolèj, ak ki ap viv nan California . Se konsa, kòm kantite gwoup yo itilize nan post-stratifikasyon vin pi gwo, sipozisyon yo bezwen sipòte metòd la vin pi rezonab. Bay sa a reyalite, chèchè souvan vle kreye yon nimewo gwo gwoup pou post-stratifikasyon. Sepandan, kòm kantite gwoup ogmante, chèchè yo antre nan yon pwoblèm diferan: done spadsity. Si gen sèlman yon ti kantite moun ki nan chak gwoup, Lè sa a, estimasyon yo pral gen plis ensèten, ak nan ka a ekstrèm kote gen yon gwoup ki pa gen okenn repond, Lè sa a, post-stratifikasyon konplètman kraze.
Gen de fason soti nan tansyon sa a nannan ant plausibilite nan omojene-repons-propensity a-nan-gwoup sipozisyon ak demann lan pou gwosè echantiyon rezonab nan chak gwoup. Premyèman, chèchè yo ka kolekte yon pi gwo, echantiyon plis divès, ki ede asire gwosè echantiyon rezonab nan chak gwoup. Dezyèmman, yo ka itilize yon modèl plis sofistike estatistik pou fè estimasyon nan gwoup yo. Epi, an reyalite, pafwa chèchè fè tou de, menm jan Wang ak kòlèg yo te fè ak etid yo nan eleksyon an lè l sèvi avèk repond nan Xbox.
Paske yo te sèvi ak yon metòd echantiyon ki pa pwobabilite ak entèvyou òdinatè ki administre (mwen pral pale plis sou entèvyou òdinatè administre nan seksyon 3.5), Wang ak kòlèg li yo te gen koleksyon trè bon mache, ki pèmèt yo kolekte enfòmasyon ki soti nan 345.858 patisipan inik , yon nimewo gwo pa estanda yo nan biwo vòt eleksyon an. Sa a gwosè echantiyon masiv pèmèt yo fòme yon nimewo gwo pòs-stratifikasyon gwoup yo. Pandan ke post-stratifikasyon tipikman enplike nan koupe popilasyon an nan dè santèn de gwoup, Wang ak kòlèg divize popilasyon an nan 176.256 gwoup defini nan sèks (2 kategori), ras (4 kategori), laj (4 kategori), edikasyon (4 kategori), eta (51 kategori), pati ID (3 kategori), ideoloji (3 kategori), ak vòt 2008 (3 kategori). Nan lòt mo, gwosè gwo echantiyon yo, ki te pèmèt pa koleksyon pri ki ba-pri, pèmèt yo fè yon sipozisyon plis posib nan pwosesis estimasyon yo.
Menm ak 345.858 patisipan inik, sepandan, te gen toujou anpil, anpil gwoup pou ki Wang ak kòlèg li te gen prèske pa gen okenn repond. Se poutèt sa, yo te itilize yon teknik rele retou annaryè pou estime sipò nan chak gwoup. Esansyèlman, pou estime sipò pou Obama nan yon gwoup espesifik, retou annè multilevel la pile enfòmasyon ki soti nan anpil gwoup ki gen rapò ak anpil. Pou egzanp, imajine ap eseye estime sipò a pou Obama pami panyòl fi ant 18 ak 29 zan, ki gradye nan kolèj, ki moun ki anrejistre Demokrat, ki moun ki idantifye tèt yo kòm modates, epi ki te vote pou Obama nan 2008. Sa a se yon trè , trè espesifik gwoup, e li posib ke gen pèsonn nan echantiyon an ak karakteristik sa yo. Se poutèt sa, fè estimasyon sou gwoup sa a, retou annaryè multilevel itilize yon modèl estatistik nan pisin ansanm estime moun nan gwoup ki sanble anpil.
Kidonk, Wang ak kòlèg li yo te itilize yon apwòch ki te konbine plizyè retou annaryè ak pòs-stratifikasyon, se konsa yo rele retousyon estrateji multilevel yo ak post-stratifikasyon oswa, plis afeksyon, "Mesye. P. "Lè Wang ak kòlèg yo te itilize Mesye P. pou fè estimasyon de echantiyon ki pa pwobabilite XBox yo, yo te pwodui estime trè pre sipò an jeneral ke Obama te resevwa nan eleksyon 2012 la (figi 3.8). An reyalite estimasyon yo te pi egzak pase yon total de biwo vòt opinyon tradisyonèl yo. Se konsa, nan ka sa a, ajisteman estatistik-espesyalman Mesye P.-sanble yo fè yon bon travay korije prejije yo nan ki pa Peye-pwobabilite done; prejije ki te vizib klèman lè ou gade nan estimasyon yo soti nan done yo Xbox unadjusted.
Gen de leson prensipal nan etid Wang ak kòlèg li. Premyèman, unadjusted echantiyon ki pa pwobabilite ka mennen nan estime move; sa a se yon leson ke chèchè anpil te tande anvan. Dezyèm leson an, sepandan, se ke echantiyon ki pa pwobabilite, lè yo analize byen, ka aktyèlman pwodwi estimasyon bon; Ki pa Peye-pwobabilite echantiyon pa bezwen otomatikman mennen nan yon bagay tankou fyasko la Digest literè .
Ale pi devan, si ou ap eseye deside ant lè l sèvi avèk yon apwòch echantiyon pwobabilite ak yon apwòch echantiyon ki pa Peye-probabilite ou fè fas a yon chwa difisil. Pafwa chèchè vle yon règ rapid ak rijid (egzanp, toujou itilize metòd pou pran echantiyon pwobabilite), men li se de pli zan pli difisil yo ofri tankou yon règ. Chèchè fè fas a yon chwa difisil ant metòd problèm probabilite nan pratik-ki se de pli zan pli chè ak byen lwen soti nan rezilta yo teyorik ki jistifye itilizasyon-yo ak ki pa Peye-probabilite metòd metòd-ki se pi bon mache ak pi vit, men mwens abitye ak plis varye. Yon sèl bagay ki klè, sepandan, se ke si ou yo fòse yo travay ak echantiyon ki pa Peye-pwobabilite oswa nonrepresentative gwo done done (panse tounen nan Chapit 2), Lè sa a, gen yon rezon ki fè fò yo kwè ke estimasyon te fè lè l sèvi avèk post-stratifikasyon ak ki gen rapò ak teknik yo pral pi bon pase estimasyon unjustjusted, anvan tout koreksyon.