B'kampjuni mhux probabbiltà, piżijiet jistgħu jneħħu distorsjonijiet ikkawżati mill-proċess jassumi kampjunar.
Bl-istess mod li r-riċerkaturi piż tweġibiet minn kampjuni ta 'probabbiltà, huma jistgħu wkoll piż tweġibiet minn kampjuni mhux probabbiltà. Per eżempju, bħala alternattiva għall-CPS, jimmaġina li inti mqiegħda ads banner fuq eluf ta 'websajts biex jirreklutaw parteċipanti għal stħarriġ biex tistma r-rata tal-qgħad. Naturalment, inti tkun xettiċi li l-medja sempliċi ta 'kampjun tiegħek tkun stima tajba tar-rata tal-qgħad. xettiċiżmu tiegħek huwa probabbilment għaliex taħseb li xi nies huma aktar probabbli li jitlesta stħarriġ tiegħek minn oħrajn. Per eżempju, nies li ma jqattgħu ħafna ħin fuq l-internet huma anqas probabbli li jitlesta l-istħarriġ tiegħek.
Kif rajna fl-aħħar taqsima, madankollu, jekk nafu kif il-kampjun intagħżel-kif nagħmlu bi probabbiltà kampjuni-, imbagħad inkunu nistgħu jneħħu distorsjonijiet ikkawżati mill-proċess ta 'kampjunar. Sfortunatament, meta jaħdmu ma 'kampjuni mhux probabbiltà, ma nafux kif il-kampjun intagħżel. Iżda, nistgħu nagħmlu suppożizzjonijiet dwar il-proċess ta 'kampjunar u mbagħad japplikaw piż bl-istess mod. Jekk dawn is-suppożizzjonijiet huma korretti, allura l-ippeżar se jneħħu d-distorsjonijiet ikkawżati mill-proċess ta 'kampjunar.
Per eżempju, immaġina li b'reazzjoni għal ads banner tiegħek, inti reklutati 100,000 rispondenti. Madankollu, inti ma nemminx li dawn 100,000 rispondenti huma kampjun każwali sempliċi ta 'adulti Amerikani. Fil-fatt, meta tqabbel dawk li wieġbu tiegħek għall-popolazzjoni Amerikana, issib li nies minn xi stati (eż New York) huma rrappreżentati żżejjed u li nies minn xi stati (eż Alaska) huma sottorappreżentati. Għalhekk, ir-rata tal-qgħad tal-kampjun tiegħek huwa probabbli li jkun hemm stima ħażina tar-rata tal-qgħad fil-popolazzjoni fil-mira.
Mod wieħed li jneħħu d-distorsjoni li ġara fil-proċess ta 'kampjunar huwa biex tassenja piżijiet lil kull persuna; piżijiet aktar baxxi lejn nies minn stati li huma over-rappreżentati fil-kampjun (eż, New York) u piżijiet ogħla biex nies minn stati li huma rrappreżentati taħt fil-kampjun (eż Alaska). B'mod aktar speċifiku, il-piż għal kull konvenut huwa relatat mal-prevalenza tagħhom fil-kampjun tiegħek relattiv għall-prevalenza tagħhom fil-popolazzjoni Amerikana. Din il-proċedura ippeżar tissejjaħ 'wara l-istratifikazzjoni u l-idea ta' l-użin għandhom infakkarkom ta 'l-eżempju fit-Taqsima 3.4.1 meta wieġbu minn Rhode Island ngħataw inqas piż minn dawk li wieġbu mill-California. Wara l-istratifikazzjoni jeħtieġ li inti taf biżżejjed biex tpoġġi wieġbu tiegħek fi gruppi u li jkunu jafu l-proporzjon tal-popolazzjoni fil-mira f'kull grupp.
Għalkemm il-piż tal-kampjun probabilità u tal-kampjun mhux probabbiltà huma l-istess matematikament (ara l-appendiċi tekniku), dawn jaħdmu sew f'sitwazzjonijiet differenti. Jekk ir-riċerkatur ikollu kampjun ta 'probabbiltà perfetta (ie, m'hemm ebda żball kopertura u l-ebda nuqqas ta' rispons), imbagħad ippeżar se tipproduċi stimi mhux preferenzjali għat-karatteristiċi kollha fil-każijiet kollha. Din il-garanzija teoretiku qawwi huwa għaliex l-avukati ta 'kampjuni ta' probabbiltà jsibu posthom hekk attraenti. Min-naħa l-oħra, kampjuni mhux probabilità ta 'peżar se biss prodotti estimi mhux preferenzjali għat-karatteristiċi kollha jekk il propensities rispons huma l-istess għal kulħadd f'kull grupp. Fi kliem ieħor, il-ħsieb lura għall-eżempju tagħna, bl-użu ta 'wara l-istratifikazzjoni għandha tipproduċi stimi imparzjali jekk kulħadd fi New York kienet l-istess probabbiltà ta' parteċipanti u kulħadd fl-Alaska għandu l-istess probabbiltà ta 'parteċipanti u l-bqija. Din is-suppożizzjoni hija msejħa l-assunzjoni omoġenji-rispons-propensities--gruppi fi ħdan, u din tilgħab rwol ewlieni li jkunu jafu jekk wara l-istratifikazzjoni se taħdem ukoll ma 'kampjuni mhux probabbiltà.
Sfortunatament, fl-eżempju tagħna, l-assunzjoni omoġenju ta 'tweġiba-propensities-ġewwa' gruppi jidher improbabbli li jkun veru. Jiġifieri, jidher improbabbli li kulħadd fl-Alaska għandu l-istess probabbiltà li jkunu fil-istħarriġ tiegħek. Iżda, hemm tliet punti importanti li wieħed iżomm f'moħħu dwar wara l-istratifikazzjoni, li kollha jagħmluha jidhru aktar promettenti.
L-ewwel, omoġenju ta 'tweġiba-propensities-ġewwa' gruppi suppożizzjoni isir aktar plawsibbli bħala n-numru ta 'gruppi żidiet. U, ir-riċerkaturi mhumiex limitati għal gruppi biss bbażati fuq dimensjoni ġeografika waħda. Per eżempju, aħna jistgħu joħolqu gruppi bbażati fuq l-istat, l-età, is-sess, u l-livell ta 'edukazzjoni. Jidher aktar plawsibbli li hemm propensities rispons omoġenji fi ħdan il-grupp ta '18-29, gradwati nisa, kulleġġ jgħixu fl-Alaska milli fil-grupp tan-nies kollha li jgħixu fl-Alaska. B'hekk, in-numru ta 'gruppi użati għal żidiet' wara l-istratifikazzjoni, is-suppożizzjonijiet meħtieġa biex jappoġġjaw din issir aktar raġonevoli. Minħabba dan il-fatt, jidher li huwa simili riċerkaturi tkunx tixtieq li joħolqu għadd kbir ta 'gruppi ta' wara l-istratifikazzjoni. Iżda, bħala n-numru ta 'gruppi żidiet, riċerkaturi run fis-problema differenti: sparsity data. Jekk ikun hemm biss numru żgħir ta 'nies f'kull grupp, allura l-istimi se jkunu aktar inċert, u fil-każ estrem fejn ikun hemm grupp li m'għandha l-ebda wieġbu, allura wara l-istratifikazzjoni kompletament ikisser. Hemm żewġ modi barra ta 'dan it-tensjoni inerenti bejn il-plawżibbiltà tal homogeneous- rispons-propensità-fi zmien il-gruppi suppożizzjoni u d-domanda għal daqsijiet tal-kampjuni raġonevoli f'kull grupp. Approċċ wieħed huwa li jimxu lejn mudell statistiku aktar sofistikat għall-kalkolu piżijiet u l-ieħor huwa li jiġbru akbar, kampjun aktar diversa, li jgħin jiżgura daqsijiet tal-kampjuni raġonevoli f'kull grupp. U, xi kultant riċerkaturi jagħmlu t-tnejn, kif jien ser tiddeskrivi f'aktar dettall hawn taħt.
It-tieni konsiderazzjoni meta jkunu qed jaħdmu ma 'post-stratifikazzjoni minn kampjuni mhux probabbiltà hija li l-assunzjoni omoġenju-rispons-propensità-fi zmien il-gruppi huwa diġà ta' spiss magħmula meta jiġu analizzati kampjuni ta 'probabbiltà. Ir-raġuni li din is-suppożizzjoni hija meħtieġa għall-kampjuni ta 'probabbiltà fil-prattika hija li kampjuni ta' probabbiltà jkollhom nuqqas ta 'rispons, u l-aktar metodu komuni għall-aġġustament minħabba nuqqas ta' rispons huwa wara l-istratifikazzjoni kif deskritt hawn fuq. Of course, sempliċement minħabba li ħafna riċerkaturi jagħmlu suppożizzjoni ċertu ma jfissirx li inti għandek tagħmel dan wisq. Iżda, dan ma jfissirx li meta jitqabblu kampjuni mhux probabbiltà li kampjuni ta 'probabbiltà fil-prattika, aħna għandu jżomm f'moħħu li t-tnejn jiddependu fuq suppożizzjonijiet u l-informazzjoni awżiljari sabiex jiġu prodotti estimi. Fil-settings aktar realistiċi, sempliċement m'hemmx approċċ bla suppożizzjoni li deduzzjoni.
Fl-aħħarnett, jekk inti care about waħda stima b'mod partikulari fil-eżempju tal-qgħad tagħna rata imbagħad inti għandek bżonn kondizzjoni dgħajfa minn omoġenji-rispons-propensità--gruppi fi ħdan suppożizzjoni. Speċifikament, inti m'għandekx bżonn li wieħed jassumi li kulħadd għandu l-istess propensità rispons, inti għandek bżonn biss li wieħed jassumi li m'hemmx korrelazzjoni bejn propensità rispons u r-rata tal-qgħad fi ħdan kull grupp. Naturalment, anke din il-kundizzjoni dgħajfa mhux se jkollhom f'ċerti sitwazzjonijiet. Per eżempju, immaġina stmat il-proporzjoni tal-Amerikani li jagħmlu xogħol volontarju. Jekk in-nies li jagħmlu xogħol volontarju huma aktar probabbli li jaqblu li jkunu fi stħarriġ, imbagħad ir-riċerkaturi ser sistematikament fuq il-stima tal-ammont ta 'volontarjat, anki jekk dawn ma aāāustamenti wara l-istratifikazzjoni, riżultat li ntwera b'mod empiriku permezz Abraham, Helms, and Presser (2009) .
Kif għidt qabel, kampjuni mhux probabilità huma meqjusa b'xettiċiżmu kbira minn xjentisti soċjali, parzjalment minħabba r-rwol tagħhom fil wħud mill-aktar nuqqasijiet embarrassing fil-jiem bikrija tar-riċerka istħarriġ. Eżempju ċar ta 'kemm għandna ġejjin ma' kampjuni mhux probabbiltà hija r-riċerka ta 'Wei Wang, David Rothschild, Sharad Goel, u Andrew Gelman li suppost rkuprat-riżultat tal-elezzjoni Istati Uniti 2012 permezz ta' kampjun mhux probabbiltà ta 'utenti Amerikana Xbox -a kampjun deċiżament mhux bl-addoċċ tal-Amerikani (Wang et al. 2015) . Ir-riċerkaturi ingaġġati li wieġbu mis-sistema tal-logħob Xbox, u kif inti tista 'tistenna, il-kampjun Xbox distorti maskili u distorti żgħażagħ: 18 - dawk li għandhom bejn 29 sena jiffurmaw 19% tal-elettorat, iżda 65% tal-kampjun Xbox u l-irġiel tpatti 47% tal-elettorat u 93% tal-kampjun Xbox (Figura 3.4). Minħabba dawn preġudizzji demografiċi qawwija, id-data Xbox prima kienet indikatur fqira tar-redditi elettorali. Hija mbassra rebħa qawwija għall Mitt Romney fuq Barack Obama. Għal darb'oħra, dan huwa eżempju ieħor tal-perikli ta ', kampjuni prima mhux aġġustati mhux probabbiltà u huwa reminixxenti tal-fiasco Letterarji Digest.
Madankollu, Wang u l-kollegi kienu konxji ta 'dawn il-problemi u attentat għall-piż li wieġbu biex jikkoreġu għall-proċess ta' kampjunar. B'mod partikolari, huma użati forma aktar sofistikata ta 'wara l-istratifikazzjoni I qallek dwar. Huwa ta 'min jitgħallmu ftit aktar dwar l-approċċ tagħhom minħabba li jibni intwizzjoni dwar wara l-istratifikazzjoni, u l-verżjoni partikolari Wang u l-kollegi użat huwa wieħed mill-aktar approċċi eċċitanti għal kampjuni mhux probabbiltà ippeżar.
Fl-eżempju sempliċi tagħna dwar stmati qgħad fit-Taqsima 3.4.1, aħna maqsuma l-popolazzjoni fi gruppi bbażata fuq l-istat ta 'residenza. B'kuntrast, Wang u l-kollegi qasmet il-popolazzjoni fi fis 176,256 gruppi definiti minn: is-sess (2 kategoriji), razza (4 kategoriji), l-età (4 Kategoriji), l-edukazzjoni (4 kategoriji), l-istat (51 kategoriji), parti ID (3 kategoriji), ideoloġija (3 kategoriji) u 2008 vot (3 kategoriji). Ma 'gruppi aktar, ir-riċerkaturi ttamat li jkun dejjem iżjed probabbli li fi ħdan kull grupp, propensità rispons kien ma jkunx korelatat ma' appoġġ għal Obama. Sussegwentement, aktar milli kostruzzjoni piżijiet ta 'livell individwali, kif għamilna fl-eżempju tagħna, Wang u l-kollegi użat mudell kumpless li jiġi stmat il-proporzjon ta' nies f'kull grupp li ser tivvota għal Obama. Fl-aħħarnett, huma kombinati dawn l-estimi tal-grupp ta 'appoġġ mad-daqs magħrufa ta' kull grupp li jipproduċi livell globali stmat ta 'appoġġ. Fi kliem ieħor, huma mqatta 'biċċiet tal-popolazzjoni fi gruppi differenti, stmat l-appoġġ għal Obama f'kull grupp, u mbagħad ħa medja peżata tal-istimi tal-grupp sabiex jipproduċu stima globali.
Għalhekk, l-isfida kbira fl-approċċ tagħhom huwa li jiġi stmat l-appoġġ għal Obama f'kull wieħed minn dawn il-gruppi 176,256. Għalkemm bord tagħhom inklużi 345,858 parteċipanti uniku, numru kbir mill-istandards ta 'votazzjoni elezzjoni, kien hemm ħafna, ħafna gruppi li għalihom Wang u l-kollegi ma kellhom kważi l-ebda rispondenti. Għalhekk, biex jiġi stmat l-appoġġ f'kull grupp huma użati ta 'teknika msejħa rigressjoni f'diversi livelli ma' wara l-stratifikazzjoni, li r-riċerkaturi affectionately sejħa Sur P. Essenzjalment, biex jiġi stmat l-appoġġ għal Obama fi ħdan grupp speċifiku, is-Sur P. pixxini informazzjoni minn ħafna gruppi relatati mill-qrib. Per eżempju, jikkunsidraw l-isfida tal-istima tal-appoġġ għal Obama fost Ispaniċi nisa, bejn 18-29 sena, li huma gradwati kulleġġ, li huma reġistrati Demokratiċi, li l-awto-identifikati bħala jimmodera, u li vvutaw għal Obama fl 2008. Dan huwa grupp ferm, speċifiċi ħafna, u huwa possibbli li jkun hemm ħadd fil-kampjun ma 'dawn il-karatteristiċi. Għalhekk, biex jagħmlu stimi dwar dan il-grupp, is-Sur P. pixxini flimkien jistima minn nies fi gruppi simili ħafna.
Bl-użu ta din l-istrateġija l-analiżi, Wang u l-kollegi kienu kapaċi jużaw il-kampjun mhux probabbiltà Xbox biex jistmaw mill-qrib ħafna l-appoġġ ġenerali li Obama rċeviet fl-elezzjoni 2012 (Figura 3.5). Fil-fatt l-istimi tagħhom kienu aktar preċiżi milli aggregat ta 'stħarriġ tal-opinjoni pubblika. Għalhekk, f'dan il-każ,-ippeżar speċifikament Sur P. 'jidher li jagħmlu xogħol tajjeb tikkoreġi l-preġudizzji fid-data mhux probabbiltà; preġudizzji li huma viżibbli meta inti tħares lejn l-estimi mill-informazzjoni Xbox mhux aġġustati.
Hemm żewġ lezzjonijiet ewlenin mill-istudju ta 'Wang u l-kollegi. L-ewwel, kampjuni mhux probabilità mhux aġġustati jistgħu jwasslu għal stimi ħżiena; din hija lezzjoni li ħafna riċerkaturi smajt qabel. Madankollu, it-tieni lezzjoni hija li kampjuni mhux probabbiltà, meta peżati kif suppost, jistgħu attwalment prodotti estimi pjuttost tajba. Fil-fatt, l-istimi tagħhom kienu aktar preċiż milli l-estimi minn pollster.com, aggregazzjoni ta stħarriġ aktar tradizzjonali elettorali.
Fl-aħħarnett, hemm limitazzjonijiet importanti għal dak li nistgħu nitgħallmu minn dan l-istudju speċifiku wieħed. Sempliċiment għax wara l-istratifikazzjoni ħadem tajjeb f'dan il-każ partikolari, m'hemm l-ebda garanzija li din se taħdem ukoll f'każijiet oħra. Fil-fatt, l-elezzjonijiet huma forsi wieħed mill-settings eħfef għax pollsters ilhom jistudjaw elezzjonijiet għal kważi 100 sena, hemm feedback regolari (nistgħu naraw li jirbaħ l-elezzjonijiet), u l-identifikazzjoni partit u l-karatteristiċi demografiċi huma relattivament tbassir ta 'votazzjoni. Wara dan, aħna n-nuqqas teorija solidu u esperjenza empirika li tkun taf meta jiżnu aġġustamenti għat kampjuni mhux probabilità se jipproduċi stimi preċiżi biżżejjed. Ħaġa waħda li hija ċara, madankollu, huwa jekk inti huma sfurzati li jaħdmu ma 'kampjuni mhux probabbiltà, allura hemm raġuni qawwija biex wieħed jemmen li l-istimi aġġustati se tkun aħjar minn stimi mhux aġġustati.