L-era diġitali qed tagħmel il-kampjunar tal-probabbiltà fil-prattika aktar diffiċli u qed toħloq opportunitajiet ġodda għal teħid ta 'kampjuni mhux probabbli.
Fl-istorja tat-teħid ta 'kampjuni, kien hemm żewġ approċċi li jikkompetu: metodi ta' teħid ta 'kampjuni ta' probabbiltà u metodi ta 'teħid ta' kampjuni mhux probabbli. Għalkemm iż-żewġ approċċi ntużaw fil-jiem bikrija tat-teħid tal-kampjuni, il-kampjunar ta 'probabbiltà wasal biex jiddomina, u ħafna riċerkaturi soċjali huma mgħallma biex jaraw it-teħid ta' kampjuni mhux probabbli bi xettiċiżmu kbir. Madankollu, kif se niddeskrivi hawn taħt, il-bidliet maħluqa mill-era diġitali jfissru li huwa żmien għar-riċerkaturi li jerġgħu jikkunsidraw it-teħid ta 'kampjuni mhux probabbli. B'mod partikolari, it-teħid tal-kampjuni ta 'probabbiltà sar diffiċli biex isir fil-prattika, u t-teħid ta' kampjuni mhux probabbli kien qed jirnexxi, irħas u aħjar. Stħarriġ aktar mgħaġġel u irħas mhumiex biss truf fihom infushom: dawn jippermettu opportunitajiet ġodda bħal stħarriġiet aktar frekwenti u daqsijiet ta 'kampjuni akbar. Pereżempju, bl-użu ta 'metodi ta' nuqqas ta 'probabbiltà, l-Istudju Koperattiv tal-Elezzjoni għall-Kungress (CCES) jista' jkollu madwar 10 darbiet aktar parteċipanti minn studji preċedenti li jużaw kampjunar ta 'probabbiltà. Dan il-kampjun ħafna akbar jippermetti li r-riċerkaturi politiċi jistudjaw il-varjazzjoni fl-attitudnijiet u l-imġiba bejn is-sottogruppi u l-kuntesti soċjali. Barra minn hekk, dan l-iskala miżjud kollu daħal mingħajr tnaqqis fil-kwalità tal-estimi (Ansolabehere and Rivers 2013) .
Bħalissa, l-approċċ dominanti għat-teħid tal-kampjuni għar-riċerka soċjali huwa l -kampjunar tal-probabbiltà . Fil-probabbiltà tat-teħid tal-kampjuni, il-membri kollha tal-popolazzjoni fil-mira għandhom probabbiltà magħrufa u mhux żero li jittieħdu kampjuni minnhom, u n-nies kollha li ttieħdu bħala kampjuni jirrispondu għall-istħarriġ. Meta jintlaħqu dawn il-kundizzjonijiet, riżultati matematiċi eleganti joffru garanziji probabbli dwar il-kapaċità tar-riċerkatur li juża l-kampjun biex jagħmel inferenzi dwar il-popolazzjoni fil-mira.
Mad-dinja reali, madankollu, il-kundizzjonijiet li fuqhom huma bbażati dawn ir-riżultati matematiċi rarament jintlaħqu. Per eżempju, spiss ikun hemm żbalji ta 'kopertura u nuqqas ta' tweġiba. Minħabba dawn il-problemi, ir-riċerkaturi sikwit ikollhom jimpjegaw varjetà ta 'aġġustamenti statistiċi sabiex jagħmlu inferenza mill-kampjun tagħhom għall-popolazzjoni fil-mira tagħhom. Għalhekk, huwa importanti li ssir distinzjoni bejn il -kampjunar ta 'probabbiltà fit-teorija , li għandu garanziji teoretiċi qawwija, u teħid ta' kampjuni ta 'probabbiltà fil-prattika , li ma joffri l-ebda garanziji bħal dawn u jiddependi fuq varjetà ta' aġġustamenti statistiċi.
Matul iż-żmien, id-differenzi bejn it-teħid ta 'kampjuni ta' probabbiltà fit-teorija u probabbiltà ta 'kampjuni fil-prattika kienu qed jiżdiedu. Pereżempju, ir-rati ta 'nuqqas ta' tweġiba żdiedu b'mod kostanti, anki f'stħarriġ għaljin u ta 'kwalità għolja (figura 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . Ir-rati ta 'nuqqas ta' tweġiba huma ħafna ogħla fl-istħarriġ tat-telefown kummerċjali - kultant anke sa 90% (Kohut et al. 2012) . Dawn iż-żidiet fin-nuqqas ta 'risposta jheddu l-kwalità tal-estimi minħabba li l-istimi jiddependu dejjem aktar fuq il-mudelli statistiċi li r-riċerkaturi jużaw biex jaġġustaw għal nuqqas ta' tweġiba. Barra minn hekk, dawn it-tnaqqis fil-kwalità seħħew minkejja sforzi dejjem aktar għoljin minn riċerkaturi ta 'l-istħarriġ biex jinżammu rati għolja ta' rispons. Xi nies jibżgħu li dawn it-tendenzi ġemellati ta 'tnaqqis fil-kwalità u żieda fl-ispejjeż jheddu s-sisien tar-riċerka tal-istħarriġ (National Research Council 2013) .
Fl-istess ħin li kien hemm diffikultajiet li qed jikbru għal metodi ta 'teħid ta' kampjuni ta 'probabbiltà, kien hemm ukoll żviluppi eċċitanti f'metodi ta' teħid ta 'kampjuni mhux probabbli . Hemm varjetà ta 'stili ta' metodi ta 'teħid ta' kampjuni mhux probabbli, iżda l-unika ħaġa li għandhom komuni hija li ma jistgħux jidħlu faċilment fil-qafas matematiku ta 'teħid ta' kampjuni ta 'probabbiltà (Baker et al. 2013) . Fi kliem ieħor, f'metodi ta 'teħid ta' kampjuni mhux probabbli, mhux kulħadd għandu probabbiltà ta 'inklużjoni magħrufa u mhux żero. Metodi ta 'teħid ta' kampjuni ta 'nuqqas ta' probabbiltà għandhom reputazzjoni terribbli fost ir-riċerkaturi soċjali u huma assoċjati ma 'wħud mill-iktar fallimenti drammatiċi tar-riċerkaturi tal-istħarriġ, bħalma huma l - fiasco Literary Digest (diskuss qabel) u "Dewey Defeats Truman" elezzjonijiet presidenzjali ta 'l-1948 (figura 3.6).
Forma waħda ta 'teħid ta' kampjuni mhux probabbli li hija partikolarment adattata għall-era diġitali hija l-użu ta ' panels onlajn . Riċerkaturi li jużaw pannelli onlajn jiddependu minn xi panel provider - normalment kumpanija, gvern jew università - biex jinbena grupp kbir u varjat ta 'nies li jaqblu li jservu bħala dawk li wieġbu għall-istħarriġ. Dawn il-parteċipanti tal-pannelli ħafna drabi jiġu rreklutati permezz ta 'varjetà ta' metodi ad hoc bħal reklami banner onlajn. Imbagħad, riċerkatur jista 'jħallas lill-fornitur tal-pannell għal aċċess għal kampjun ta' dawk li wieġbu b'karatteristiċi mixtieqa (eż., Rappreżentant nazzjonali tal-adulti). Dawn il-pannelli onlajn huma metodi ta 'nuqqas ta' probabbiltà għaliex mhux kulħadd għandu probabbiltà ta 'inklużjoni magħrufa, mhux żero. Għalkemm il-panels onlajn li mhumiex probabbli diġà qed jintużaw minn riċerkaturi soċjali (eż., Is-CCES), għad hemm xi dibattitu dwar il-kwalità tal-estimi li ġejjin minnhom (Callegaro et al. 2014) .
Minkejja dawn id-dibattiti, naħseb li hemm żewġ raġunijiet għaliex iż-żmien huwa tajjeb għar-riċerkaturi soċjali biex jerġgħu jikkunsidraw it-teħid ta 'kampjuni mhux probabbli. L-ewwel, fl-era diġitali, kien hemm ħafna żviluppi fil-ġbir u l-analiżi ta 'kampjuni ta' nuqqas ta 'probabbiltà. Dawn il-metodi ġodda huma differenti biżżejjed mill-metodi li kkawżaw problemi fil-passat li naħseb li jagħmel sens li wieħed jaħseb minnhom bħala "kampjunar mhux probabbli 2.0." It-tieni raġuni għaliex ir-riċerkaturi għandhom jikkunsidraw mill-ġdid teħid ta 'kampjuni mhux probabbli huwa minħabba teħid ta' kampjuni ta 'probabbiltà il-prattika qed issir dejjem aktar diffiċli. Meta jkun hemm rati għoljin ta 'nuqqas ta' tweġiba - kif hemm fl-istħarriġ reali issa - il-probabbiltajiet attwali ta 'inklużjoni għal dawk li jwieġbu mhumiex magħrufa, u għalhekk, kampjuni ta' probabbiltà u kampjuni ta 'probabbiltà mhumiex differenti daqs kemm jemmnu ħafna riċerkaturi.
Kif għidt qabel, il-kampjuni ta 'nuqqas ta' probabbiltà huma meqjusa bi xettiċiżmu kbir minn ħafna riċerkaturi soċjali, parzjalment minħabba r-rwol tagħhom f'uħud mill-iżbalji l-aktar imbarazzanti fil-jiem bikrija tar-riċerka tal-istħarriġ. Eżempju ċar ta 'kemm aħna għandna ma' kampjuni li mhumiex ta 'probabbiltà huwa r-riċerka minn Wei Wang, David Rothschild, Sharad Goel u Andrew Gelman (2015) li rkupraw b'mod korrett ir-riżultat tal-elezzjoni tal-2012 fl-Istati Uniti billi użaw kampjun mhux probabbli ta' Utenti ta 'l-Xbox Amerikani - kampjun deċiżament nonrandom ta' l-Amerikani. Ir-riċerkaturi rreklutaw lil dawk li wieġbu mis-sistema tal-logħob XBox, u kif tista 'tistenna, il-kampjun ta' Xbox qajjem żagħżugħ maskili u żbilanċjat: 18- sa 29-il sena jiffurmaw 19% tal-elettorat iżda 65% tal-kampjun Xbox, u l-irġiel jiffurmaw 47% tal-elettorat iżda 93% tal-kampjun Xbox (figura 3.7). Minħabba dawn il-preġudizzji demografiċi qawwija, id-dejta tal-Xbox mhux ipproċessata kienet indikatur fqir tal-prospetti elettorali. Huwa mbassar rebħa qawwija għal Mitt Romney fuq Barack Obama. Għal darb'oħra, dan huwa eżempju ieħor tal-perikli ta 'kampjuni nej mhux aġġustati ta' probabbiltà u huwa reminixxenti tal-fiasco tal- Letter Digest Digest .
Madankollu, Wang u l-kollegi kienu konxji ta 'dawn il-problemi u ppruvaw jaġġustaw għall-proċess ta' teħid ta 'kampjuni mhux każwali meta għamlu estimi. B'mod partikolari, huma użaw post stratifikazzjoni , teknika li tintuża ħafna biex taġġusta kampjuni ta 'probabbiltà li għandhom żbalji ta' kopertura u nuqqas ta 'tweġiba.
L-idea prinċipali tal-post-stratifikazzjoni hija li tuża informazzjoni awżiljarja dwar il-popolazzjoni fil-mira biex tgħin ittejjeb l-istima li ġejja minn kampjun. Meta użaw post stratifikazzjoni biex jagħmlu stimi mill-kampjun ta 'nuqqas ta' probabbiltà tagħhom, Wang u l-kollegatur qatlu l-popolazzjoni fi gruppi differenti, stmaw l-appoġġ għal Obama f'kull grupp u mbagħad ħadu medja peżata tal-estimi tal-grupp biex jipproduċu stima ġenerali. Per eżempju, dawn setgħu qasmu l-popolazzjoni f'żewġ gruppi (irġiel u nisa), stmaw l-appoġġ għal Obama fost l-irġiel u n-nisa, u mbagħad stmaw appoġġ ġenerali għal Obama billi ħadu medja mwieżna sabiex jagħtu kont tal-fatt li n-nisa jagħmlu 53% tal-elettorat u rġiel ta '47%. Bejn wieħed u ieħor, il-post-stratifikazzjoni jgħin biex jikkoreġi kampjun żbilanċjat billi jġib informazzjoni awżiljarja dwar id-daqsijiet tal-gruppi.
Iċ-ċavetta għal wara l-istratifikazzjoni hija li tifforma l-gruppi t-tajbin. Jekk tista 'tnaqqas il-popolazzjoni fi gruppi omoġenji hekk li t-tendenzi ta' reazzjoni huma l-istess għal kulħadd f'kull grupp, allura l-istratifikazzjoni ta 'wara tipproduċi estimi imparzjali. Fi kliem ieħor, l-istratifikazzjoni wara l-ġeneru se tipproduċi estimi imparzjali jekk l-irġiel kollha jkollhom it-tendenza ta 'rispons u n-nisa kollha għandhom l-istess propensità ta' reazzjoni. Din is-suppożizzjoni tissejjaħ is-suppożizzjoni omoġenja-rispons-propensitajiet fi ħdan il-gruppi , u niddeskriha ftit aktar fin-noti matematiċi fl-aħħar ta 'dan il-kapitolu.
Naturalment, jidher improbabbli li l-propensitajiet ta 'rispons ikunu l-istess għall-irġiel u n-nisa kollha. Madankollu, is-suppożizzjoni omoġenja-rispons-propensitajiet fi ħdan il-gruppi ssir aktar plawsibbli hekk kif jiżdied in-numru ta 'gruppi. Bejn wieħed u ieħor, isir aktar faċli li l-popolazzjoni tinqata 'f'gruppi omoġenji jekk toħloq aktar gruppi. Pereżempju, jista 'jidher improbabbli li n-nisa kollha għandhom l-istess tendenza ta' rispons, iżda jista 'jidher iktar plawżibbli li hemm l-istess propensità ta' reazzjoni għan-nisa kollha li għandhom 18-29 sena, li ggradwaw mill-kulleġġ u li qed jgħixu fil-California . Għalhekk, peress li n-numru ta 'gruppi użati fil-post-stratifikazzjoni isir akbar, is-suppożizzjonijiet meħtieġa biex isostnu l-metodu jsiru aktar raġonevoli. Minħabba dan il-fatt, ir-riċerkaturi ħafna drabi jixtiequ joħolqu numru kbir ta 'gruppi għal wara l-istratifikazzjoni. Madankollu, hekk kif jiżdied in-numru ta 'gruppi, ir-riċerkaturi jidħlu f'xi problema differenti: id-data hija baxxa. Jekk hemm biss numru żgħir ta 'persuni f'kull grupp, allura l-istimi jkunu aktar inċerti, u fil-każ estrem fejn hemm grupp li ma jkollux dawk li wieġbu, allura l-istratifikazzjoni kompletament tinqasam.
Hemm żewġ modi minn din it-tensjoni inerenti bejn il-plawżibilità tas-suppożizzjoni omoġenja-rispons-propensità fi ħdan il-gruppi u d-domanda għal daqsijiet ta 'kampjuni raġonevoli f'kull grupp. L-ewwelnett, ir-riċerkaturi jistgħu jiġbru kampjun akbar u aktar varjat, li jgħin jiżgura qisien raġonevoli tal-kampjuni f'kull grupp. It-tieni, jistgħu jużaw mudell statistiku aktar sofistikat biex isiru stimi fi ħdan gruppi. U, fil-fatt, xi kultant ir-riċerkaturi jagħmlu t-tnejn, kif Wang u l-kollegi għamlu bl-istudju tagħhom dwar l-elezzjoni bl-użu ta 'dawk li wieġbu minn Xbox.
Minħabba li kienu qed jużaw metodu ta 'teħid ta' kampjuni mhux probabbli b'interventi amministrati mill-kompjuter (I ser nitkellmu aktar dwar intervisti amministrati mill-kompjuter fit-taqsima 3.5), Wang u l-kollegi kellhom ġbir ta 'dejta rħisa ħafna, li ppermettilhom jiġbru informazzjoni minn 345,858 parteċipant uniku , numru kbir mill-istandards tal-votazzjoni tal-elezzjoni. Dan id-daqs enormi tal-kampjuni ppermettilhom jiffurmaw numru kbir ta 'gruppi ta' wara l-istratifikazzjoni. Billi wara l-istratifikazzjoni tipikament tinvolvi l-qtugħ tal-popolazzjoni f'mezzi ta 'gruppi, Wang u l-kollegi qassmu l-popolazzjoni f'17,6,256 gruppi definiti skont is-sess (2 kategoriji), razza (4 kategoriji), età (4 kategoriji), edukazzjoni (4 kategoriji) (51 kategorija), parti ID (3 kategoriji), ideoloġija (3 kategoriji), u vot tal-2008 (3 kategoriji). Fi kliem ieħor, id-daqs enormi tal-kampjun tagħhom, li ġie attivat permezz ta 'ġbir ta' data bi prezz baxx, ippermettahom jagħmlu suppożizzjoni aktar plawżibbli fil-proċess ta 'stima tagħhom.
Anke bi 345,858 parteċipant uniku, madankollu, kien għad hemm ħafna, ħafna gruppi li għalihom Wang u l-kollegi kellhom kważi l-ebda wieġbu. Għalhekk, użaw teknika msejħa regressjoni f'diversi livelli biex tistma l-appoġġ f'kull grupp. Essenzjalment, biex jiġi stmat l-appoġġ għal Obama fi ħdan grupp speċifiku, ir-rigressjoni f'diversi livelli ġabret informazzjoni minn ħafna gruppi relatati mill-qrib. Per eżempju, jimmaġina li qed tipprova tistma l-appoġġ għal Obama fost is-Skejki nisa bejn it-18 u d-29 sena, li huma gradwati kulleġġ, li huma rreġistrati Demokratiċi, li jidentifikaw lilhom infushom bħala moderati, u li vvutaw għal Obama fl-2008. , grupp speċifiku ħafna, u huwa possibbli li m'hemm ħadd fil-kampjun b'dawn il-karatteristiċi. Għalhekk, biex tagħmel estimi dwar dan il-grupp, ir-rigressjoni f'diversi livelli tuża mudell statistiku biex jinġabru flimkien estimi minn nies f'ħafna gruppi simili.
Għalhekk, Wang u l-kollegi użaw approċċ li kkombina regressjoni f'diversi livelli u wara l-istratifikazzjoni, u għalhekk huma talbu l-istrateġija tagħhom b'livell ta 'rigressjoni f'diversi livelli wara stratifikazzjoni jew, b'mod aktar affettwat, "Is-Sur. P. "Meta Wang u l-kollegi użaw is-Sur P. biex jagħmlu estimi mill-kampjun ta 'nuqqas ta' probabbiltà ta 'XBox, huma pproduċew estimi viċin ħafna tal-appoġġ ġenerali li Obama irċieva fl-elezzjoni tal-2012 (figura 3.8). Fil-fatt l-estimi tagħhom kienu aktar preċiżi minn aggregat ta 'stħarriġiet ta' l-opinjoni pubblika tradizzjonali. Għalhekk, f'dan il-każ, l-aġġustamenti statistiċi-speċifikament is-Sur P.- jidhru li jagħmlu xogħol tajjeb li jikkoreġi l-preġudizzji f'dejta ta 'nuqqas ta' probabbiltà; preġudizzji li kienu jidhru b'mod ċar meta wieħed iħares lejn l-estimi mid-data mhux aġġustata Xbox.
Hemm żewġ lezzjonijiet ewlenin mill-istudju ta 'Wang u l-kollegi. L-ewwel, kampjuni mhux aġġustati ta 'mhux probabbiltà jistgħu jwasslu għal stimi ħżiena; din hija lezzjoni li ħafna riċerkaturi semgħu qabel. It-tieni lezzjoni, madankollu, hija li kampjuni ta 'nuqqas ta' probabbiltà, meta analizzati sewwa, jistgħu fil-fatt jipproduċu stimi tajbin; kampjuni ta 'mhux probabbiltà m'għandhomx awtomatikament iwasslu għal xi ħaġa bħalma hu l - fiasco tal- Letter Digest .
Jekk immorru 'l quddiem, jekk qed tipprova tiddeċiedi bejn l-użu ta' metodu ta 'teħid ta' kampjuni ta 'probabbiltà u metodu ta' teħid ta 'kampjuni mhux probabbli inti tiffaċċja għażla diffiċli. Xi drabi r-riċerkaturi jixtiequ regola rapida u riġida (eż., Dejjem jużaw metodi ta 'teħid ta' kampjuni ta 'probabbiltà), iżda huwa dejjem aktar diffiċli li toffri din ir-regola. Ir-riċerkaturi jiffaċċjaw għażla diffiċli bejn il-metodi ta 'teħid ta' kampjuni ta 'probabbiltà fil-prattika - li huma dejjem iktar għaljin u' l bogħod mir-riżultati teoretiċi li jiġġustifikaw l-użu tagħhom u metodi ta 'teħid ta' kampjuni li mhumiex probabbli - li huma irħas u aktar mgħaġġla, iżda inqas familjari u aktar varjati. Ħaġa waħda li hija ċara, madankollu, hija li jekk inti sfurzat taħdem b'kampjuni ta 'nuqqas ta' probabbiltà jew sorsi kbar ta 'dejta mhux rappreżentattivi (think back to Chapter 2), allura hemm raġuni valida biex wieħed jemmen li l-istimi magħmula bl-użu ta' stratifikazzjoni u tekniki relatati ma 'l-enerġija se jkunu aħjar minn mhux aġġustati, stimi mhux ipproċessati.