Si wote sampuli zisizo uwezekano ni sawa. Tunaweza kuongeza udhibiti zaidi juu ya mwisho mbele.
mbinu Wang na wenzake kutumika kukadiria matokeo ya 2012 US uchaguzi wa rais wanategemea kabisa juu ya maboresho katika uchambuzi wa data. Yaani, walikusanya majibu kama wengi kama wanaweza na kisha alijaribu re-uzito yao. mkakati nyongeza kwa kufanya kazi na zisizo uwezekano sampuli ni kuwa na udhibiti zaidi juu ya mchakato wa ukusanyaji wa takwimu.
Mfano rahisi ya sehemu kudhibitiwa zisizo uwezekano sampuli mchakato ni upendeleo sampuli, mbinu ambayo inakwenda nyuma siku za mwanzo za utafiti utafiti. Katika upendeleo sampuli, watafiti kugawanya idadi ya watu katika makundi mbalimbali (kwa mfano, vijana, wanawake vijana, nk) na upendeleo kisha kuweka kwa idadi ya watu kwa kuwa kuchaguliwa katika kila kundi. Waliohojiwa ni kuchaguliwa kwa namna isiyokuwa na mpangilio mpaka mtafiti amekutana upendeleo wao katika kila kundi. Kwa sababu ya upendeleo, sampuli kusababisha inaonekana zaidi kama walengwa kuliko itakuwa kweli vinginevyo, lakini kwa sababu probabilities ya kuingizwa ni haijulikani watafiti wengi ni wasiwasi juu ya upendeleo sampuli. Kwa kweli, upendeleo sampuli ilikuwa sababu ya "Dewey kushindwa Truman" makosa mwaka 1948 uchaguzi Marekani Rais. Kwa sababu inatoa baadhi ya udhibiti wa mchakato sampuli, hata hivyo, mtu anaweza kuona jinsi upendeleo sampuli wanaweza kuwa na baadhi ya faida juu ya ukusanyaji wa takwimu ulafi kabisa.
Kusonga zaidi upendeleo sampuli, mbinu za kisasa zaidi kwa kudhibiti zisizo uwezekano sampuli mchakato ni sasa inawezekana. Mmoja kama mbinu inaitwa sampuli vinavyolingana, na ni kutumiwa na baadhi ya kibiashara online watoa jopo. Katika hali yake ya rahisi, sampuli vinavyolingana inahitaji data miwili vyanzo: 1) rejista kamili ya idadi ya watu na 2) jopo kubwa ya kujitolea. Ni muhimu kwamba kujitolea huna haja ya kuwa na uwezekano sampuli kutoka idadi ya watu wo wote; kusisitiza kwamba hakuna mahitaji kwa ajili ya uteuzi katika jopo, mimi itabidi kuiita jopo chafu. Pia, wote wawili idadi ya watu kujiandikisha na jopo chafu lazima ni pamoja na baadhi ya taarifa msaidizi kuhusu kila mtu, katika mfano huu, mimi itabidi kufikiria umri na jinsia, lakini katika hali ya kweli habari hii msaidizi inaweza kuwa zaidi ya kina. Hila ya sampuli vinavyolingana ni kuchagua sampuli kutoka kwa jopo chafu kwa njia ambayo inazalisha sampuli ili kuangalia kama sampuli uwezekano.
Mfano wa vinavyolingana huanza wakati simulated uwezekano sampuli ni kuchukuliwa kutoka kujiandikisha idadi ya watu; huu sampuli simulated inakuwa Lengo sampuli. Kisha, kulingana na habari msaidizi, kesi katika lengo sampuli ni kuendana na watu katika jopo chafu na kuunda sampuli kuendana. Kwa mfano, kama kuna 25 umri wa miaka kike katika lengo sampuli, basi mtafiti anaona kike 25 umri wa miaka kutoka kwa jopo chafu kuwa katika sampuli kuendana. Hatimaye, wanachama wa sampuli kuendana ni waliohojiwa kuzalisha seti ya mwisho ya washiriki.
Japokuwa sampuli kuendana inaonekana kama lengo sampuli, ni muhimu kukumbuka kwamba sampuli kuendana si uwezekano sampuli. sampuli kuendana inaweza tu mechi Lengo sampuli juu ya habari inayojulikana msaidizi (kwa mfano, umri na jinsia), lakini si juu ya tabia ya unmeasured. Kwa mfano, kama watu juu ya jopo chafu huwa na kuwa maskini-baada ya yote, sababu moja kujiunga jopo utafiti ni kupata fedha-basi hata kama sampuli kuendana inaonekana kama lengo sampuli katika suala la umri na jinsia itakuwa bado kuwa na upendeleo kuelekea watu maskini. uchawi wa kweli uwezekano sampuli ni utawala wa nje matatizo juu ya sifa zote mbili kipimo na unmeasured (hatua hiyo inaendana na mjadala wetu wa vinavyolingana kwa causal inference kutoka masomo ya uchunguzi katika sura ya 2).
Katika mazoezi, sampuli vinavyolingana inategemea kuwa kubwa na tofauti jopo hamu ya kukamilisha tafiti, na hivyo ni hasa kufanyika kwa makampuni ambayo inaweza kumudu kuendeleza na kudumisha jopo hizo. Pia, katika mazoezi, kuna kuwa na matatizo na vinavyolingana (wakati mwingine mechi nzuri kwa mtu katika lengo sampuli haipo kwenye jopo) na yasiyo ya majibu (wakati mwingine watu katika sampuli kuendana kukataa kushiriki katika utafiti). Kwa hiyo, katika mazoezi, watafiti kufanya sampuli vinavyolingana pia kufanya aina fulani ya marekebisho baada ya stratification kufanya makadirio.
Ni vigumu kutoa muhimu dhamana ya kinadharia kuhusu sampuli vinavyolingana, lakini katika mazoezi anaweza kufanya vizuri. Kwa mfano, Stephen Ansolabehere na Brian Schaffner (2014) ikilinganishwa tafiti tatu sambamba ya watu wapatao 1,000 uliofanywa mwaka 2010 kwa kutumia tatu tofauti sampuli na kuhoji mbinu: barua pepe, simu, na jopo Internet kwa kutumia sampuli vinavyolingana na marekebisho baada ya stratification. makadirio kutoka njia tatu walikuwa sawa kabisa na makadirio kutoka vigezo ubora kama vile Idadi ya watu sasa Survey (CPS) na National Health Mahojiano Survey (NHIS). Zaidi hasa, mtandao na barua tafiti zote mbili walikuwa mbali kwa wastani wa asilimia 3 na utafiti simu alikuwa mbali kwa asilimia 4. Makosa hii kubwa ni takriban nini moja bila kutarajia kutoka sampuli ya watu wapatao 1,000. Pamoja na kwamba, hakuna hata mmoja modes hizi zinazozalishwa data kikubwa bora, wote Internet na simu utafiti (ambayo alichukua siku au wiki) walikuwa kikubwa kasi ya uwanja kuliko utafiti pepe (ambayo alichukua miezi nane), na utafiti Internet, ambayo hutumiwa sampuli vinavyolingana, ilikuwa nafuu zaidi kuliko njia nyingine mbili.
Kwa kumalizia, wanasayansi ya jamii na wanatakwimu ni incredibly wasiwasi juu ya inferences kutoka hizi sampuli zisizo uwezekano, katika sehemu kwa sababu wao ni kuhusishwa na baadhi ya kushindwa aibu ya utafiti utafiti kama vile uchaguzi Fasihi Digest. Katika sehemu, nakubaliana na wasiwasi huu: unadjusted sampuli zisizo uwezekano ni uwezekano wa kuzalisha makadirio mbaya. Hata hivyo, kama watafiti wanaweza kurekebisha kwa biases katika mchakato sampuli (kwa mfano, baada ya stratification) au kudhibiti mchakato sampuli kiasi fulani (kwa mfano, sampuli vinavyolingana), wanaweza kuzalisha makadirio bora zaidi, na hata makadirio ya ubora wa kutosha kwa ajili ya wengi. Bila shaka, itakuwa bora kufanya kikamilifu kunyongwa uwezekano sampuli, lakini kwamba hakuna tena inaonekana kuwa chaguo kweli.
Wote zisizo uwezekano sampuli na sampuli uwezekano kutofautiana katika ubora wao, Na kwa sasa ni uwezekano kesi hiyo makadirio ya kutoka sampuli uwezekano ni ya kuaminika zaidi kuliko makadirio kutoka sampuli zisizo uwezekano. Lakini, hata sasa, makadirio kutoka vizuri uliofanywa sampuli zisizo uwezekano pengine ni bora kuliko makadirio kutoka sampuli hafifu uliofanywa uwezekano. Zaidi ya hayo, zisizo uwezekano sampuli ni kikubwa nafuu. Hivyo, inaonekana kwamba uwezekano vs zisizo uwezekano sampuli inatoa gharama ubora biashara-off (Mchoro 3.6). Kuangalia mbele, mimi kutarajia kwamba makadirio kutoka vizuri kufanyika sampuli zisizo uwezekano itakuwa nafuu na bora. Zaidi ya hayo, kwa sababu ya kuvunjika katika tafiti simu ya mezani na kuongezeka kwa viwango vya majibu yasiyo, mimi kutarajia kwamba uwezekano sampuli itakuwa ghali zaidi na ya ubora wa chini. Kwa sababu ya mwenendo haya ya muda mrefu, nadhani kwamba zisizo uwezekano sampuli itakuwa kuzidi kuwa muhimu katika zama tatu ya utafiti utafiti.