Pagsumpay sa imong survey sa digital mga timailhan mahimo nga sama sa sa pagpangutana sa tanan sa imong mga pangutana sa tanang mga panahon.
Ang pagpangutana sa kasagaran moabut sa duha ka nag-unang mga kategoriya: sample survey ug census. Sample survey, diin kamo access sa usa ka gamay nga gidaghanon sa mga tawo, mahimong flexible, tukma sa panahon, ug medyo barato. Apan, sample survey, tungod kay sila base sa usa ka sample, sagad limitado sa ilang resolusyon; uban sa usa ka sample survey, kini mao ang kanunay nga lisud nga sa paghimo sa mga banabana mahitungod sa piho nga geograpikanhong rehiyon o alang sa piho nga mga grupo demographic. Census, sa uban nga mga, mosulay sa interbyu sa tanan sa sa populasyon. Sila adunay dako nga resolusyon, apan sila sa kasagaran mahal, pig-ot nga sa focus (sila lamang naglakip sa usa ka gamay nga gidaghanon sa mga pangutana), ug dili tukma sa panahon (kini mahitabo sa usa ka natudlong sa eskedyul, sama sa matag 10 ka tuig) (Kish 1979) . Karon handurawa kon tigdukiduki nga combine sa labing maayo nga mga kinaiya sa sample survey ug census; handurawa kon tigdukiduki nga pagpangutana sa matag pangutana sa tanan sa adlaw-adlaw.
Tin-aw nga, kini nga kanunay nga, ubiquitous, sa kanunay-sa survey mao ang usa ka matang sa sosyal nga siyensiya sa Pantasya. Apan, kini makita nga kita magsugod sa pagbanabana niini pinaagi sa paghiusa survey nga mga pangutana gikan sa usa ka gamay nga gidaghanon sa mga tawo uban sa mga digital timailhan gikan sa daghang mga tawo. Gitawag ko kini nga matang sa kombinasyon Amplified sa pagpangutana. Kon naghimo sa maayo, kini motabang kanato sa naghatag og banabana nga mas lokal nga (alang sa mas gagmay nga lugar), mas granular (alang sa piho nga mga grupo demographic), ug labaw pa tukma sa panahon.
Usa ka panig-ingnan sa mapalambo pagpangayo moabut gikan sa buhat ni Josue Blumenstock, nga gusto sa pagkolekta sa data nga makatabang giya kalambuan sa kabos nga mga nasod. Mas espesipiko, Blumenstock gusto sa paghimo sa usa ka sistema sa pagsukod sa bahandi ug kaayohan nga hiniusa nga ang pagkakompleto sa usa ka sensus sa pleksibilidad ug frequency sa usa ka survey (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Sa pagkatinuod, na na gihulagway ako ni Blumenstock buhat sa makadiyot sa Kapitulo 1.
Sa pagsugod, Blumenstock nakigtambayayong uban sa mga kinadak-ang mobile phone provider sa Rwanda. Ang kompaniya nga gihatag kaniya anonymized mga rekord transaksyon gikan sa 1.5 ka milyon nga kustomer nga naglangkob kinaiya gikan sa 2005 ug 2009. Ang logs naglakip sa impormasyon mahitungod sa matag tawag ug text sa mensahe sama sa panahon sa pagsugod, gidugayon, ug gibanabanang dapit sa caller ug tigdawat. Sa dili pa kita magsugod sa paghisgot mahitungod sa mga statistical nga mga isyu, kini mao ang bili nagtudlo nga kini nga unang lakang mahimong usa sa labing lisud. Ingon nga gihulagway diha sa Kapitulo 2, labing digital pagsubay data inaccessible sa mga tigdukiduki. Ug, sa daghang mga kompaniya sa mga makataronganon magpanuko sa pagpakigbahin sa ilang mga data tungod kay kini mao ang pribado nga; nga mao ang ilang mga kustomer tingali wala magdahum nga ang ilang mga talaan nga mipakigbahin-sa kinabag-uban sa mga tigdukiduki. Sa kini nga kaso, ang mga tigdukiduki mikuha amping lakang sa anonymize sa mga data ug sa ilang mga buhat nga overseen sa usa ka ikatulo nga-sa partido (ie, ang ilang IRB). Apan, bisan pa niini nga mga paningkamot, kini nga mga mga datos tingali pa mailhan ug sila lagmit naglakip sensitibo nga impormasyon (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . ko mobalik sa niini nga mga pamatasan nga pangutana sa Kapitulo 6.
Hinumdomi nga Blumenstock interesado sa pagsukod bahandi ug kaayohan. Apan, kini nga mga kinaiya dili direkta diha sa mga talaan nga tawag. Sa laing mga pulong, kini nga mga tawag talaan dili kompleto alang niini nga panukiduki, ang usa ka komon nga bahin sa digital nga mga timailhan nga gihisgutan sa detalye sa Kapitulo 2. Apan, lagmit nga ang mga talaan nga tawag tingali adunay pipila ka mga impormasyon mahitungod sa bahandi ug kaayohan. Busa, ang usa ka paagi sa pagpangutana ni Blumenstock pangutana mahimong: kini posible nga sa pagtagna sa unsa nga paagi ang usa ka tawo motubag sa usa ka survey nga base sa ilang digital data sa pagsubay? Kon mao, nan pinaagi sa pagpangutana sa usa ka pipila ka mga tawo nga atong pagtag ang mga tubag sa tanan.
Sa pagtimbang-timbang niini kasinatianong, Blumenstock ug research katabang gikan sa Kigali Institute of Science and Technology nga gitawag sa usa ka sample sa mga usa ka libo ka mga mobile kustomer telepono. Ang mga tigdukiduki mipasabut sa mga tumong sa proyekto ngadto sa mga partisipante, nangutana alang sa ilang pag-uyon nga misumpay sa survey mga tubag ngadto sa mga rekord sa tawag, ug dayon nangutana kanila sa usa ka sunod-sunod nga mga pangutana aron sa pagsukod sa ilang mga bahandi ug kaayohan, sama sa "ba-iya kamo sa usa ka radyo? "ug" ba iya kamo sa usa ka bisikleta? "(tan-awa sa Figure 3.11 alang sa usa ka partial nga listahan). Ang tanan nga mga partisipante sa survey ang compensated sa pinansiyal.
Sunod, Blumenstock gigamit sa usa ka duha ka-lakang nga pamaagi nga komon sa mga data sa siyensiya: bahin engineering gisundan sa supervised sa pagkat-on. Una, diha sa lakang bahin engineering, kay ang tanan nga interbyu, Blumenstock nakabig sa mga talaan nga tawag ngadto sa usa ka hugpong sa mga mga kinaiya mahitungod sa matag tawo; nga data mga siyentipiko gitawag kini nga mga kinaiya "bahin" ug sosyal nga mga siyentipiko nga sa pagtawag kanila "baryable." Pananglitan, alang sa matag tawo, Blumenstock kalkulado kinatibuk-ang gidaghanon sa mga adlaw uban sa kalihokan, ang gidaghanon sa mga lahi nga katawhan sa usa ka tawo nga sa kontak uban sa, sa kantidad sa salapi nga gigahin sa airtime, ug sa ingon sa. Kritikal, maayo nga bahin sa engineering nagkinahanglan og kahibalo sa kahimtang research. Pananglitan, kon kini mao ang importante nga sa pag-ila tali sa domestic ug internasyonal nga mga tawag (aron kita maglaum sa mga tawo nga nagtawag sa internasyonal nga mahimong adunahang), nan kini kinahanglan nga gibuhat sa lakang bahin engineering. Ang usa ka tigdukiduki uban sa gamay nga pagsabot sa Rwanda dili maglakip kini nga bahin, ug unya ang matagnaong performance sa modelo nga mag-antos.
Sunod, sa supervised lakang sa pagkat-on, Blumenstock nagtukod ug usa ka statistical nga modelo sa pagtagna sa survey tubag alang sa matag tawo nga base sa ilang mga bahin. Sa kini nga kaso, Blumenstock gigamit lohikal pagbalik uban sa 10-pilo krus-validation, apan siya nga gigamit sa usa ka matang sa ubang mga pamaagi statistical o machine sa pagkat-on.
Busa sa unsang paagi man kini sa trabaho? Si Blumenstock makahimo sa pagtagna sa mga tubag sa survey sa mga pangutana sama sa "iya ba kamo sa usa ka radyo?" Ug "iya ba kamo sa usa ka bisikleta?" Sa paggamit sa mga bahin nga nakuha gikan sa mga rekord sa tawag? Matang sa. Ang katukma sa mga panagna sa mga hatag-as nga alang sa pipila kinaiya (Figure 3.11). Apan, kini mao ang kanunay nga importante nga itandi sa usa ka komplikado nga pamaagi tagna batok sa usa ka yano nga alternatibo. Sa kini nga kaso, ang usa ka yano nga alternatibo mao ang pagtagna nga ang tanan sa paghatag sa mga labing komon nga tubag. Kay sa panig-ingnan, 97,3% report pagbaton sa usa ka radyo mao nga kon Blumenstock gitagna nga ang tanan nga report pagbaton sa usa ka radyo siya may usa ka tukma sa 97,3%, nga mao ang kahitingala susama sa paghimo sa iyang mas komplikado nga pamaagi (97.6% nga tukma). Sa laing mga pulong, ang tanan nga mga fancy datos ug modelo misaka sa katukma sa panagna nga gikan sa 97,3% ngadto sa 97,6%. Apan, alang sa uban nga mga pangutana, sama sa "ba-iya kamo sa usa ka bisikleta?", Ang mga panagna milambo gikan sa 54,4% ngadto sa 67,6%. Dugang sa kasagaran, Figure 3.12 sa gipakita alang sa pipila kinaiya Blumenstock wala pagpalambo sa daghan nga sa unahan lang sa paghimo sa mga yano nga baseline panagna, apan nga alang sa ubang mga kinaiya didto sa pipila ka mga kalamboan.
Sa niini nga punto aron kamo naghunahuna nga kini nga mga resulta sa usa ka gamay disappointing, apan sa usa ka tuig sa ulahi, Blumenstock ug duha ka mga kauban-si Gabriel Cadamuro ug Robert Sa-nga gipatik sa usa ka papel sa Science sa kinadak mas maayo nga mga resulta (Blumenstock, Cadamuro, and On 2015) . Adunay mga duha ka nag-unang mga teknikal nga mga rason alang sa kalamboan: 1) gigamit sila mas sopistikado mga pamaagi (ie, ang usa ka bag-o nga pamaagi sa naglatid engineering ug sa usa ka mas sopistikado makina sa pagkat-on nga modelo) ug 2) kay sa pagsulay sa gihunahuna tubag sa tagsa-tagsa nga mga pangutana sa survey (pananglitan, "Ayaw kamo iya sa usa ka radyo?"), misulay sila sa gihunahuna sa usa ka composite bahandi index.
Blumenstock ug kaubanan gipakita sa performance sa ilang pamaagi sa duha ka paagi. Una, ilang nakita nga ang alang sa mga tawo sa ilang sample, sila pagbuhat sa usa ka pretty maayo nga trabaho sa pagtagna sa ilang bahandi gikan sa mga rekord nga tawag (Figure 3.14). Ikaduha, ug mas importante, Blumenstock ug kaubanan nagpakita nga ang ilang pamaagi makapatunghag hatag-as nga-kalidad nga mga banabana sa mga geograpikanhong apod-apod sa bahandi sa Rwanda. Mas espesipiko, gigamit nila ang ilang makina sa pagkat-on nga modelo, nga gibansay sa ilang sample sa mga 1,000 ka mga tawo, aron sa pagtagna sa bahandi sa tanang 1.5 milyon nga mga tawo diha sa mga rekord sa tawag. Dugang pa, uban sa geospatial data nga nasukip sa mga data tawag (mahinumdoman nga ang tawag sa data naglakip sa nahimutangan sa sa labing duol nga cell torre alang sa matag tawag), ang mga tigdukiduki nakahimo sa pagbanabana sa gibanabanang dapit sa pinuy-anan sa matag tawo. Pagbutang niini nga mga duha ka mga banabana sa tingub, ang research nga gihimo sa usa ka banabana sa geograpikanhong apod-apod sa suskritor bahandi sa hilabihan lino nga fino nga spatial granularity. Kay sa panig-ingnan, sila Gibanabana sa ang average nga bahandi sa matag usa sa ni Rwanda 2148 mga selula (ang pinakagamay nga administratibo nga yunit sa nasud). Kini gitagna mga prinsipyo bahandi kaayo granular sila lisud nga sa pagsusi. Busa, ang mga tigdukiduki aggregated sa ilang mga resulta sa pagmugna banabana sa average nga bahandi sa Rwanda 30 distrito. Kini nga mga distrito-level banabana ang hugot nga may kalabutan ngadto sa mga banabana gikan sa usa ka bulawan nga sumbanan nga tradisyonal nga survey, ang Rwanda Demographic ug Health Survey (Figure 3.14). Bisan tuod ang mga banabana gikan sa duha ka tinubdan nga mga susama nga, ang mga banabana sa Blumenstock ug kaubanan ang mga 50 mga panahon mas barato ug 10 nga mga panahon nga mas paspas (sa diha nga gasto sa gisukod sa mga termino sa baryable gasto). Kini nga drama, sa dula nga pagkunhod sa gasto nagpasabot nga inay nga modagan sa matag pipila ka tuig-ingon nga mao ang sumbanan alang sa Demographic ug Health Surveys-ang hybrid nga sa gamay nga survey nga inubanan sa daku nga digital data sa pagsubay mahimong modagan sa matag bulan.
Sa konklusyon, Blumenstock ni Amplified sa pagpangutana nga paagi inubanan sa data sa survey sa digital data sa pagsubay sa pagmugna mga banabana ikatandi sa bulawan-standard banabana survey. Kini partikular nga panig-ingnan sa nagpatin-aw usab sa pipila sa mga trade-offs sa taliwala sa mapalambo pagpangayo ug sa tradisyonal nga pamaagi sa survey. Una, ang mga Amplified sa pagpangutana sa mga banabana mas tukma sa panahon, sa kinadak mas barato, ug mas linginon ug. Apan, sa laing bahin, sa niini nga panahon, walay usa ka lig-on nga theoretical basehan alang niini nga matang sa mapalambo pagpangayo. Nga mao, kini nga sa usa ka panig-ingnan dili ipakita sa diha nga kini sa trabaho ug sa diha nga kini dili. Dugang pa, ang mga Amplified pagpangayo paagi wala pa adunay maayo nga mga paagi sa sukdon kawalay kasigurohan sa palibot banabana niini. Apan, mapalambo pagpangayo adunay lawom nga koneksyon sa tulo ka dagkong mga dapit sa statistics-modelo-based post-stratification (Little 1993) , ngari kanato (Rubin 2004) , ug sa gagmay nga-nga dapit pagbana-bana (Rao and Molina 2015) -ug sa ingon ako nga nga ang pag-uswag sa kabubut-on nga paspas.
Mapalambo pagpangayo mosunod sa usa ka nag-unang mga resipe nga mahimong ipahaum sa imong partikular nga kahimtang. Adunay duha ka mga sagol ug duha ka mga lakang. Ang duha ka mga sagol mao ang 1) sa usa ka digital nga pagsubay panid nga halapad apan manipis nga (nga mao, kini may daghang mga tawo apan dili sa mga impormasyon nga imong gikinahanglan mahitungod sa matag tawo), ug 2) ang usa ka survey nga pig-ot nga, apan ang mabaga nga (nga mao, kini may lamang sa pipila ka mga tawo, apan kini adunay impormasyon nga imong kinahanglan nga bahin sa mga tawo). Unya, adunay duha ka mga lakang. Una, kay ang mga tawo sa duha ka mga tinubdan sa data, pagtukod sa usa ka makina nga modelo sa pagkat-on nga naggamit digital data sa pagsubay sa pagtagna survey mga tubag. Sunod, sa paggamit nga modelo machine sa pagkat-on sa pag-ipasangil sa sa survey mga tubag sa tanan sa digital data nga pagsubay. Busa, kon adunay pipila ka mga pangutana nga imong gusto nga mangutana sa daghang sa mga tawo, tan-awa alang sa digital data sa pagsubay sa mga tawo nga mahimong gamiton sa pagtagna sa ilang tubag.
Pagtandi sa una ug ikaduha nga pagsulay ni Blumenstock sa problema usab naghulagway sa usa ka importante nga leksyon mahitungod sa transisyon gikan sa ikaduhang panahon ngadto sa ikatulo nga panahon mga pamaagi sa survey research: ang sinugdan dili mao ang katapusan. Nga mao, sa daghang mga higayon, ang unang nga paagi dili ang labing maayo, apan kon tigdukiduki padayon nga pagbuhat, mga butang nga mas maayo. Dugang sa kasagaran, sa diha nga pagtasal sa bag-ong pamaagi sa sosyal nga research sa digital edad, kini mao ang importante sa paghimo sa duha ka managlahi ebalwasyon: 1) kon sa unsang paagi sa maayo nga paagi nga kini nga buhat karon ug 2) kon sa unsang paagi sa maayo sa imong hunahuna niini nga mahimo sa pagbuhat sa umaabot nga ingon sa data nga talan-awon mga kausaban ug ingon sa mga tigdukiduki mas dakong pagtagad sa problema. Bisan tuod, tigdukiduki gibansay sa paghimo sa unang matang sa evaluation (kon sa unsang paagi sa maayo mao kini partikular nga piraso sa research), ang ikaduha mao ang kanunay nga mas importante.