Bisan tuod kini mahimong nagkalamukat, enriched pagpangayo mahimong gamhanan.
Usa ka lain-laing mga pamaagi sa pagpakig-angot sa sa kakulang sa digital pagsubay data aron sa pagpalambo sa kini direkta sa mga data sa survey, usa ka proseso nga ako motawag enriched pagpangayo. Usa ka panig-ingnan sa mabungahong pagpangayo mao ang pagtuon sa Burke and Kraut (2014) , nga akong gihulagway sa sayo pa sa kapitulo (Section 3.2), mahitungod sa kon makig-sa Facebook nagdugang sa panaghigalaay kusog. Sa maong kahimtang, Burke ug Kraut hiniusa nga data sa survey nga uban sa Facebook sa data log.
Ang kahimtang nga Burke ug Kraut nagtrabaho sa, Apan, nagpasabot nga wala sila may pag-atubang sa duha ka dagkong mga problema nga tigdukiduki sa pagbuhat ginapadato pagpangayo nawong. Una, sa pagkatinuod nagsumpay sa tingub ang mga data sa sets-usa ka proseso nga gitawag nga rekord kalambigitan, ang matching sa usa ka rekord diha sa usa ka panid sa tukma nga rekord sa ubang mga panid-lisod ug sayop-prone (kita tan-awa ang usa ka panig-ingnan sa niini nga problema sa ubos ). Ang ikaduha nga nag-unang problema sa mabungahong pagpangayo mao nga ang kalidad sa digital timailhan kanunay nga lisud nga alang sa mga tigdukiduki sa pag-assess. Pananglitan, usahay ang proseso nga pinaagi niini kini kolektahon ang proprietary ug mahimong delikado sa daghan sa mga problema nga gihulagway sa Kapitulo 2. Sa laing mga pulong, enriched pagpangayo kanunay naglakip sa sayop-prone paglanggikit sa survey sa itom-kahon nga data mga tinubdan sa wala mailhi kalidad nga. Bisan pa sa mga kabalaka nga kining duha ka mga problema sa pagpaila, kini mao ang posible nga sa pagpahigayon og importante nga research uban sa niini nga estratehiya sama sa gipakita sa Esteban Ansolabehere ug Eitan Hersh (2012) sa ilang research sa sumbanan voting sa US. Kini mao ang mapuslanon sa pag-adto sa ibabaw sa niini nga pagtuon sa pipila ka detalye tungod kay daghan sa mga pamaagi nga Ansolabehere ug Hersh naugmad mahimong mapuslanon sa uban nga mga aplikasyon sa mabungahong mangutana.
turnout botante nga sa hilisgutan sa halapad nga research sa politika siyensiya, ug sa nangagi, tigdukiduki pagsabot sa nga boto ug nganong sagad base sa pagtuki sa mga data sa survey. Pagboto sa US, Apan, mao ang usa ka talagsaon nga kinaiya sa nga mga talaan sa gobyerno kon ang matag lungsoranon nagboto (siyempre, ang gobyerno dili pagrekord nga sa matag lungsoranon boto alang sa). Kay sa daghan nga mga tuig, kini nga mga gobyerno nga mga rekord voting mga anaa sa ibabaw sa mga porma nga papel, nagkatibulaag sa nagkalain-laing mga buhatan sa lokal nga gobyerno sa tibuok nasud. Kini gihimo kini lisud, apan dili imposible, alang sa politikal nga mga siyentipiko nga adunay usa ka bug-os nga hulagway sa mga botante ug sa itandi kon unsa ang mga tawo moingon sa mga survey bahin sa pagboto sa ilang aktuwal nga kinaiya voting (Ansolabehere and Hersh 2012) .
Apan, karon kini nga mga talaan sa pagboto ang na-digitized, ug ang usa ka gidaghanon sa mga pribado nga kompaniya ang sistematikong kolektahon ug nakighiusa niini nga mga talaan sa pagbotar sa pagmugna komprehensibo nga file agalon voting nga pagrekord sa kinaiya voting sa tanan nga mga Amerikano. Ansolabehere ug Hersh nakigtambayayong uban sa usa sa niini nga mga kompanya-Catalist LCC-aron sa paggamit sa ilang agalon file voting sa pagtabang sa pagpalambo og usa ka mas maayo nga hulagway sa mga botante. Dugang pa, tungod kay kini nagsalig sa digital nga mga talaan nga nakolekta ug curated pinaagi sa usa ka panon sa, kini mihalad sa usa ka gidaghanon sa mga bentaha sa ibabaw sa miaging mga paningkamot pinaagi sa mga tigdukiduki nga gibuhat sa gawas sa tabang sa kompanya ug sa paggamit sa Analog mga rekord.
Sama sa daghan sa mga digital nga tinubdan pagsubay sa Kapitulo 2, ang Catalist agalon file wala maglakip sa daghan sa mga demographic, attitudinal, ug sa pamatasan nga impormasyon nga Ansolabehere ug Hersh gikinahanglan. Dugang pa sa niini nga impormasyon, Ansolabehere ug Hersh mga partikular nga interesado sa pagtandi report kinaiya voting sa validated kinaiya voting (ie, ang impormasyon sa Catalist database). Busa, ang mga tigdukiduki nga nakolekta sa mga data nga ilang gusto ingon nga bahin sa Cooperative Congressional Election sa Pagtuon (CCES), usa ka dakong sosyal nga survey. Sunod, ang mga tigdukiduki nga gihatag niini nga mga data sa Catalist, ug Catalist mihatag sa mga tigdukiduki balik sa usa ka gitapong sa data file nga naglakip validated kinaiya voting (gikan sa Catalist), ang-sa-kaugalingon report kinaiya voting (gikan sa CCES) ug ayo sa populasyon ug mga kinaiya sa mga respondents (gikan sa CCES ). Sa laing mga pulong, Ansolabehere ug Hersh nagdato sa mga data sa voting sa mga survey, ug makapahimo sa mga resulta sa gitapong file kanila sa pagbuhat og usa ka butang nga wala file nakahimo sa tagsa-tagsa.
Pinaagi sa pagpalambo sa Catalist agalon sa data file uban sa survey nga data, Ansolabehere ug Hersh miadto ngadto sa tulo ka importante nga mga konklusyon. Una, sa ibabaw sa-sa pagreport sa pagbotar mao ang kaylap: halos katunga sa mga non-botante report voting. O, sa lain nga paagi sa pagtan-aw sa kini mao ang kon ang usa ka tawo report pagbotar, adunay usa lamang ka 80% higayon nga sila sa pagkatinuod nibotar. Ikaduha, sa ibabaw sa-sa pagreport dili random; sa ibabaw sa-pagreport mas komon sa taliwala sa mga hatag-as-nga kinitaan, edukado, gerilya nga moapil diha sa mga publiko nga mga kalihokan. Sa laing mga pulong, ang mga katawhan nga lagmit sa pagbotar usab lagmit nga mamakak bahin sa pagbotar. Ikatulo, ug labing kritikal, tungod sa sistematikong kinaiya sa ibabaw sa-pagreport, ang aktuwal nga mga kalainan tali sa mga botante ug sa mga dili-botante mas gamay kay sa sila makita lamang gikan sa mga survey. Pananglitan, sa mga uban sa usa ka bachelors degree mao ang mahitungod sa 22 porsyento puntos nga mas lagmit sa pag-report pagbotar, apan lamang 10 porsyento puntos nga mas lagmit sa aktuwal nga boto. Dugang pa, kasamtangan nga resource-based nga teoriya sa pagbotar mao ang daghan nga mas maayo sa pagtagna nga report voting kay sa nga sa tinuod boto, usa ka empirical pagpangita og katudloan nga nanawagan alang sa mga bag-ong teoriya sa pagsabut ug pagtagna voting.
Apan, sa unsa nga paagi daghan nga kita kinahanglan nga mosalig niini nga mga resulta? Hinumdumi kining mga resulta-agad sa sayop-prone pagsumpay sa datos itom-kahon sa wala mailhi nga kantidad sa kasaypanan. Dugang ilabi, ang mga resulta-agad sa duha ka yawe nga mga lakang: 1) sa abilidad sa Catalist sa combine sa daghan nga mga disparate tinubdan sa data sa pagmugna sa usa ka tukma nga agalon datafile ug 2) ang abilidad sa Catalist sa pagsumpay sa mga data sa survey sa iyang agalon datafile. Ang matag usa niini nga mga lakang mao na lisud nga ug ang mga sayop sa bisan hain lakang mosangpot tigdukiduki sa sayop nga mga konklusyon. Apan, ang duha nga data pagproseso ug matching ang mga kritikal nga sa padayon nga paglungtad sa Catalist ingon sa usa ka panon sa mao nga kini mamuhunan mga kapanguhaan sa pagsulbad sa mga problema, nga sagad sa usa ka timbangan nga walay indibidwal nga academic tigdukiduki o grupo sa mga tigdukiduki nga mahimo pagpares sa. Sa dugang pa nga pagbasa sa katapusan sa kapitulo, paghulagway ko kining mga problema sa mas detalye ug sa kon sa unsang paagi Ansolabehere ug Hersh pagtukod sa pagsalig sa ilang mga resulta. Bisan tuod kini nga mga detalye sa mga piho nga sa niini nga pagtuon, mga isyu nga sama sa niini nga mga motindog alang sa ubang mga tigdukiduki buot sa misumpay ngadto sa itom-kahon digital pagsubay tinubdan sa data.
Unsa ang kinatibuk-ang mga leksyon tigdukiduki makakuha gikan sa pagtuon niini? Una, adunay dakong bili sa pagpalambo digital timailhan sa survey nga data. Ikaduha, bisan tuod kini nga mga aggregated, komersyal nga mga tinubdan sa data dili isipon nga "yuta sa kamatuoran", sa pipila ka mga kaso nga sila mahimong mapuslanon. Sa pagkatinuod, kini mao ang labing maayo nga itandi ang kini nga mga tinubdan sa data nga dili bug-os nga Kamatuoran (nga sila kanunay nga mahulog mubo). Hinunoa, kini mao ang mas maayo nga itandi sila sa uban pang mga anaa tinubdan sa data, nga kanunayng may mga sayop ingon man.