Kvankam ĝi povas esti senorda, riĉigita demandante povas esti potenca.
Malsama aliro al traktado la nekompleteco de ciferecaj spuro datumoj estas riĉigi ĝin rekte kun enketo datumoj, procezo kiu mi vokos riĉigita demandante. Unu ekzemplo de riĉigita demandante estas la studo de Burke and Kraut (2014) , kiun mi priskribis pli frue en la ĉapitro (Sekcio 3.2), pri ĉu interagante en Facebook pliigas amikecon forto. Tiukaze, Burke kaj Kraut kombinita enketo datumojn Facebook log datumoj.
La fikso ke Burke kaj Kraut laboris en tamen signifis ke ili ne devis trakti du grandaj problemoj kiujn esploristoj faras riĉigita demandanta vizaĝo. Unua, fakte kunligantaj la datenaroj-procezo nomita rekordo ligo, la trafaj de registro en unu datumaro kun la taŭga rekordon en la alia aro de datumoj-povas esti malfacila kaj eraro-inklina (ni vidos ekzemplon de tiu problemo sube ). La dua ĉefa problemo de riĉigita demandante estas ke la kvalito de la diĝita spuroj estos ofte esti malfacile por esploristoj taksi. Ekzemple, kelkfoje la procezo tra kiu ĝi estas kolektita estas proprieta kaj povus esti impresebla al multaj de la problemoj priskribitaj en ĉapitro 2. En aliaj vortoj, riĉigita demandante estos ofte impliki eraro-inklina sinsekvon de enketoj al nigra-skatolo datumoj fontoj de nekonata kvalito. Malgraŭ konzernoj ke tiuj du problemoj prezenti, eblas fari gravan esploron kun tiu strategio estis pruvita de Stephen Ansolabehere kaj Eitan Hersh (2012) en ilia esplorado sur balotado ŝablonoj en Usono. Ĝi meritas la domaĝon iri super tiu studo en iu detalo ĉar multaj el la strategioj kiuj Ansolabehere kaj Hersh disvolvita estos utila en aliaj aplikoj de riĉigita demandante.
Balotpartopreno estis celo de vasta esploro en politika scienco, kaj en la pasinteco, esploristoj 'kompreno de kiuj voĉdonas kaj kial estis ĝenerale bazitaj sur la analizo de enketo datumoj. Voĉdoni en Usono, tamen, estas nekutima konduto en kiuj la registaro registroj ĉu ĉiu civitano voĉdonis (kompreneble, la registaro ne gravuri kiu ĉiu civitano voĉdonoj por). Por multaj jaroj, tiuj registaraj registroj de balotado estis haveblaj sur papero formoj, disĵetitaj en diversaj lokaj registaraj oficejoj ĉirkaŭ la lando. Tio igis ĝin malfacila, sed ne neebla, pro politikaj sciencistoj havi kompletan bildon de la balotantaro kaj kompari kion oni diras en enketoj pri voĉdoni por ilia fakta voĉdonado konduto (Ansolabehere and Hersh 2012) .
Sed nun tiuj voĉdonantaj registroj estis ciferecigita kaj kelkajn privatajn entreprenojn sisteme kolektita kaj kunfalis tiuj registroj de balotado por produkti kompletan mastro balotado dosierojn kiuj gravuros la balotado konduto de ĉiuj usonanoj. Ansolabehere kaj Hersh partnerita kun unu el ĉi tiuj kompanioj-Catalist LCC-por uzi ties mastro balotado dosiero helpi evoluigi pli bonan bildon de la elektantaro. Plui, ĉar ĝi konfidis en diĝita registroj kolektita kaj kuracas por kompanio, ĝi proponis plurajn avantaĝojn super antaŭaj klopodoj de esploristoj kiuj estis farita sen la helpo de entreprenoj kaj uzanta analoga rekordojn.
Kiel multaj de la diĝita spuro fontoj en Ĉapitro 2, la Catalist mastro dosiero ne inkluzivas multe de la demografia, attitudinal kaj kondutaj informoj Ansolabehere kaj Hersh bezonis. Krom tiu informo, Ansolabehere kaj Hersh estis aparte interesita en komparante raportis balotado konduto al validigita balotado konduto (te, la informo en la Catalist datumbazo). Do, la esploristoj kolektis la datumojn kiuj volis kiel parto de la Kooperativo Kongresa Elekto Studo (CCES), granda socia enketo. Tuj poste, la esploristoj donis tiun datumon al Catalist kaj Catalist donis la esploristoj malantaŭeniri kun kunfandita datumoj dosieron kiu inkludis validigita balotado konduto (de Catalist), la mem-raportita balotado konduto (de CCES) kaj la demografio kaj sintenoj de respondantoj (de CCES ). Alivorte, Ansolabehere kaj Hersh riĉigis la balotado datumojn enketo datumoj kaj la rezultanta kunfandita dosiero ebligas ilin fari ion ke nek dosiero aktivigita individue.
Per riĉigante la Catalist mastro datumoj dosiero kun enketo datumoj, Ansolabehere kaj Hersh atingis tri gravajn konkludojn. Unua, super-raportado de balotado estas senbrida: preskaŭ duono de la ne-balotantoj raportis balotado. Aŭ, alimaniere rigardi estas se iu raportis balotado, estas nur 80% ŝanco ke ili efektive voĉdonis. Dua, super-raportado ne hazarda; super-raportado estas pli komuna inter altaj enspezoj, instruita, partizanojn, kiuj okupiĝas pri la publikaj aferoj. En aliaj vortoj, la personoj kiuj estas plej verŝajna voĉdoni ankaŭ plej verŝajne mensogi pri balotado. Tria, plej kritike, pro la sistema naturo de super-raportado, la fakta diferencoj inter balotantoj kaj ne-balotantoj estas pli malgrandaj ol ili aperas nur de enketoj. Ekzemple, tiuj kun fraŭloj grado estas proksimume 22 procentoj pli verŝajna raporti balotado, sed nur 10 procentoj pli verŝajna al fakta voĉdono. Plui, ekzistanta rimedo bazita teoriojn de voĉdonado estas multe pli bona ĉe antaŭvidanta kiuj raportos balotado ol kiu fakte voĉdonoj, empírica trovo ke postulas novajn teoriojn por kompreni kaj antaŭdiri balotado.
Sed, kiom ni fidu tiujn rezultojn? Memoras tiujn rezultojn dependas eraro-inklina sinsekvon al nigra-skatolo datumoj kun nekonataj kvantoj de eraro. Pli specife, la rezultoj ĉarniro sur du ŝlosilaj paŝoj: 1) la kapablo de Catalist kombini multajn malsimilajn datumoj fontoj produkti preciza mastro datafile kaj 2) la kapablo de Catalist ligi la enketon datumoj al lia mastro datafile. Ĉiu de ĉi tiuj paŝoj estas tre malfacila kaj eraroj en ĉiu paŝo povus konduki al esploristoj la malĝusta konkludojn. Tamen, ambaŭ datumtraktado kaj trafaj estas kritika al la daŭra ekzisto de Catalist kiel entrepreno tiel ĝi povas investi rimedojn por solvi tiujn problemojn, ofte en skalo ke neniu individua akademia esploristo aŭ grupo de esploristoj povas egali. En la plua legado fine de la ĉapitro, mi priskribus tiujn problemojn en pli detalo kaj kiel Ansolabehere kaj Hersh konstrui konfidon en liaj rezultoj. Kvankam tiuj detaloj estas specifaj al tiu studo, temoj similaj al tiuj leviĝos por aliaj esploristoj dezirantaj ligi al nigra-skatolo ciferecan spuron datumoj fontoj.
Kio estas la ĝenerala lecionoj esploristoj povas ĉerpi de ĉi tiu studo? Unue, tie estas terura valoro de riĉigi ciferecan spuron kun enketo datumoj. Due, kvankam tiuj agregita, komercaj datumoj fontoj ne devus esti konsiderita "tero vero", en iuj kazoj povas esti utila. Fakte, estas plej bone kompari tiuj datumoj fontoj ne absoluta vero (de kiu oni ĉiam maltrafis). Prefere, ĝi estas bona por kompari ilin al aliaj disponeblaj datumoj fontoj, kiuj senescepte havas eraroj tiel.