Anki jekk jista 'jkun messy, tistaqsi mogħni jista' jkun qawwi.
Approċċ differenti biex jittrattaw ma 'l-inkompletezza tad-data traċċa diġitali huwa li tarrikkixxi lilha direttament bid-data tal-istħarriġ, proċess li jien ser sejħa titlob arrikkit. Eżempju wieħed ta 'tistaqsi arrikkit hija l-istudju ta' Burke and Kraut (2014) , li jiena deskritt qabel fil-kapitolu (Taqsima 3.2), dwar jekk l-interazzjoni fuq Facebook żidiet qawwa ħbiberija. F'dak il-każ, Burke u Kraut kkombinata dejta tal-istħarriġ mad-dejta log Facebook.
L-istabbiliment li Burke u Kraut kienu qed jaħdmu fi, madankollu, kien ifisser li huma ma jkollhomx għalfejn jinnegozjaw ma 'żewġ problemi kbar li r-riċerkaturi jagħmlu wiċċ tistaqsi arrikkit. L-ewwel, fil-fatt jgħaqqad flimkien l-settijiet-a data proċess jissejjaħ rekord rabta, il tqabbil ta 'rekord fid-dataset waħda mal-rekord xieraq fl-ieħor dataset' jista 'jkun diffiċli u żbalji suxxettibbli (Ser naraw eżempju ta' dan il-problema ta 'hawn taħt ). It-tieni problema ewlenija ta 'tistaqsi arrikkit huwa li l-kwalità tal-traċċi diġitali spiss se jkun diffiċli għar-riċerkaturi li tevalwa. Per eżempju, xi kultant il-proċess li permezz tiegħu jinġabar huwa proprjetarja u jista 'jkun suxxettibbli għal ħafna mill-problemi deskritti fil-Kapitolu 2. Fi kliem ieħor, tistaqsi arrikkit se tinvolvi spiss jgħaqqdu żbalji suxxettibbli ta' stħarriġ għal sorsi ta 'data bl-iswed kaxxa ta magħruf kwalità. Minkejja t-tħassib li dawn iż-żewġ problemi jintroduċu, huwa possibbli li twettaq riċerka importanti ma 'din l-istrateġija kif intwera minn Stephen Ansolabehere u Eitan Hersh (2012) fir-riċerka tagħhom dwar xejriet tal-vot fl-Istati Uniti. Huwa utli li jmorru fuq dan l-istudju f'ċertu dettall minħabba li ħafna mill-istrateġiji li Ansolabehere u Hersh żviluppati se jkunu utli fl-applikazzjonijiet l-oħra ta titlob arrikkit.
numru ta 'votanti kien is-suġġett ta' riċerka estensiva fix-xjenza politika, u fil-passat, il-fehim tar-riċerkaturi ta 'min jivvota u għaliex ġiet ġeneralment ibbażata fuq l-analiżi tad-dejta tal-istħarriġ. Votazzjoni fl-Istati Uniti, madankollu, hija mġiba mhux tas-soltu fis-sens li r-rekords tal-gvern jekk kull ċittadin ikun ivvota (naturalment, il-gvern ma jirreġistrax WHO kull ċittadin vot favur). Għal ħafna snin, dawn ir-rekords tal-vot governattivi kienu disponibbli fuq formoli stampati, mifruxa fl-uffiċċji varji tal-gvern lokali madwar il-pajjiż. Dan għamilha diffiċli, iżda mhux impossibbli, għax-xjenzati politiċi li jkollhom stampa kompleta tal-elettorat u li jqabblu liema nies jgħidu fl-istħarriġ dwar votazzjoni għall-imġiba tagħhom votazzjoni attwali (Ansolabehere and Hersh 2012) .
Iżda, issa dawn ir-reġistri tal-vot ġew diġitalizzata, u numru ta 'kumpaniji privati sistematikament miġbura u magħquda dawn ir-rekords tal-vot li tipproduċi fajls komprensivi vot kaptan li jirreġistraw l-imġiba tal-vot tal-Amerikani kollha. Ansolabehere u Hersh IMSEHBIN ma 'waħda minn dawn il-kumpaniji Catalist LCC-sabiex jużaw fajl tagħhom ta' votazzjoni kaptan biex tgħin fl-iżvilupp stampa aħjar tal-elettorat. Barra minn hekk, peress li bbażat ruħha fuq ir-rekords diġitali miġbura u curated minn kumpannija, dan offra numru ta 'vantaġġi fuq sforzi preċedenti mir-riċerkaturi li kien sar mingħajr l-għajnuna ta' kumpaniji u l-użu rekords Analog.
Bħal ħafna mill-għejun traċċi diġitali fil-Kapitolu 2, il-master fajl Catalist ma kienx jinkludi ħafna mill-informazzjoni demografika, attitudinali, u komportamentali li Ansolabehere u Hersh meħtieġa. B'żieda ma 'dan it-tagħrif, Ansolabehere u Hersh kienu partikolarment interessati fit-tqabbil imġiba adottata rrapportati lill imġiba adottata validat (jiġifieri, it-tagħrif fid-database Catalist). Allura, ir-riċerkaturi ġabret id-data li huma riedu bħala parti mill-Koperattiva tal-Kungress Elezzjoni Istudju (CCES), stħarriġ soċjali kbir. Sussegwentement, ir-riċerkaturi taw din id-data lill Catalist, u Catalist taw l riċerkaturi lura fajl magħquda dejta li kienu jinkludu validata imġiba adottata (minn Catalist), awto rrappurtati l-imġiba adottata (minn CCES) u l-demografija u l-attitudnijiet ta 'dawk li wieġbu (minn CCES ). Fi kliem ieħor, Ansolabehere u Hersh arrikkita d-data tal-vot bil dejta tal-istħarriġ, u l-fajl amalgamata li tirriżulta tippermettilhom li jagħmlu xi ħaġa li la fajl ppermettiet individwalment.
Mill tarrikkixxi l master file tad-data Catalist ma 'data istħarriġ, Ansolabehere u Hersh waslet għal tliet konklużjonijiet importanti. L-ewwel, ta 'votazzjoni' rappurtar fuq hija rampanti: kważi nofs il-persuni mhux votanti rrappurtat votazzjoni. Jew, mod ieħor ta 'tħares lejn dan huwa jekk xi ħadd rrappurtat votazzjoni, hemm biss ċans 80% li huma fil-fatt ivvutaw. It-tieni nett,-rappurtar fuq mhix każwali; over-rappurtar huwa aktar komuni fost bi dħul għoli, edukat tajjeb, partisans li huma involuti fl-affarijiet pubbliċi. Fi kliem ieħor, il-persuni li huma l-aktar probabbli li jivvutaw huma wkoll aktar probabbli li jinsabu madwar votazzjoni. It-tielet, u l-aktar kritiku, minħabba n-natura sistematika ta 'rappurtar fuq, id-differenzi reali bejn votanti u persuni mhux votanti huma iżgħar milli jidhru biss minn stħarriġ. Per eżempju, dawk bi grad tal-bakkalawrjat madwar 22 punti perċentwali aktar probabbli li jirrappurtaw votazzjoni, imma huma biss 10 punti perċentwali aktar probabbli li vot attwali. Barra minn hekk, teoriji eżistenti bbażati fuq ir-riżorsi tal-votazzjoni huma ħafna aħjar fil-tbassir li ser jirrapporta votazzjoni minn li fil-fatt voti, konstatazzjoni empirika li s-sejħiet għal teoriji ġodda biex jifhmu u jbassru votazzjoni.
Iżda, kemm għandna fiduċja dawn ir-riżultati? Ftakar dawn ir-riżultati jiddependu fuq żbalji suxxettibbli li tgħaqqad id-dejta iswed kaxxa b'ammonti mhux magħrufa ta 'żball. B'mod aktar speċifiku, ir-riżultati ċappetta fuq żewġ passi ewlenin: 1) il-kapaċità ta 'Catalist li jikkombinaw ħafna sorsi ta' data differenti biex jipproduċu datafile kaptan preċiża u 2) il-kapaċità ta 'Catalist li torbot data tas-servej biex datafile kaptan tiegħu. Kull wieħed minn dawn il-passi huwa pjuttost diffiċli u żbalji fil jew pass jista 'jwassal riċerkaturi għall-konklużjonijiet żbaljati. Madankollu, kemm l-ipproċessar tad-data u t-tqabbil huma kritiċi għall-eżistenza kontinwa ta Catalist bħala kumpanija sabiex ikun jista 'jinvesti r-riżorsi b'mod jissolvew dawn il-problemi, ħafna drabi fuq skala li ħadd riċerkatur akkademiku individwali jew grupp ta' riċerkaturi jistgħu jaqblu. Fil-qari ulterjuri fl-aħħar tal-kapitolu, I jiddeskrivi dawn il-problemi f'aktar dettall u kif Ansolabehere u Hersh jibni fiduċja fil-riżultati tagħhom. Għalkemm dawn id-dettalji huma speċifiċi għal dan l-istudju, kwistjonijiet simili għal dawn se jinqalgħu għar-riċerkaturi oħra li jixtiequ jagħtu link għall-iswed-kaxxa sorsi ta 'data traċċi diġitali.
X'inhuma l-lezzjonijiet ġenerali r-riċerkaturi jistgħu jiġbdu minn dan l-istudju? L-ewwel, hemm valur enormi mill tarrikkixxi traċċi diġitali b'data istħarriġ. It-tieni nett, anki jekk dawn aggregata, sorsi kummerċjali ta 'data m'għandhomx jiġu kkunsidrati bħala "verità art", f'xi każijiet dawn jistgħu jkunu utli. Fil-fatt, huwa aħjar li tqabbel dawn is-sorsi ta 'data li ma Verità assoluta (minn fejn dejjem se jaqgħu qasir). Pjuttost, huwa aħjar li dawn jiġu mqabbla ma 'sorsi oħra ta' dejta disponibbli, li invarjabbilment jkollhom żbalji kif ukoll.