Hata ingawa inaweza kuwa messy, utajiri kuuliza inaweza kuwa na nguvu.
Mfumo tofauti wa kushughulika na incompleteness ya kuwaeleza data digital ni kuimarisha ni moja kwa moja na takwimu za utafiti, mchakato kwamba Mimi nitakuita utajiri kuuliza. Mfano mmoja wa kuuliza utajiri ni utafiti wa Burke and Kraut (2014) , ambayo mimi ilivyoelezwa mapema katika sura (Sehemu ya 3.2), kuhusu iwapo mazungumzo katika Picha kuongezeka kwa urafiki nguvu. Katika kesi hiyo, Burke na Kraut pamoja takwimu za utafiti na Facebook data gogo.
kuweka kwamba Burke na Kraut walikuwa wakifanya kazi katika, hata hivyo, ilimaanisha kuwa hawakuwa na kukabiliana na matatizo mawili makubwa ambayo watafiti kufanya utajiri kuuliza uso. Kwanza, kwa kweli kuunganisha pamoja data seti-mchakato kuitwa rekodi uhusiano, vinavyolingana wa rekodi katika CCD moja na rekodi sahihi katika nyingine CCD-inaweza kuwa vigumu na makosa ya kukabiliwa (tutaona mfano wa tatizo hili hapa chini ). pili kuu tatizo la kuuliza utajiri ni kwamba ubora wa athari digital itakuwa mara kwa mara kuwa vigumu kwa watafiti kutathmini. Kwa mfano, wakati mwingine mchakato wa kupitia ambayo ni zilizokusanywa ni wamiliki na inaweza kuwa wanahusika na matatizo mengi ilivyoelezwa katika Sura ya 2. Kwa maneno mengine, utajiri kuuliza itakuwa mara kwa mara kuhusisha makosa ya kukabiliwa kuunganisha ya tafiti na vyanzo data nyeusi-sanduku la jamii haijulikani ubora. Pamoja na wasiwasi kwamba matatizo haya mawili kuanzisha, inawezekana kufanya utafiti muhimu na mkakati huu kama alikuwa alionyesha kwa Stephen Ansolabehere na Eitan Hersh (2012) katika utafiti wao juu ya kupiga kura chati katika Marekani. Ni vyema kwenda juu ya utafiti huu katika baadhi ya kina kwa sababu wengi wa mikakati ambayo Ansolabehere na Hersh maendeleo itakuwa muhimu katika maombi mengine ya kuuliza utajiri.
Wapiga kura wachache imekuwa chini ya utafiti wa kina katika sayansi ya siasa, na katika siku za nyuma, uelewa watafiti 'ya nani kura na kwa nini kwa ujumla ni misingi ya uchambuzi wa takwimu za utafiti. Kupiga kura katika Marekani, hata hivyo, ni tabia kawaida kwa kuwa rekodi za serikali kama kila mwananchi ana kura (bila shaka, serikali haina rekodi ambao kila mmoja kura raia kwa). Kwa miaka mingi, hawa rekodi ya kiserikali ya kupiga kura walikuwa inapatikana katika fomu za karatasi, waliotawanyika katika ofisi mbalimbali za serikali za mitaa nchini kote. Hii ilifanya kuwa vigumu, lakini si vigumu, kwa wanasayansi wa siasa kwa kuwa na picha kamili ya wapiga kura na kulinganisha nini watu wanasema katika tafiti kuhusu kupiga kura kwa kupiga kura yao halisi ya tabia (Ansolabehere and Hersh 2012) .
Lakini, sasa kumbukumbu hizi kupiga kura wamekuwa digitized, na idadi ya makampuni binafsi kuwa utaratibu zilizokusanywa na ilijiunga kumbukumbu hizi upigaji kura wa kuzalisha files kina bwana kupiga kura kwamba kurekodi kupiga kura tabia ya Wamarekani wote. Ansolabehere na Hersh ilishirikiana na moja ya makampuni-Catalist hizi LCC-ili kutumia bwana zao za kupiga kura file kusaidia kuendeleza picha bora ya wapiga kura. Zaidi ya hayo, kwa sababu kutegemewa rekodi digital zilizokusanywa na iliyoangaliwa na kampuni, ni inayotolewa idadi ya faida juu jitihada za awali na watafiti yaliyotendeka bila ya misaada ya makampuni na kutumia kumbukumbu Analog.
Kama wengi wa vyanzo digital kuwaeleza katika Sura ya 2, Catalist bwana faili hawakuwa ni pamoja na sehemu kubwa ya idadi ya watu, mtizamo, na kitabia habari kwamba Ansolabehere na Hersh inahitajika. Mbali na habari hii, Ansolabehere na Hersh walikuwa hasa nia ya kulinganisha taarifa kupiga kura tabia ya Ilisahihishwa kupiga kura tabia (yaani, habari katika Catalist database). Hivyo, watafiti zilizokusanywa data kwamba walitaka kama sehemu ya Ushirika Utafiti Congressional Uchaguzi (CCES), kubwa kijamii utafiti. Next, watafiti alitoa data huu kwa Catalist, na Catalist alitoa watafiti kuunga data zimeunganishwa faili kwamba pamoja Ilisahihishwa kupiga kura tabia (kutoka Catalist), binafsi taarifa kupiga kura tabia (kutoka CCES) na idadi ya watu na mitazamo ya washiriki (kutoka CCES ). Kwa maneno mengine, Ansolabehere na Hersh utajiri data kupiga kura na takwimu za utafiti, na kusababisha zimeunganishwa faili inawawezesha kufanya kitu ambacho wala file kuwezeshwa mmoja mmoja.
By kurutubisha Catalist bwana data faili na data utafiti, Ansolabehere na Hersh alikuja hitimisho tatu muhimu. Kwanza, juu-kutoa taarifa ya kupiga kura ni rampant: karibu nusu ya mashirika yasiyo ya wapiga kura taarifa kupiga kura. Au, njia nyingine ya kuangalia ni kama mtu The taarifa kupiga kura, kuna tu nafasi ya 80% kwamba wao waliweza kupiga kura. Pili, juu-utoaji wa taarifa ni si random; juu-utoaji wa taarifa ni zaidi ya kawaida kati ya kipato cha juu, vizuri elimu, wafuasi ambao ni kushiriki katika masuala ya umma. Kwa maneno mengine, watu ambao ni zaidi uwezekano wa kupiga kura pia wengi ni uwezekano wa uongo kuhusu upigaji kura. Tatu, na zaidi kwa kina, kwa sababu ya asili ya utaratibu wa juu-kuripoti, tofauti halisi kati ya wapiga kura na mashirika yasiyo ya wapiga kura ni ndogo kuliko wao kuonekana tu kutoka tafiti. Kwa mfano, wale walio na shahada ya Bachelors ni kuhusu 22 asilimia pointi zaidi uwezekano wa ripoti ya kupiga kura, lakini ni asilimia 10 tu pointi zaidi uwezekano wa kupiga kura halisi. Zaidi ya hayo, zilizopo nadharia rasilimali-msingi wa kupiga kura ni bora zaidi katika utabiri ambao ripoti kupiga kura kuliko ambao kwa kweli kura, kutafuta empirical kwamba wito kwa nadharia mpya ya kuelewa na kutabiri kupiga kura.
Lakini, ni kiasi gani tunapaswa kutegemea matokeo haya? Kumbuka matokeo haya hutegemea makosa ya kukabiliwa kuunganisha na data nyeusi-sanduku kwa kiasi haijulikani ya makosa. Zaidi hasa, matokeo kikwazo kwa hatua mbili muhimu: 1) uwezo wa Catalist kuchanganya wengi disparate data vyanzo kuzalisha sahihi bwana datafile na 2) uwezo wa Catalist kuunganisha takwimu za utafiti kwa bwana wake datafile. Kila moja ya hatua hizi ni ngumu na makosa katika hatua ama inaweza kusababisha watafiti hitimisho sahihi. Hata hivyo, data zote mbili usindikaji na vinavyolingana ni muhimu kwa kuendelea kuwepo kwa Catalist kama kampuni hiyo inaweza kuwekeza rasilimali katika kutatua matatizo haya, mara nyingi katika kiwango kwamba hakuna kitaaluma mtafiti mtu binafsi au kundi la watafiti wanaweza mechi. Katika kusoma zaidi mwishoni mwa sura, mimi kuelezea matatizo haya kwa undani zaidi na jinsi Ansolabehere na Hersh kujenga imani katika matokeo yao. Ingawa maelezo haya ni maalum kwa utafiti huu, masuala sawa na hizi yatatokea kwa wengine watafiti wanaotaka zimeunganishwa na nyeusi-sanduku digital kuwaeleza vyanzo data.
masomo ujumla watafiti wanaweza kuteka kutoka somo hili ni nini? Kwanza, kuna thamani kubwa kutoka kwa kurutubisha athari digital na takwimu za utafiti. Pili, hata kama hawa totala, biashara vyanzo data haipaswi kuchukuliwa "ardhi kweli", katika baadhi ya matukio inaweza kuwa na manufaa. Kwa kweli, ni bora kulinganisha hizi vyanzo data si Ukweli kabisa (ambayo wao daima kupungukiwa). Badala yake, ni bora kulinganisha yao kwa inapatikana vyanzo vingine data, ambayo invariably kuwa na makosa kama vile.