Sanajan bisa pabalatak, enriched nanyakeun bisa kuat.
A pendekatan beda kaayaan jeung incompleteness data renik digital nyaéta pikeun enrich eta langsung jeung data survey, hiji prosés nu Abdi gé nelepon nanyakeun enriched. Hiji conto nanyakeun enriched ngarupakeun ulikan ngeunaan Burke and Kraut (2014) , nu kuring dijelaskeun saméméhna dina bab (Bagéan 3.2), ngeunaan naha interacting on Facebook ngaronjatkeun kakuatan silaturahim. Dina hal éta, Burke jeung Kraut digabungkeun data survey jeung data log Facebook.
Setelan nu Burke jeung Kraut anu gawe dina, kumaha oge, Hartina, maranehna teu boga nungkulan dua masalah gede nu panalungtik ngalakonan enriched beungeut nanyakeun. Kahiji, sabenerna linking babarengan data susunan-prosés nu disebut catetan beungkeut, nu cocog tina catetan di hiji dataset jeung catetan hade di tempat sejen dataset-bisa hese and error-rawan (urang gé ningali conto masalah di handap ieu ). Masalah utama kadua nanyakeun enriched nyaeta kualitas ngambah digital remen bakal hésé pikeun panalungtik pikeun assess. Contona, sakapeung prosés ngaliwatan nu eta dikumpulkeun téh proprietary jeung bisa jadi susceptible ka loba masalah dijelaskeun dina Bab 2. Dina basa sejen, enriched nanyakeun remen bakal kaasup linking kasalahan-rawan tina survey ka sumber data hideung-kotak tina nu teu dipikanyaho kualitas. Najan masalah nu dua masalah ieu ngawanohkeun, kasebut nyaéta dimungkinkeun pikeun ngalaksanakeun panalungtikan penting jeung strategi ieu salaku ieu nunjukkeun ku Stephen Ansolabehere jeung Eitan Hersh (2012) dina panalungtikan maranéhanana dina pola voting di AS. Ieu téh worthwhile balik leuwih ulikan ieu di sababaraha jéntré sabab loba strategi nu Ansolabehere jeung Hersh dimekarkeun bakal dipake dina aplikasi sejenna nanyakeun enriched.
Voter turnout geus subjek panalungtikan éksténsif dina élmu pulitik, sarta dina jaman baheula, pamahaman panalungtik 'saha sora jeung kunaon geus umum geus dumasar kana analisis data survey. Voting di AS kitu, hiji kalakuan mahiwal di nu catetan pamaréntah naha unggal warga geus milih (tangtu, pamaréntah teu ngarekam anu unggal sora warga pikeun). Pikeun sababaraha taun, ieu catetan voting wewenang éta aya di bentuk kertas, sumebar di sagala rupa kantor pamaréntahan lokal di sakuliah nagara. Ieu dijieun hésé, tapi teu mustahil, pikeun élmuwan pulitik boga gambar lengkep electorate jeung pikeun ngabandingkeun naon urang nyebutkeun di survey ngeunaan voting ka paripolah voting sabenerna maranéhanana (Ansolabehere and Hersh 2012) .
Tapi, ayeuna ieu catetan voting geus digitized, sarta sajumlah pausahaan swasta geus sistematis dikumpulkeun sarta dihijikeun catetan voting ieu ngahasilkeun payil master voting komprehensif nu ngarekam paripolah voting sakabeh Amerika. Ansolabehere jeung Hersh partnered jeung salah sahiji pausahaan-Catalist ieu LCC-guna make file voting master maranéhanana pikeun mantuan ngamekarkeun gambar leuwih alus electorate teh. Salajengna, sabab relied dina catetan digital dikumpulkeun jeung curated ku hiji pausahaan, eta ditawarkeun jumlah kaunggulan leuwih usaha saméméhna ku panalungtik nu geus dipigawé tanpa bantuan pausahaan jeung make catetan analog.
Kawas loba sumber renik digital dina Bab 2, nu Catalist master file teu kaasup loba informasi demografi, attitudinal, jeung behavioral nu Ansolabehere jeung Hersh diperlukeun. Salian informasi ieu, Ansolabehere jeung Hersh éta utamana kabetot dina ngabandingkeun paripolah voting dilaporkeun ka paripolah voting disahkeun (ie, informasi dina database Catalist). Jadi, panalungtik dikumpulkeun data nu hayang salaku bagian tina Congressional Study Koperasi Pemilihan (CCES), hiji survey sosial badag. Next, panalungtik méré data ieu Catalist, sarta Catalist méré panalungtik nyieun hiji payel dihijikeun data nu kaasup disahkeun paripolah voting (ti Catalist), paripolah voting timer ngalaporkeun (ti CCES) jeung demografi jeung sikap responden (ti CCES ). Dina basa sejen, Ansolabehere jeung Hersh enriched data voting jeung data survey, sarta balukarna koropak dihijikeun nyandak eta pikeun ngalakukeun hiji hal anu file ayakeun diaktipkeun individual.
Ku enriching nu Catalist file data master jeung data survey, Ansolabehere jeung Hersh datang ka tilu conclusions penting. Kahiji, leuwih-ngalaporkeun of voting geus rampant: ampir satengah tina non-pamilih dilaporkeun voting. Atawa, jalan sejen nempo eta lamun batur dilaporkeun voting, aya ngan hiji kasempetan 80% nu sabenerna milih. Kadua, leuwih-ngalaporkeun teu random; leuwih-ngalaporkeun leuwih ilahar dipimilik-panghasilan luhur, well-nyakola, partisans anu kalibet dina urusan publik. Dina basa sejen, jalma anu paling dipikaresep ka ngajawab ogé paling dipikaresep ngabohong ngeunaan voting. Katilu, jeung paling kritis, sabab alam sistimatis pikeun leuwih-ngalaporkeun, béda sabenerna antara pamilih jeung non-pamilih nu leuwih leutik batan nembongan ngan ti survey. Contona, maranéhanana jeung gelar bachelors kira 22 persentase titik leuwih gampang lapor voting, tapi ngan 10 persentase titik leuwih gampang sora nu sabenerna. Salajengna, téori basis sumberdaya aya of voting anu leuwih hadé di ngaramal anu baris ngalaporkeun voting ti anu sabenerna sora, hiji Pananjung empiris nu panggero pikeun téori anyar nyurtian sarta ngaduga voting.
Tapi, sabaraha kudu we dipercanten hasil ieu? Inget hasil ieu gumantung kana kasalahan-rawan linking ka data hideung-kotak jeung jumlah dipikanyaho kasalahan. More husus, hasil hinge dina dua hambalan konci: 1) kamampuh Catalist ngagabungkeun loba sumber data disparate pikeun ngahasilkeun hiji master datafile jeung 2 akurat) kamampuh Catalist ka numbu data survey ka datafile master anak. Unggal hambalan ieu cukup hese jeung kasalahan di boh lengkah bisa ngakibatkeun panalungtik ka conclusions salah. Tapi, boh processing data jeung cocog anu kritis ka ayana terus of Catalist salaku pausahaan jadi bisa investasi daya dina ngarengsekeun masalah ieu, mindeng dina skala nu no panalungtik akademik individu atawa kelompok panalungtik bisa cocog. Dina maca salajengna di ahir bab, Kuring ngajelaskeun masalah ieu di leuwih jéntré jeung kumaha Ansolabehere jeung Hersh ngawangun kayakinan dina hasil maranéhanana. Sanajan wincikan ieu husus pikeun ulikan ieu, isu jiga ieu bakal hudang pikeun panalungtik séjén wishing ka numbu ka hideung-kotak sumber data renik digital.
Naon nu palajaran umum panalungtik bisa narik ti ulikan ieu? Kahiji, aya nilai tremendous ti enriching ngambah digital jeung data survey. Kadua, sanajan ieu aggregated, sumber data komérsial teu kudu dianggap "taneuh bebeneran", dina sababaraha kasus maranehna bisa dipake. Kanyataanna, éta téh pangalusna pikeun ngabandingkeun ieu sumber data teu Kaleresan mutlak (ti nu maranéhanana baris sok digolongkeun pondok). Rada, eta leuwih hade pikeun ngabandingkeun eta sumber data sadia séjén, nu invariably boga kasalahan ogé.