Sanadyan iku bisa dadi ora tumoto, kandungan nyuwon bisa kuat.
A pendekatan beda kanggo dealing karo incompleteness data tilak digital kanggo enrich langsung karo data survey, proses sing aku arep nelpon nyuwon kandungan. Tuladha saka nyuwon kandungan punika sinau Burke and Kraut (2014) , kang aku diterangake sadurungé ing bab (Section 3.2), bab apa ubungan ing Facebook mundhak kekuatan Persahabatan. Ing kasus-kasus iku, Burke lan Kraut digabungake data survey karo data log Facebook.
Setelan sing Burke lan Kraut padha digunakake ing, Nanging, temenan sing padha ora kudu menehi hasil karo loro masalah amba sing peneliti mengkono kandungan pasuryan takon. First, bener ngubungaké bebarengan data mranata-prosès sing diarani rekaman ubungan, ing cocog laporan ing siji perlengkapan data karo rekaman cocok ing liyane perlengkapan data-bisa angel lan kesalahan-rawan (bakal ndeleng conto masalah ngisor iki ). Masalah utama kapindho nyuwon kandungan iku kualitas ngambah digital seneng bakal angel kanggo riset netepke. Contone, kadhangkala proses liwat kang dikumpulake iku tertutup lan bisa dadi rentan kanggo akeh masalah sing diterangake ing bab 2. Ing tembung liyane, kandungan takon seneng bakal ndherek Nining error-rawan saka survey kanggo sumber data ireng-kothak diweruhi kualitas. Senadyan uneg-uneg sing loro masalah iki introduce, iku bisa tumindak riset penting karo strategi iki minangka iki tontonan dening Stephen Ansolabehere lan Etan Hersh (2012) ing riset ing pilihan patron ing AS. Iku bermanfaat kanggo pindhah liwat sinau iki ing sawetara detail amarga akeh Sastranegara sing Ansolabehere lan Hersh dikembangaké bakal migunani ing aplikasi liyane nyuwon kandungan.
Pinilih turnout wis tindakan ingkang dipunanggep perlu ekstensif ing ilmu politik, lan ing sasi, pangerten peneliti 'saka sing Votes lan apa wis umume wis adhedhasar analisis data survey. Pilihan ing AS, Nanging, iku sawijining prilaku mboten umum ing cathetan pemerintah apa saben warga wis milih (mesthi, pamaréntah ora ngrekam sing saben votes warga kanggo). Kanggo akèh taun, iki cathetan pilihan pemerintah padha kasedhiya ing formulir kertas, kasebar ing kantor-kantor pemerintah lokal ing saindhenging negara. Iki digawe angel, nanging ora mokal, kanggo ilmuwan pulitik duwe gambar sakabehane electorate lan kanggo mbandhingaké apa wong ngomong ing survey bab pilihan kanggo prilaku pilihan nyata (Ansolabehere and Hersh 2012) .
Nanging, saiki iki cathetan pilihan wis digital, lan sawetara perusahaan swasta wis runtut diklumpukake lan ditambahake cathetan pilihan iki kanggo gawé file master pilihan lengkap sing ngrekam prilaku pilihan kabeh Amerika. Ansolabehere lan Hersh partnered karo salah siji perusahaan-Catalist iki LCC-in supaya nganggo berkas pilihan master sing kanggo berkembang Gambar luwih saka electorate ing. Saterusé migunaaké cathetan digital diklumpukake lan curated dening perusahaan, iku ana pirang-pirang kaluwihan upados sadurungé dening peneliti sing wis rampung tanpa bantuan perusahaan lan nggunakake cathetan analog.
Kaya akeh sumber tilak digital ing Pasal 2, ing Catalist master file ora kalebu akeh saka informasi demografi, attitudinal, lan tindak tanduk sing Ansolabehere lan Hersh needed. Saliyane kanggo informasi iki, Ansolabehere lan Hersh padha utamané interested in mbandingaken prilaku pilihan kacarita kanggo prilaku pilihan divalidasi (IE, informasi ing database Catalist). Dadi, peneliti diklumpukake data sing padha wanted minangka bagéan saka Kongres Study Cooperative Pemilihan (CCES), a survey sosial gedhe. Sabanjure, peneliti marang data iki kanggo Catalist, lan Catalist marang peneliti gawe file gabung data sing kalebu divalidasi prilaku pilihan (saka Catalist), prilaku pilihan poto-kacarita (saka CCES) lan Demografi lan Donyane penjawab (saka CCES ). Ing tembung liyane, Ansolabehere lan Hersh kandungan data pilihan karo data survey, lan asil berkas gabung mbisakake kanggo nindakake soko sing file ora aktif individu.
Miturut enriching Catalist file data master karo data survey, Ansolabehere lan Hersh teka telung Serat penting. First, liwat-Reporting saka pilihan iku rampant: meh setengah saka non-Pamilih kacarita pilihan. Utawa, cara liyane saka looking ing iku yen wong kacarita pilihan, ana mung kasempatan 80% sing bener milih. Kapindho, liwat-Reporting ora acak; liwat-Reporting luwih umum antarane dhuwur income, uga-educated, Indies sing melu urusane umum. Ing tembung liyane, wong-wong sing paling kamungkinan kanggo milih uga paling kamungkinan kanggo ngapusi babagan pilihan. Katelu, lan paling kritis, amarga ing alam sistematis liwat-Reporting, beda nyata antarane Pamilih lan non-Pamilih cilik saka padha katon mung saka survey. Contone, wong kanthi gelar bachelors bab 22 nilai persentasi liyane kamungkinan kanggo laporan pilihan, nanging mung 10 nilai persentasi liyane kamungkinan kanggo voting nyata. Luwih, teori basis sumber ana pilihan akeh sing luwih apik ing ngiro-iro sing bakal laporan pilihan saka sing bener votes, lan nemokake empiris sing telpon kanggo teori anyar kanggo ngerti lan prédhiksi pilihan.
Nanging, pinten kita dipercaya asil iki? Elingi asil iki gumantung error-rawan Nining kanggo data ireng-kothak karo jumlah sing ora dingerteni saka kesalahan. More khusus, ing asil nggeser ing rong langkah tombol: 1) kemampuan saka Catalist kanggo gabungke akeh sumber data disparate kanggo ngasilaké master datafile lan 2 akurat) kemampuan saka Catalist kanggo nyambung data survey kanggo datafile master sawijining. Saben langkah iki cukup angel lan kasalahan ing salah siji langkah bisa mimpin kanggo riset Serat salah. Nanging, loro Processing data lan cocog wigati kanggo anané terus Catalist minangka perusahaan supaya bisa nandur modal sumber mecahaken masalah-masalah iki, asring ing ukuran sing ora peneliti akademisi individu utawa klompok peneliti bisa cocog. Ing maca luwih ing mburi bab, aku njlèntrèhaké masalah iki ing liyane rinci lan carane Ansolabehere lan Hersh mbangun kapercayan ing asil sing. Senajan rincian iki tartamtu kanggo sinau iki, padha masalah iki bakal njedhul kanggo panliti liya pengarepan kanggo pranala menyang ireng-kothak sumber data tilak digital.
Apa sing piwulang umum peneliti bisa tarik saka sinau iki? First, ana nilai sanget saka enriching ngambah digital karo data survey. Kapindho, sanadyan iki dikumpulke, sumber data komersial ngirim ora bisa dianggep "lemah bebener", ing sawetara kasus padha bisa migunani. Ing kasunyatan, iku paling apik kanggo mbandhingaké iki sumber data ora kanggo bebener mutlak (saka kang padha bakal tansah). Luwih, iku luwih apik kanggo mbandhingake sumber data kasedhiya liyane, kang diasilke duwe kasalahan uga.