U iflos bo'lishi mumkin bo'lsa-da, boyitilgan kerakli kuchli bo'lishi mumkin.
Raqamli iz ma'lumotlar noto'liqligi bilan shug'ullanadigan bir xil yondashuv tadqiqot ma'lumotlariga, men boyitilgan so'rash chaqiray jarayoni bilan bevosita uni boyitish hisoblanadi. Boyitilgan sizdan bir misol o'rganish hisoblanadi Burke and Kraut (2014) I Facebookda o'zaro do'stlik kuch ziyoda bo'lsin haqida, avvalgi bobda (Bo'lim 3.2) tasvirlangan. Bunday holda, Burke va nemis Facebook log ma'lumotlar bilan tadqiqot ma'lumotlarni birlashgan.
Burke va nemis ishlaydigan bo'ldi sozlama, biroq, ular tadqiqotchilar boyitilgan so'rab yuzini qilib ikki katta muammolar bilan shug'ullanish kerak emas edi, deb edi. Birinchidan, aslida ma'lumotlar silsilasini-a jarayoni deb ataladi rekord oqimlarga, quyida bu muammoning boshqa ma'lumotlar to'plami-mumkin qiyin va xato-moyil bo'lishi (Biz ko'rasiz misol tegishli rekord bilan bir ma'lumotlar majmui ichida bir rekord taalukli birgalikda bog'lab ). boyitilgan so'raydi ikkinchi asosiy muammo raqamli izlar sifati tez-tez tadqiqotchilar baholash uchun qiyin bo'ladi, deb. Misol uchun, ba'zan u to'plangan orqali jarayoni mulkiy va boshqa aytganda bob 2. tasvirlangan muammolar ko'p sezgir bo'lishi mumkin, boyitilgan kerakli tez-tez noma'lum qora-box ma'lumot manbalariga so'roqlarni xato-moyil ulanish jalb qiladi sifati. Bu ikki muammolar joriy xavotirlar qaramay, u Stiven Ansolabehere va Eitan Hersh tomonidan namoyish etilgan bo'lib, bu strategiya bilan muhim tadqiqotlar olib borish mumkin (2012) AQShda saylov naqshlar o'z tadqiqotlar. Ba'zi batafsil, bu ishda ustidan borish maqsadga muvofiq Ansolabehere va Hersh boyitilgan sizdan boshqa dasturlarga foydali bo'ladi rivojlangan strategiyasi ko'p, chunki.
Saylovchilar ishtiroki, siyosiy fanda keng tadqiqot mavzusiga aylandi, va o'tmishda, ovoz va nima uchun odatda tadqiqot ma'lumotlarni tahlil qilish asosida qilingan kim tadqiqotchilarining tushunish. AQShda ovoz berish bilan birga, har bir fuqaro ovoz berdi yo'qmi hukumat yozuvlar ham g'ayrioddiy xatti (albatta, davlat uchun kim har bir fuqaro ovoz yozib bermaydi). Ko'p yillar davomida, bu davlat saylov yozuvlar mamlakat bo'ylab turli mahalliy hukumat idoralarida tarqalib, qog'oz shakllari mavjud edi. Bu, qiyin, lekin imkonsiz emas siyosatshunoslar elektorati to'liq rasm bor, va insonlar haqiqiy saylov xatti uchun ovoz berish haqida anketalar aytish nima solishtirish uchun qilingan (Ansolabehere and Hersh 2012) .
Lekin, hozir bu ovoz yozuvlar sayisallastirilmak qilindi va xususiy kompaniyalari, bir qator tizimli to'plagan va barcha amerikaliklar ovoz berish xatti yozib kompleks master saylov fayllarni ishlab chiqarish uchun bu saylov yozuvlarni birlashtirildi. Ansolabehere va Hersh elektorati yaxshiroq rasm rivojlantirish yordam berish uchun o'z master saylov faylini ishlatish uchun LCC-bu kompaniyalar-Catalist biri bilan hamkorlik. Bu to'plangan va kompaniya tomonidan küratörlüğünü raqamli yozuvlar suyanib, chunki Bundan tashqari, u kompaniyalari yordam va analog yozuvlarni holda amalga oshirilayotganini tadqiqotchilar tomonidan o'tgan harakatlari ustidan afzalliklari, bir qator taklif.
2-dars raqamli iz manbalardan ko'plab kabi, Catalist master fayl Ansolabehere va Hersh zarur, demografik munosabati va qiziqishlariga ma'lumotlarni ko'p o'z ichiga qilmadi. Bu ma'lumotlarga qo'shimcha ravishda, Ansolabehere va Hersh tasdiqlangan ovoz berish xatti (Catalist bazasida ya'ni, axborot) xabar saylov xatti taqqoslab, ayniqsa manfaatdor edi. Shunday qilib, tadqiqotchilar, ular kooperatsiya Kongress saylov o'rganish (CCES), katta ijtimoiy so'rov qismi sifatida xohlagan ma'lumotlarni to'plagan. Keyingi tadqiqotchilar Catalist bu ma'lumotlarni berdi, va Catalist tadqiqotchilar CCES dan ((Catalist dan) saylov xatti tasdiqlangan shu jumladan, bir birlashtirilib, ma'lumotlar fayli (CCES dan) o'z-o'zini xabar saylov xatti va demografiyasi va respondentlarning xulq nusxasini berdi ). Boshqa so'zlar bilan aytganda, Ansolabehere va Hersh tadqiqot ma'lumotlari bilan saylov ma'lumotlarni boyitilgan va natijada birlashtirilib Fayl ularni na fayl alohida yoqilgan, bir narsa qilish imkonini beradi.
So'rov ma'lumotlariga bilan Catalist master ma'lumotlar faylini boyitish tomonidan, Ansolabehere va Hersh uchta muhim xulosalarga keldi. Birinchidan, ustidan-hisobot ovoz berish keng tarqalgan: non-saylovchilarning deyarli yarmi ovoz ma'lum qildi. Yoki, unga qarab yana bir yo'li kimdir ovoz berishni xabar bo'lsa, ular aslida ovoz faqat 80% imkoniyat bor, deb. Ikkinchidan, ustidan-hisobot tasodifiy emas; ustidan-hisobot, yuqori daromad orasida yaxshi ta'lim yanada keng tarqalgan bo'lib, jamoat ishlariga jalb qilingan partizanlar. Boshqa so'zlar bilan aytganda, ovoz extimoli bor odamlar ham eng ovoz berish haqida yolg'on ehtimoli bor. Uchinchidan, va eng muhimi, chunki ustida-hisobot, saylovchilar va nodavlat saylovchilar o'rtasida haqiqiy farqlar ular anketalar faqat paydo kichikroq bo'lgan sistematik tabiat. Misol uchun, bir bakalavr darajasiga ega bo'lganlar haqida 22 ball ovoz hisobot ehtimoli ko'proq, lekin haqiqiy ovoz faqat 10 foiz ball ehtimoli ko'proq bo'ladi. Bundan tashqari, ovoz berish, mavjud resurs asoslangan nazariyalar aslida kim ovoz, yangi nazariyalar tushunish va ovoz bashorat qilish uchun chaqiradi empirik topilma ko'ra ovoz berish hisobot beradi kim bashorat juda yaxshi.
Lekin, qancha, biz bu natijalar ishonch kerak? bu natijalar xato noma'lum miqdorda qora-box ma'lumotlarga xato-moyil ulanish bog'liq eslab. Batafsil ravishda, natijalar ikki asosiy qadamlar haqida menteşe: 1) to'g'ri master faylidan va 2) uning master faylidan uchun so'rov ma'lumotlarni bog'langan uchun Catalist qobiliyatini ishlab chiqarish uchun ko'p turli ma'lumotlarni manbalarini birlashtirish Catalist qobiliyati. Har bir qadam juda qiyin va yo qadamda xatolar noto'g'ri xulosalar uchun tadqiqotchilari olib kelishi mumkin. Bu tez-tez tadqiqotchilar hech individual akademik tadqiqotchisi yoki guruh mos mumkin miqyosda, bu muammolarni hal resurslarini sarmoya qilib, Biroq, axborotga ishlov berish va taalukli ham kompaniya sifatida Catalist davom borligi uchun muhim ahamiyatga ega. bobning oxirida yanada o'qishda, men batafsil va qanday Ansolabehere va Hersh ularning natijalari ishonch qurish bu muammolarni bayon. Bu details bu o'rganishga o'ziga xos bo'lsa-da, bu o'xshash masalalar qora-box raqamli iz ma'lumot manbalariga bog'langan istagan boshqa tadqiqotchilar uchun paydo bo'ladi.
tadqiqotchilar, bu ishda dan chizish mumkin umumiy darslar nima? Birinchidan, tadqiqot ma'lumotlari bilan raqamli iz boyitish dan katta qiymati bor. Ikkinchidan, bu yig'ilgan bo'lsa-da, tijorat ma'lumot manbalari "Zamin haqiqat", deb o'ylamaslik kerak, ayrim hollarda, ular foydali bo'lishi mumkin. Aslida, u (ular har doim qisqa tushadi qaysi) emas mutlaq haq bu ma'lumotlar manbalari solishtirish uchun eng yaxshi hisoblanadi. Balki, u doim shuningdek xatolar bor, boshqa mavjud ma'lumotlar manbalari, ularni solishtirish uchun yaxshidir.