მიუხედავად იმისა, რომ ეს შეიძლება იყოს ბინძურ, გამდიდრებული ეკითხება შეიძლება იყოს ძლიერი.
განსხვავებული მიდგომა საქმე დაუსრულებლობის ციფრული კვალი მონაცემების არის გამდიდრების იგი უშუალოდ კვლევის მონაცემები, პროცესი, რომელიც მე მოვუწოდებ გამდიდრებული ითხოვს. ერთ-ერთი მაგალითია გამდიდრებული ეკითხება შესწავლა Burke and Kraut (2014) , რომელიც მე აღწერილი ადრე თავი (თავი 3.2), თუ არა ინტერაქციაში on Facebook ზრდის მეგობრობისათვის ძალა. იმ შემთხვევაში, Burke და Kraut კომბინირებული კვლევის მონაცემების with Facebook შესვლა მონაცემები.
გარემოში, რომ Burke და Kraut მუშაობდა, თუმცა, იმას ნიშნავს, რომ ისინი არ უნდა გაუმკლავდეთ ორი დიდი პრობლემა, რომ მკვლევარები აკეთებს გამდიდრებული ითხოვს სახე. პირველ, ფაქტობრივად ერთმანეთთან მონაცემები კომპლექტი-პროცესს ეწოდება ჩანაწერი კავშირი, შესაბამისი ჩანაწერი ერთ ნაკრებს შესაბამისი ჩანაწერი მეორე ნაკრებს-შეიძლება იყოს რთული და შეცდომის მიდრეკილება (ჩვენ დავინახავთ, მაგალითად, ამ პრობლემის ქვემოთ ). მეორე მთავარი პრობლემა გამდიდრებული ეკითხება, რომ ხარისხის ციფრული კვალი ხშირად გაუჭირდება მკვლევარები შეაფასოს. მაგალითად, ზოგჯერ პროცესი, რომლის მეშვეობითაც იგი გროვდება საკუთრების და შეიძლება იყოს მგრძნობიარე ბევრი პრობლემები აღწერილია თავი 2. სხვა სიტყვებით, გამდიდრებული ეკითხება ხშირად ჩართვა შეცდომის მიდრეკილება აკავშირებს კვლევები შავი ყუთი მონაცემთა წყაროები უცნობი ხარისხი. მიუხედავად იმისა, რომ შეშფოთება, რომ ეს ორი პრობლემა დანერგვა, ეს შესაძლებელია ჩატარდეს მნიშვნელოვანი კვლევა, რომ ეს სტრატეგია აჩვენა, სტივენ Ansolabehere და ეითან Hersh (2012) მათი კვლევა ხმის მიცემა ზეწოლის აშშ. ნიშანდობლივია, რომ წავიდეს ამ კვლევის ზოგიერთი დეტალი, რადგან ბევრი სტრატეგიები, რომ Ansolabehere და ჰირშ განვითარებული სასარგებლო იქნება სხვა პროგრამები გამდიდრებული ითხოვს.
ამომრჩეველთა აქტივობა უკვე საგანი ვრცელი კვლევის პოლიტიკურ მეცნიერებათა და წარსულში, მკვლევართა გაგება, ვინც ხმას და რატომ ზოგადად ეფუძნება ანალიზი კვლევის მონაცემები. ხმის მიცემა აშშ-ში, თუმცა, არის უჩვეულო ქცევის, რომ ხელისუფლება ჩანაწერები თუ არა თითოეული მოქალაქე ხმა (რა თქმა უნდა, ხელისუფლება არ ჩაიწეროს, რომელიც თითოეული მოქალაქის ხმა). მრავალი წლის განმავლობაში, ამ სამთავრობო კენჭისყრების იყო ხელმისაწვდომი ქაღალდის ფორმები, მიმოფანტული სხვადასხვა ადგილობრივი ხელისუფლების სამსახურებში მთელი ქვეყნის მასშტაბით. ეს გახადა რთულია, მაგრამ არა შეუძლებელი, პოლიტოლოგები, რომ გვქონდეს სრული სურათი ელექტორატის და შედარება, რასაც ადამიანები ამბობენ კვლევები შესახებ ხმის მიცემის მათი ფაქტობრივი საარჩევნო ქცევის (Ansolabehere and Hersh 2012) .
მაგრამ, ახლა ამ კენჭისყრების უკვე დიგიტალიზაცია, და რიგი კერძო კომპანიები სისტემურად შეგროვებული და შეუერთდა ამ კენჭისყრების წარმოების ყოვლისმომცველი საძიებო კენჭისყრის ფაილი, რომელიც ჩაწერას საარჩევნო ქცევის ყველა ამერიკელები. Ansolabehere და ჰირშ პარტნიორი ერთად ერთი ამ კომპანიების Catalist LCC-, რათა გამოიყენონ თავიანთი საძიებო კენჭისყრის ფაილი დაეხმარება განავითაროს უკეთესი სურათი ამომრჩევლები. გარდა ამისა, იმის გამო, რომ იგი დაეყრდნო ციფრული ჩანაწერები შეგროვებული და კურატორი კომპანია, ეს შესთავაზა რიგი უპირატესობები წინა ძალისხმევა მკვლევარები რომ გაკეთდა დახმარების გარეშე კომპანიები და გამოყენებით ანალოგური ჩანაწერი.
ისევე როგორც ბევრი ციფრული კვალი წყაროების თავი 2, Catalist სამაგისტრო ფაილი არ მოიცავს გაცილებით დემოგრაფიული, attitudinal და ქცევითი ინფორმაცია, რომ Ansolabehere და ჰირშ საჭირო. გარდა იმისა, რომ ეს ინფორმაცია, Ansolabehere და ჰირშ განსაკუთრებით დაინტერესდნენ შედარებით ცნობით კენჭისყრის ქცევის დამტკიცდა საარჩევნო ქცევის (ანუ, ინფორმაცია Catalist მონაცემთა ბაზა). ასე რომ, მკვლევარმა მონაცემები, რომ მათ სურდათ, როგორც ნაწილი Cooperative კონგრესის საარჩევნო შესწავლა (ცენტრების), დიდი სოციალური კვლევა. შემდეგი, მკვლევარები მისცა ამ მონაცემების Catalist და Catalist მისცა მკვლევარები უკან გაერთიანებული მონაცემთა ფაილი, რომელიც შედის დამტკიცდა საარჩევნო ქცევის (from Catalist), თვითმმართველობის ცნობით საარჩევნო ქცევის (from ცენტრების) და დემოგრაფიას და დამოკიდებულება გამოკითხულთა (ცენტრების ). სხვა სიტყვებით, Ansolabehere და ჰირშ გამდიდრებული კენჭისყრის მონაცემები კვლევის მონაცემები, და შედეგად შერწყმული ფაილი მათ საშუალებას აძლევს, რომ რამე რომ არც ფაილი ჩართულია ინდივიდუალურად.
მიერ გამდიდრების Catalist სამაგისტრო მონაცემების ფაილის კვლევის მონაცემები, Ansolabehere და ჰირშ მოვიდა სამი მნიშვნელოვანი დასკვნები. პირველი, ზედმეტად საანგარიშო კენჭისყრის ყოვლისმომცველი: თითქმის ნახევარი არასამთავრობო ამომრჩეველთა ცნობით კენჭისყრით. ან, კიდევ ერთი გზა ეძებს ის არის, თუ ვინმე ცნობით კენჭისყრის, არსებობს მხოლოდ 80% შანსი, რომ ისინი რეალურად მისცა ხმა. მეორე, ზედმეტად საანგარიშო არ არის შემთხვევითი; ზედმეტად საანგარიშო უფრო საერთო შორის მაღალი შემოსავლის მქონე, კარგად განათლებული, პარტიზანები, რომლებიც ჩართული საზოგადოებრივ საქმეთა. სხვა სიტყვებით, რომ ადამიანები, რომლებიც, სავარაუდოდ, ხმას ასევე სავარაუდოდ მოტყუება შესახებ კენჭისყრით. მესამე და ყველაზე მნიშვნელოვანია, იმიტომ, რომ სისტემატური ხასიათის ზედმეტად საანგარიშო, ფაქტობრივი განსხვავებები ამომრჩეველთა და არასამთავრობო ამომრჩეველთა უფრო მცირეა, ვიდრე ისინი, როგორც ჩანს მხოლოდ კვლევები. მაგალითად, იმ უმაღლესი დაახლოებით 22 პროცენტი უფრო სავარაუდოა, რომ ხმის მიცემის, მაგრამ მხოლოდ 10 პროცენტი უფრო სავარაუდოა, რომ კენჭისყრაზე. გარდა ამისა, არსებული რესურსი დაფუძნებული თეორიები კენჭისყრის ბევრად უკეთესი წინასწარმეტყველებდნენ, რომელიც აცხადებს, ხმის მიცემის, ვიდრე ვინც რეალურად რაოდენობა, ემპირიული დასკვნა, რომელიც მოუწოდებს ახალი თეორიები გაგება და პროგნოზირება კენჭისყრით.
მაგრამ, რამდენად უნდა ვენდოთ ეს შედეგები? გახსოვთ ეს შედეგი დამოკიდებულია შეცდომის მიდრეკილება აკავშირებს შავი ყუთი მონაცემების უცნობი რაოდენობით შეცდომა. უფრო კონკრეტულად კი, შედეგები იმაზე ორი ძირითადი ნაბიჯი: 1) უნარი Catalist გაერთიანდება ბევრი განსხვავებული მონაცემების წყაროების აწარმოოს ზუსტი საძიებო datafile და 2) უნარი Catalist უკავშირებენ კვლევის მონაცემები სამაგისტრო datafile. თითოეული ეს ნაბიჯი საკმაოდ რთულია და შეცდომები ან ნაბიჯი შეიძლება გამოიწვიოს მკვლევარები არასწორი დასკვნები. თუმცა, როგორც მონაცემების დამუშავება და შესაბამისი კრიტიკული იარსება Catalist, როგორც კომპანია, ასე რომ შეგიძლიათ ინვესტირებას რესურსების ამ პრობლემების მოსაგვარებლად, ხშირად მასშტაბის, რომ არ არსებობს ცალკეული აკადემიური ან მკვლევარის მკვლევართა ჯგუფმა შეიძლება ემთხვევა. შემდგომი მოსმენით ბოლოს თავი, მე აღწერს ამ პრობლემებს უფრო დეტალურად და როგორ Ansolabehere და ჰირშ ნდობის მათი შედეგები. მიუხედავად იმისა, რომ ეს დეტალები კონკრეტული შესწავლა, მსგავსი საკითხები ამ წარმოიქმნება სხვა მკვლევართა, რომელთაც სურთ უკავშირებენ შავი ყუთი ციფრული კვალი მონაცემები.
რა ზოგად გაკვეთილებს მკვლევარები შეგიძლიათ დახაზოთ ამ სტატიაში? პირველ რიგში, არსებობს დიდი მნიშვნელობა გამდიდრების ციფრული კვალი კვლევის მონაცემები. მეორე, მიუხედავად იმისა, რომ ეს ერთიანი, კომერციული მონაცემთა წყაროებს არ უნდა იქნას განხილული "ადგილზე სიმართლე", ზოგიერთ შემთხვევაში ისინი შეიძლება იყოს სასარგებლო. ფაქტობრივად, ეს არის საუკეთესო შედარება ამ მონაცემების წყაროების არ აბსოლუტური ჭეშმარიტება (რომელსაც ისინი ყოველთვის მოკლე). პირიქით, ეს არის უკეთესი შედარების მათ სხვა ხელმისაწვდომი მონაცემები, რომელიც უცვლელად აქვს შეცდომები, ასევე.