O dağınık olabilir olsa da, zenginleştirilmiş soran güçlü olabilir.
Dijital iz verilerinin eksiklik ile uğraşan farklı bir yaklaşım anket verilerine, ben zenginleştirilmiş sormamda arayacağım bir işlemle doğrudan zenginleştirmektir. Zenginleştirilmiş soran bir örneği çalışmadır Burke and Kraut (2014) Ben Facebook'ta etkileşim dostluk mukavemetini artırır olmadığı konusunda, bölümde daha önce (Bölüm 3.2) tarif. Bu durumda, Burke ve Kraut Facebook günlük verileri ile anket verilerini birleştirdi.
Burke ve Kraut görev yapan ayarı, ancak, araştırmacılar zenginleştirilmiş soran yüz yapıyor iki büyük sorunlarla başa çıkmak zorunda değildi anlamına geliyordu. Birincisi, aslında veri setleri-bir süreç olarak adlandırılan kayıt bağlantı, aşağıda bu sorunun diğer veri kümesi-can zor ve hata eğilimli olması (göreceğiz bir örnekte uygun kaydı ile bir veri kümesi bir kaydın eşleşen birbirine bağlayan ). zenginleştirilmiş soran ikinci temel sorun, dijital izleri kalitesi sık sık araştırmacılar değerlendirmek için zor olacak olmasıdır. Örneğin, bazen tahsil edildikleri süreçtir tescilli olup başka deyişle Bölüm 2'de anlatılan sorunların çoğu duyarlı olabilir, zenginleştirilmiş soran sıklıkla bilinmeyen kara kutu veri kaynaklarına anketler hata eğilimli bağlama içerecektir kalitesi. Bu iki sorun tanıtmak endişelere rağmen, Stephen Ansolabehere ve Eitan Hersh tarafından gösterildiği gibi bu strateji ile önemli araştırma mümkündür (2012) ABD'de oylama desenleri üzerine araştırma. Bazı ayrıntılı olarak bu çalışmada üzerinden gitmek için faydalıdır Ansolabehere ve Hersh zenginleştirilmiş soran diğer uygulamalarda yararlı olacaktır geliştirilen stratejilerin çünkü birçok.
Seçmen katılımı siyaset bilimi kapsamlı araştırma konusu olmuştur ve geçmişte oyu ve neden genellikle anket verilerinin analizine dayalı olmuştur kim araştırmacıların anlayışı. ABD'de Oylama Ancak, her vatandaş oy olup olmadığını hükümet kayıtlarında alışılmadık bir davranış (tabii ki, hükümet için kim her vatandaş oy yazmaz). Uzun yıllar boyunca, bu hükümet oylama kayıtları ülke çapında çeşitli yerel devlet dairelerinde dağınık, kağıt formlar üzerinde kullanılabilir. Bu, zor, ama imkansız değil siyaset bilimciler seçmen tam bir resim var ve insanların gerçek oylama davranışı oylama hakkında araştırmalarda söylediklerini karşılaştırmak için yapılmış (Ansolabehere and Hersh 2012) .
Ancak, artık bu oylama kayıtlar sayısallaştırılmış edilmiştir, ve özel şirketlerin bir dizi sistematik toplanmış ve tüm Amerikalıların oylama davranışlarını kaydetmek kapsamlı master oylama dosyaları üretmek için bu oylama kayıtları birleşti. Ansolabehere ve Hersh seçmenlerin daha iyi bir görüntü geliştirmeye yardımcı olmak için kendi ana oylama dosyasını kullanmak için LCC-bu şirketlerin-Catalist biri ile ortaklık kurdu. toplanan ve bir şirket tarafından küratörlüğünü dijital kayıtların dayandığı, çünkü Dahası, bu şirketlerin yardımı ve analog kayıtlar kullanmadan yapıldığını araştırmacılar tarafından önceki çabaları üzerinde bir takım avantajlar sundu.
2. Bölümde dijital iz kaynakların birçoğu gibi, Catalist ana dosya Ansolabehere ve Hersh gerekli demografik tutumsal ve davranışsal bilgilerin çoğunu içermiyordu. Bu bilgilere ek olarak, Ansolabehere ve Hersh valide oylama davranışı (Catalist veritabanında, yani bilgi) rapor oylama davranışlarını karşılaştıran özellikle ilgilenmişlerdir. Yani, araştırmacılar Kooperatif Kongre Seçim Çalışması (CCES), büyük bir sosyal araştırmanın bir parçası olarak aranan veri topladı. Daha sonra, araştırmacılar catalist için bu verileri veren ve Catalist araştırmacılar CCE dan ((catalist itibaren) oylama davranışı valide dahil bir birleştirilmiş veri dosyası, (CCE itibaren) kendi kendine bildirilen oylama davranış ve demografi ve katılımcıların tutumlarını geri verdi ). Bir başka deyişle, Ansolabehere ve Hersh anket verileri ile oylama verileri zenginleştirilmiş ve elde edilen birleştirilmiş dosya onları ne dosya ayrı ayrı etkin bir şeyler yapmak sağlar.
Anket verileri ile Catalist ana veri dosyası zenginleştirerek, Ansolabehere ve Hersh üç önemli sonuçlara varmıştır. İlk olarak, aşırı raporlama oylama yaygın olan: sigara seçmenlerin neredeyse yarısı oylama bildirdi. Ya da ona bakarak başka bir yolu birisi oylama bildirdi, onlar aslında oy verdiğini ancak% 80 şansı var olmasıdır. İkinci olarak, aşırı raporlama rastgele değildir; Aşırı raporlama, yüksek gelir arasındaki iyi eğitimli daha sık görülür, kamu işlerine yapan partizanlar. Diğer bir deyişle, oy için büyük olasılıkla insanlar da en çok oy hakkında yalan muhtemeldir. Üçüncüsü ve en önemlisi, çünkü aşırı raporlama, seçmen ve seçmen olmayanlar arasındaki gerçek farklar anketler sadece görünür küçüktür sistematik doğası. Örneğin, bir lisans derecesine sahip olanlar yaklaşık 22 puanlık oylama rapor olasılığı daha yüksektir, ancak gerçek oylamaya sadece 10 puan daha yüksektir. Dahası, oylama mevcut kaynak tabanlı teoriler aslında kim oy, yeni teoriler anlamak ve oylama tahmin etmek için çağıran bir ampirik bulgu daha oylama rapor kim tahmin de çok daha iyi.
Ancak, ne kadar biz bu sonuçları güvenelim ki? Bu sonuçlar hata bilinmeyen miktarda kara kutu verilerine hata eğilimli bağlama bağlıdır unutmayın. Daha spesifik olarak, sonuçlar iki önemli adımlar menteşe: 1) doğru bir ana veri dosyası ve 2) kendi ana veri dosyası için anket verileri bağlamak için catalist yeteneğini üretmek için birçok farklı veri kaynaklarını birleştirmek için catalist yeteneği. Bu adımların her biri oldukça zordur ve her iki aşamada hatalar yanlış sonuçlara araştırmacıları yol açabilir. genellikle araştırmacıların hiçbir bireysel akademik araştırmacı veya grup maç bir ölçekte, bu sorunların çözümünde kaynak ayırması, böylece Ancak, veri işleme ve eşleme hem şirket olarak catalist devam varlığı için kritik öneme sahiptir. bölüm sonunda daha fazla okuma, daha detaylı ve nasıl Ansolabehere ve Hersh bunların sonuçları güven inşa bu sorunların açıklar. Bu ayrıntıları bu çalışmada özgü olsa da, bu benzer konular kara kutu dijital iz veri kaynaklarına bağlantı isteyen diğer araştırmacılar için ortaya çıkacaktır.
Araştırmacılar bu çalışmanın çizebilirsiniz genel dersler nelerdir? İlk olarak, anket verileri ile dijital izler zenginleştiren muazzam değeri yoktur. İkinci olarak, bu toplu olsa da, ticari veri kaynakları "zemin gerçeği" olarak kabul edilmemelidir, bazı durumlarda yararlı olabilir. Aslında, (onlar her zaman kısa düşecek hangi) mutlak Truth bu veri kaynaklarını karşılaştırmak için en iyisidir. Aksine, her zaman yanı hatalar var diğer mevcut veri kaynakları, bunları karşılaştırmak daha iyidir.