Bu bölümde, bir anlatı olarak okunacak ziyade, bir referans olarak kullanılmak üzere tasarlanmıştır.
Bu bölümde temalar çoğu da gibi Kamuoyu Araştırma Amerikan Derneği (AAPOR) geçtiğimiz günlerde Cumhurbaşkanlığı Adresleri, yankılandı edilmiş Dillman (2002) , Newport (2011) , Santos (2014) , ve Link (2015) .
Anket araştırma geliştirme hakkında daha fazla tarihsel için bkz Smith (1976) ve Converse (1987) . Anket araştırma üç dönemlerin fikri üzerine daha fazla bilgi için, bkz Groves (2011) ve Dillman, Smyth, and Christian (2008) (biraz farklı üç dönemler kırılır).
Anket araştırma ikinci dönemin ilk geçiş içinde bir zirve olduğunu Groves and Kahn (1979) arasında ayrıntılı bir kafa kafaya karşılaştırma yapar, bir yüz-yüze ve telefon anketi. Brick and Tucker (2007) rastgele rakam çevirme örnekleme yöntemlerinin tarihsel gelişimine bakıyor.
Nasıl anket araştırması daha toplumdaki değişikliklere yanıt olarak geçmişte değişti için bkz Tourangeau (2004) , Mitofsky (1989) , ve Couper (2011) .
bazen katılımcıların kendilerini içsel durumları farkında değildir, çünkü soru sorarak iç durumları hakkında öğrenme sorunlu olabilir. Örneğin, Nisbett and Wilson (1977) yazarları sonuçlandırmak yazıda: "konular bazen (a) habersiz:" zihinsel süreçlere Sözlü raporlar bildiğimiz edebileceğinden çok daha fazla söylemek. "Uyandıran başlığı ile harika bir kağıt var önemlisi bir yanıt etkilemiş bir uyarıcı varlığı, (b) tepki varlığı, ve (c) uyaran yanıtı etkiledi farkında habersiz. "
Araştırmacılar bildirilen davranış ya da tutumlar gözlenen davranış tercih etmeliyiz argümanlar için, bkz Baumeister, Vohs, and Funder (2007) (psikoloji) ve Jerolmack and Khan (2014) ve yanıtları (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (sosyoloji). soran ve ayrıca gözlemleyerek arasındaki fark araştırmacılar belirtilen ve açıklanmış tercihler hakkında konuşmak ekonomi, ortaya çıkar. Örneğin, bir araştırmacı onlar (belirtilen tercihleri) dondurma yeme ya da spor salonuna gitmeyi tercih edip ankete sorabilirsiniz veya araştırma insanların dondurma yemek ne sıklıkta gözlemlemek ve spor salonu (açıklanmış tercihler) gidebiliriz. Ekonomi belirtilen tercihleri belirli veri tiplerinin derin şüphecilik vardır (Hausman 2012) .
Bu tartışmalardan bir ana teması bildirilen davranış her zaman doğru olmadığıdır. Ama, otomatik olarak kaydedilen davranış, doğru olmayabilir ilgi bir örnek üzerinde toplanan olmayabilir, ve araştırmacıların erişimine olmayabilir. Bu nedenle, bazı durumlarda, ben bildirilen davranış yararlı olabilir diye düşünüyorum. Ayrıca, bu tartışmaların ikinci bir ana tema duygular, bilgi, beklenti ve görüşlerini raporlar her zaman doğru değildir olmasıdır. Fakat bu içsel durumları hakkında bilgi tarafından yapılması gerektiği takdirde, araştırmacılar-ya bazı davranışlarını açıklamak yardımcı olmak ya da bir şey izah-sonra olmak üzere uygun olabilir soruyorum.
Toplam anket hatası kitap uzunluğu tedaviler için bkz Groves et al. (2009) ya da Weisberg (2005) . Toplam anket hata gelişim öyküsü için bkz Groves and Lyberg (2010) .
Bir Araştırma Gündemi: temsiliyet açısından, yanıtsızlık ve non-cevap yanlılığı konularına büyük bir tanıtım Sosyal Bilimler Araştırmaları cevaplamamanın Ulusal Araştırma Konseyi raporudur (2013) . Bir diğer kullanışlı bakış tarafından sağlanmaktadır (Groves 2006) . Ayrıca, Resmi İstatistik Dergisi, Kamuoyu Quarterly ve Siyasi ve Sosyal Bilimler American Academy of Annals tüm özel konular yanıtsızlık konuda yayınlanmıştır. Son olarak, yanıt oranı hesaplama aslında birçok farklı yolu vardır; Bu yaklaşımlar Kamuoyu Araştırmacıları Amerikan Derneği (AAPOR) tarafından bir raporda ayrıntılı olarak açıklanmıştır (Public Opinion Researchers} 2015) .
1936 Edebiyat Digest anketi detaylı olarak ele alınmıştır (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Ayrıca gelişigüzel veri toplama karşı uyarmak için bir mesel olarak kullanılır olmuştur (Gayo-Avello 2011) . 1936 yılında, George Gallup örnekleme daha sofistike bir şeklini kullanılan ve çok daha küçük bir örnek ile daha doğru tahminler üretmek mümkün oldu. Edebiyat Digest üzerinde Gallup'un başarısı bir kilometre taşıdır anket araştırmasının gelişme oldu (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .
Ölçme açısından, tasarımı anket için büyük bir ilk kaynaktır Bradburn, Sudman, and Wansink (2004) . Tutum sorular üzerine, özellikle duruldu daha gelişmiş bir tedavi için, bkz Schuman and Presser (1996) . Ön test soruları daha mevcuttur Presser and Blair (1994) , Presser et al. (2004) , ve Bölüm 8 Groves et al. (2009) .
Anket maliyetleri ve anket hataları arasındaki ticaret-off klasik, kitap uzunluğunda tedavi Groves (2004) .
Standart olasılık örnekleme ve tahmin klasik kitap uzunlukta tedavi edilir Lohr (2009) (daha fazla tanıtım) ve Särndal, Swensson, and Wretman (2003) (daha gelişmiş). Post-tabakalaşma ve ilgili yöntemlerin bir klasik kitap uzunlukta tedavi Särndal and Lundström (2005) . bazı dijital yaş ayarları, araştırmacılar geçmişte sık sık doğru değildi olmayan katılımcıların, hakkında biraz biliyorum. Araştırmacılar olmayan katılımcıların hakkında bilgi sahibi olduğunda olmayan tepki ayarlama farklı şekilleri mümkündür (Kalton and Flores-Cervantes 2003; Smith 2011) .
Xbox çalışması Wang et al. (2015) araştırmacılar, hücre birçok, birçok hücre vardır bile anlamı tahmin sağlar (bazen "Mister P" olarak adlandırılan MRP) çoklu regresyon ve post-tabakalaşma denilen bir tekniği kullanır. Bu tekniği tahminlerinin kalitesi hakkında bazı tartışmalar olsa da, bu keşfetmek için umut verici bir alan gibi görünüyor. Tekniği ilk kullanılan Park, Gelman, and Bafumi (2004) , ve sonraki kullanım ve tartışma olmuştur (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Bireysel ağırlıkları ve hücre bazlı ağırlıkları arasındaki bağlantı hakkında ayrıntılı bilgi için bakınız Gelman (2007) .
Ağırlıklandırma web anketleri diğer yaklaşımlar için, bkz Schonlau et al. (2009) , Valliant and Dever (2011) , ve Bethlehem (2010) .
Örnek eşleştirme tarafından önerilen Rivers (2007) . Bethlehem (2015) örnek eşleştirme performansı aslında diğer örnekleme yaklaşımları (örneğin, tabakalı örnekleme) ve diğer ayar yaklaşımları (örneğin, post-tabakalaşma) benzer olacağını savunuyor. Online panelleri üzerinde daha fazla bilgi için, bkz Callegaro et al. (2014) .
Bazen araştırmacılar olasılık örnekleri ve non-olasılık örnekleri benzer kalitede tahminlerde bulduk (Ansolabehere and Schaffner 2014) , ancak diğer karşılaştırmalar olmayan olasılık örnekleri kötü yapmak bulduk (Malhotra and Krosnick 2007; Yeager et al. 2011) . Bu farklılıkların olası nedenlerinden biri, olasılıklı olmayan örnekleri zamanla geliştirilmiş olmasıdır. Olasılık dışı örnekleme yöntemleri bir daha kötümser bir görünüm için olmayan olasılık Örnekleme üzerinde AAPOR Task Force (Baker et al. 2013) , ve ben de özet raporu aşağıdaki bir yorum okuma tavsiye.
Olasılık dışı örneklerinde önyargı azaltmak için ağırlık etkisi üzerinde bir meta-analizde için, Tablo 2.4 Tourangeau, Conrad, and Couper (2013) ayarlamaları yararlı ama yanılabilir düzeltmeler gibi görünüyor "sonucuna yazarları açar. . . "
Conrad and Schober (2008) Geleceğin Anketi Röportaj Tasarlamak başlıklı düzenlenmiş bir hacim sağlar ve bu bölümdeki temalar birçok giderir. Couper (2011) benzer temaları ele alır ve Schober et al. (2015) , yeni bir ayara uyarlanmış veri toplama yöntemleri daha kaliteli veri neden olabilir nasıl güzel bir örnek sunmaktadır.
Sosyal bilimler araştırmaları için Facebook uygulamalarını kullanarak başka ilginç örnek için bkz Bail (2015) .
Yapılan anketlerde katılımcıların keyifli ve değerli bir deneyim yapma konusunda daha fazla tavsiye için Tailored Tasarım Yöntemi üzerinde çalışmaya bakınız (Dillman, Smyth, and Christian 2014) .
Stone et al. (2007) ekolojik anlık değerlendirilmesi ve ilgili yöntemlerin bir kitap uzunluğu tedavi sunuyor.
Judson (2007) olarak anket ve idari verilerin birleştirilmesi süreci tarif "bilgi entegrasyonu," Bu yaklaşımın bazı avantajlar tartışır ve bazı örnekler sunmaktadır.
Araştırmacılar dijital izler ve idari verileri kullanabilirsiniz başka bir yolu belirli özelliklere sahip insanlar için bir örnekleme çerçevesi. Ancak, bu kayıtları da gizlilik ilgili soruları oluşturabilir bir örnekleme çerçevesi kullanılacak erişim (Beskow, Sandler, and Weinberger 2006) .
ben bunu tarif ettik nasıl dan görünebilir olarak güçlendirilmiş soran ile ilgili olarak, bu yaklaşım gibi yeni değildir. Bu yaklaşım istatistik-model-tabanlı sonrası tabakalaşma üç büyük alanlara derin bağlantıları vardır (Little 1993) , ithamlarla (Rubin 2004) , ve küçük bir alanda tahmini (Rao and Molina 2015) . Aynı zamanda tıbbi araştırmalara vekil değişkenlerin kullanımı ile ilgilidir (Pepe 1992) .
Dijital iz verilerine erişmek ilgili etik konuların yanı sıra, güçlendirilmiş soran aynı zamanda insanların bir ankete ortaya çıkarmak için tercih olmayabilir hassas özellikleri anlaması için kullanılan olabilir (Kosinski, Stillwell, and Graepel 2013) .
Maliyet ve zaman tahminleri Blumenstock, Cadamuro, and On (2015) gibi temiz ve çağrı verilerini işlemek için maliyet olarak ek bir anket-ve dahil değildir sabit maliyetlerin değişken maliyet-maliyet daha bakın. Genel olarak, güçlendirilmiş soran muhtemelen yüksek sabit maliyetleri ve dijital deneyler (Bölüm 4'e bakınız) benzer düşük değişken maliyetleri olacaktır. Daha kullanılan verilerin ilgili ayrıntılar Blumenstock, Cadamuro, and On (2015) , kağıt olan Blumenstock and Eagle (2010) ve Blumenstock and Eagle (2012) . Birden imputuation gelen Yaklaşımlar (Rubin 2004) güçlendirilmiş soran gelen tahminlerinde yakalama belirsizliği yardımcı olabilir. Araştırmacılar toplam sayım yerine bireysel düzeyde özellikleri umurumda sadece soran güçlendirilmiş yapıyor, sonra yaklaşımlar King and Lu (2008) ve Hopkins and King (2010) yararlı olabilir. Makine öğrenme yaklaşımları hakkında daha fazla bilgi için Blumenstock, Cadamuro, and On (2015) , bkz James et al. (2013) (daha fazla giriş) veya Hastie, Tibshirani, and Friedman (2009) (daha gelişmiş). Bir başka popüler makine öğrenme kitabı olan Murphy (2012) .
Zenginleştirilmiş Sormamın ilgili olarak, Ansolabehere ve Hersh sonuçları (2012) iki kilit adımlar menteşe: 1) anket verileri doğru bir ana veri dosyası üretmek için birçok farklı veri kaynaklarını birleştirmek ve 2) catalist yeteneği bağlamak için catalist yeteneği onun ana veri dosyası. Bu nedenle, Ansolabehere ve Hersh dikkatle bu adımların her biri kontrol edin.
ana veri dosyası oluşturmak için, Catalist birleştirir ve dahil olmak üzere birçok farklı kaynaklardan bilgi uyumunu: diğer belirtilmemiş ticari sağlayıcılardan birden oylama kayıtları her eyaletten anlık, Adres Kayıt Postane'nin Ulusal Değişim verilerine ve veri. Bütün bu temizlik ve birleştirme olur nasıl kanlı ayrıntılar bu kitabın kapsamı dışındadır, ancak ne kadar dikkatli, bu süreç, özgün veri kaynaklarında hataları yaymak ve hatalarla tanıtacak. Catalist kendi veri işleme tartışmak ve ham veri bazı sağlamak için istekli olmasına rağmen araştırmacılar tüm Catalist veri boru hattı gözden geçirmek, bu imkansız oldu. Aksine, araştırmacılar Catalist veri dosyası hatası bazı bilinmeyen ve belki de bilinemez, bir miktar vardı bir durum vardı. Bir eleştirmen değil katılımcılar tarafından misreporting tarafından, CCE üzerinde anket raporları ve Catalist ana veri dosyasında davranış arasındaki büyük farklar ana veri dosyasındaki hataları neden olduğunu spekülasyon olabilir çünkü bu ciddi bir sorundur.
Ansolabehere ve Hersh veri kalitesi endişe adresleme için iki farklı yaklaşım aldı. İlk olarak, Catalist ana dosyadaki oy kendinden bildirilen oylama karşılaştırarak yanı sıra, araştırmacılar da karşılaştırıldığında kendine bildirilen parti, ırk, seçmen kayıt durumu (örneğin, kayıtlı veya kayıtlı) ve oylama yöntemi (örneğin, şahsen, devamsızlık Catalist veritabanlarında bulunan bu değerlere seçim, vs.). Bu dört demografik değişkenler için, araştırmacılar oylama için daha Catalist ana dosyadaki etüt raporunun ve veri arasındaki anlaşmanın çok daha yüksek düzeylerde bulundu. Böylece, Catalist ana veri dosyası, yoksul genel kalitesi değil düşündüren, oylama dışındaki özellikler için yüksek kaliteli bilgiye sahip gibi görünüyor. İkincisi, catalist verileri kullanılarak kısmen, bir bulgu Ansolabehere ve Hersh ilçe oylama kayıtlarının kalitesi üç farklı tedbirler geliştirdi ve onlar oylama fazla raporlama tahmini oranı bu veri kalitesi önlemlerin herhangi esas ilgisiz olduğunu bulduğunu aşırı raporlama yüksek oranda alışılmadık düşük veri kalitesi ile ilçeler tarafından tahrik ediliyor olmadığını düşündürmektedir.
Bu ana oylama dosyasının oluşturulmasını göz önüne alındığında, olası hataların ikinci kaynağı buna anket kayıtlarını bağlanıyor. Bu bağlantı yanlış yapılırsa Örneğin, rapor ve onaylanmış oylama davranışı arasındaki farkın aşırı tahmine neden olabilir (Neter, Maynes, and Ramanathan 1965) . her insanın, her iki veri kaynakları oldu istikrarlı, benzersiz bir tanımlayıcı olsaydı, o zaman bağlantı önemsiz olacaktır. ABD ve diğer ülkelerin çoğunda, ancak, hiçbir evrensel tanımlayıcı yoktur. Dahası, böyle olsaydı bile bir tanımlayıcı insanlar muhtemelen araştırmacıları anket bunu sağlamak için tereddüt olurdu! isim, cinsiyet, doğum yılı ve ev adresi: Böylece, Catalist bu durumda, her davalı hakkında bilgi dört adet kusurlu tanımlayıcıları kullanarak bağlantı yapmak zorunda. Örneğin, Catalist CCE içinde Homie J Simpson kendi ana veri dosyasında Homer Jay Simpson ile aynı kişi olup olmadığını karar vardı. Uygulamada, eşleştirme araştırmacılar için Daha da kötüsü, zor ve dağınık bir süreçtir, ve Catalist tescilli olma eşleştirme tekniği düşündü.
eşleştirme algoritmaları doğrulamak için, iki zorluklar dayanıyordu. MITRE Şirketi: Birincisi, Catalist bağımsız, üçüncü taraf tarafından işletilen bir eşleştirme yarışmaya katıldı. MITRE tüm katılımcılara iki gürültülü veri dosyaları temin eşleştirilecek ve farklı takım MITRE en iyi eşleştirme dönmek için yarıştı. MITRE kendisi doğru eşleştirmeyi biliyordu çünkü onlar ekipleri puanı başardık. yarıştı 40 şirket, Catalist ikinci sırada yer aldı. patentli teknoloji bağımsız, üçüncü taraf değerlendirme Bu tür oldukça nadirdir ve son derece değerli olduğu; o catalist en uygun prosedürleri state-of-the-art esasen olduğunu bize güven vermelidir. Ama devlet-of-the-art yeterince iyi mi? Bu eşleştirme rekabet ek olarak, Ansolabehere ve Hersh katalizli kendi uygun meydan hazırlandı. Bir önceki projeden, Ansolabehere ve Hersh Florida seçmen kayıtları toplamış. Onlar kendi alanlarında catalist için redacted ve daha sonra gerçek değerlerine Bu alanların catalist raporlarını karşılaştırıldığında bazı bu kayıtların bazılarını sağladı. Neyse ki, catalist raporları Catalist kendi ana veri dosyası üzerine kısmi seçmen kayıtlarını maç olabilir belirten tevkif değerlerine yakın idi. Bu iki zorluklar, Ansolabehere ve Hersh tarafından üçüncü tarafça diğeri, onların tam uygulama kendimizi gözden olamaz olsa bile, bize Catalist eşleştirme algoritmalarının daha fazla güven verir.
oylama doğrulamak için birçok önceki girişimler olmuştur. Literatürde genel bir bakış için, bkz Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , ve Hanmer, Banks, and White (2014) .
Durumda araştırmacılar catalist elde edilen verilerin kalitesi ile teşvik olmasına rağmen, ticari satıcılardan diğer değerlendirmeler daha az hevesli olmuştur dikkat etmek önemlidir. Araştırmacılar kalitesiz bulduğunuzda (kendisi üç sağlayıcılarından verileri bir araya birleştirilmiş: Acxiom, Experian, ve infoUSA) Pazarlama Sistemleri Grubu tüketici dosya için bir anket verileri (Pasek et al. 2014) . Bu araştırmacılar doğru olması beklenen anket yanıtları eşleşmedi veri dosyası, veri dosyası sorular çok sayıda ve eksik veri deseni için eksik verileri eksik veri sistematik başka bir deyişle (bildirilen anket değerine korelasyon vardı, bir ), rastgele değil.
Anket ve idari veriler arasındaki rekor bağlantı ile ilgili daha fazla bilgi için, bkz Sakshaug and Kreuter (2012) ve Schnell (2013) . Genel olarak rekor bağlantı ile ilgili daha fazla bilgi için, bkz Dunn (1946) ve Fellegi and Sunter (1969) (tarihi) ve Larsen and Winkler (2014) (modern). Benzer yaklaşımlar da bu tür veri tekilleştirme, örnek tanımlama, isim eşleştirme, yinelenen algılama gibi adlar altında bilgisayar bilimi gelişti ve kayıt algılama yinelenen edilmiştir (Elmagarmid, Ipeirotis, and Verykios 2007) . Kişisel tanımlayıcı bilgilerin iletilmesini gerekmez bağlantı kaydetmek için yaklaşımlar koruyarak gizlilik vardır (Schnell 2013) . Facebook araştırmacılar probabilisticsly oylama davranış kayıtlarını bağlamak için bir prosedür geliştirmiştir (Jones et al. 2013) ; Bu bağlantı ben 4. Bölümde anlatacağım bir deney değerlendirmek için yapıldı (Bond et al. 2012) .
Hükümet idari kayıtlar için geniş çaplı sosyal araştırma bağlayan bir başka örneği Sağlığı ve Emekli Anketi ve Sosyal Güvenlik Kurumu geliyor. Bu çalışmaya daha fazla bilgi için, rıza prosedürü hakkında bilgi de dahil olmak üzere, bkz Olson (1996) ve Olson (1999) .
Catalist bazı ulusal hükümetlerin istatistik ofislerinin ortak çalışanlar-bir usta veri dosyası-sürecine idari kayıtların birçok kaynak birleştirme işlemi. İsveç İstatistik iki araştırmacı konu hakkında ayrıntılı bir kitap yazdım (Wallgren and Wallgren 2007) . (Olmstead County, Minnesota; Mayo Clinic ev) Amerika Birleşik Devletleri'nde tek ilçesinde bu yaklaşımın bir örnek için, bkz Sauver et al. (2011) . Idari kayıtlar görünebilir hataları hakkında daha fazla bilgi için, bkz Groen (2012) .