Bu bölümdeki temaların çoğu, Dillman (2002) , Newport (2011) , Santos (2014) ve Link (2015) ) gibi Amerikan Kamuoyu Araştırmaları Derneği (AAPOR) 'daki son cumhurbaşkanlığı adreslerinde de dile getirilmiştir. Link (2015) .
Anket araştırması ve derinlemesine görüşmeler arasındaki farklar hakkında daha fazla bilgi için, bkz. Small (2009) . Derinlemesine görüşmelerle ilgili olarak etnografya denilen yaklaşımlar bir ailedir. Etnografik araştırmalarda, araştırmacılar genellikle doğal ortamlarında katılımcılarla çok daha fazla zaman harcarlar. Etnografya ve derinlemesine görüşmeler arasındaki farklar hakkında daha fazla bilgi için, bkz. Jerolmack and Khan (2014) . Dijital etnografya hakkında daha fazla bilgi için bkz. Pink et al. (2015) .
Anket araştırması tarihinin tanımlarım, gerçekleşmiş olan heyecan verici gelişmelerin çoğunu içermek için çok kısa. Daha tarihi bir geçmiş için bkz. Smith (1976) , Converse (1987) ve Igo (2008) . Araştırma araştırmalarının üç dönemi hakkında daha fazla bilgi için bkz. Groves (2011) ve Dillman, Smyth, and Christian (2008) (bu üç dönemi biraz farklı şekilde bozar).
Groves and Kahn (1979) yüz yüze ve telefon anketi arasında detaylı bir kafa-kafa karşılaştırması yaparak anket araştırmasında ilk dönemden ikinci döneme geçişte bir göz atmaktadırlar. ( ??? ) rasgele basamaklı arama örnekleme yöntemlerinin tarihsel gelişimine geriye bakın.
Geçmişte, toplumdaki değişimlere yanıt olarak anket araştırmasının nasıl değiştiğini görmek için bkz. Tourangeau (2004) , ( ??? ) ve Couper (2011) .
Baumeister, Vohs, and Funder (2007) ve gözlemlemenin güçlü ve zayıf yanları psikologlar (örneğin, Baumeister, Vohs, and Funder (2007) ) ve sosyologlar (örn., Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) ; Jerolmack and Khan (2014) ] Araştırmacıların belirttikleri ve ortaya koyduğu tercihler hakkında konuştukları ekonomide sorma ve gözlemleme arasındaki fark ortaya çıkmaktadır.Örneğin, bir araştırmacı, katılımcılara dondurma yemeyi veya spor salonuna gitmeyi tercih etmelerini isteyebilir. (belirtilen tercihler), ya da insanların ne sıklıkla dondurma yediklerini ve spor salonuna gittiklerini (ortaya çıkan tercihleri) gözlemleyebildikleri gibi, Hausman (2012) açıklandığı gibi, iktisattaki belirli tipte tercih edilen tercihler hakkında derin bir kuşku vardır.
Bu tartışmaların ana teması, bildirilen davranışların her zaman doğru olmamasıdır. Ancak, 2. bölümde anlatıldığı gibi, büyük veri kaynakları doğru olmayabilir, bir ilgi konusu örnek üzerinde toplanamaz ve araştırmacılar tarafından erişilebilir olmayabilir. Bu nedenle, bazı durumlarda, rapor edilen davranışların yararlı olabileceğini düşünüyorum. Ayrıca, bu tartışmaların ikinci ana teması, duygu, bilgi, beklenti ve görüşler hakkındaki raporların her zaman doğru olmadığıdır. Ancak, eğer bu içsel durumlara ilişkin bilgiler araştırmacılar tarafından istenirse - ya bazı davranışları veya açıklanacak olan şeyleri açıklamaya yardımcı olmak için - istemek uygun olabilir. Elbette, soru sormak suretiyle içsel devletleri öğrenmek problemli olabilir, çünkü bazen yanıt verenlerin kendi içsel durumlarının farkında olmaları mümkün değildir (Nisbett and Wilson 1977) .
Groves'in 1. Bölümü Groves (2004) , anket araştırmacılarının toplam anket hata çerçevesini tanımlamak için kullandıkları tutarsız terminolojiyi uzlaştıran mükemmel bir iş yapar. Toplam tarama hatası çerçevesinin bir kitap uzunluğu tedavisi için bkz. Groves et al. (2009) ve tarihsel bir genel bakış için bkz. Groves and Lyberg (2010) .
Hataların önyargıya ve varyansa ayrıştırılması fikri de makine öğrenmede ortaya çıkmaktadır; Örneğin, bkz. Hastie, Tibshirani, and Friedman (2009) bölüm 7.3. Bu genellikle araştırmacıların “önyargı-varyans” ticaretinden söz etmelerine yol açar.
Temsiliyet açısından, yanıt vermeyen ve yanıt vermeyen önyargı konularına büyük bir giriş yapan Ulusal Araştırma Konseyi, Sosyal Bilimler Araştırmalarında Cevapsızlık: Bir Araştırma Gündemi (2013) . Bir başka yararlı bakış Groves (2006) tarafından sağlanmaktadır. Ayrıca, Resmi İstatistikler Dergisi, Kamuoyu Üçlüsü ve Amerikan Siyasal ve Sosyal Bilimler Akademisi'nin tüm özel konuları da cevapsızlık konusunda yayınlanmıştır. Son olarak, yanıt oranını hesaplamanın birçok farklı yolu vardır; Bu yaklaşımlar Amerikan Kamuoyu Araştırmacıları Derneği (AAPOR) tarafından bir raporda ayrıntılı olarak açıklanmıştır ( ??? ) .
1936 Literary Digest anketinde daha fazla bilgi için bkz. Bryson (1976) , Squire (1988) , Cahalan (1989) ve Lusinchi (2012) . Bu anketin, gelişigüzel verilerin toplanmasıyla ilgili bir Gayo-Avello (2011) olarak başka bir tartışması için bkz. Gayo-Avello (2011) . 1936'da, George Gallup daha sofistike bir örnekleme yöntemi kullanmış ve daha küçük bir örneklemle daha doğru tahminler üretebilmiştir. Gallup'un Edebiyat Özeti üzerindeki başarısı, @ converse_survey_1987 bölüm 3'te açıklandığı gibi anket araştırmasının geliştirilmesinde bir kilometre taşıydı; Ohmer (2006) bölüm 4 Ohmer (2006) ; ve @ igo_averaged_2008.
Ölçme açısından anketlerin tasarlanması için büyük bir ilk kaynak Bradburn, Sudman, and Wansink (2004) . Daha ileri tedaviler için, özellikle tutum sorularına odaklanan Schuman and Presser (1996) Saris and Gallhofer (2014) daha genel olan Saris and Gallhofer (2014) . ( ??? ) de tarif edildiği gibi psikometride ölçüme biraz farklı bir yaklaşım atılmıştır. Presser et al. (2004) Presser and Blair (1994) Presser et al. (2004) ve Groves et al. (2009) . Anket deneyleri hakkında daha fazla bilgi için, bkz. Mutz (2011) .
Maliyet açısından, anket maliyetleri ile anket hataları arasındaki değişimin klasik, kitap boyu muamelesi Groves (2004) .
Standart olasılıklı örnekleme ve kestirmenin iki klasik kitap uzunluklu muameleleri Lohr (2009) (daha fazla giriş) ve Särndal, Swensson, and Wretman (2003) (daha ileri düzey) dir. Tabakalaşma ve ilgili yöntemlerin klasik kitap boyu tedavi Särndal and Lundström (2005) . Bazı dijital çağlarda araştırmacılar, geçmişte çoğu zaman doğru olmayan muhabirler hakkında epey bilgi sahibi. Araştırmacılar, Kalton and Flores-Cervantes (2003) ve Smith (2011) tarafından açıklandığı gibi, Kalton and Flores-Cervantes (2003) hakkında bilgi sahibi olduklarında farklı cevap vermemesi biçimleri mümkündür.
W. Wang et al. (2015) çoktan fazla regresyon ve post-tabakalaşma (“P.P.”) Adlı bir teknikten yararlanmaktadır ve bu da araştırmacıların çok sayıda grup olduğunda bile grup araçlarını tahmin etmelerine olanak sağlamaktadır. Bu teknikten elde edilen tahminlerin kalitesi hakkında bazı tartışmalar olsa da, keşfedilecek umut verici bir alan gibi görünüyor. Bu teknik ilk olarak Park, Gelman, and Bafumi (2004) kullanıldı ve daha sonraki kullanım ve tartışmalar yapıldı (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Bireysel ağırlıklar ve grup ağırlıkları arasındaki bağlantı için bkz. Gelman (2007) .
Web anketlerinin ağırlıklandırılmasına yönelik diğer yaklaşımlar için, bkz. Schonlau et al. (2009) , Bethlehem (2010) ve Valliant and Dever (2011) . Çevrimiçi paneller olasılık örnekleme veya olasılık dışı örnekleme kullanabilir. Çevrimiçi paneller hakkında daha fazla bilgi için, bkz. Callegaro et al. (2014) .
Bazen, araştırmacılar olasılık numunelerinin ve olasılıksız örneklerin benzer kalitede tahminler (Ansolabehere and Schaffner 2014) , fakat diğer karşılaştırmalar olasılık dışı örneklerin daha kötü olduğunu göstermiştir (Malhotra and Krosnick 2007; Yeager et al. 2011) . Bu farklılıklar için olası bir sebep, olasılık dışı örneklerin zamanla gelişmesidir. Olasılık dışı örnekleme yöntemlerine ilişkin daha karamsar bir görüş için, OABRİK Olmayan Örneklemle İlgili AAPOR Görev Gücü'ne bakın (Baker et al. 2013) ve ayrıca özet raporunu izleyen yorumları okumayı da tavsiye ederim.
Conrad and Schober (2008) Geleceğin Anket Röportajını Düşünen başlıklı bir cilttir ve soru sormanın geleceği hakkında çeşitli bakış açıları sunar. Couper (2011) benzer temaları ele alır ve Schober et al. (2015) , yeni bir ortama uyarlanmış veri toplama yöntemlerinin daha yüksek kaliteli verilere nasıl yol açabileceğine dair güzel bir örnek sunmaktadır. Schober and Conrad (2015) , toplumdaki değişiklikleri eşleştirmek için araştırma araştırması sürecini düzenlemeye devam etme konusunda daha genel bir argüman sunmaktadır.
Tourangeau and Yan (2007) hassas sorulardaki sosyal arzulanabilirlik yanlılığı konularını gözden Tourangeau and Yan (2007) Lind et al. (2013) , insanların bilgisayarla yapılan bir röportajda daha hassas bilgileri açıklayabilmelerinin bazı olası nedenlerini sunmaktadır. Anketlerde katılım oranlarının artırılmasında insan görüşmecilerinin rolü hakkında daha fazla bilgi için bkz Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) ve Schaeffer et al. (2013) . Karışık mod anketleri hakkında daha fazla bilgi için bkz. Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) ekolojik anlık değerlendirmenin ve ilgili yöntemlerin kitap boyu tedavisini önermektedir.
Anketleri katılımcılara yönelik keyifli ve değerli bir deneyim haline getirme konusunda daha fazla tavsiye için, Özel Tasarım Yöntemi (Dillman, Smyth, and Christian 2014) . Sosyal bilimler anketleri için Facebook uygulamalarını kullanmanın başka bir ilginç örneği için bkz. Bail (2015) .
Judson (2007) , anketleri ve idari verileri “bilgi entegrasyonu” olarak bir araya getirme sürecini tanımlamakta ve bu yaklaşımın bazı avantajlarını tartışmanın yanı sıra bazı örnekler sunmaktadır.
Zenginleştirilmiş soruna gelince, oylamayı doğrulamak için daha önce yapılmış birçok girişimde bulunulmuştur. Bu literatüre genel bir bakış için bkz. Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , ve Berent, Krosnick, and Lupia (2016) . Ansolabehere and Hersh (2012) sunulan sonuçların daha kuşkulu bir görünümü için bkz. Berent, Krosnick, and Lupia (2016) Ansolabehere and Hersh (2012) .
Ansolabehere ve Hersh’in Katalist’in verilerinin kalitesiyle teşvik edilmesine rağmen, ticari satıcıların diğer değerlendirmelerinin daha az hevesli olduğunu belirtmek önemlidir. Pasek et al. (2014) bir anketten elde edilen veriler, Marketing Systems Group'un (kendisi üç sağlayıcıdan gelen verileri birleştiren: Acxiom, Experian ve InfoUSA) bir tüketici dosyası ile kıyaslandığında zayıf kaliteyi buldu. Yani, veri dosyası araştırmacıların doğru olması beklenen anket cevapları ile eşleşmedi, tüketici dosyası çok sayıda soru için verileri kaçırdı ve eksik veri modeli rapor edilen anket değeriyle korundu (diğer bir deyişle, eksik olan) Veriler sistematik değildi, rastgele değil).
Anketler ve idari veriler arasındaki daha fazla bağlantı için bkz. Sakshaug and Kreuter (2012) ve Schnell (2013) . Genel olarak daha fazla kayıt bağlantısı için bkz. Dunn (1946) ve Fellegi and Sunter (1969) (tarihsel) ve Larsen and Winkler (2014) (modern). Bilgisayar biliminde veri tekilleştirme, örnek tanımlama, isim eşleme, çift tespit ve çift kayıt tespiti (Elmagarmid, Ipeirotis, and Verykios 2007) gibi isimler altında da benzer yaklaşımlar geliştirilmiştir. Kişisel tanımlayıcı bilgilerin iletilmesini gerektirmeyen bağlantıyı kaydetmek için gizlilik koruma yaklaşımları da vardır (Schnell 2013) . Facebook'taki araştırmacılar kayıtlarını olasılıkla oy verme davranışlarına bağlayan bir prosedür geliştirdiler (Jones et al. 2013) ; Bu bağlantı size 4. bölümde anlatacağım bir deneyi değerlendirmek için yapıldı (Bond et al. 2012) . Kayıt bağlantısı için daha fazla onay almak için bkz. Sakshaug et al. (2012) .
Büyük ölçekli bir sosyal araştırmanın devlet idari kayıtlarına bağlanması ile ilgili bir başka örnek, Sağlık ve Emeklilik Anketi ve Sosyal Güvenlik İdaresi'nden gelmektedir. Bu çalışma hakkında daha fazla bilgi için, rıza prosedürü ile ilgili bilgiler dahil, bkz. Olson (1996, 1999) .
Birçok idari kayıt kaynağının, bir Katalistin kullandığı süreç olan bir ana veri dosyasına birleştirilmesi süreci, bazı ulusal hükümetlerin istatistik bürolarında yaygındır. İstatistik İsveç'ten iki araştırmacı konuyla ilgili ayrıntılı bir kitap yazdı (Wallgren and Wallgren 2007) . Amerika Birleşik Devletleri'ndeki tek bir ilçede bu yaklaşımın bir örneği için (Mayo Clinic'e ev sahipliği yapan Olmstead County, Minnesota) Sauver et al. (2011) . Yönetim kayıtlarında görünebilecek hatalar hakkında daha fazla bilgi için bkz. Groen (2012) .
Araştırmacıların araştırma araştırmalarında büyük veri kaynaklarını kullanabilmesinin bir başka yolu, belirli özelliklere sahip insanlar için örnekleme çerçevesidir. Ne yazık ki, bu yaklaşım mahremiyetle ilgili soruları gündeme getirebilir (Beskow, Sandler, and Weinberger 2006) .
Yükseltilmiş sorma ile ilgili olarak, bu yaklaşım onu nasıl tarif ettiğimden göründüğü kadar yeni değildir. İstatistikte üç büyük alana derin bağlantıları vardır: model tabanlı post-tabakalaşma (Little 1993) , imputation (Rubin 2004) ve küçük alan tahmini (Rao and Molina 2015) . Aynı zamanda tıbbi araştırmalarda vekil değişkenlerin kullanımı ile ilgilidir (Pepe 1992) .
Blumenstock, Cadamuro, and On (2015) daki maliyet ve zaman tahminleri değişken maliyetlere - bir ek anketin maliyetine - atıfta bulunur ve arama verilerinin temizlenmesi ve işlenmesi maliyeti gibi sabit maliyetleri içermez. Genel olarak, çoğaltılmış sorma büyük olasılıkla yüksek sabit maliyetlere ve dijital deneylere benzer düşük değişken maliyetlere sahip olacaktır (bkz. Bölüm 4). Gelişmekte olan ülkelerde cep telefonu tabanlı anketler için bkz. Dabalen et al. (2016) .
Büyümenin nasıl daha iyi olduğunu öğrenmek için, birden fazla ders hakkında daha fazla şey öğrenmenizi tavsiye ederim (Rubin 2004) . Ayrıca araştırmacılar, bireysel düzeydeki özellikler yerine toplu sayıları önemsemeyi teşvik ettikleri takdirde, King and Lu (2008) ve Hopkins and King (2010) daki yaklaşımlar yararlı olabilir. Son olarak, Blumenstock, Cadamuro, and On (2015) de makine öğrenme yaklaşımları hakkında daha fazla bilgi için, bkz. James et al. (2013) (daha fazla tanıtım) veya Hastie, Tibshirani, and Friedman (2009) (daha ileri düzey).
Amplifiye edilmiş soruşturmayla ilgili tek bir etik mesele, insanların Kosinski, Stillwell, and Graepel (2013) de tarif edildiği gibi bir ankette ortaya çıkarmayı seçemeyeceği hassas özelliklerin çıkarılması için kullanılabileceğidir.