Loba téma dina bagean ieu geus ogé geus echoed di alamat presiden panganyarna dina Asosiasi Amérika of Opinion Public Panalungtikan (AAPOR), kayaning jelema ku Dillman (2002) , Newport (2011) , Santos (2014) , sarta Link (2015) .
Pikeun leuwih lengkep dina Bedana antara panalungtikan survéy jeung wawancara di-jero, tingali Small (2009) . Patali jeung ngawawancara dina-jero nyaéta kulawarga deukeut disebut ethnography. Dina ieu panalungtikan ethnographic, peneliti umumna méakkeun leuwih waktos sareng pamilon dina lingkungan alam maranéhanana. Pikeun leuwih lengkep dina Bedana antara ethnography jeung wawancara di-jero, tingali Jerolmack and Khan (2014) . Pikeun langkung lengkep ihwal ethnography digital, tingali Pink et al. (2015) .
pedaran kuring tina sajarah panalungtikan survéy téh tebih teuing ringkes keur ngawengku loba kamajuan seru anu dicokot tempat. Pikeun tukang sajarah leuwih lengkep, tingal Smith (1976) , Converse (1987) , sarta Igo (2008) . Pikeun langkung lengkep ihwal pamanggih tilu eras panalungtikan survéy, tingali Groves (2011) sarta Dillman, Smyth, and Christian (2008) (anu ngarecah nepi ka tilu eras rada béda).
Groves and Kahn (1979) nawarkeun Toong jero transisi ti mimiti jaman kadua dina panalungtikan survéy ku lakukeun perbandingan lengkep sirah-to-sirah antara hiji raray-to-beungeut jeung survei telepon. ( ??? ) kasampak deui dina ngembangkeun sajarah métode sampling acak-angka-maneuh.
Pikeun leuwih lengkep kumaha survey ieu panalungtikan geus robah nu geus kaliwat dina respon kana parobahan di masarakat, tingali Tourangeau (2004) , ( ??? ) , sarta Couper (2011) .
Kaunggulan na kelemahan of nanyakeun sarta observasi geus didebat ku psikolog (misalna Baumeister, Vohs, and Funder (2007) ) jeung ahli sosiologi (misalna Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) ; Jerolmack and Khan (2014) ] beda antara nanyakeun sarta observasi ogé timbul dina ékonomi, dimana peneliti ngobrol ngeunaan kahoyong nyatakeun jeung wangsit contona, panalungtik a bisa menta responden naha maranéhna leuwih milih dahar és krim atawa bade gim.. (kahoyong nyatakeun), atawa bisa nitenan kumaha mindeng urang tuang és krim sarta buka gim (wangsit preferensi). Aya skepticism jero ngeunaan jenis tangtu data preferensi nyatakeun di ékonomi sakumaha dijelaskeun dina Hausman (2012) .
A poko utama tina debat ieu nyaeta kabiasaan dilaporkeun teu salawasna akurat. Tapi, sakumaha ieu dijelaskeun dina bagean 2, sumber data badag bisa jadi akurat, maranéhna bisa jadi teu dikumpulkeun dina sampel dipikaresep, tur maranéhna bisa jadi diaksés nepi peneliti. Ku kituna, kuring pikir nu, dina sababaraha kaayaan, dilaporkeun kabiasaan tiasa mangpaat. Salajengna, tema utama detik debat ieu éta laporan ngeunaan émosi, pangaweruh, ekspektasi, jeung opini teu salawasna akurat. Tapi, upami informasi ngeunaan ieu nagara internal ieu diperlukeun ku peneliti-boh pikeun mantuan ngajelaskeun sababaraha kabiasaan atawa salaku hal anu jadi dipedar-lajeng nanyakeun bisa jadi hade. Tangtu, diajar ngeunaan nagara internal ku nanyakeun patarosan tiasa masalah sabab kadang responden sorangan henteu sadar nagara internal maranéhna (Nisbett and Wilson 1977) .
Bab 1 of Groves (2004) teu hiji pakasaban unggulan reconciling terminologi kalana inconsistent dipaké ku panalungtik survéy ka nerangkeun kerangka kasalahan survei total. Pikeun pengobatan buku-panjang tina total kerangka kasalahan survei, tingali Groves et al. (2009) , sarta pikeun gambaran sajarah, tingali Groves and Lyberg (2010) .
Pamanggih decomposing kasalahan kana bias sarta varian oge asalna nepi di learning mesin; tingali, contona, bagian 7,3 of Hastie, Tibshirani, and Friedman (2009) . Ieu sering jadi marga peneliti ngobrol ngeunaan hiji "bias-varian" trade-off.
Dina watesan ngagambarkeun, a bubuka hébat kana isu ngeunaan nonresponse tur bias nonresponse mangrupa laporan Déwan Panalungtikan Nasional Nonresponse di Ukur Élmu Sosial: A Agenda Panalungtikan (2013) . Tinjauan sejen mangpaat anu disadiakeun ku Groves (2006) . Ogé, sakabéh isu husus tina Journal of resmi Statistik, Pamadegan Public Quarterly, sarta Annals tina Amérika Akademi Pulitik jeung Élmu Sosial geus diterbitkeun dina topik di non-response. Tungtungna, aya sabenerna loba cara béda tina ngitung tingkat respons; deukeut ieu digambarkeun di jéntré dina laporan ku The Amérika Association of Opinion Public Panalungtik (AAPOR) ( ??? ) .
Pikeun leuwih lengkep dina 1936 Literary Digest polling, tingali Bryson (1976) , Squire (1988) , Cahalan (1989) , sarta Lusinchi (2012) . Pikeun sawala sejen tina polling ieu peringatan pasemon ngalawan pendataan haphazard, tingali Gayo-Avello (2011) . Dina 1936, George Gallup dipaké wangun leuwih canggih ti sampling jeung éta bisa ngahasilkeun perkiraan langkung akurat jeung sampel leuwih leutik. Kasuksésan Gallup urang leuwih Literary Digest éta hiji milestone dina ngembangkeun ieu panalungtikan survéy sakumaha anu dijelaskeun dina bagean 3 of @ converse_survey_1987; bab 4 of Ohmer (2006) ; jeung bab 3 of @ igo_averaged_2008.
Dina watesan pangukuran, sumber daya mimiti gede pikeun ngarancang questionnaires nyaeta Bradburn, Sudman, and Wansink (2004) . Pikeun perlakuan nu leuwih canggih, tingali Schuman and Presser (1996) , anu geus husus fokus kana patarosan sikep, tur Saris and Gallhofer (2014) , anu leuwih umum. Hiji pendekatan rada beda mun ukur dicokot dina psychometrics, sakumaha dijelaskeun dina ( ??? ) . Langkung lengkep ihwal pretesting nyaéta sadia dina Presser and Blair (1994) , Presser et al. (2004) , sarta surah 8 Groves et al. (2009) . Pikeun langkung lengkep ihwal percobaan survéy, tingali Mutz (2011) .
Dina watesan ongkos, perlakuan Palasik, buku-panjangna perdagangan-off antara waragad survéy jeung kasalahan survei anu Groves (2004) .
Dua perlakuan Palasik buku-panjang baku sampling probabilitas jeung estimasi nyaéta Lohr (2009) (leuwih bubuka) jeung Särndal, Swensson, and Wretman (2003) (leuwih canggih). A perlakuan buku-panjangna Palasik tina pos-stratifikasi jeung patali métode téh Särndal and Lundström (2005) . Dina sababaraha setélan-umur digital, peneliti terang rada saeutik ngeunaan nonrespondents, nu ieu mah mindeng leres nu geus kaliwat. Bentuk beda adjustment nonresponse anu mungkin nalika peneliti gaduh informasi ngeunaan nonrespondents, sakumaha nu ditétélakeun ku Kalton and Flores-Cervantes (2003) jeung Smith (2011) .
The Xbox ulikan ku W. Wang et al. (2015) ngagunakeun téhnik nu disebut regression multilevel na pos-stratifikasi ( "Mr. P.") anu ngamungkinkeun peneliti keur estimasi group hartina sanajan aya loba, loba grup. Sanajan aya sababaraha perdebatan ngeunaan kualitas sahiji perkiraan tina téknik ieu, sigana kawas aréa ngajangjikeun ngajajah. Teknik ieu mimiti dipake dina Park, Gelman, and Bafumi (2004) , sarta aya geus pamakéan saterusna sarta perdebatan (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Pikeun leuwih lengkep dina sambungan antara beurat individu sarta beurat group, tingali Gelman (2007) .
Pikeun pendekatan sejen keur survey web weighting, tingali Schonlau et al. (2009) , Bethlehem (2010) , sarta Valliant and Dever (2011) . panels online tiasa make sampling probability atawa non-probability sampling. Pikeun langkung lengkep ihwal panels online, tingali Callegaro et al. (2014) .
Sakapeung, peneliti geus kapanggih yén sampel probabilitas jeung sampel non-probability ngahasilkeun perkiraan tina kualitas sarupa (Ansolabehere and Schaffner 2014) , tapi babandinganana lianna geus kapanggih yén sampel non-probability do parah (Malhotra and Krosnick 2007; Yeager et al. 2011) . Hiji alesan mungkin keur Bedana ieu nyaeta sampel non-kamungkinan geus ningkat kana waktu. Pikeun nempo leuwih pesimis sahiji metodeu sampling non-probability ningali Tugas Force AAPOR on Non-Probabilitas Sampling (Baker et al. 2013) , sarta kuring ogé nyarankeun maca commentary nu kieu laporan kasimpulan.
Conrad and Schober (2008) mangrupa kekembangan diédit judulna Envisioning nu Wawancara Survey tina Future, sarta eta nawarkeun rupa-rupa sudut pandang ngeunaan masa depan nanyakeun patarosan. Couper (2011) alamat téma sarupa, sarta Schober et al. (2015) nawarkeun conto saé kumaha métode pendataan nu tailored ka setting anyar bisa ngahasilkeun data kualitas luhur. Schober and Conrad (2015) nawiskeun argumen umum tentang neraskeun nyaluyukeun prosés panalungtikan survéy jeung cocog parobahan di masarakat.
Tourangeau and Yan (2007) isu review ngeunaan bias desirability sosial dina patarosan sénsitip, sarta Lind et al. (2013) nawiskeun sababaraha alesan mungkin naha jalma bisa nyingkab informasi leuwih sénsitip dina wawancara komputer-dikaluarkeun. Pikeun langkung lengkep ihwal peran interviewers manusa dina ngaronjatkeun ongkos partisipasi dina survey, tingali Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , sarta Schaeffer et al. (2013) . Pikeun langkung lengkep ihwal survey dicampur-mode, tingali Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) nawiskeun perlakuan buku-panjang assessment sakeudeung ékologis jeung métode patali.
Pikeun nasihat langkung lengkep ihwal nyieun survey hiji pangalaman nikmat na berharga pikeun pamilon, tingali gawé dina Métode tailored Desain (Dillman, Smyth, and Christian 2014) . Contona sejen metot tina ngagunakeun aktip Facebook pikeun survey elmu sosial, tingali Bail (2015) .
Judson (2007) ngagambarkeun prosés ngagabungkeun survey sarta data administrasi saperti "integrasi informasi" na ngabahas sababaraha kaunggulan tina pendekatan ieu, sakumaha ogé maturan sababaraha conto.
Ngeunaan nanyakeun enriched, aya geus loba usaha saméméhna nepi sangkan méré konfirmasi voting. Pikeun tinjauan literatur yen, tingali Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , sarta Berent, Krosnick, and Lupia (2016) . Tempo Berent, Krosnick, and Lupia (2016) pikeun nempo leuwih skeptis tina hasil dibere di Ansolabehere and Hersh (2012) .
Kadé dicatet yén sanajan Ansolabehere na Hersh anu wanti ku kualitas data ti Catalist, Panakawan séjén tina ngical paralatan komérsial geus kirang sumanget. Pasek et al. (2014) kapanggih kualitas goréng lamun data ti survey a ieu dibandingkeun sareng file konsumen ti Marketing Systems Grup (anu sorangan dihijikeun babarengan data ti tilu panyadia: Acxiom, Experian, sarta InfoUSA). Hartina, data file teu cocog réspon survey anu peneliti diperkirakeun jadi bener, nu file konsumen kungsi leungit data pikeun angka nu gede ngarupakeun patarosan, jeung pola data leungit ieu correlated kalayan nilai survey dilaporkeun (dina basa sejen, leungit data éta sistematis, henteu acak).
Pikeun langkung lengkep ihwal catetan beungkeut antara survey sarta data administrasi, tingali Sakshaug and Kreuter (2012) sarta Schnell (2013) . Pikeun langkung lengkep ihwal catetan beungkeut sacara umum, tingali Dunn (1946) sarta Fellegi and Sunter (1969) (sajarah) jeung Larsen and Winkler (2014) (modern). Deukeut sarupa geus ogé geus tumuwuh di elmu komputer dina ngaran kayaning deduplication data, idéntifikasi conto, ngaran cocog, duplikat deteksi, sarta jadi gaduh panulisan catetan deteksi (Elmagarmid, Ipeirotis, and Verykios 2007) . Aya ogé deukeut privacy-preserving kana catetan beungkeut nu teu merlukeun népana pribadi identifying informasi (Schnell 2013) . Peneliti di Facebook dimekarkeun prosedur pikeun probabilistically numbu rékaman maranéhna pikeun kabiasaan voting (Jones et al. 2013) ; beungkeut ieu dipigawé pikeun evaluate hiji percobaan nu kuring gé ngabejaan Anjeun tentang dina bab 4 (Bond et al. 2012) . Pikeun langkung lengkep ihwal meunangkeun idin pikeun rékaman beungkeut, tingali Sakshaug et al. (2012) .
conto sejen tina linking survey sosial badag skala kana rékaman administrasi pamaréntah asalna tina Kaséhatan na Survey pangsiun jeung Administrasi Jaminan Sosial. Pikeun langkung lengkep ihwal ulikan nu, kaasup informasi ngeunaan prosedur idin, tingali Olson (1996, 1999) .
Prosés ngagabungkeun loba sumber tina rékaman administrasi kana master datafile-prosés nu Catalist employs-geus ilahar di kantor statistik tina sababaraha pamaréntah nasional. Dua peneliti ti Statistik Swédia geus ditulis hiji buku lengkep dina topik (Wallgren and Wallgren 2007) . Pikeun conto pendekatan ieu dina county tunggal di Amérika Serikat (Olmstead County, Minnesota; ngarep nu klinik Mayo), tingali Sauver et al. (2011) . Pikeun langkung lengkep ihwal kasalahan nu bisa muncul dina rékaman administratif, tingali Groen (2012) .
Cara séjén nu peneliti tiasa make sumber data badag dina panalungtikan survéy téh salaku pigura sampling pikeun jalma kalawan ciri husus. Hanjakal, pendekatan ieu bisa ngangkat patarosan patali privacy (Beskow, Sandler, and Weinberger 2006) .
Ngeunaan nanyakeun amplified, pendekatan ieu teu jadi anyar salaku eta bisa muncul tina sabaraha Kuring geus digambarkeun eta. Cai mibanda sambungan jero kana tilu wewengkon badag dina statistik: dumasar-modél pos-stratifikasi (Little 1993) , imputation (Rubin 2004) , sarta estimasi aréa leutik (Rao and Molina 2015) . Hal ieu ogé patali jeung pamakéan variabel surrogate dina panalungtikan médis (Pepe 1992) .
Biaya na waktos perkiraan di Blumenstock, Cadamuro, and On (2015) ningali deui variabel ongkos-ongkos hiji béa survéy-na tambahan teu kaasup dibereskeun kayaning biaya beberesih sarta ngolah data panggero. Sacara umum, amplified nanyakeun meureun kudu waragad dibereskeun tinggi na waragad variabel low sarupa pamadegan percobaan digital (tingali surah 4). Pikeun langkung lengkep ihwal mobile survey dumasar telepon-di nagara berkembang, tingali Dabalen et al. (2016) .
Pikeun pamendak ngeunaan kumaha carana ulah amplified nanyakeun hadé, Abdi nyarankeun diajar ngeunaan sababaraha imputation (Rubin 2004) . Ogé, upami peneliti lakukeun amplified nanyakeun perawatan ngeunaan diitung agrégat, tinimbang Tret individu-tingkat, mangka pendekatan dina King and Lu (2008) sarta Hopkins and King (2010) bisa jadi mangpaat. Tungtungna, pikeun leuwih lengkep ngeunaan deukeut mesin learning dina Blumenstock, Cadamuro, and On (2015) , tingali James et al. (2013) (leuwih bubuka) atanapi Hastie, Tibshirani, and Friedman (2009) (leuwih canggih).
Hiji masalah etika ngeunaan nanyakeun amplified téh nya éta bisa dipaké pikeun infer Tret sénsitip anu urang bisa moal milih nembongkeun di survey hiji sakumaha nu dijelaskeun dina Kosinski, Stillwell, and Graepel (2013) .