Akeh tema ing bab iki uga wis ditulis ing alamat presiden anyar ing American Association of Public Opinion Research (AAPOR), kayata dening Dillman (2002) , Newport (2011) , Santos (2014) , lan Link (2015) .
Kanggo informasi luwih lengkap babagan riset survey lan wawancara jero, deleng Small (2009) . Kaitane karo wawancara jero-jero yaiku kulawarga saka pendekatan sing disebut etnografi. Ing panliten etnografis, panaliti ngalami wektu luwih akeh karo para peserta ing lingkungan alam. Kanggo luwih saka beda antarane etnografi lan wawancara sing jero, deleng Jerolmack and Khan (2014) . Kanggo luwih rinci babagan etnografi digital, waca Pink et al. (2015) .
Gambaranku babagan riset panalitisan sejarah iku adoh banget kanggo nambah akeh perkembangan sing menarik. Kanggo latar mburi sing luwih akeh sejarah, pirsani Smith (1976) , Converse (1987) , lan Igo (2008) . Kanggo luwih jelas babagan telung wektu riset survey, deleng Groves (2011) lan Dillman, Smyth, and Christian (2008) (sing ngeculake wektu telung taun rada beda).
Groves and Kahn (1979) nyedhiyakake pamindhahan ing transisi saka periode kapindho nganti kaping pindho ing panlitam survey kanthi nglakoni perbandingan sing luwih rinci antarane survey pasuryan lan telpon. ( ??? ) katon maneh ing pangembangan sajarah metode ngambakake acak-digit-dialing.
Kanggo luwih manawa riset panaliten wis diganti ing jaman sadurungé kanggo nanggepi owah-owahan ing masyarakat, deleng Tourangeau (2004) , ( ??? ) , lan Couper (2011) .
Kekiyatan lan kelemahane takon lan ngisi wis bebantahan dening psikolog (eg, Baumeister, Vohs, and Funder (2007) ) lan sosiolog (eg, Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) ; Jerolmack and Khan (2014) ] Bentenipun ing antawisipun Jerolmack and Khan (2014) ugi wonten ing ékonomi, ing pundi panaliti Jerolmack and Khan (2014) , Jerolmack and Khan (2014) peneliti saged nyuwun responden manawi langkung milih mangan es krim (nyatakake preferensi), utawa bisa mirsani yen asring wong mangan es krim lan pindhah menyang gedung olahraga (prabédan sing dicethakaké). Ana skeptisisme jero babagan jinis tartamtu sing disenengi preferensi data ing ekonomi kaya sing dijelasake ing Hausman (2012) .
Tema utama saka perdebatan kasebut yaiku sing dilapurake ora tansah akurat. Nanging, kaya sing dijelasake ing bab 2, sumber data sing gedhe ora akurat, ora bisa dikumpulake kanthi sampurna, lan ora bisa diakses dening peneliti. Mangkene, aku mikir, ing sawetara situasi, perilaku sing dilapurake bisa migunani. Luwih, tema utama liya saka debat iki yaiku laporan babagan emosi, kawruh, pangarepan, lan panemu ora tansah akurat. Nanging, yen informasi babagan negara-negara internal iki perlu dening peneliti-kanggo mbantu nerangake sawetara prilaku utawa minangka bab sing bakal diterangake-banjur takon uga cocok. Mesthi, sinau babagan negara-negara internal kanthi takon pitakonan bisa dadi masalah amarga kadhangkala responden dhewe ora ngerti status internal (Nisbett and Wilson 1977) .
Bab 1 Groves (2004) nduwe proyek sing apik kanggo ngrujukake terminologi soko konsisten sing digunakake dening peneliti survey kanggo njlèntrèhaké total kerangka kesalahan survey. Kanggo perawatan buku-buku total kerangka kesalahan survey, pirsani Groves et al. (2009) , lan kanggo gambaran sejarah, waca Groves and Lyberg (2010) .
Idea saka decomposing errors menyang bias lan varians uga muncul ing learning machine; umpamane, umpamane bagean 7.3 saka Hastie, Tibshirani, and Friedman (2009) . Iki asring ndadékaké para panaliti ngobrol babagan "bias-varians" trade-off.
Ing istilah perwakilan, introduksi gedhe kanggo masalah nonresponse lan nonresponse bias yaiku laporan Dewan Riset Nasional Nonresponse ing Social Science Surveys: A Agenda Riset (2013) . Ringkesan liyane sing migunani diwenehake dening Groves (2006) . Uga, kabeh masalah khusus saka Jurnal Statistik Resmi , Pendapat Umum Triwulan , lan Catatan Akademi Ilmu Politik dan Sosial Amérika wis diterbitake ing topik non-respon. Akhire, ana akeh cara kanggo ngitung tingkat respon; pendekatan kasebut diterangake kanthi rinci ing laporan dening The American Association of Public Opinion Researchers (AAPOR) ( ??? ) .
Kanggo luwih lengkap babagan jajak pendapat Literatur Digest taun 1936, pirsani Bryson (1976) , Squire (1988) , Cahalan (1989) , lan Lusinchi (2012) . Kanggo diskusi liyane babagan polling iki minangka bebaya pasemon nglawan koleksi data sing ora sopan, deleng Gayo-Avello (2011) . Nalika taun 1936, George Gallup migunakaken wangun sampling ingkang langkung canggih lan saged ngasilaken perkiraan langkung akurat kanthi sampel ingkang langkung alit. Sukses Gallup liwat Literary Digest minangka tonggak sejarah ing pengembangan riset survey kaya sing dijelasake ing bab 3 saka @ converse_survey_1987; Bab 4 saka Ohmer (2006) ; lan bab 3 saka @ igo_averaged_2008.
Ing istilah pangukuran, sumber pisanan sing gedhe kanggo ngrancang kuesioner yaiku Bradburn, Sudman, and Wansink (2004) . Kanggo pangobatan luwih lanjut, waca Schuman and Presser (1996) , sing khusus difokuskan kanggo pitakonan sikap, lan Saris and Gallhofer (2014) , sing luwih umum. Pendekatan sing rada beda kanggo pangukuran dijupuk ing psychometrics, kaya diterangake ing ( ??? ) . Liyane pretesting kasedhiya ing Presser and Blair (1994) , Presser et al. (2004) , lan bab 8 Groves et al. (2009) . Kanggo luwih akeh nyinaoni survey, deleng Mutz (2011) .
Ing istilah biaya, perawatan klasik, buku-buku babagan biaya transaksi lan kasalahan survey yaiku Groves (2004) .
Loro pangobatan buku-buku klasik babagan sampling probabilitas standar lan estimasi yaiku Lohr (2009) (luwih pendahuluan) lan Särndal, Swensson, and Wretman (2003) (luwih maju). A treatment klasik buku babagan post-stratification lan cara sing gegandhengan yaiku Särndal and Lundström (2005) . Ing sawetara setelan umur digital, panaliti ngerti babagan sing ora pati ngerti, sing ora kerep dingerteni ing jaman kepungkur. Wangun macem-macem penyesuaian nonresponse bisa ditindakake nalika peneliti duwe informasi babagan nonrespondents, kaya sing diterangake dening Kalton and Flores-Cervantes (2003) lan Smith (2011) .
Studi Xbox dening W. Wang et al. (2015) nggunakake teknik sing diarani regression multilevel lan post-stratification ("Mr. P.") sing ngidini para panaliti nemtokake grup berarti sanajan ana akeh, akeh kelompok. Sanajan ana sawetara perdebatan babagan kualitas prakiraan saka teknik iki, misale jek kaya wilayah sing jembar kanggo njelajah. Teknik iki pisanan dipigunakaké ing Park, Gelman, and Bafumi (2004) , lan ana sing digunakaké lan debat (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Kanggo luwih kontras antarane bobot individu lan bobot klompok, deleng Gelman (2007) .
Kanggo pendekatan liyane kanggo Schonlau et al. (2009) survey web, waca Schonlau et al. (2009) , Bethlehem (2010) , lan Valliant and Dever (2011) . Panel online bisa migunakake sampling probability utawa non-probability sampling. Kanggo luwih akeh panel online, pirsani Callegaro et al. (2014) .
Kadhangkala, panaliti nemokake menawa sampel probabilitas lan sampel ora probabilitas ngasilake prakiraan kualitas sing padha (Ansolabehere and Schaffner 2014) , nanging (Ansolabehere and Schaffner 2014) liyane nemokake yen sampel non probabilitas luwih gedhe (Malhotra and Krosnick 2007; Yeager et al. 2011) . Salah siji alesan sing bisa kanggo bedane iki yaiku yen sampel ora probabilitas wis nambah wektu. Kanggo ndeleng pessimistic luwih saka cara sampling non-probabilitas ndeleng AAPOR Task Force ing Non-Probability Sampling (Baker et al. 2013) , lan aku uga menehi rekomendasi maca komentar sing nderek laporan ringkesan.
Conrad and Schober (2008) minangka volume edited kanthi irah-irahan Envisioning the Surveys of the Future , lan nawakake macem-macem sudut pandang babagan masa depan pitakon pitakonan. Couper (2011) alamat tema sing padha, lan Schober et al. (2015) nyedhiyakake conto becik babagan cara pangumpulan data sing disetel menyang setelan anyar bisa nyebabake data sing luwih dhuwur. Schober and Conrad (2015) nyengkuyung argumen sing luwih umum babagan terus nyetel proses riset survey kanggo cocog owah-owahan ing masyarakat.
Tourangeau and Yan (2007) ngrengkuh masalah bias kabutuhan sosial ing pitakonan sing sensitif, lan Lind et al. (2013) nyawisake sawetara alasan sing bisa ditrapake kanggo informasi sing luwih sensitif ing wawancara komputer. Kanggo luwih ngenani peran pewawancara manungsa babagan nambah partisipasi ing survey, pirsani Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , lan Schaeffer et al. (2013) . Kanggo luwih lengkap ing survey mode campuran, deleng Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) nyedhiyakake perawatan dawa buku kanthi ekologis lan metode sing gegandhengan.
Kanggo saran liyane babagan nggawe survey pengalaman sing nyenengake lan sing paling berharga kanggo para peserta, waca karya Metode Desain Disesuaikan (Dillman, Smyth, and Christian 2014) . Kanggo conto liyane sing menarik nggunakake aplikasi Facebook kanggo survey ilmu sosial, pirsani Bail (2015) .
Judson (2007) nggambarake proses nggabungake survey lan data administratif minangka "integrasi informasi" lan mbahas sawetara cara kanggo pendekatan kasebut, uga menehi sawetara conto.
Menawi dipunsukani pratelan, wonten kathah upaya sadèrèngipun kanggé ngéwahi pemungutan suara. Kanggo gambaran babagan literatur kasebut, pirsani Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , lan Berent, Krosnick, and Lupia (2016) . Waca Berent, Krosnick, and Lupia (2016) kanggo tampilan sing luwih skeptis babagan asil sing disajikake ing Ansolabehere and Hersh (2012) .
Penting diwenehi tandha manawa Ansolabehere lan Hersh didhukung dening kualitas data saka Catalist, evaluasi liya saka vendor komersial luwih entheng. Pasek et al. (2014) nemokake kualitas apik nalika data saka survey dibandhingake karo file konsumen saka Marketing Systems Group (sing dhewe nggabungake data saka telung panyedhiya: Acxiom, Experian, lan InfoUSA). Umume, file data ora cocog karo respon survey sing ditindakake para panaliti sing bener, file konsumen wis ilang data kanggo akeh pitakonan, lan pola data sing ilang ana hubungane karo nilai survey sing dilapurake (kanthi tembung liya, sing ilang data sacara sistematis, ora acak).
Kanggo informasi luwih lengkap babagan survey lan data administratif, waca Sakshaug and Kreuter (2012) lan Schnell (2013) . Kanggo luwih rinci babagan cathetan ing umum, waca Dunn (1946) lan Fellegi and Sunter (1969) (sajarah) lan Larsen and Winkler (2014) (modern). Pendekatan sing padha uga wis dikembangake ing ilmu komputer miturut jeneng kayata deduplication data, identifikasi kayata, pencocokan jeneng, deteksi duplikat, lan deteksi rekaman duplikat (Elmagarmid, Ipeirotis, and Verykios 2007) . Ana uga cara kanggo ngrekam privasi kanggo ngrekam linkage sing ora mbutuhake transmisi informasi sing ngenali pribadi (Schnell 2013) . Peneliti ing Facebook ngembangake prosedur kanggo nyantekke rekaman kanggo prilaku pemilihan (Jones et al. 2013) ; linkage iki rampung kanggo ngevaluasi eksperimen sing bakal dakwartakake bab ing bab 4 (Bond et al. 2012) . Kanggo luwih ngenani idin kanggo linkage rekaman, pirsani Sakshaug et al. (2012) .
Conto liyane nyantolke survey sosial skala gedhe kanggo cathetan administratif pamaréntah rawuh saka Survey Kesehatan lan Pensiun lan Administrasi Keamanan Sosial. Kanggo luwih sinau, kalebu informasi babagan prosedur persetujuan, waca Olson (1996, 1999) .
Proses nggabungake akeh sumber cathetan administratif dadi datafile master - proses sing dianggo Catalist-umum ing kantor statistika sawetara pemerintahan nasional. Loro peneliti saka Statistik Swedia wis nulis buku rinci babagan topik (Wallgren and Wallgren 2007) . Kanggo conto pendekatan iki ing county tunggal ing Amerika Serikat (Olmstead County, Minnesota, asal saka Clinic Mayo), pirsani Sauver et al. (2011) . Kanggo luwih saka kasalahan sing bisa katon ing cathetan administratif, waca Groen (2012) .
Liyane cara peneliti bisa nggunakake sumber data gedhe ing riset survey minangka pigura sampling kanggo wong sing duwe ciri spesifik. Sayange, pendekatan iki bisa ndhedhet pitakonan sing (Beskow, Sandler, and Weinberger 2006) privasi (Beskow, Sandler, and Weinberger 2006) .
Wujude pitakon sing dikarepake, pendekatan iki ora kaya sing anyar amarga bisa nerangake babagan cara aku nyatakake. Ana hubungan jero kanggo telung wilayah gedhe ing statistik: post-stratification model (Little 1993) , imputation (Rubin 2004) , lan perkiraan wilayah cilik (Rao and Molina 2015) . Uga ana hubungane karo nggunakake variabel pengganti ing riset medis (Pepe 1992) .
Perkiraan biaya lan wektu ing Blumenstock, Cadamuro, and On (2015) nuduhake liyane biaya variabel-biaya saka siji survey tambahan-lan ora kalebu biaya tetep kayata biaya pembersihan lan ngolah data telpon. Secara umum, taksiran amplifikasi bakal mbutuhake biaya tetep sing dhuwur lan biaya variabel kurang padha karo eksperimen digital (pirsani bab 4). Kanggo luwih akeh babagan survey basis telpon ing negara-negara berkembang, pirsani Dabalen et al. (2016) .
Kanggo gagasan babagan carane nggedhekake takon luwih apik, aku arep menehi rekomendasi luwih akeh babagan imputasi kaping (Rubin 2004) . Uga, manawa panaliti nggedhekake ngurmati babagan agregat, tinimbang ciri-ciri individu, banjur pendekatan ing King and Lu (2008) lan Hopkins and King (2010) bisa uga migunani. Pungkasan, kanggo luwih akeh babagan pendekatan mesin learning ing Blumenstock, Cadamuro, and On (2015) , waca James et al. (2013) (luwih pendahuluan) utawa Hastie, Tibshirani, and Friedman (2009) (luwih maju).
Salah sawijining masalah etika babagan Kosinski, Stillwell, and Graepel (2013) yaiku supaya bisa digunakake kanggo nyimpulake sifat-sifat sensitif sing ora bisa ditampilake wong ing survey minangka diterangake ing Kosinski, Stillwell, and Graepel (2013) .