Marami sa mga tema sa kabanatang ito ay nai-echo din sa mga nakaraang pampanguluhan address sa American Association ng Pampublikong Opinyon Research (AAPOR), tulad ng sa pamamagitan ng Dillman (2002) , Newport (2011) , Santos (2014) , at Link (2015) .
Para sa higit pa sa mga pagkakaiba sa pagitan ng pagsisiyasat ng survey at malalalim na panayam, tingnan ang Small (2009) . Nauugnay sa malalim na panayam ay isang pamilya ng mga diskarte na tinatawag na ethnography. Sa etnograpikong pananaliksik, ang mga mananaliksik ay karaniwang gumugol ng mas maraming oras sa mga kalahok sa kanilang likas na kapaligiran. Para sa higit pa sa mga pagkakaiba sa pagitan ng etnograpya at malalalim na panayam, tingnan ang Jerolmack and Khan (2014) . Para sa higit pa sa digital na etnograpya, tingnan ang Pink et al. (2015) .
Ang aking paglalarawan sa kasaysayan ng pagsasaliksik sa survey ay masyadong maikli upang maisama ang marami sa mga kapana-panabik na pag-unlad na naganap. Para sa higit pang makasaysayang background, tingnan ang Smith (1976) , Converse (1987) , at Igo (2008) . Para sa higit pa sa ideya ng tatlong panahon ng pananaliksik sa pananaliksik, tingnan Groves (2011) at Dillman, Smyth, and Christian (2008) (na kung saan break up ang tatlong panahon bahagyang naiiba).
Groves and Kahn (1979) aalok ng pagsilip sa loob ng paglipat mula sa una hanggang sa ikalawang panahon sa pananaliksik sa pagsasaliksik sa pamamagitan ng paggawa ng isang detalyadong pagtutu-hat-ulo sa pagitan ng isang mukha-sa-mukha at survey ng telepono. ( ??? ) tumingin pabalik sa makasaysayang pag-unlad ng random-digit-dialing sampling method.
Para sa higit pa kung paano nagbago ang pananaliksik sa survey noong nakaraan bilang tugon sa mga pagbabago sa lipunan, tingnan ang Tourangeau (2004) , ( ??? ) , at Couper (2011) .
Ang mga kalakasan at kahinaan ng mga humihingi at pagmamasid ay nai-debated sa pamamagitan ng Psychologist (eg, Baumeister, Vohs, and Funder (2007) ) at sociologists (eg, Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) ; Jerolmack and Khan (2014) Ang pagkakaiba sa pagitan ng pagtatanong at pagmamasid ay nagmumula din sa ekonomika, kung saan ang mga mananaliksik ay nag-uusap tungkol sa mga ipinahayag at inihayag na mga kagustuhan. Halimbawa, ang isang mananaliksik ay maaaring magtanong sa mga sumasagot kung mas gusto nilang kumain ng ice cream o pagpunta sa gym (nakasaad na mga kagustuhan), o maaaring obserbahan kung gaano kadalas kumakain ang mga tao ng ice cream at pumunta sa gym (inihayag na mga kagustuhan). May malalim na pag-aalinlangan tungkol sa ilang mga uri ng mga nakasaad na kagustuhan sa data sa economics tulad ng inilarawan sa Hausman (2012) .
Ang pangunahing tema mula sa mga debate na ito ay ang pag-uugali ng pag-uulat ay hindi laging tumpak. Subalit, tulad ng inilarawan sa kabanata 2, maaaring hindi tumpak ang mga pinagmumulan ng data, hindi sila maaaring kolektahin sa isang sample ng interes, at hindi ito maaaring makuha ng mga mananaliksik. Kaya, sa palagay ko, sa ilang sitwasyon, ang naiulat na pag-uugali ay maaaring maging kapaki-pakinabang. Higit pa, ang pangalawang pangunahing tema mula sa mga debate na ito ay ang mga ulat tungkol sa mga emosyon, kaalaman, inaasahan, at opinyon ay hindi laging tumpak. Ngunit, kung ang impormasyon tungkol sa mga panloob na kalagayan ay kailangan ng mga mananaliksik-alinman upang matulungan ipaliwanag ang ilang pag-uugali o bilang bagay na dapat na ipaliwanag-pagkatapos humihiling ay maaaring naaangkop. Siyempre, ang pag-aaral tungkol sa mga panloob na estado sa pamamagitan ng pagtatanong ay maaaring maging problema sapagkat kung minsan ang mga sumasagot ay hindi nalalaman ang kanilang mga panloob na estado (Nisbett and Wilson 1977) .
Kabanata 1 ng Groves (2004) ay isang mahusay na trabaho na nagko-reconcile sa paminsan-minsan na hindi pantay na terminolohiya na ginagamit ng mga mananaliksik ng survey upang ilarawan ang kabuuang balangkas ng error sa survey. Para sa isang aklat-haba na paggamot ng kabuuang balangkas ng error sa survey, tingnan ang Groves et al. (2009) , at para sa pangkalahatang pangkalahatang pananaw, tingnan ang Groves and Lyberg (2010) .
Ang ideya ng decomposing error sa bias at pagkakaiba ay lumalabas din sa pag-aaral ng machine; tingnan, halimbawa, ang seksyon 7.3 ng Hastie, Tibshirani, and Friedman (2009) . Ito ay madalas na humantong sa mga mananaliksik upang pag-usapan ang tungkol sa isang "bias-variance" trade-off.
Sa mga tuntunin ng pagkatawan, isang mahusay na pagpapakilala sa mga isyu ng di-sagot na pananagutan at hindi pagsang-ayon sa bias ay ang ulat ng National Research Council Nonresponse sa Social Science Surveys: A Research Agenda (2013) . Ang isa pang kapaki-pakinabang na pangkalahatang ideya ay ibinibigay ng Groves (2006) . Gayundin, ang buong espesyal na isyu ng Journal of Official Statistics , Public Opinion Quarterly , at ang mga Annals ng American Academy of Political and Social Science ay na-publish sa paksa ng di-tugon. Sa wakas, may mga tunay na maraming iba't ibang mga paraan ng pagkalkula ng tugon rate; Ang mga pamamaraang ito ay inilarawan nang detalyado sa isang ulat ng The American Association of Public Opinion Researchers (AAPOR) ( ??? ) .
Para sa higit pa sa 1936 Literary Digest poll, tingnan ang Bryson (1976) , Squire (1988) , Cahalan (1989) , at Lusinchi (2012) . Para sa isa pang talakayan ng poll na ito bilang isang parabula babala laban sa hindi nakakatawang koleksyon ng data, tingnan ang Gayo-Avello (2011) . Noong 1936, gumamit si George Gallup ng mas sopistikadong paraan ng sampling at nakagawa ng mas tumpak na pagtatantya na may mas maliit na sample. Ang tagumpay ni Gallup sa Literary Digest ay isang milyahe sa pagpapaunlad ng pananaliksik sa survey na inilarawan sa kabanata 3 ng @ converse_survey_1987; kabanata 4 ng Ohmer (2006) ; at kabanata 3 ng @ igo_averaged_2008.
Sa mga tuntunin ng pagsukat, isang mahusay na unang mapagkukunan para sa pagdisenyo ng mga questionnaires ay Bradburn, Sudman, and Wansink (2004) . Para sa higit pang mga advanced na paggamot, tingnan ang Schuman and Presser (1996) , na partikular na nakatutok sa mga tanong sa saloobin, at Saris and Gallhofer (2014) , na mas pangkalahatan. Ang isang bahagyang iba't ibang diskarte sa pagsukat ay kinuha sa psychometrics, tulad ng inilarawan sa ( ??? ) . Higit pa sa pretesting ay magagamit sa Presser and Blair (1994) , Presser et al. (2004) , at kabanata 8 ng Groves et al. (2009) . Para sa higit pa sa mga eksperimentong pagsusuri, tingnan ang Mutz (2011) .
Sa mga tuntunin ng gastos, ang klasikong, paggamot ng aklat-haba ng trade-off sa pagitan ng mga gastos sa survey at mga error sa survey ay Groves (2004) .
Ang dalawang klasikong paggamot ng aklat na haba ng pamantayan na posibilidad na sampling at pagtantya ay ang Lohr (2009) (higit pang pambungad) at Särndal, Swensson, and Wretman (2003) (mas advanced). Ang isang klasikong paggamot sa haba ng libro ng post-stratification at mga kaugnay na pamamaraan ay Särndal and Lundström (2005) . Sa ilang mga setting ng digital-edad, alam ng mga mananaliksik ang kaunti tungkol sa mga hindi tumutugon, na hindi madalas na totoo sa nakaraan. Ang mga iba't ibang uri ng pagsasaayos na hindi tumutugon ay posible kapag ang mga mananaliksik ay mayroong impormasyon tungkol sa mga hindi tumutugon, tulad ng inilarawan nina Kalton and Flores-Cervantes (2003) at Smith (2011) .
Ang pag-aaral ng Xbox ni W. Wang et al. (2015) gumagamit ng isang pamamaraan na tinatawag na multilevel regression at post-stratification ("Mr. P.") na nagbibigay-daan sa mga mananaliksik upang tantiyahin ang ibig sabihin ng grupo kahit na mayroong maraming, maraming mga grupo. Kahit na may ilang debate tungkol sa kalidad ng mga pagtatantya mula sa diskarteng ito, mukhang tulad ng isang promising area upang tuklasin. Ang pamamaraan ay unang ginamit sa Park, Gelman, and Bafumi (2004) , at nagkaroon ng kasunod na paggamit at debate (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Para sa higit pa sa koneksyon sa pagitan ng mga indibidwal na weight at weight group, tingnan ang Gelman (2007) .
Para sa iba pang mga diskarte sa weighting mga survey sa web, tingnan ang Schonlau et al. (2009) , Bethlehem (2010) , at Valliant and Dever (2011) . Ang mga online na panel ay maaaring gumamit ng alinman sa posibilidad ng sampling o di-posibilidad na sampling. Para sa higit pa sa mga online na panel, tingnan ang Callegaro et al. (2014) .
Minsan, natuklasan ng mga mananaliksik na ang mga sample ng probabilidad at mga di-posibilidad na mga sample ay nagbubunga ng mga pagtatantya ng magkatulad na kalidad (Ansolabehere and Schaffner 2014) , subalit iba pang mga paghahambing ang natagpuan na ang mga di-posibilidad na mga sample ay mas masahol (Malhotra and Krosnick 2007; Yeager et al. 2011) . Ang isang posibleng dahilan para sa mga pagkakaiba na ito ay ang mga di-posibilidad na mga halimbawa ay napabuti sa paglipas ng panahon. Para sa higit pang pessimistic view ng mga di-posibilidad na paraan ng sampling makita ang AAPOR Task Force sa Non-Probability Sampling (Baker et al. 2013) , at inirerekomenda ko rin ang pagbabasa ng komentaryo na sumusunod sa ulat ng buod.
Conrad and Schober (2008) ay isang na-edit na dami na pinamagatang Nagpapakita ng Survey Interview ng Hinaharap , at nag-aalok ito ng iba't ibang pananaw tungkol sa kinabukasan ng pagtatanong. Couper (2011) tumutugon sa mga katulad na tema, at Schober et al. (2015) aalok ng magandang halimbawa kung paano ang mga pamamaraan sa pagkolekta ng data na iniayon sa isang bagong setting ay maaaring magresulta sa mas mataas na kalidad na data. Schober and Conrad (2015) aalok ng mas pangkalahatang argument tungkol sa patuloy na pagsasaayos ng proseso ng pagsasaliksik sa pananaliksik upang tumugma sa mga pagbabago sa lipunan.
Tourangeau and Yan (2007) magrerepaso ng mga isyu ng bias na kahilingan sa panlipunan sa mga sensitibong tanong, at Lind et al. (2013) aalok ng ilang mga posibleng dahilan kung bakit maaaring ibunyag ng mga tao ang mas sensitibong impormasyon sa isang interbyu na pinangangasiwaan ng computer. Para sa higit pa sa papel ng mga tagapanayam ng tao sa pagtaas ng mga rate ng paglahok sa mga survey, tingnan ang Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , at Schaeffer et al. (2013) . Para sa higit pa sa mga mixed-mode survey, tingnan ang Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) aalok ng isang libro-haba ng paggamot ng ekolohiya panandaliang pagtatasa at mga kaugnay na pamamaraan.
Para sa higit pang payo sa paggawa ng mga survey na isang kasiya-siya at mahalagang karanasan para sa mga kalahok, tingnan ang trabaho sa Disenyo ng Disenyo na (Dillman, Smyth, and Christian 2014) . Para sa isa pang kagiliw-giliw na halimbawa ng paggamit ng apps ng Facebook para sa mga survey sa social science, tingnan ang Bail (2015) .
Judson (2007) ang proseso ng pagsasama ng mga survey at data ng administrasyon bilang "pagsasama ng impormasyon" at tinatalakay ang ilang mga pakinabang ng diskarteng ito, pati na rin ang pagbibigay ng ilang halimbawa.
Hinggil sa sobrang pagtatanong, maraming mga dating pagtatangka upang patunayan ang pagboto. Para sa pangkalahatang ideya ng literatura na iyon, tingnan ang Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , at Berent, Krosnick, and Lupia (2016) . Tingnan ang Berent, Krosnick, and Lupia (2016) para sa higit pang pag-aalinlangan sa mga resulta na iniharap sa Ansolabehere and Hersh (2012) .
Mahalagang tandaan na kahit na hinimok ang Ansolabehere at Hersh sa pamamagitan ng kalidad ng data mula sa Catalist, iba pang mga pagsusuri ng mga komersyal na vendor ay mas mababa masigasig. Pasek et al. (2014) natagpuan ang mahinang kalidad kapag ang data mula sa isang survey ay inihambing sa isang file ng mamimili mula sa Marketing Systems Group (na kung saan mismo ay pinagsama ang data mula sa tatlong provider: Acxiom, Experian, at InfoUSA). Iyon ay, ang data file ay hindi tumutugma sa mga tugon sa survey na inaasahan ng mga mananaliksik na tama, ang data ng mamimili ay nawawala ang data para sa isang malaking bilang ng mga tanong, at ang nawawalang data pattern ay sang-ayon sa iniulat na halaga ng survey (sa ibang salita, ang nawawala ang data ay sistematiko, hindi random).
Para sa higit pa sa linkage linkage sa pagitan ng mga survey at data ng administratibo, tingnan ang Sakshaug and Kreuter (2012) at Schnell (2013) . Para sa higit pa sa linkage linkage sa pangkalahatan, tingnan ang Dunn (1946) at Fellegi and Sunter (1969) (makasaysayang) at Larsen and Winkler (2014) (modernong). Ang mga katulad na pamamaraan ay binuo din sa agham ng computer sa ilalim ng mga pangalan tulad ng data deduplication, pagkakakilanlan ng pagkakataon, pagtutugma ng pangalan, duplicate detection, at duplicate detection record (Elmagarmid, Ipeirotis, and Verykios 2007) . Mayroon ding mga diskarte sa pagpapanatili ng pagkapribado upang magtala ng linkage na hindi nangangailangan ng pagpapadala ng personal na pagkilala ng impormasyon (Schnell 2013) . Ang mga mananaliksik sa Facebook ay bumuo ng isang pamamaraan upang mapabilis ang pag-link sa kanilang mga tala sa pag-uugali ng pagboto (Jones et al. 2013) ; ginawa ang pag-uugnay na ito upang suriin ang isang eksperimento na sasabihin ko sa iyo sa kabanata 4 (Bond et al. 2012) . Para sa higit pa sa pagkuha ng pahintulot para sa linkage link, tingnan Sakshaug et al. (2012) .
Ang isa pang halimbawa ng pag-uugnay sa isang malakihang survey sa panlipunan sa mga talaang pang-administratibo ng pamahalaan ay mula sa Survey sa Kalusugan at Pagreretiro at sa Social Security Administration. Para sa higit pa sa pag-aaral na iyon, kabilang ang impormasyon tungkol sa pamamaraan ng pahintulot, tingnan ang Olson (1996, 1999) .
Ang proseso ng pagsasama-sama ng maraming mga mapagkukunan ng mga talaang pang-administratibo sa isang master datafile-ang proseso na ginagamit ng Catalist-ay pangkaraniwan sa mga istatistika ng ilang mga pambansang pamahalaan. Dalawang mananaliksik mula sa Statistics Sweden ay may nakasulat na isang detalyadong aklat sa paksa (Wallgren and Wallgren 2007) . Para sa isang halimbawa ng diskarteng ito sa isang county sa Estados Unidos (Olmstead County, Minnesota, tahanan ng Mayo Clinic), tingnan ang Sauver et al. (2011) . Para sa higit pa sa mga error na maaaring lumitaw sa mga talaan ng administratibo, tingnan ang Groen (2012) .
Ang isa pang paraan kung saan ang mga mananaliksik ay maaaring gumamit ng malaking pinagkukunan ng data sa pananaliksik ng survey ay bilang isang sampling frame para sa mga taong may mga partikular na katangian. Sa kasamaang palad, ang diskarte na ito ay maaaring magtataas ng mga katanungan na may kaugnayan sa privacy (Beskow, Sandler, and Weinberger 2006) .
Tungkol sa sobrang pagtatanong, ang diskarte na ito ay hindi bilang bago na maaaring lumitaw mula sa kung paano ko inilarawan ito. May malalim na koneksyon sa tatlong malalaking lugar sa istatistika: batay sa modelo ng post-stratification (Little 1993) , imputation (Rubin 2004) , at maliit na lugar na pagtatantya (Rao and Molina 2015) . Ito ay may kaugnayan din sa paggamit ng mga kapalit na variable sa medikal na pananaliksik (Pepe 1992) .
Ang mga pagtatantya sa gastos at oras sa Blumenstock, Cadamuro, and On (2015) ay higit na tumutukoy sa variable cost-ang halaga ng isang karagdagang survey-at hindi kasama ang mga nakapirming gastos tulad ng gastos ng paglilinis at pagproseso ng data ng tawag. Sa pangkalahatan, ang sobrang pagtatanong ay malamang na may mataas na mga nakapirming gastos at mababang mga gastos na katulad ng mga digital na eksperimento (tingnan ang kabanata 4). Para sa higit pa sa mga survey na batay sa mobile phone sa mga umuunlad na bansa, tingnan ang Dabalen et al. (2016) .
Para sa mga ideya tungkol sa kung paano gawin amplified na humihiling ng mas mahusay, Gusto ko inirerekomenda ang pag-aaral ng higit pa tungkol sa maraming imputasyon (Rubin 2004) . Gayundin, kung ang mga mananaliksik ay nagpapalawak na humihingi ng pag-aalaga tungkol sa mga pinagsamang bilang, sa halip na mga katangian ng indibidwal na antas, ang mga pamamaraang sa King and Lu (2008) at Hopkins and King (2010) ay maaaring maging kapaki-pakinabang. Panghuli, para sa higit pa tungkol sa mga diskarte sa pag-aaral ng machine sa Blumenstock, Cadamuro, and On (2015) , tingnan ang James et al. (2013) (mas pambungad) o Hastie, Tibshirani, and Friedman (2009) (mas advanced).
Ang isang etikal na usapin tungkol sa pinalalakas na pagtatanong ay maaari itong magamit upang ipahiwatig ang mga sensitibong katangian na hindi maaaring piliin ng mga tao upang ipakita sa isang survey na inilarawan sa Kosinski, Stillwell, and Graepel (2013) .