Multaj el la temoj en ĉi tiu ĉapitro ankaŭ estis eĥataj en freŝaj prezidantaj adresoj ĉe la Amerika Asocio de Publika Komenca Esplorado (AAPOR), kiel ekzemple Dillman (2002) , Newport (2011) , Santos (2014) , kaj Link (2015) .
Por pli da pri la diferencoj inter enketa esplorado kaj profundaj intervjuoj, vidu Small (2009) . Rilatita al profundaj intervjuoj estas familio de alproksimiĝoj nomata etnografio. En etnografia esplorado, esploristoj ĝenerale pasigas multe pli da tempo kun partoprenantoj en ilia natura medio. Por pli da pri la diferencoj inter etnografio kaj profundaj intervjuoj, vidu Jerolmack and Khan (2014) . Por pli da cifereca etnografio, vidu Pink et al. (2015) .
Mia priskribo de la historio de enketa esplorado estas tre tro mallonga por inkluzivi multajn el la ekscitaj evoluoj okazintaj. Por pli historia fono, vidu Smith (1976) , Converse (1987) , kaj Igo (2008) . Por pli pri la ideo de tri esploroj de enketo, vidu Groves (2011) kaj Dillman, Smyth, and Christian (2008) (kiu rompas la tri jarojn iomete malsame).
Groves and Kahn (1979) proponas alrigardon en la transiro de la unua ĝis la dua epoko en enketa esplorado per detala kaploko al kapo inter vizaĝo kaj vizaĝo kaj telefona enketo. ( ??? ) Rigardas reen sur la historia evoluado de hazardaj-ciferecaj signaloj.
Por pli, kiel enketo esploris en la pasinteco en respondo al ŝanĝoj en la socio, vidu Tourangeau (2004) , ( ??? ) , kaj Couper (2011) .
La fortoj kaj malfortoj de petado kaj observado estis diskutataj de psikologoj (ekz. Baumeister, Vohs, and Funder (2007) ) kaj sociologoj (ekzemple Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) : Jerolmack and Khan (2014) ]. La diferenco inter demandado kaj observado ankaŭ ŝprucas en ekonomiko, kie esploristoj parolas pri esprimitaj kaj malkaŝitaj preferoj. Ekzemple, esploristo povus demandi alrespondantoj ĉu ili preferas manĝi glaciaĵon aŭ iri al la gimnazio (deklaritaj preferoj), aŭ povis observi, kiom ofte homoj manĝas glaciaĵon kaj iri al la gimnazio (malkaŝitaj preferoj). Estas profunda skeptiko pri certaj specoj de datumoj de ekonomiaj preferoj kiel priskribitaj en Hausman (2012) .
Ĉefa temo de ĉi tiuj debatoj estas, ke raportita konduto ne ĉiam estas preciza. Sed, kiel estis priskribita en ĉapitro 2, grandaj datumaj fontoj ne povas esti precizaj, ili eble ne kolektiĝos en specimeno de intereso, kaj ili eble ne estu alireblaj por esploristoj. Tiel, mi pensas, ke en iuj situacioj, raportita konduto povas esti utila. Plue, dua ĉefa temo de ĉi tiuj debatoj estas, ke raportoj pri emocioj, scioj, atendoj kaj opinioj ne ĉiam estas precizaj. Sed se informo de ĉi tiuj internaj statoj bezonas esploristojn-ĉu por helpi klarigi iun konduton aŭ kiel la aferon klarigatan-tiam petante, ke vi taŭgas. Kompreneble, lernanta pri internaj ŝtatoj demandante demandojn povas esti problema, ĉar kelkfoje la enketantoj mem ne konscias pri siaj internaj statoj (Nisbett and Wilson 1977) .
Ĉapitro 1 de Groves (2004) faras bonegan laboron kunkonstruante la foje nekonforman terminologion uzatan de enketistoj por priskribi la tutan enketan eraronkadron. Por longa daŭra traktado de la tuta enketa erara kadro, vidu Groves et al. (2009) , kaj por historia superrigardo, vidu Groves and Lyberg (2010) .
La ideo de malkomponanta erarojn en parolado kaj varianco ankaŭ venas en maŝinlernado; vidu, ekzemple, sekcion 7.3 de Hastie, Tibshirani, and Friedman (2009) . Ĉi tio ofte kondukas esploristojn por paroli pri komerca "interkonsento".
Koncerne al la reprezento, granda enkonduko al la aferoj de ne respondaj kaj ne respondaj antaŭjuĝoj estas la raporto pri la Nacia Konsilio pri Esploro pri Neresponse en Sociaj Sciencaj Enketoj: Esploro Agenda (2013) . Alia utila superrigardo estas provizita fare de Groves (2006) . Ankaŭ, kompletaj specialaj aferoj de la Ĵurnalo de Oficiala Statistiko , Publika Komitato Trimonate , kaj la Anales de la Amerika Akademio pri Politika kaj Socia Scienco estis publikigitaj sur la temo de ne-respondo. Fine, fakte multaj malsamaj manieroj kalkulas la respondan indicon; ĉi tiuj aliroj priskribiĝas detale en raporto de La Amerika Asocio de Publikaj Opiniaj Esploristoj (AAPOR) ( ??? ) .
Por pli da en la enketo de Literaturaj Digestoj de 1936, vidu Bryson (1976) , Squire (1988) , Cahalan (1989) , kaj Lusinchi (2012) . Por alia diskuto pri ĉi tiu enketo kiel parola averto kontraŭ malmolaj datumoj-kolekto, vidu Gayo-Avello (2011) . En 1936, George Gallup uzis pli kompleksan formon de samplado kaj povis produkti pli precizajn taksojn kun multe pli malgranda specimeno. La sukceso de Gallup super la Literatura Digesto estis mejloŝtono en la disvolviĝo de enketa esplorado kiel estas priskribita en ĉapitro 3 de @ converse_survey_1987; ĉapitro 4 de Ohmer (2006) ; kaj ĉapitro 3 de @ igo_averaged_2008.
En mezuroj, granda unua rimedo por desegnado de demandoj estas Bradburn, Sudman, and Wansink (2004) . Por pli progresintaj traktadoj, vidu Schuman and Presser (1996) , kiu estas specife enfokusigita al sintenoj kaj Saris and Gallhofer (2014) , kiu estas pli ĝenerala. Iomete malsama al mezuro estas prenita en psikometriaĵoj, kiel priskribita en ( ??? ) . Pli da pretigado estas disponebla en Presser and Blair (1994) , Presser et al. (2004) , kaj ĉapitro 8 de Groves et al. (2009) . Por pli da enketaj eksperimentoj, vidu Mutz (2011) .
Koncerne al kosto, la klasika, kompleta daŭra traktado de la komerco inter interkonsentoj kaj enketaj eraroj estas Groves (2004) .
Du klasikaj libroj-longaj traktadoj de norma probablo-samplado kaj korinklino estas Lohr (2009) (pli enkondukaj) kaj Särndal, Swensson, and Wretman (2003) (pli progresintaj). Traktado de klasikaj libroj longaj de post-estratigo kaj rilataj metodoj estas Särndal and Lundström (2005) . En iuj ciferecaj agordoj, esploristoj scias iom pri nerespondantoj, kiuj ofte ne estis vera en la pasinteco. Malsamaj formoj de ne-responda ĝustigo estas eblaj kiam esploristoj havas informojn pri nerespondantoj, kiel priskribis Kalton and Flores-Cervantes (2003) kaj Smith (2011) .
La Xbox-studo de W. Wang et al. (2015) uzas teknikon nomitan multinivelan regreson kaj post-estratigon ("sinjoro P.") kiu permesas esploristojn taksi grupon signifas eĉ kiam multaj estas multaj grupoj. Kvankam estas iu debato pri la kvalito de la taksoj de ĉi tiu tekniko, ŝajnas kiel promesplena areo esplori. La tekniko unue uzis en Park, Gelman, and Bafumi (2004) , kaj ekzistis posta uzo kaj debato (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Por pli da rilato inter individuaj pezoj kaj grupaj pezoj, vidu Gelman (2007) .
Por aliaj aliroj por pezantaj TTT-enketoj, vidu Schonlau et al. (2009) , Bethlehem (2010) , kaj Valliant and Dever (2011) . Enretaj paneloj povas uzi ĉu probablajn samplingojn aŭ ne-probablajn specimenojn. Por pli da interretaj paneloj, vidu Callegaro et al. (2014) .
Kelkfoje, esploristoj trovis, ke probablaj specimenoj kaj ne-probablaj specimenoj produktas taksojn de simila kvalito (Ansolabehere and Schaffner 2014) , sed aliaj komparoj trovis, ke ne-probablaj specimenoj plimalbonigas (Malhotra and Krosnick 2007; Yeager et al. 2011) . Ebla kialo por ĉi tiuj diferencoj estas, ke ne-probablaj specimenoj plibonigis tra la tempo. Por pli pesimisma vidpunkto de neprobablaj specimenaj metodoj vidu la AAPOR-Task-Force sur Ne-Probabl-Samplado (Baker et al. 2013) , kaj mi ankaŭ rekomendas legi la komenton, kiu sekvas la resuman raporton.
Conrad and Schober (2008) estas redaktita volumeno titolita Envisioning the Survey Intervjuo de la Estonteco , kaj ĝi ofertas diversajn vidpunktojn pri la estonta demandado. Couper (2011) adresas similajn temojn, kaj Schober et al. (2015) proponas belan ekzemplon pri kiel datumaj metodoj kolektitaj al nova agordo povas rezultigi pli altan kvalitan datumon. Schober and Conrad (2015) proponas pli ĝeneralan argumenton pri daŭrigado por ĝustigi la procezon de enketa esplorado por egali ŝanĝojn en la socio.
Tourangeau and Yan (2007) revizias aferojn pri socia deziro-parolado en sentivaj demandoj, kaj Lind et al. (2013) proponas iujn eblajn kialojn, kial homoj povus malkaŝi pli sentivan informon en komputila administra intervjuo. Por pli da pri la rolo de homaj intervjuantoj en pliigantaj tantiemoj en enketoj, vidu Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , kaj Schaeffer et al. (2013) . Por pli da pri miksitaj enketoj, vidu Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) ofertas libron-longan traktadon de ekologia momenta takso kaj rilataj metodoj.
Por pli da konsiloj pri enketoj ĝuas kaj valorajn spertojn por partoprenantoj, vidu laboron pri la Tailored Design Method (Dillman, Smyth, and Christian 2014) . Por alia interesa ekzemplo pri uzado de Facebook-apps por sociaj sciencaj enketoj, vidu Bail (2015) .
Judson (2007) priskribas la procezon kombinante enketojn kaj administrajn datumojn kiel "integriĝo de informoj" kaj diskutas iujn avantaĝojn de ĉi tiu aliro, kaj ankaŭ proponante iujn ekzemplojn.
Koncerne al riĉaj demandoj, estis multaj antaŭaj provoj validigi voĉdonadon. Por superrigardo de tiu literaturo, vidu Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , kaj Berent, Krosnick, and Lupia (2016) . Vidu Berent, Krosnick, and Lupia (2016) por pli skeptika vidado de la rezultoj prezentitaj en Ansolabehere and Hersh (2012) .
Estas grave rimarki, ke kvankam Ansolabehere kaj Hersh estis kuraĝigitaj de la kvalito de datumoj de Katalunio, aliaj taksadoj de komercaj vendistoj estis malpli entuziasmuloj. Pasek et al. (2014) trovis malriĉan kvaliton kiam datumoj de enketo estis komparitaj kun konsumata dosiero de Merkatika Sistema Grupo (kiu mem kunmetis datumojn de tri provizantoj: Aksiomomo, Sperto kaj Informoj). Tio estas, la datumdosiero ne kongruis kun enketaj respondoj, kiujn la esploristoj atendis korekti, la konsumanto-dosiero mankis datumojn por multajn demandojn, kaj la mankanta datuma ŝablono estis rilatigita kun la raportita valoro de enketo (alivorte, la mankanta datumoj estis sistemaj, ne hazardaj).
Por pli da registra ligo inter enketoj kaj administraj datumoj, vidu Sakshaug and Kreuter (2012) kaj Schnell (2013) . Por pli da registra ligado ĝenerale, vidu Dunn (1946) kaj Fellegi and Sunter (1969) (historia) kaj Larsen and Winkler (2014) (moderna). Similaj aliroj ankaŭ estis disvolvitaj en komputika sub nomoj kiel datumaj deduplikado, ekzemplo de ekzemploj, kongruaj nomoj, duobla detektado kaj duobla registra detekto (Elmagarmid, Ipeirotis, and Verykios 2007) . Ekzistas ankaŭ privateco-konservantaj aliroj por registri ligon, kiu ne postulas la transdono de persone identiganta informon (Schnell 2013) . Esploristoj ĉe Facebook disvolvis proceduron por probable ligi siajn rekordojn al voĉdonado (Jones et al. 2013) ; ĉi tiu ligo fariĝis por taksi eksperimenton, pri kiu mi diros al vi en ĉapitro 4 (Bond et al. 2012) . Por pli akiri konsenton por registra ligo, vidu Sakshaug et al. (2012) .
Alia ekzemplo de ligo de grandskala socia enketo al administraj administraj rekordoj venas de la Sano kaj Izoliteco kaj la Socia Sekureca Administrado. Por pli da pri tiu studo, inkluzive de informoj pri la konsento, vidu Olson (1996, 1999) .
La procezo de kombinaĵo de multaj fontoj de administraj registroj en maŝinforma dosiero -la procezo, kiun Katalunujo utiligas- estas komuna en la statistikaj oficejoj de iuj naciaj registaroj. Du esploristoj de Statistiko Svedio skribis detalan libron pri la temo (Wallgren and Wallgren 2007) . Por ekzemplo de ĉi tiu aliro en ununura distrikto en Usono (Olmstead County, Minnesota, hejmo de la Mayo-Kliniko), vidu Sauver et al. (2011) . Por pli da eraroj, kiuj povas aperi en administraj registroj, vidu Groen (2012) .
Alia maniero, en kiu esploristoj povas uzi grandajn datumojn en enketa esploro, estas kiel kadro de specimeno por homoj kun specifaj trajtoj. Bedaŭrinde, ĉi tiu aliro povas levi demandojn rilate al privateco (Beskow, Sandler, and Weinberger 2006) .
Pri amplifila peto, ĉi tiu aliro ne estas tiel nova kiel ĝi povus aperi de kiel mi priskribis ĝin. Ĝi havas profundajn rilatojn al tri grandaj areoj en statistikoj: model-bazita post-estratigo (Little 1993) , imputacio (Rubin 2004) , kaj malgranda areo-korinklino (Rao and Molina 2015) . Ĝi ankaŭ rilatas al la uzado de anstataŭaj variabloj en medicina esploro (Pepe 1992) .
La kostoj kaj tempoj taksoj en Blumenstock, Cadamuro, and On (2015) raportas pli al ŝanĝiĝema kosto - la kosto de alia aldono - kaj ne inkluzivas fiksajn kostojn kiel ekzemple la kosto de purigado kaj prilaborado de la alvokoj. Ĝenerale, plifortigita demandado probable havas altajn fiksajn kostojn kaj malaltajn variajn kostojn similajn al tiuj de ciferecaj eksperimentoj (vidu ĉapitro 4). Por pli da pri poŝtelefonaj enketoj en evolulandoj, vidu Dabalen et al. (2016) .
Por ideoj pri kiel plibonigi petante pli bonan, mi rekomendus lerni pli pri multoblaj imputoj (Rubin 2004) . Ankaŭ, se esploristoj agas plifoje demandante zorgojn pri aldonaj kalkuloj, prefere ol individuaj niveloj, tiam la aliroj en King and Lu (2008) kaj Hopkins and King (2010) povas esti utilaj. Fine, por pli pri la maŝinaj Blumenstock, Cadamuro, and On (2015) en Blumenstock, Cadamuro, and On (2015) , vidu James et al. (2013) (pli enkonduka) aŭ Hastie, Tibshirani, and Friedman (2009) (pli progresinta).
Etika demando pri plifortigado petas, ke ĝi povas esti uzata por konkludi sentivajn trajtojn, kiujn homoj ne elektas malkaŝi en enketo kiel priskribita en Kosinski, Stillwell, and Graepel (2013) .