Molts dels temes d'aquest capítol també s'han fet ressò a les últimes adreces presidencials de l'Associació Americana d'Investigació d'Opinió Pública (AAPOR), com ara les de Dillman (2002) , Newport (2011) , Santos (2014) i Link (2015) .
Per obtenir més informació sobre les diferències entre la recerca d'enquestes i entrevistes en profunditat, consulteu Small (2009) . Relacionat amb entrevistes en profunditat, es tracta d'una família d'enfocaments anomenats etnografia. En la investigació etnogràfica, els investigadors generalment passen molt més temps amb els participants en el seu entorn natural. Per obtenir més informació sobre les diferències entre etnografia i entrevistes en profunditat, vegeu Jerolmack and Khan (2014) . Per obtenir més informació sobre etnografia digital, vegeu Pink et al. (2015) .
La meva descripció de la història de la investigació d'enquestes és massa breu per incloure moltes de les emocionants novetats que s'han produït. Per obtenir més antecedents històrics, vegeu Smith (1976) , Converse (1987) i Igo (2008) . Per obtenir més informació sobre tres etapes d'investigació d'enquestes, vegeu Groves (2011) i Dillman, Smyth, and Christian (2008) (que trenca les tres etapes lleugerament diferent).
Groves and Kahn (1979) ofereixen un cop d'ull dins de la transició de la primera a la segona era en la investigació d'enquestes, realitzant una comparació detallada de cara a cara entre una enquesta cara a cara i telèfon. ( ??? ) el desenvolupament històric dels mètodes de mostreig de marcatge aleatori.
Per obtenir més informació sobre com ha canviat la investigació en el passat en resposta als canvis socials, vegeu Tourangeau (2004) , ( ??? ) i Couper (2011) .
Els punts forts i febles de preguntar i observar han estat debatuts per psicòlegs (per exemple, Baumeister, Vohs, and Funder (2007) ) i sociòlegs (per exemple, Jerolmack and Khan (2014) , Maynard (2014) , Cerulo (2014) , Vaisey (2014) , Jerolmack and Khan (2014) . La diferència entre preguntar-se i observar també sorgeix en l'economia, on els investigadors parlen de preferències declarades i revelades. Per exemple, un investigador podria preguntar als enquestats si prefereixen menjar gelats o anar al gimnàs (es van indicar les preferències) o es podia observar la freqüència amb què es menja gelat i es dirigeix al gimnàs (preferències revelades). Hi ha profund escepticisme sobre determinats tipus de dades de preferències establertes en economia tal i com es descriu a Hausman (2012) .
Un tema principal d'aquests debats és que el comportament informat no sempre és precís. Però, com es va descriure al capítol 2, les grans fonts de dades poden no ser exactes, no es poden recollir en una mostra d'interès, i poden no ser accessibles per als investigadors. Per tant, crec que, en algunes situacions, el comportament informat pot ser útil. A més, un segon tema principal d'aquests debats és que els informes sobre emocions, coneixements, expectatives i opinions no sempre són precisos. Però, si els investigadors necessiten informació sobre aquests estats interns, ja sigui per ajudar a explicar un comportament o com a explicació, a continuació, es pot preguntar si és convenient. Per descomptat, l'aprenentatge dels estats interns mitjançant la formulació de preguntes pot ser problemàtic, perquè de vegades els mateixos enquestats no són conscients dels seus estats interns (Nisbett and Wilson 1977) .
El capítol 1 de Groves (2004) fa un excel·lent treball reconciliant la terminologia ocasionalment inconsistent utilitzada pels investigadors de l'enquesta per descriure el marc d'error de l'enquesta total. Per obtenir un tractament de longitud completa del marc d'errors de l'enquesta total, consulteu Groves et al. (2009) , i per obtenir una visió històrica, vegeu Groves and Lyberg (2010) .
La idea de descompondre errors en biaix i variància també apareix en l'aprenentatge automàtic; vegeu, per exemple, la secció 7.3 d' Hastie, Tibshirani, and Friedman (2009) . Això sovint condueix als investigadors a parlar d'una "variació de biaix" compensació.
Pel que fa a la representació, una gran introducció als problemes de no resposta i biaix no respondre és l'informe del Consell Nacional de Recerca No respòs en les enquestes de ciències socials: un programa de recerca (2013) . Una altra descripció útil és proporcionada per Groves (2006) . També s'han publicat qüestions especials completes del Diari d'Estadístiques Oficials , Opinió Pública Trimestral i els Anals de l'Acadèmia Americana de Ciències Polítiques i Socials sobre el tema de no resposta. Finalment, hi ha moltes maneres diferents de calcular la taxa de resposta; Aquests enfocaments es detallen detalladament en un informe de The American Association of Public Opinion Researchers (AAPOR) ( ??? ) .
Per obtenir més informació sobre l'enquesta de 1936 Literary Digest , vegeu Bryson (1976) , Squire (1988) , Cahalan (1989) i Lusinchi (2012) . Per a una altra discussió d'aquesta enquesta com una advertència de paràbola contra la recopilació de dades inapropiades, vegeu Gayo-Avello (2011) . El 1936, George Gallup va utilitzar una forma més sofisticada de mostreig i va poder produir estimacions més precises amb una mostra molt més petita. L'èxit de Gallup sobre el Literary Digest va ser una fita en el desenvolupament de la investigació d'enquestes tal com es descriu al capítol 3 de @ converse_survey_1987; capítol 4 d' Ohmer (2006) ; i capítol 3 de @ igo_averaged_2008.
Quant a la mesura, un gran primer recurs per dissenyar qüestionaris és Bradburn, Sudman, and Wansink (2004) . Per a tractaments més avançats, vegeu Schuman and Presser (1996) , que es centra específicament en qüestions d'actitud, i Saris and Gallhofer (2014) , que són més generals. Una aproximació lleugerament diferent a la mesura es pren en psicometria, com es descriu a ( ??? ) . Més informació sobre pretest està disponible a Presser and Blair (1994) , Presser et al. (2004) i el capítol 8 de Groves et al. (2009) . Per obtenir més informació sobre els experiments d'enquesta, vegeu Mutz (2011) .
En termes de cost, el tractament clàssic i de longitud del llibre entre els costos d'enquesta i els errors de l'enquesta són Groves (2004) .
Dos tractaments clàssics de mostres de mostreig i estimació de probabilitat estàndard són Lohr (2009) (més introductori) i Särndal, Swensson, and Wretman (2003) (més avançats). Un tractament clàssic de mètodes Särndal and Lundström (2005) mètodes relacionats és el de Särndal and Lundström (2005) . En alguns entorns d'edat digital, els investigadors saben una mica sobre els no responsables, que sovint no eren veritables en el passat. Diferents formes d'ajustament de resposta no és possible quan els investigadors tenen informació sobre els no Kalton and Flores-Cervantes (2003) , tal com ho descriu Kalton and Flores-Cervantes (2003) i Smith (2011) .
L'estudi de Xbox per W. Wang et al. (2015) utilitza una tècnica anomenada regressió multinivell i postestratificació ("Sr P.") que permet als investigadors estimar els mitjans del grup fins i tot quan hi ha molts grups, molts. Tot i que hi ha un debat sobre la qualitat de les estimacions d'aquesta tècnica, sembla una àrea prometedora per explorar. La tècnica va ser usada per primera vegada a Park, Gelman, and Bafumi (2004) , i hi ha hagut un posterior ús i debat (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Per obtenir més informació sobre la connexió entre els pesos individuals i els pesos del grup, vegeu Gelman (2007) .
Per a altres enfocaments de ponderació d'enquestes web, vegeu Schonlau et al. (2009) , Bethlehem (2010) , i Valliant and Dever (2011) . Els panells en línia poden utilitzar un mostreig de probabilitat o un mostreig no probabilístic. Per obtenir més informació sobre panells en línia, vegeu Callegaro et al. (2014) .
De vegades, els investigadors han trobat que les mostres de probabilitat i les mostres de no probabilitat produeixen estimacions de qualitat similar (Ansolabehere and Schaffner 2014) , però altres comparacions han trobat que les mostres de no probabilitat empitjoren (Malhotra and Krosnick 2007; Yeager et al. 2011) . Un possible motiu d'aquestes diferències és que les mostres no probables han millorat amb el temps. Per obtenir una visió més pessimista dels mètodes de mostreig no probables, consulteu el grup de treball AAPOR sobre el mostreig no probabilístic (Baker et al. 2013) , i també recomano llegir el comentari que segueix l'informe de resum.
Conrad and Schober (2008) és un volum editat amb el títol Envisioning the Survey Entrevista del futur , i ofereix una varietat de punts de vista sobre el futur de fer preguntes. Couper (2011) aborda temes similars, i Schober et al. (2015) ofereixen un bon exemple de com els mètodes de recopilació de dades que s'adapten a una nova configuració poden generar dades de més qualitat. Schober and Conrad (2015) ofereixen un argument més general sobre continuar ajustant el procés de recerca d'enquestes per adaptar-se als canvis socials.
Tourangeau and Yan (2007) revisen qüestions de biaix de desitjabilitat social en qüestions sensibles, i Lind et al. (2013) ofereixen algunes raons possibles per les quals la gent pot revelar informació més sensible en una entrevista administrada per ordinador. Per obtenir més informació sobre el paper dels entrevistadors humans en augmentar les taxes de participació en enquestes, vegeu Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , i Schaeffer et al. (2013) . Per obtenir més informació sobre enquestes en mode mixt, vegeu Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) ofereixen un tractament de longitud completa de l'avaluació momentània ecològica i mètodes relacionats.
Per obtenir més consells sobre com fer les enquestes una experiència agradable i valuosa per als participants, consulteu el treball sobre el mètode de disseny a mida (Dillman, Smyth, and Christian 2014) . Per a un altre exemple interessant d'utilitzar aplicacions de Facebook per a enquestes de ciències socials, vegeu Bail (2015) .
Judson (2007) descriu el procés de combinació d'enquestes i dades administratives com a "integració d'informació" i analitza alguns avantatges d'aquest enfocament, a més d'oferir alguns exemples.
Pel que fa a l'enriquiment de la pregunta, hi ha hagut molts intents anteriors de validar la votació. Per obtenir una visió general d'aquesta literatura, vegeu Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , i Berent, Krosnick, and Lupia (2016) . Vegeu Berent, Krosnick, and Lupia (2016) per obtenir una visió més escèptica dels resultats presentats a Ansolabehere and Hersh (2012) .
És important tenir en compte que tot i que Ansolabehere i Hersh van ser encoratjats per la qualitat de les dades de Catalist, altres avaluacions dels venedors comercials han estat menys entusiastes. Pasek et al. (2014) trobar una qualitat deficient quan es van comparar les dades d'una enquesta amb un fitxer de consum de Màrqueting Systems Group (que en si mateix va combinar dades de tres proveïdors: Acxiom, Experian i InfoUSA). És a dir, el fitxer de dades no coincideix amb les respostes d'enquesta que els investigadors esperaven que eren correctes, el fitxer de consumidor tenia dades perdudes per a una gran quantitat de preguntes i el patró de dades que faltava es correlacionava amb el valor de l'enquesta denunciat (és a dir, el desaparegut les dades eren sistemàtiques, no aleatòries).
Per obtenir més informació sobre el vincle registrat entre les enquestes i les dades administratives, consulteu Sakshaug and Kreuter (2012) i Schnell (2013) . Per obtenir més informació sobre l'enllaç discogràfic en general, vegeu Dunn (1946) i Fellegi and Sunter (1969) (històric) i Larsen and Winkler (2014) (modern). També s'han desenvolupat enfocaments similars en informàtica sota noms com la deduplicació de dades, la identificació d'instàncies, la concordança de noms, la detecció duplicada i la detecció de registres duplicats (Elmagarmid, Ipeirotis, and Verykios 2007) . També hi ha enfocaments de conservació de la privacitat per enllaçar registres que no requereixen la transmissió d'informació d'identificació personal (Schnell 2013) . Els investigadors de Facebook van desenvolupar un procediment per vincular probabilísticament els seus registres al comportament de vot (Jones et al. 2013) ; aquest enllaç es va fer per avaluar un experiment que et diré al capítol 4 (Bond et al. 2012) . Per obtenir més informació sobre l'obtenció del consentiment per a un enllaç de registre, consulteu Sakshaug et al. (2012) .
Un altre exemple d'enllaçar una enquesta social a gran escala amb els registres administratius del govern prové de l'Enquesta de salut i jubilació i l'Administració de la Seguretat Social. Per obtenir més informació sobre aquest estudi, inclosa la informació sobre el procediment de consentiment, vegeu Olson (1996, 1999) .
El procés de combinar moltes fonts de registres administratius en un arxiu de dades mestres -el procés que Catalyst fa servir- és comú a les oficines d'estadística d'alguns governs nacionals. Dos investigadors de Statistics Sweden han escrit un llibre detallat sobre el tema (Wallgren and Wallgren 2007) . Per obtenir un exemple d'aquest enfocament en un sol comtat dels Estats Units (Olmstead County, Minnesota, seu de la Clínica Mayo), vegeu Sauver et al. (2011) . Per obtenir més informació sobre els errors que poden aparèixer als registres administratius, vegeu Groen (2012) .
Una altra manera en què els investigadors poden utilitzar grans fonts de dades en la recerca d'enquestes és un marc de mostreig per a persones amb característiques específiques. Malauradament, aquest plantejament pot plantejar qüestions relacionades amb la privadesa (Beskow, Sandler, and Weinberger 2006) .
Pel que fa a la pregunta amplificada, aquest enfocament no és tan nou com podria aparèixer de com l'he descrit. Té connexions profundes amb tres grans àrees d'estadística: la postestructura basada en models (Little 1993) , la imputació (Rubin 2004) i l'estimació de petites àrees (Rao and Molina 2015) . També està relacionat amb l'ús de variables subrogades en la investigació mèdica (Pepe 1992) .
Les estimacions de costos i temps en Blumenstock, Cadamuro, and On (2015) refereixen més al cost variable -el cost d'una enquesta addicional- i no inclouen costos fixos, com ara el cost de la neteja i el processament de les dades de la trucada. En general, la sol·licitud amplificada probablement tindrà elevats costos fixos i costos baixos variables similars als d'experiments digitals (vegeu el capítol 4). Per obtenir més informació sobre enquestes basades en telefonia mòbil a països en desenvolupament, consulteu Dabalen et al. (2016) .
Per obtenir idees sobre com fer l'amplificació fent-me una pregunta millor, us recomanaria aprendre més sobre la imputació múltiple (Rubin 2004) . A més, si els investigadors que fan amplificacions demanant atenció als recomptes agregats, més que no pas a trets individuals, els enfocaments a King and Lu (2008) i Hopkins and King (2010) poden ser útils. Finalment, per obtenir més informació sobre els enfocaments d'aprenentatge automàtic de Blumenstock, Cadamuro, and On (2015) , vegeu James et al. (2013) (més introductori) o Hastie, Tibshirani, and Friedman (2009) (més avançat).
Una pregunta ètica sobre la pregunta amplificada és que es pot utilitzar per inferir trets sensibles que la gent no podria triar revelar en una enquesta tal com es descriu a Kosinski, Stillwell, and Graepel (2013) .