Atal honek diseinatuta dago erreferentzia gisa erabili ahal, narrazio bat bezala irakurri behar baino.
Kapitulu honetan gai askok, gainera, American Association of Iritzi Publikoa Research (AAPOR) Presidential azken helbideak, esaterako oihartzuna dira Dillman (2002) , Newport (2011) , Santos (2014) , eta Link (2015) .
Gehiago inkesta ikerketa garapenari buruz oinarri historikoa lortzeko, ikus Smith (1976) eta Converse (1987) . Hiru inkesta ikerketa garai ideia gehiago nahi izanez gero, ikusi Groves (2011) eta Dillman, Smyth, and Christian (2008) (bertan askatuko hiru garai desberdinean).
Bigarren aro lehen trantsizio inkesta ikerketan barruan mendia da Groves and Kahn (1979) , buru-to-burua arteko konparaketa zehatza egiten du bat face-to-face eta telefono bidezko inkesta. Brick and Tucker (2007) atzera begiratu ausazko digitu Markatze laginketa metodo garapen historikoa at.
For more nola inkesta ikerketa iraganean aldatu gizartean aldaketak erantzunez, ikusi Tourangeau (2004) , Mitofsky (1989) , eta Couper (2011) .
barneko estatu buruz ikastea galderak eginez problematikoa izan daiteke batzuetan, inkestatuen beraiek ez dira beren barne egoera jakitun delako. Adibidez, Nisbett and Wilson (1977) "kontatu jakin ahal izango dugu baino gehiago::. Adimen-prozesuak on Verbal txostenak" Paper egileek ondorioztatu: "irakasgaiak dira batzuetan (a) ezjakin paper zoragarri bat iradokitzaileak izenburua estimulu bat garrantzitsuagoa eragina erantzunik existentzia, (b) erantzuna izatea, eta (c) ez dakite estimulu duten erantzuna eragina izan du, ez dakite. "
Argumentuak duten ikertzaile ikusitako portaera nahiago portaera du edo jarreren izateko, ikus Baumeister, Vohs, and Funder (2007) (psikologia) eta Jerolmack and Khan (2014) eta erantzunak (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (soziologia). galdetuz eta, era berean, behatzeko arteko aldea ekonomia, non ikertzaileek adierazi eta agerian lehentasunei buruz hitz egiteko ere sortzen. Adibidez, ikertzaile bat inkestatuen izozkia jateko aukera izango dute ala gimnasioa joan (adierazi lehentasunak) eskatu izan edo ikerketa jendeak nola askotan jan izozkia sumatu eta gimnasioa (lehentasunak agerian) joan. Badira adierazi lehentasunak datu-mota batzuk Ekonomiako eszeptizismoa sakona da (Hausman 2012) .
Eztabaida hauetan tema nagusia da dela jakinarazi jokabidea ez da beti zehatza. Baina, automatikoki erregistratzen portaera baliteke zehatzak ez izatea, agian, ez da interes-lagin batean bildu, eta agian ez da ikertzaileen eskura. Horrela, egoera batzuetan, jakinarazi portaera hori baliagarria izan daitekeela uste dut. Aurrerago, eztabaidak hauetatik bigarren gaia nagusia da emozioak, ezagutza, itxaropenak, eta iritziak buruzko txostenak ez dira beti zehatzak. Baina, barne-eskari hauei buruzko informazioa dira, behar izanez gero ikertzaile-bai portaera batzuk azaldu laguntzeko edo gauza esplikatu-orduan egon bezala eskatuz egokia izan daiteke.
Liburuaren luzera guztira inkesta error tratamenduak egiteko, ikus Groves et al. (2009) edo Weisberg (2005) . Guztira inkesta error garapena historia bat lortzeko, ikusi Groves and Lyberg (2010) .
Ikerketa Agenda A: ordezkaritza dagokionez, erantzun ezaren eta ez-erantzuna bias gaiak sarrera handi bat National Research Council txostena Nonresponse on Social Science Inkestak da (2013) . Beste ikuspegi erabilgarria da emandako (Groves 2006) . Era berean, osoa Estatistika ofiziala Journal, Iritzi Publikoa Quarterly, eta American Politika eta Gizarte Zientzien Akademia Anales de arazo berezirik izan, erantzun eza gaia argitaratu dira. Azkenik, badira erantzun-tasa kalkulatzeko modu ezberdinak benetan asko; planteamendu horiek xehetasunez deskribatu American Association iritzi publikoaren Ikertzaileak (AAPOR) txosten batean (Public Opinion Researchers} 2015) .
1936an Literatur Digest inkesta aztergai izan du zehatz-mehatz (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Era berean, parabola bat Ostolaza datu bilketa aurka ohartarazten gisa erabiltzen dira (Gayo-Avello 2011) . 1936an, George Gallup Laginketa forma konplexuagoa da erabiltzen, eta zehatzagoak kalkuluen ekoizteko lagin askoz txikiagoa duten gai izan zen. Gallup Literatur Digest osoko arrakasta mugarri bat inkesta ikerketa garatzea izan zen (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .
Neurketa dagokionez, galdesortak diseinatzeko lehen baliabide handia da Bradburn, Sudman, and Wansink (2004) . Tratamendu aurreratuagoak bat zehazki bideratuta jarrera galdera, ikus Schuman and Presser (1996) . Pre-probak galdera gehiago dago eskuragarri Presser and Blair (1994) , Presser et al. (2004) , eta 8 kapitulua Groves et al. (2009) .
Klasikoa, book-luzera inkesta kostuak eta inkesta akatsak arteko merkataritza-off tratamendua da Groves (2004) .
Classic book-luzera probabilitate-laginketa estandarraren estimazioa eta tratamendua dira Lohr (2009) (sarrera gehiago) eta Särndal, Swensson, and Wretman (2003) (aurreratuagoak). Liburu klasiko-luzera postestratifikazioa eta erlazionatutako metodo tratamendua A da Särndal and Lundström (2005) . batzuk adin digital ezarpenak, ikertzaileek jakin erantzuten ez, eta hori ez zen egia askotan iraganean nahiko pixka bat. Ez-erantzuna doikuntza forma desberdinak dira posible denean ikertzaileek erantzuten ez dute informazio (Kalton and Flores-Cervantes 2003; Smith 2011) .
Xbox ikertuz, Wang et al. (2015) izeneko anitzeko erregresio eta postestratifikazioa teknika bat (MRP, batzuetan "Mister P" izeneko) ahalbidetzen duen ikertzaile batzuek zelula esan nahi, nahiz eta asko daude, zelula askok balioesteko erabiltzen du. Han teknika honetatik estimazioen kalitateari buruzko eztabaida batzuk izan arren, badirudi etorkizun handiko arloak arakatzeko bezala. Teknika Lehen erabiltzen zen Park, Gelman, and Bafumi (2004) , eta ez du, ondorengo erabilera eta eztabaida izan (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Pisuak banakako eta zelula-oinarritutako pisuak arteko konexioa buruz gehiago ikusi Gelman (2007) .
Ponderazio web inkesten beste planteamendu lortzeko, ikus Schonlau et al. (2009) , Valliant and Dever (2011) , eta Bethlehem (2010) .
Sample bat datorren proposatu zen Rivers (2007) . Bethlehem (2015) argudiatzen lagin bat datorren errendimendua benetan beste laginketa planteamendu (adibidez, laginketa) eta beste doikuntza planteamendu (adibidez, postestratifikazioa) antzekoa izan. Online paneletan gehiagorako, ikus Callegaro et al. (2014) .
Batzuetan ikertzaileek aurkitu dute probabilitate laginak eta ez-probabilitatea laginak amore duten antzeko kalitate kalkuluak (Ansolabehere and Schaffner 2014) , baina beste konparazioak aurkitu dute ez-probabilitatea laginak hori egin okerragoa (Malhotra and Krosnick 2007; Yeager et al. 2011) . One desberdintasun horiek arrazoi posible da ez-probabilitatea laginak denboran zehar hobetu dute. Ez-probabilitate-laginketa metodoak ikuspegi ezkorra baterako ikusi du AAPOR Task Force Non-probabilitatea Laginketa on (Baker et al. 2013) , eta, halaber, gomendatzen dut laburpen txostena jarraitzen duen comentario irakurtzen.
Meta-analisi baten haztapena ez-probabilitatea laginak alborapena murrizteko eragina, ikus 2.4 taulan Tourangeau, Conrad, and Couper (2013) , egileek eramaten bukatutzat emateko "doikuntza diruditen zuzenketak erabilgarria baina huts izan. . . "
Conrad and Schober (2008) edited bolumen bat izenburua Inkesta Etorkizuneko Elkarrizketa Irudika ematen du, eta atal honetan gai askoren helbideak. Couper (2011) helbideak antzeko gaiak, eta Schober et al. (2015) nola erabiltzen diren agertoki berri bat egokitutako datu bilketa metodoak eta datuen kalitate handiagorik eragin dezake adibide polit bat eskaintzen du.
Beste Facebook gizarte zientzia inkesten apps erabiliz adibide interesgarria eskuratzeko, ikus Bail (2015) .
Inkestetan parte-hartzaileen esperientzia atsegina eta baliotsu bat egiteko aholkua gehiago eskuratzeko, ikusi Egokitutako Design metodoa lana (Dillman, Smyth, and Christian 2014) .
Stone et al. (2007) liburuaren luzera ekologiko momentuko ebaluazioa eta erlazionatutako metodo tratamendu bat eskaintzen du.
Judson (2007) inkestak eta administrazio-datuak konbinatuz gisa prozesua deskribatu "informazio integrazioa," planteamendu honen abantaila batzuk aztertzen ditu, eta adibide batzuk eskaintzen ditu.
duten ikertzaile aztarnak digital eta administrazio-datuak erabili ahal beste modu laginketa ezaugarri espezifikoak dituzten pertsonak markoa da. Hala ere, sartzeko erregistro horiek erabili ahal izateko, laginketa-marko bat, gainera pribatutasuna lotutako galdera sor dezake (Beskow, Sandler, and Weinberger 2006) .
haundituko galdetuz dagokionez, planteamendu hau ez da berria, nola ez dut deskribatu bertatik zitekeen agertzen den bezala. Planteamendu honek estatistikak-ereduetan oinarritutako postestratifikazioa hiru eremu handietan konexioak sakonak ditu (Little 1993) , egozpena (Rubin 2004) , eta eremu txiki zenbatespena (Rao and Molina 2015) . Era berean, ikerketa mediku surrogate aldagaiak erabiliz lotuta dago (Pepe 1992) .
Du arrastorik digital datuetan sartzen buruzko gaiak etikoak gain, anplifikatu galdetuz izan ere erabiliko dira ezaugarri sentikorra duten pertsonen agian ez aukeratu inkesta bat agerian inferitzea (Kosinski, Stillwell, and Graepel 2013) .
Kostua eta denbora estimazioak lehenengo Blumenstock, Cadamuro, and On (2015) erreferentzia aldakorra kostuak inkesta-eta osagarriak ez dira sartu finko bat kostua-kostu gehiago, hala nola, kostu garbitzeko eta dei datuak prozesatu gisa. Oro har, anplifikatu galdetuz ziurrenik kostu finkoak altuak eta aldakorra kostuak baxua esperimentuak digital (ikus 4. kapitulua) antzekoa izango dute. Erabilitako datuei buruzko xehetasun gehiago Blumenstock, Cadamuro, and On (2015) paper daude Blumenstock and Eagle (2010) eta Blumenstock and Eagle (2012) . Imputuation anitzetako Aproximaciones (Rubin 2004) harrapaketa haundituko eskatuz kalkuluen ziurgabetasuna lagun dezake. Ikertzaileek eginez haundituko bakarrik eskatuz zenbatzen agregatua, baino banakako mailako ezaugarri buruz zaintzen bada, orduan ere planteamendu King and Lu (2008) eta Hopkins and King (2010) lagungarria izan daiteke. Makinen ikasketa planteamendu buruzko gehiagorako Blumenstock, Cadamuro, and On (2015) , ikus James et al. (2013) (sarrera gehiago) edo Hastie, Tibshirani, and Friedman (2009) (aurreratuagoak). Beste herri makinen ikasketa testuliburua da Murphy (2012) .
Aberastu galdetuz dagokionez, Ansolabehere eta Hersh ere emaitzak (2012) bi urrats nagusiei banda: 1) Catalist gaitasuna disparate askoren datuak iturri inkesta datuak konbinatzeko zehatzak master datafile bat ekoizteko eta 2) Catalist gaitasuna lotu nahi bere maisu datafile. Beraz, Ansolabehere eta Hersh egiaztatu urrats horietako bakoitza arretaz.
maisu datafile sortzeko, Catalist uztartzen eta barne hainbat iturri informazioa bateratzen ditu: hainbat boto erregistro beste especificar komertzial hornitzaile from egoera bakoitzaren argazkiak, Post Office Aldatu National Helbidea Erregistroaren datuak, eta datu. garbiketa hori guztia batzeko nola gertatzen góry xehetasun liburu honen esparrutik kanpo daude, baina prozesu hori, eta ez du axola nola ibili, datuak jatorrizko iturrietan akatsak hedatzeko du, eta akatsak aurkeztuko dute. Catalist bere datuak prozesatzeko eztabaidatzeko eta bere datu gordin batzuk emateko prest zegoen arren, besterik gabe, ezinezkoa izan ikertzaileek osoa Catalist datuak gasbide ikuskatzea. Izan ere, ikertzaileek egoera non Catalist datuak fitxategi batzuk ezezagunak, eta agian ezezagunaren error zenbatekoa izan ziren. Hau kezka larria da kritikari bat espekulatu leza inkesta CCES buruzko txostenak eta Catalist datuak fitxategi nagusia portaera arteko ezberdintasunak handiak zirela akatsak eragindako datuak fitxategi nagusia ere, ez inkestatuen arabera zuzena arabera.
Ansolabehere eta Hersh bi ikuspegi ezberdinak hartu datuen kalitate kezka hori irabazteko. Lehenik eta behin, auto-du boto gehien parekatzea Catalist fitxategi nagusia botua gain, ikertzaileek ere alderatu norberaren du festa, arraza, Erroldako status (adibidez, erregistratu edo ez erregistratu) eta boto-metodoa (adibidez, pertsona, absentismoa Boto-, etc.) Catalist base aurki balio horiek. lau aldagai demografiko horiek direla eta, ikertzaileek aurkitu inkestaren txosten eta datuak arteko akordioa boto baino Catalist fitxategi nagusia ere maila askoz ere handiagoa. Horrela, Catalist datuak fitxategi nagusia agertzen boto baino beste ezaugarri kalitate handiko informazioa dute, ez dela kalitate orokorra txarrekoak proposatuz. Bigarren, parte Catalist datuak erabilita ere, Ansolabehere eta Hersh hiru county boto erregistroen kalitatearen neurri ezberdinak garatu, eta hori estimatzen boto baino gehiago-erreportajeen tasa funtsean horiek datuen kalitate neurriak edozein zerikusirik izan zen aurkitu zuten, aurkikuntza bat dela iradokitzen duten baino gehiago-erreportajea tasa handiak ez dira ari counties bultzatuta datuen kalitatea ohiz baxua.
maisu honek boto fitxategia sortzea hartuta, bigarren akatsak potentzial iturri da inkesta erregistro lotzen da. Adibidez, lotura hori okerrean egiten bada, ezin al du eta balioztatu boto jokabidearen arteko aldea baino gehiago-estimazio bat eramaten (Neter, Maynes, and Ramanathan 1965) . Pertsona bakoitzeko egonkorra, identifikatzaile bakarra da, datuak iturri biak ibili izan bada, orduan batze hutsala litzateke. AEBetako eta beste herrialde batzuetan, ordea, ez identifikatzailea unibertsala ez da. Are gehiago, ez ziren, hala nola, nahiz identifikatzailea pertsona bat seguruenik hesitant emateko ikertzaile gainbegiratzeko! izena, sexua, jaiotza urtea, eta etxeko helbidea: Horrela, Catalist batze egin inperfektua identifikatzaileak lau erantzuleak bakoitzari buruzko informazio piezak erabiliz, kasu honetan izan. Adibidez, Catalist Homie J Simpson du CCES batean Homer Simpson Jay pertsona ote du bere datuak fitxategi nagusia izan zen erabaki behar izan zuen. Praktikan, bat datorren prozesua zaila eta messy bat da, eta, gaiei ikertzaileek okerragoa egiteko, Catalist jotzen bere etortze teknika jabeduna izan.
Ordena bat datorren algoritmoak balioztatzeko, bi erronka bermea dute. Mitre Korporazioko: Lehenengoa, Catalist bat datorren lehiaketa bat izan zen independentea, hirugarren bat zuzentzen zuen parte. Mitre emandako parte-hartzaile guztiek bi zaratatsua datu fitxategiak parekatzen beharreko, eta hainbat taldetan lehiatu den Mitre datozen onenak itzultzeko. Mitre bera etortze zuzena zenekien delako taldeek lortu izan dute. du 40 enpresek duten lehiatu Of, Catalist bigarren postuan iritsi zen. independentea, hirugarrenen teknologia ebaluazio mota hau oso arraroa eta oso baliotsua da; konfiantza eman behar digu Catalist en matching prozedurak erabiltzen dira, funtsean, egoera-de-la-art at. Baina egoera-de-la-art ona da nahikoa? Bat datorren lehiaketa honetan gain, Ansolabehere eta Hersh beren matching Catalist erronka sortu. lehenago proiektu bat aurrera, Ansolabehere eta Hersh bildu zuen Florida hautesleak erregistroak. Erregistro horiek ematen dute beren eremu Catalist den redacted eta gero Catalist beren balioak benetako eremu horien txostenak aldean batzuekin. Zorionez, Catalist txostenak withheld balioak pasea, Catalist partziala hautesleak erregistroak datoz bat izan du bere datuak fitxategi nagusia kalera adieraziz. bi erronka horiek, inork hirugarrenen batek eta inork Ansolabehere eta Hersh arabera, ematen diguten gehiago Catalist bat datorren algoritmoak konfiantza, nahiz eta ezin dugu haiek gauzatzen zehatza berrikusi geure.
Ez dago aurreko askok boto balioztatzeko saiakerak egon dira. Literatura ikuspegi orokor bat lortzeko, ikusi Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , eta Hanmer, Banks, and White (2014) .
Garrantzitsua da jakitea, nahiz eta kasu honetan ikertzaileak ziren Catalist datuen kalitatea animaturik, beste merkataritza-saltzaileek ebaluazioak izan dira gutxiago gogotsu. Ikertzaileak kalitate txarrekoak aurkitu dituzten (eta elkarrekin datuak batu hiru hornitzaile bera: Acxiom, Experian, eta infoUSA) kontsumo-fitxategi batean Marketing Systems Group tik inkesta baten datuak (Pasek et al. 2014) . Hau da, datu-fitxategia ez dator inkestaren erantzunak ikertzaileek espero zuzena izan, datafile zuen galdera-kopuru handi bat, eta falta diren datuak eredua egiteko datuak falta korrelazioan du inkesta balio (beste hitz falta datu sistematikoak zen , ez ausazko).
Inkestak eta administrazio-datuak arteko erregistroak batzeko buruz gehiago jakiteko, ikusi Sakshaug and Kreuter (2012) eta Schnell (2013) . Erregistroak batzeko on orokorrago, ikus Dunn (1946) eta Fellegi and Sunter (1969) (historikoa) eta Larsen and Winkler (2014) (modernoa). Antzeko planteamendu batzuk ere informatika garatu dira, besteak beste, datu Deduplication, esate identifikazioa, izen bat datorren, bikoiztuak detektatzeko, izen pean, eta bikoiztu erregistroa detektatzeko (Elmagarmid, Ipeirotis, and Verykios 2007) . Badira ere pribatutasuna planteamendu mantentzea batze horrek ez pertsonalki identifikatzeko informazioa transmisioa eskatzen grabatzeko (Schnell 2013) . Facebook ikertzaileek prozedura bat garatu behar probabilisticsly lotzen bere erregistro boto portaera (Jones et al. 2013) ; lotura hori esperimentu bat dudala esango 4. kapituluan buruz ebaluatzeko egin zen (Bond et al. 2012) .
eskala handiko gobernuak administrazio-erregistroen gizarte inkesta bat lotzen dituen beste adibide Osasun eta Erretiro Inkesta eta Gizarte Segurantzaren Administrazioaren dator. Azterketa horretan gehiago eskuratzeko, baimenaren prozedurak buruzko informazioa barne, ikusi Olson (1996) eta Olson (1999) .
administrazio-erregistroak iturri asko konbinatuz maisu datafile-prozesu hori Catalist langile-da gobernuak zenbait estatistika-bulego ohikoa bilakatu prozesua. Estatistikak Suedian bi ikertzaile gaiari buruzko liburu zehatzago bat idatzi dute (Wallgren and Wallgren 2007) . (Olmstead County, AEB, Mayo Klinika home), Estatu Batuetako county bakar bat ere planteamendu hau adibide bat lortzeko, ikusi Sauver et al. (2011) . Hori da administrazioaren erregistro agertzen akatsak buruz gehiago jakiteko, ikusi Groen (2012) .