Daudzi no šīs nodaļas tematiem ir atkārtoti minēti nesenajā prezidenta amatā Amerikas Asociācijas sabiedriskās domas pētījumu (AAPOR), piemēram, Dillman (2002) , Newport (2011) , Santos (2014) un Link (2015)
Plašāku informāciju par atšķirībām starp aptauju pētījumiem un padziļinātām intervijām skatiet sadaļā Small (2009) . Saistīts ar padziļinātām intervijām ir pieeju ģimene, ko sauc par etnogrāfiju. Etnogrāfiskajā pētniecībā pētnieki parasti pavada daudz laika dalībniekiem savā dabiskajā vidē. Plašāku informāciju par atšķirībām starp etnogrāfiju un padziļinātām intervijām skatiet Jerolmack and Khan (2014) . Plašāku informāciju par digitālo etnogrāfiju skatiet Pink et al. (2015) .
Aptauju izpētes vēstures apraksts ir pārāk īss, lai iekļautu daudzus no aizraujošajiem notikumiem. Sīkāku informāciju par vēsturi skatīt Smith (1976) , Converse (1987) un Igo (2008) . Plašāku informāciju par triju pētījumu izpētes periodu skatīt Groves (2011) un Dillman, Smyth, and Christian (2008) (kas trīs reizes atšķiras nedaudz savādāk).
Groves and Kahn (1979) piedāvā pētīt pētījumus pārejā no pirmās uz otro laikmeta, veicot detalizētu salīdzinājumu starp aci pret aci un telefona aptauju. ( ??? ) atskatīties uz nejaušu ciparu numura paraugu ņemšanas metožu vēsturisko attīstību.
Lai uzzinātu vairāk par to, kā pagātnē pētījumi ir mainījušies, reaģējot uz izmaiņām sabiedrībā, skatiet Tourangeau (2004) , ( ??? ) un Couper (2011) .
Psihologi (piemēram, Baumeister, Vohs, and Funder (2007) ) un sociologi (piemēram, Jerolmack and Khan (2014) , Maynard (2014) , Cerulo (2014) , Vaisey (2014) , Jerolmack and Khan (2014) ]. Starpība starp jautājumu un novērojumu rodas arī ekonomikā, kurā pētnieki runā par noteiktiem un atklātiem priekšrakstiem. Piemēram, pētnieks varētu jautāt respondentiem, vai viņi vēlas ēst saldējumu vai doties uz sporta zāli (norādītās izvēles) vai varēja novērot, cik bieži cilvēki ēd saldējumu un dodas uz sporta zāli (atklātās izvēles). Pastāv dziļs skepticisms attiecībā uz noteiktiem norādīto veidu preferenču datiem ekonomikā, kā aprakstīts Hausman (2012) .
Šo diskusiju galvenā tēma ir tāda, ka ziņotā uzvedība ne vienmēr ir precīza. Tomēr, kā aprakstīts 2. nodaļā, lielie datu avoti var nebūt precīzi, tos var neiekļūt interesējošā paraugā, un tie var nebūt pieejami pētniekiem. Tādējādi es domāju, ka dažās situācijās ziņotā rīcība var būt noderīga. Turklāt otra galvenā diskusiju tēma ir tā, ka ziņojumi par emocijām, zināšanām, cerībām un viedokļiem ne vienmēr ir precīzi. Bet, ja pētnieki ir nepieciešami informācija par šīm iekšējām valstīm - vai nu lai palīdzētu izskaidrot kādu uzvedību vai kā izskaidrojamu - tad jautājums var būt piemērots. Protams, uzzināt par iekšējām valstīm, uzdodot jautājumus, var būt problemātiska, jo reizēm paši respondenti nav informēti par viņu iekšējiem stāvokļiem (Nisbett and Wilson 1977) .
Groves (2004) 1. nodaļa Groves (2004) ir lielisks darbs, kas saskaņo reizēm neatbilstošo terminoloģiju, ko izmanto aptaujas pētnieki, lai aprakstītu kopējo apsekojumu kļūdu sistēmu. Grāmatu garuma apstrāde attiecībā uz kopējo apsekojumu kļūdu sistēmu skat. Groves et al. (2009) un vēsturisku pārskatu skatīt Groves and Lyberg (2010) .
Ideja par kļūdas sadalīšanos neobjektivitātē un dispersijā arī parādās mašīnu apmācībā; skatīt, piemēram, Hastie, Tibshirani, and Friedman (2009) 7.3. iedaļu. Tas bieži liek pētniekiem runāt par "neobjektivitātes atšķirību" kompromisu.
Reprezentācijas ziņā lielisks ievads neatbildēšanas un neatbildēšanas jautājumos ir Nacionālās pētniecības padomes ziņojums Neatbildes reakcija sociālās zinātnes aptaujās: pētniecības programma (2013) . Vēl viens noderīgs pārskats ir Groves (2006) . Tika publicēti arī īpaši Oficiālā Vēstneša žurnāla , Sabiedriskās domas ceturkšņa izdevumi un Amerikas Vēstures un sociālo zinātņu akadēmijas publikācijas par neatbildēšanas tēmu. Visbeidzot, reaģēšanas ātruma aprēķināšanai ir daudz dažādu veidu; šīs pieejas ir sīki aprakstītas Amerikas Sabiedriskās domas pētnieku asociācijas (AAPOR) ( ??? ) ziņojumā.
Cahalan (1989) par 1936. gada Literatūras Digest aptauju skatiet Bryson (1976) , Squire (1988) , Cahalan (1989) un Lusinchi (2012) . Vēl viena diskusija par šo aptauju kā līdzības brīdinājumu pret nejaušās datu vākšanu ir pieejama Gayo-Avello (2011) . Džordžs Gallups 1936. gadā izmantoja sarežģītāku paraugu veidošanas metodi un spēja sagatavot precīzākus aprēķinus ar daudz mazāku paraugu. Gallup panākumi literārajā apkopojumā bija nozīmīgs solis pētījumu izpētes attīstībā, kā aprakstīts @ converse_survey_1987 3. nodaļā; Ohmer (2006) nodaļa 4 Ohmer (2006) ; un @ igo_averaged_2008 3. nodaļa.
Bradburn, Sudman, and Wansink (2004) ziņā lielisks pirmais resurss aptauju veidošanai ir Bradburn, Sudman, and Wansink (2004) . Lai iegūtu vairāk uzlabotu ārstēšanu, skatīt Schuman and Presser (1996) , kas ir īpaši vērsts uz attieksmes jautājumiem, un Saris and Gallhofer (2014) , kas ir vispārīgāks. Nedaudz atšķirīga pieeja mērījumu ir pieņemts psychometrics, kā aprakstīts ( ??? ) . Vairāk par pretestēšanu ir pieejama Presser and Blair (1994) , Presser et al. (2004) un Groves et al. (2009) 8. nodaļā Groves et al. (2009) . Plašāku informāciju par apsekojumu eksperimentiem skatiet sadaļā Mutz (2011) .
Runājot par izmaksām, " Groves (2004) klasiskā, uzskaites ilguma pieeja kompromisam starp aptaujas izmaksām un aptaujas kļūdām.
Divas klasiskās Särndal, Swensson, and Wretman (2003) standarta varbūtības paraugu ņemšanas un novērtēšanas metodes ir Lohr (2009) (vairāk ievada) un Särndal, Swensson, and Wretman (2003) (vairāk progresīvas). Klasiskais Särndal and Lundström (2005) režīms pēc stratifikācijas un saistītām metodēm ir Särndal and Lundström (2005) . Dažos digitālā vecuma iestatījumos pētnieki zina daudz nedaudz par nerezidentiem, kas pagātnē bieži vien nav taisnība. Dažādi neuzstādījumu korekcijas veidi ir iespējami, ja pētniekiem ir pieejama informācija par nerezidentiem, kā to raksturo Kaltons Kalton and Flores-Cervantes (2003) un Smith (2011) .
W. Wang et al. (2015) Xbox pētījums W. Wang et al. (2015) izmanto metodi, ko sauc par daudzlīmeņu regresiju un pēc stratifikācijas ("Mr P."), kas ļauj pētniekiem novērtēt grupas līdzekļus pat tad, ja ir daudzas, daudzas grupas. Lai gan ir zināmas debates par aplēšu kvalitāti, izmantojot šo metodi, šķiet, ka tā ir daudzsološa joma, ko izpētīt. Šī metode pirmo reizi tika izmantota Park, Gelman, and Bafumi (2004) , un pēc tam tika izmantotas Park, Gelman, and Bafumi (2004) (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Plašāku informāciju par saikni starp atsevišķiem svariem un grupu svariem skatiet sadaļā Gelman (2007) .
Citas pieejas tīmekļa apsekojumu svēršanai sk. Schonlau et al. (2009) , Bethlehem (2010) un Valliant and Dever (2011) . Tiešsaistes paneļi var izmantot vai nu varbūtības paraugu ņemšanu, vai nekontrolētu paraugu ņemšanu. Plašāku informāciju par tiešsaistes paneļiem skatiet Callegaro et al. (2014) .
Dažreiz pētnieki ir noskaidrojuši, ka varbūtības paraugi un ne varbūtības paraugi iegūst līdzīgas kvalitātes novērtējumus (Ansolabehere and Schaffner 2014) , bet citi salīdzinājumi ir atklājuši, ka ne varbūtības paraugi ir sliktāki (Malhotra and Krosnick 2007; Yeager et al. 2011) . Viens no iespējamiem iemesliem šīm atšķirībām ir tas, ka ne varbūtības paraugi laika gaitā ir uzlabojušies. Par pesimistiskāku viedokli par nevēlamu paraugu ņemšanas metodēm skatiet AAPOR neparedzamās izlases veida darba grupu (Baker et al. 2013) , un es arī ieteiktu izlasīt komentāru, kas seko kopsavilkuma ziņojumam.
Conrad and Schober (2008) ir rediģēts apjoms ar nosaukumu Enviance Survey Intervija par nākotni , un tas piedāvā dažādus viedokļus par nākotnes uzdot jautājumus. Couper (2011) pievēršas līdzīgām tēmām, un Schober et al. (2015) ir jauks piemērs tam, kā datu apkopošanas metodes, kas pielāgotas jaunam iestatījumam, var radīt augstākas kvalitātes datus. Schober and Conrad (2015) piedāvā vispārīgāku argumentu par to, ka turpina koriģēt aptaujas pētījumu procesu, lai tas atbilstu pārmaiņām sabiedrībā.
Tourangeau and Yan (2007) pārskata jautājumus par sociālās vēlmes neobjektivitāti jutīgos jautājumos, un Lind et al. (2013) ir daži iespējamie iemesli, kāpēc cilvēki varētu atklāt slepenāku informāciju datorizētā intervijā. Plašāk par cilvēka intervētāju lomu, palielinot dalības rādītājus aptaujās, skatīt Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) un Schaeffer et al. (2013) . Plašāku informāciju par jaukto režīmu apskatēm skatiet Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) piedāvā grāmatas garu ekoloģisko momentāno novērtējumu un saistītās metodes.
Lai saņemtu papildu padomu par to, ka aptaujas dalībniekiem ir patīkama un vērtīga pieredze, skatiet darbu pie piemērotas projektēšanas metodes (Dillman, Smyth, and Christian 2014) . Vēl viens interesants piemērs tam, kā lietot Facebook lietotnes sociālo zinātņu aptaujās, skatiet Bail (2015) .
Judson (2007) apraksta aptauju un administratīvo datu apvienošanas procesu kā "informācijas integrāciju" un apspriež dažas šīs pieejas priekšrocības, kā arī piedāvā dažus piemērus.
Attiecībā uz bagātinātu jautājumu, ir bijuši daudzi iepriekšēji mēģinājumi apstiprināt balsošanu. Pārskats par šo literatūru atrodams Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) un Berent, Krosnick, and Lupia (2016) . Skatīt Berent, Krosnick, and Lupia (2016) par skeptiskāku viedokli par Ansolabehere and Hersh (2012) sniegtajiem rezultātiem.
Ir svarīgi atzīmēt, ka, lai gan Ansolabehere un Hersh tika iedrošināti ar Katalistu datu kvalitāti, citi komerciālo pārdevēju vērtējumi bija mazāk entuziastiski. Pasek et al. (2014) bija slikta kvalitāte, kad aptaujas dati tika salīdzināti ar mārketinga sistēmu grupas patērētāju datni (kas apvienoja datus no trim pakalpojumu sniedzējiem: Acxiom, Experian un InfoUSA). Tas nozīmē, ka datu fails nesaskanēja aptaujas atbildes, kuras pētnieki pareizi uztvēra, patērētāju datnei trūka datu par lielu jautājumu skaitu, un trūkstošais datu modelis tika saistīts ar ziņoto apsekojumu vērtību (citiem vārdiem sakot, trūkstošo dati bija sistemātiski, nevis nejauši).
Plašāku informāciju par ierakstu saistību starp apsekojumiem un administratīvajiem datiem skatiet Sakshaug and Kreuter (2012) un Schnell (2013) . Fellegi and Sunter (1969) par ierakstu saikni kopumā skatiet Dunn (1946) un Fellegi and Sunter (1969) (vēsturiskie) un Larsen and Winkler (2014) (mūsdienu). Līdzīgas pieejas ir izstrādātas arī datorzinātnēs ar tādiem nosaukumiem kā datu deduplication, piemēru identifikācija, vārdu saskaņošana, atklāšanas dublēšana un dublikāta ierakstu noteikšana (Elmagarmid, Ipeirotis, and Verykios 2007) . Ir arī privātumu saglabājošas pieejas, lai ierakstītu saikni, kas neprasa personīgi identificējošas informācijas pārsūtīšanu (Schnell 2013) . Pētnieki pie Facebook izstrādāja procedūru, lai varbūtēji saistītu savus ierakstus ar balsošanas gaitu (Jones et al. 2013) ; šī saikne tika veikta, lai novērtētu eksperimentu, ko es jums pastāstīšu 4. nodaļā (Bond et al. 2012) . Plašāku informāciju par reģistrācijas saites saskaņošanas iegūšanu skatiet Sakshaug et al. (2012) .
Cits piemērs liela mēroga sociālās aptaujas saistīšanai ar valdības administratīvajiem ierakstiem ir no Veselības un pensijas aptaujas un Sociālās drošības administrācijas. Plašāku informāciju par šo pētījumu, ieskaitot informāciju par piekrišanas procedūru, skatīt Olson (1996, 1999) .
Daudzu valstu administrāciju reģistru avotu apvienošanas procesā galvenais datu fails - Katalizatora izmantotais process ir izplatīts dažu valstu valdību statistikas iestādēs. Divi pētnieki no Zviedrijas statistikas ir uzrakstījuši detalizētu grāmatu par šo tēmu (Wallgren and Wallgren 2007) . Par piemēru šai pieejai vienā apgabalā Amerikas Savienotajās Valstīs (Ohmstedas grāfiste, Minesota, Mayo klīnikas mājas), skatiet Sauver et al. (2011) . Plašāku informāciju par kļūdām, kas var parādīties administratīvajos ierakstos, skatiet Groen (2012) .
Vēl viens veids, kā pētnieki var izmantot lielus datu avotus izpētes pētījumos, ir paraugu ņemšanas ietvars cilvēkiem ar specifiskām iezīmēm. Diemžēl šī pieeja var radīt jautājumus, kas saistīti ar privātumu (Beskow, Sandler, and Weinberger 2006) .
Attiecībā uz pastiprinātu jautājumu, šī pieeja nav tik jauna, kā tas varētu parādīties no tā, kā es to aprakstīju. Tajā ir dziļi savienojumi ar trīs lielām statistikas jomām: modelēšana pēc stratifikācijas (Little 1993) , imputation (Rubin 2004) un neliela apgabala aplēse (Rao and Molina 2015) . Tas ir saistīts arī ar aizstājēju mainīgo izmantošanu medicīniskajā pētījumā (Pepe 1992) .
Blumenstock, Cadamuro, and On (2015) izmaksu un laika aprēķini vairāk attiecas uz mainīgajām izmaksām - vienai papildu aptaujai - un neietver fiksētās izmaksas, piemēram, zvana datu tīrīšanas un apstrādes izmaksas. Parasti paplašinātam jautājumam, iespējams, būs augstas fiksētās izmaksas un zemas mainīgās izmaksas, kas ir līdzīgas kā digitālajos eksperimentos (sk. 4. nodaļu). Plašāku informāciju par mobilo telefonu aptaujām jaunattīstības valstīs sk. Dabalen et al. (2016) .
Idejas par to, kā padarīt pastiprinātu prasību labāk, es ieteiktu vairāk uzzināt vairāk par ieskaitīšanu (Rubin 2004) . Arī tad, ja pētnieki, kas pastiprināti pieprasa rūpes par kopējo skaitu, nevis individuālā līmeņa pazīmes, tad var būt noderīgas pieejas lietā King and Lu (2008) un Hopkins and King (2010) . Visbeidzot, lai uzzinātu vairāk par mašīnapmācības metodēm Blumenstock, Cadamuro, and On (2015) , skat. James et al. (2013) (vairāk ievada) vai Hastie, Tibshirani, and Friedman (2009) (progresīvāki).
Viena ētiska problēma, kas saistīta ar pastiprinātu jautājumu, ir tā, ka to var izmantot, lai secinātu tādas jutīgas pazīmes, ko cilvēki, iespējams, neizvēlas atklāti aptaujā, kā aprakstīts Kosinski, Stillwell, and Graepel (2013) .