Sehemu hii ni iliyoundwa kutumiwa kama rejea, badala ya kusomwa kama hadithi.
Wengi wa mandhari katika sura hii pia wamekuwa aliunga katika Addresses hivi karibuni Rais katika Chama cha Marekani ya Umma Maoni Utafiti (AAPOR), kama vile Dillman (2002) , Newport (2011) , Santos (2014) , na Link (2015) .
Kwa kihistoria zaidi background kuhusu maendeleo ya utafiti utafiti, angalia Smith (1976) na Converse (1987) . Kwa zaidi juu ya wazo la eras mitatu ya utafiti utafiti, angalia Groves (2011) na Dillman, Smyth, and Christian (2008) (ambayo mapumziko juu eras tatu tofauti kidogo).
Kilele ndani ya kipindi cha mpito kutoka la kwanza hadi zama pili katika utafiti utafiti ni Groves and Kahn (1979) , ambayo haina kina kichwa-kwa-kichwa kulinganisha kati ya uso kwa uso na simu utafiti. Brick and Tucker (2007) inaonekana nyuma katika maendeleo ya kihistoria ya random tarakimu haraka sampuli mbinu.
Kwa zaidi jinsi utafiti utafiti imebadilika katika siku za nyuma katika kukabiliana na mabadiliko katika jamii, kuona Tourangeau (2004) , Mitofsky (1989) , na Couper (2011) .
Kujifunza kuhusu hali za ndani kwa kuuliza maswali inaweza kuwa tatizo kwa sababu wakati mwingine waliohojiwa wenyewe si ufahamu wa majimbo yao ya ndani. Kwa mfano, Nisbett and Wilson (1977) na karatasi ajabu na cheo evocative: "Akielezea zaidi tunaweza kujua:. Ripoti Verbal juu ya michakato ya akili" Katika karatasi waandishi kuhitimisha: "masomo ni wakati mwingine (a) hawajui kuwepo kwa kichocheo kwamba muhimu kusukumwa majibu, (b) hawajui uwepo wa majibu, na (c) hawajui kwamba kichocheo imeathiri majibu. "
Kwa hoja kwamba watafiti lazima wanapendelea tabia aliona kwa taarifa tabia au mitazamo, angalia Baumeister, Vohs, and Funder (2007) (saikolojia) na Jerolmack and Khan (2014) na majibu (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (sosholojia). tofauti kati ya kuuliza na kuchunguza pia lililojitokeza katika uchumi, ambapo watafiti kuzungumza kuhusu mapendekezo alisema na umebaini. Kwa mfano, mtafiti anaweza kuuliza waliohojiwa kama wao wanapendelea kula ice cream au kwenda kwa mazoezi (alisema upendeleo) au utafiti inaweza kuchunguza jinsi mara nyingi watu kula ice cream na kwenda kwa mazoezi (umebaini upendeleo). Kuna kina wasiwasi wa aina fulani ya data alisema upendeleo katika uchumi (Hausman 2012) .
mada kuu kutoka mijadala hii ni kwamba tabia iliyoripotiwa si mara zote sahihi. Lakini, moja kwa moja kumbukumbu ya tabia inaweza kuwa sahihi, inaweza kukusanywa juu ya sampuli ya riba, na inaweza kuwa kupatikana kwa watafiti. Hivyo, katika baadhi ya hali, nadhani kwamba tabia kuripoti inaweza kuwa na manufaa. Zaidi ya hayo, pili kuu mandhari kutoka mijadala hii ni kwamba ripoti kuhusu hisia, maarifa, matarajio, na maoni ni daima si sahihi. Lakini, kama taarifa kuhusu mataifa haya ndani zinahitajika kwa watafiti-ama kusaidia kuelezea baadhi ya tabia au kama kitu kuelezwa-kisha kuuliza inaweza kuwa sahihi.
Kwa kitabu urefu matibabu juu ya makosa jumla utafiti, angalia Groves et al. (2009) au Weisberg (2005) . Kwa historia ya maendeleo ya makosa jumla utafiti, angalia Groves and Lyberg (2010) .
Katika suala la uwakilishi, kuanzishwa kubwa kwa masuala ya majibu yasiyo na majibu yasiyo na upendeleo ripoti Baraza la Taifa la Utafiti juu nonresponse katika Sayansi ya Jamii Tafiti: Agenda Utafiti (2013) . Maelezo kingine muhimu ni zinazotolewa na (Groves 2006) . Pia, nzima masuala maalum ya Jarida la Official Takwimu, Public Maoni Quarterly, na Annals ya American Academy of Political na Sayansi ya Jamii yamechapishwa juu ya mada ya mashirika yasiyo ya majibu. Hatimaye, kuna njia kweli nyingi tofauti ya kuhesabu kiwango mwitikio; njia hizi ni maelezo kwa undani katika ripoti ya Chama cha Marekani ya Umma Maoni Watafiti (AAPOR) (Public Opinion Researchers} 2015) .
1936 Fasihi Digest uchaguzi imekuwa alisoma kwa kina (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Ni pia imekuwa kutumika kama mfano na kuonya dhidi ya usiokuwa wa mpangilio ukusanyaji wa takwimu (Gayo-Avello 2011) . Mwaka 1936, George Gallup kutumika fomu ya kisasa zaidi ya sampuli, na alikuwa na uwezo wa kuzalisha makadirio sahihi zaidi na sampuli ndogo sana. Mafanikio Gallup ya juu Fasihi Digest ilikuwa ni hatua ya maendeleo ya utafiti utafiti (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .
Katika suala la upimaji, kwanza kubwa ya rasilimali kwa ajili ya kubuni maswali ni Bradburn, Sudman, and Wansink (2004) . Kwa ajili ya matibabu ya juu zaidi kulenga hasa juu ya maswali tabia, angalia Schuman and Presser (1996) . Zaidi juu ya maswali kabla ya kupima inapatikana katika Presser and Blair (1994) , Presser et al. (2004) , na Sura ya 8 ya Groves et al. (2009) .
Classic, kitabu-urefu matibabu ya biashara-off kati ya gharama za utafiti na makosa utafiti ni Groves (2004) .
Classic kitabu-urefu matibabu ya kiwango cha uwezekano sampuli na makadirio ni Lohr (2009) (zaidi ya utangulizi) na Särndal, Swensson, and Wretman (2003) (zaidi juu). Classic kitabu-urefu matibabu ya mbinu za baada ya stratification na kuhusiana ni Särndal and Lundström (2005) . Katika baadhi ya mazingira digital umri, watafiti kujua kabisa kidogo kuhusu yasiyo ya waliohojiwa, ambayo ilikuwa si mara nyingi kweli katika siku za nyuma. Aina mbalimbali za marekebisho majibu yasiyo yanawezekana wakati watafiti kuwa na taarifa kuhusu yasiyo ya waliohojiwa (Kalton and Flores-Cervantes 2003; Smith 2011) .
Utafiti Xbox ya Wang et al. (2015) anatumia mbinu ya kuitwa multilevel regression na baada ya stratification (MRP, wakati mwingine inaitwa "Mister P") ambayo inaruhusu watafiti kukadiria kiini ina maana hata wakati kuna watu wengi, seli nyingi. Ingawa kuna baadhi ya mjadala kuhusu ubora wa makadirio kutoka mbinu hii, inaonekana kama eneo la kuahidi kuchunguza. Mbinu mara ya kwanza kutumika katika Park, Gelman, and Bafumi (2004) , na kumekuwa baadae matumizi na mjadala (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Kwa zaidi juu ya uhusiano kati ya uzito wa mtu binafsi na uzito kiini makao angalia Gelman (2007) .
Kwa mbinu nyingine na tafiti Viktning mtandao, angalia Schonlau et al. (2009) , Valliant and Dever (2011) , na Bethlehem (2010) .
Mfano wa vinavyolingana alikuwa uliopendekezwa na Rivers (2007) . Bethlehem (2015) anasema kuwa utendaji wa sampuli vinavyolingana kweli kuwa sawa na mbinu nyingine sampuli (kwa mfano, stratified sampuli) na mbinu nyingine marekebisho (kwa mfano, baada ya stratification). Kwa zaidi juu ya paneli online, kuona Callegaro et al. (2014) .
Wakati mwingine watafiti wamegundua kwamba uwezekano sampuli na sampuli zisizo uwezekano mavuno makadirio ya ubora sawa (Ansolabehere and Schaffner 2014) , lakini kulinganisha wengine wamegundua kwamba yasiyo ya uwezekano sampuli kufanya mbaya (Malhotra and Krosnick 2007; Yeager et al. 2011) . Moja ya sababu inawezekana kwa tofauti hizi ni kwamba mashirika yasiyo ya uwezekano sampuli na kuboreshwa baada ya muda. Kwa mtazamo zaidi tamaa ya mashirika yasiyo ya uwezekano sampuli mbinu angalia AAPOR kamati maalumu ya Non-uwezekano uchaguzi katika utafiti (Baker et al. 2013) , na mimi pia kupendekeza kusoma ufafanuzi kwamba ifuatavyo ripoti muhtasari.
Kwa Uchambuzi juu ya athari za Viktning kupunguza upendeleo katika sampuli zisizo uwezekano, tazama Jedwali 2.4 mwaka Tourangeau, Conrad, and Couper (2013) , ambayo inaongoza waandishi kuhitimisha "marekebisho wanaonekana kuwa na manufaa lakini dosari marekebisho. . . "
Conrad and Schober (2008) hutoa kiasi mwisho yenye jina la envisioning Survey Mahojiano ya Baadaye, na anwani wengi wa mandhari katika sehemu hii. Couper (2011) anazungumzia mandhari sawa, na Schober et al. (2015) inatoa mfano mzuri wa jinsi mbinu ukusanyaji wa takwimu kwamba ni kulengwa na kuweka mpya inaweza kusababisha data ubora wa juu.
Kwa mfano mwingine kuvutia ya kutumia Facebook programu kwa ajili ya tafiti sayansi ya jamii, kuona Bail (2015) .
Kwa ushauri zaidi juu ya maamuzi tafiti uzoefu wa kufurahisha na thamani kwa ajili ya washiriki, kuona kazi juu ya Tailored Design Method (Dillman, Smyth, and Christian 2014) .
Stone et al. (2007) inatoa kitabu urefu matibabu ya kimazingira ya muda wa kitambo tathmini na mbinu kuhusiana.
Judson (2007) alieleza mchakato wa kuchanganya tafiti na data utawala kama "habari ushirikiano," kujadili baadhi ya mbinu hii, na inatoa baadhi ya mifano.
Njia nyingine ambayo watafiti wanaweza kutumia athari digital na data utawala ni sampuli hii kwa watu wenye sifa maalum. Hata hivyo, kupata kumbukumbu hizo kutumiwa sampuli hii inaweza pia kuunda maswali kuhusiana na faragha (Beskow, Sandler, and Weinberger 2006) .
Kuhusu kuuliza alijiinua, mbinu hii si kama mpya kama inaweza kuonekana kutoka jinsi nimekuwa alieleza. Mbinu hii ina uhusiano mzito maeneo matatu kubwa katika takwimu-mfano makao baada ya stratification (Little 1993) , imputation (Rubin 2004) , na ndogo eneo la kukadiria (Rao and Molina 2015) . Pia ni kuhusiana na matumizi ya vigezo surrogate katika utafiti wa matibabu (Pepe 1992) .
Mbali na masuala ya kimaadili kuhusu kupata data digital kuwaeleza, alijiinua kuuliza pia inaweza kutumika kwa kudai sifa nyeti kwamba watu wanaweza kuchagua yatangaza katika utafiti (Kosinski, Stillwell, and Graepel 2013) .
Gharama na muda makadirio katika Blumenstock, Cadamuro, and On (2015) rejea zaidi kwa kutofautiana gharama gharama za moja gharama utafiti-na ziada si ni pamoja na fasta kama vile gharama ya kusafisha na mchakato wa data simu. Kwa ujumla, alijiinua kuuliza pengine high gharama za kudumu na chini kutofautiana gharama sawa na majaribio digital (tazama Sura ya 4). Maelezo zaidi juu ya data kutumika katika Blumenstock, Cadamuro, and On (2015) karatasi ni katika Blumenstock and Eagle (2010) na Blumenstock and Eagle (2012) . Mbinu kutoka nyingi imputuation (Rubin 2004) inaweza kusaidia kukamata uhakika katika makadirio kutoka kuuliza alijiinua. Kama watafiti akifanya alijiinua kuuliza huduma kuhusu mashtaka jumla ya mabao, badala ya sifa ya mtu binafsi ngazi tu, ndipo hatua katika King and Lu (2008) na Hopkins and King (2010) inaweza kuwa na manufaa. Kwa zaidi kuhusu mbinu kujifunza mashine katika Blumenstock, Cadamuro, and On (2015) , angalia James et al. (2013) (zaidi ya utangulizi) au Hastie, Tibshirani, and Friedman (2009) (zaidi juu). Mwingine maarufu mashine kujifunza vitabu vya kiada ni Murphy (2012) .
Kuhusu utajiri kuuliza, matokeo katika Ansolabehere na Hersh (2012) pata juu ya hatua mbili muhimu: 1) uwezo wa Catalist kuchanganya wengi disparate data vyanzo kuzalisha sahihi bwana datafile na 2) uwezo wa Catalist kuunganisha takwimu za utafiti kwa bwana wake datafile. Kwa hivyo, Ansolabehere na Hersh kuangalia kila moja ya hatua hizi kwa makini.
Kujenga bwana datafile, Catalist inaunganisha na linapatana taarifa kutoka vyanzo mbalimbali ikiwa ni pamoja na: mbalimbali rekodi ya kupiga kura snapshots kutoka kila jimbo, data kutoka idadi ya Posta ya Badilisha Taifa ya mitaani Msajili, na data kutoka kwa watoa huduma wengine isiyojulikana ya kibiashara. maelezo gory kuhusu jinsi ya kusafisha hii yote na kuunganisha hutokea ni zaidi ya upeo wa kitabu hiki, lakini mchakato huu, bila kujali jinsi makini, itakuwa kueneza makosa katika awali vyanzo vya takwimu na mapenzi kuanzisha makosa. Ingawa Catalist alikuwa tayari kujadili usindikaji wake data na kutoa baadhi ya data ghafi yake, ilikuwa vigumu tu kwa watafiti wa mapitio nzima Catalist data bomba. Badala yake, watafiti walikuwa katika hali ambapo Catalist data file na baadhi haijulikani, na labda hajulikani, kiasi cha makosa. Hii ni wasiwasi mkubwa kwa sababu critic inaweza kubashiri kwamba tofauti kubwa kati ya ripoti ya utafiti juu ya CCES na tabia katika Catalist file bwana data yalisababishwa na makosa katika faili bwana data, na si kwa misreporting na washiriki.
Ansolabehere na Hersh alichukua njia mbili tofauti ya kushughulikia wasiwasi data ubora. Kwanza, katika Mbali na kulinganisha binafsi taarifa kupiga kura kwa kupiga kura katika Catalist bwana faili, watafiti pia ikilinganishwa binafsi taarifa ya chama, rangi, mpiga kura hadhi usajili (kwa mfano, kusajiliwa au haijasajiliwa) na njia ya kupiga kura (kwa mfano, katika mtu, absentee kura, nk) kwa maadili hayo hupatikana katika database Catalist. Kwa hizi nne vigezo idadi ya watu, watafiti kupatikana viwango vya juu zaidi ya makubaliano kati ya ripoti ya utafiti na data katika Catalist bwana faili kuliko kwa ajili ya kupiga kura. Hivyo, Catalist bwana data file inaonekana kuwa na ubora wa habari kwa ajili ya sifa nyingine ya kupiga kura, na kupendekeza kuwa siyo ya maskini ubora wa jumla. Pili, katika sehemu kwa kutumia data kutoka Catalist, Ansolabehere na Hersh maendeleo hatua tatu tofauti za ubora wa kumbukumbu za kata kupiga kura, na waligundua kuwa inakadiriwa kiwango cha juu-kutoa taarifa ya kupiga kura alikuwa kimsingi lisilohusiana na yoyote ya hatua hizi data ubora, kutafuta kuwa zinaonyesha kwamba viwango vya juu vya juu-kuripoti si likiendeshwa na Wilaya na chini mno ubora data.
Kutokana na kuundwa kwa hii bwana kupiga kura file, Chanzo cha pili cha makosa uwezo ni kuunganisha rekodi utafiti na hiyo. Kwa mfano, kama uhusiano hii inafanywa kimakosa inaweza kusababisha makadirio ya juu ya tofauti kati ya taarifa na kuthibitishwa kupiga kura tabia (Neter, Maynes, and Ramanathan 1965) . Kama kila mtu alikuwa imara, kipekee kitambulisho kwamba alikuwa katika wawili vyanzo data, basi uhusiano itakuwa na maana. Katika Marekani na wengi nchi nyingine, hata hivyo, hakuna kitambulisho wote. Zaidi ya hayo, hata kama kulikuwa na vile kitambulisho watu pengine ingekuwa tvekar kutoa ni kufanya utafiti wa watafiti! Hivyo, Catalist alikuwa na kufanya uhusiano kwa kutumia vitambulisho vya mkamilifu, katika kesi hii vipande vinne vya habari kuhusu kila mhojiwa: jina, jinsia, mwaka wa kuzaliwa, na anwani ya nyumbani. Kwa mfano, Catalist alikuwa na kuamua kama Homie J Simpson katika CCES alikuwa mtu sawa kama Homer Jay Simpson katika faili zao bwana data. Katika mazoezi, vinavyolingana ni ngumu na messy mchakato, na, kufanya mambo mabaya kwa watafiti, Catalist kuchukuliwa vinavyolingana mbinu yake kuwa wamiliki.
Ili kuhalalisha algorithms vinavyolingana, wao kutegemewa na changamoto mbili. Kwanza, Catalist walishiriki katika mashindano vinavyolingana kwamba ilikuwa inaendeshwa na huru, wa tatu: Mitre Corporation. Mitre zinazotolewa washiriki wote wawili data kelele files kwa kuendana na timu mbalimbali alishiriki kurudi Mitre vinavyolingana bora. Kwa sababu Mitre yenyewe alijua vinavyolingana sahihi waliweza alama timu. Ya makampuni 40 kwamba alishiriki, Catalist alikuja katika nafasi ya pili. Aina hii ya huru, wa tatu tathmini ya teknolojia ya wamiliki ni nadra kabisa na incredibly thamani; ni lazima kutupa imani kwamba Catalist ya vinavyolingana taratibu ni kimsingi katika hali ya-ya sanaa. Lakini ni hali ya-ya sanaa nzuri ya kutosha? Mbali na shindano hili vinavyolingana, Ansolabehere na Hersh umba vinavyolingana yao wenyewe changamoto kwa Catalist. Kutokana na mradi mapema, Ansolabehere na Hersh alikuwa zilizokusanywa rekodi wapiga kura kutoka Florida. Wao zinazotolewa baadhi ya rekodi hizi na baadhi ya mashamba yao redacted kwa Catalist na kisha ikilinganishwa na ripoti Catalist ya mashamba hayo na maadili yao halisi. Kwa bahati nzuri, taarifa Catalist walikuwa karibu na maadili limehifadhiwa, kuonyesha kwamba Catalist inaweza mechi rekodi ubaguzi mpiga kura kwenye faili zao bwana data. Changamoto hizi mbili, moja kwa tatu na moja kwa Ansolabehere na Hersh, kutupa ujasiri zaidi katika Catalist algorithms vinavyolingana, ingawa hatuwezi kupitia zao utekelezaji halisi sisi wenyewe.
Kumekuwa na jitihada nyingi uliopita na kuhalalisha kupiga kura. Kwa maelezo ya fasihi kwamba, kuona Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , na Hanmer, Banks, and White (2014) .
Ni muhimu kutambua kwamba ingawa katika kesi hii watafiti walikuwa moyo na ubora wa data kutoka Catalist, tathmini nyingine ya wachuuzi kibiashara wamekuwa chini ya shauku. Watafiti wamegundua duni wakati data kutoka utafiti kwa walaji-file kutoka Marketing Systems Group (ambayo yenyewe zimeunganishwa pamoja data kutoka kwa watoa tatu: Acxiom, Experian, na infoUSA) (Pasek et al. 2014) . Yaani, file data hakuwa na mechi majibu ya utafiti kwamba watafiti anatarajiwa kuwa sahihi, datafile alikuwa kukosa data kwa idadi kubwa ya maswali, na data kukosa muundo alikuwa correlated thamani The taarifa utafiti (kwa maneno mengine data kukosa alikuwa utaratibu , si random).
Kwa zaidi juu ya rekodi uhusiano kati ya tafiti na data utawala, angalia Sakshaug and Kreuter (2012) na Schnell (2013) . Kwa zaidi juu ya rekodi uhusiano kwa ujumla, kuona Dunn (1946) na Fellegi and Sunter (1969) (historical) na Larsen and Winkler (2014) (ya kisasa). Mbinu kama hizo pia imekuwa maendeleo katika sayansi ya kompyuta chini ya majina kama vile data deduplication, mfano kitambulisho, jina vinavyolingana, duplicate kugundua, na duplicate rekodi kugundua (Elmagarmid, Ipeirotis, and Verykios 2007) . Pia kuna faragha kuhifadhi mbinu kurekodi uhusiano ambayo hayahitaji maambukizi ya taarifa binafsi kutambua (Schnell 2013) . Watafiti katika Picha maendeleo utaratibu wa probabilisticsly kuhusisha rekodi zao na tabia ya kupiga kura (Jones et al. 2013) ; uhusiano hilo lilifanyika ili kutathmini majaribio kwamba mimi nitakuambia kuhusu katika sura ya 4 (Bond et al. 2012) .
Mfano mwingine wa kuunganisha kwa kiasi kikubwa utafiti kijamii na rekodi za serikali kiutawala linatokana na Afya na Survey Retirement na Utawala wa Hifadhi ya Jamii. Kwa zaidi juu ya utafiti huo, ikiwa ni pamoja na taarifa kuhusu utaratibu ridhaa, angalia Olson (1996) na Olson (1999) .
mchakato wa kuchanganya vyanzo vingi vya kumbukumbu ya utawala katika bwana datafile-mchakato kwamba Catalist wafanyakazi-ni ya kawaida katika ofisi za takwimu za serikali baadhi ya kitaifa. Watafiti wawili kutoka Takwimu Sweden wameandika kitabu kina juu ya mada (Wallgren and Wallgren 2007) . Kwa mfano wa mfumo huu katika kata moja nchini Marekani (Olmstead County, Minnesota, nyumba ya Mayo Clinic), angalia Sauver et al. (2011) . Kwa zaidi juu ya makosa ambayo inaweza kuonekana katika kumbukumbu ya utawala, angalia Groen (2012) .