ഈ വിഭാഗം .അതേതു വായിക്കണം പകരം, ഒരു റഫറൻസ് ആയി ഉപയോഗിക്കുന്ന രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്.
ഈ അധ്യായത്തിൽ തീമുകൾ പലരും പോലെയുള്ള പൊതുജനാഭിപ്രായം റിസർച്ച് അമേരിക്കൻ അസോസിയേഷൻ (AAPOR) ഭൂതകാല സമീപകാല പ്രസിഡൻഷ്യൽ വിലാസങ്ങൾ ൽ ഉപ്പയെ ചെയ്തു Dillman (2002) , Newport (2011) , Santos (2014) , ഒപ്പം Link (2015) .
സർവേ റിസർച്ച് വികസനത്തിന് കുറിച്ച് കൂടുതൽ ചരിത്രപ്രാധാന്യമുള്ള, കാണുക Smith (1976) ഉം Converse (1987) . സർവേ റിസർച്ച് മൂന്നു ഈണങ്ങള് ആശയം കൂടുതലറിയാൻ, കാണുക Groves (2011) ഉം Dillman, Smyth, and Christian (2008) (ഏത് അൽപ്പം വ്യത്യസ്തമായി മൂന്ന് കാലഘട്ടങ്ങളിലായി തകർച്ചയ്ക്കു).
സർവേ റിസർച്ച് രണ്ടാം കാലഘട്ടത്തിന്റെ ആദ്യ മാറ്റം ഉള്ളിൽ ഒരു കൊടുമുടിയാണ് Groves and Kahn (1979) ഒരു മുഖം വരെ മുഖാമുഖം, ടെലിഫോൺ സർവേ തമ്മിലുള്ള വിശദമായ തല ലേക്കുള്ള-തല താരതമ്യത്തിന് പറയുന്നില്ല. Brick and Tucker (2007) റാൻഡം അക്ക ഡയലിംഗ് ഒരുപറ്റം രീതികൾ ചരിത്രവികാസമാണ് തിരികെ നോക്കുന്നു.
സർവേ ഗവേഷണ സമൂഹത്തിൽ മാറ്റങ്ങൾ പ്രതികരണമായി കഴിഞ്ഞ മാറ്റി എങ്ങനെ കൂടുതൽ, കാണുക Tourangeau (2004) , Mitofsky (1989) , ഒപ്പം Couper (2011) .
കാരണം ചിലപ്പോൾ സർവേയിൽ തങ്ങളുടെ ഇന്റേണൽ സംസ്ഥാനങ്ങളിൽ അറിയുന്നില്ല ചോദ്യങ്ങൾ ചോദിച്ച് ആന്തരിക സംസ്ഥാനങ്ങളിൽ കുറിച്ച് പഠിക്കുക പ്രശ്നാമാകാം. ഉദാഹരണത്തിന്, Nisbett and Wilson (1977) പേപ്പർ രചയിതാക്കൾ നിഗമനം ൽ ബാല്യത്തിന്റെ ശീർഷകം ഒരു അത്ഭുതകരമായ പേപ്പർ: "മാനസികപ്രക്രിയ ന് സംഭാഷണം റിപ്പോർട്ടുകൾ നമുക്ക് അറിയാൻ കഴിയില്ല അധികം അറിയിച്ചു.": "വിഷയങ്ങളുടെ ചിലപ്പോൾ (എ) അശ്രദ്ധയിൽ പ്രധാനമായും, ഒരു പ്രതികരണം സ്വാധീനിച്ച പ്രതികരണവും നിലനിൽപ്പിനു (ബി) അശ്രദ്ധയിൽ ഒരു ഉത്തേജക, (സി) ഉത്തേജന പ്രതികരണവും ബാധിച്ചു പെട്ടതല്ല അസ്തിത്വം. "
ഗവേഷകർ റിപ്പോർട്ട് പെരുമാറ്റം അല്ലെങ്കിൽ മനോഭാവം ലേക്കുള്ള പ്രവർത്തനരീതി നിരീക്ഷിച്ചു മുൻഗണന നൽകുന്ന ആ വാദങ്ങൾ, കാണുക Baumeister, Vohs, and Funder (2007) (മനഃശാസ്ത്രം) ഉം Jerolmack and Khan (2014) പ്രതികരണങ്ങളും (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (സോഷ്യോളജി). അപേക്ഷിക്കുന്ന നിരീക്ഷിക്കുവാൻ തമ്മിലുള്ള വ്യത്യാസം പുറമേ ഗവേഷകർ പ്രസ്താവിച്ചു മുൻഗണനകളും വെളിപ്പെടുത്തി സംസാരിക്കാവുന്ന എവിടെ എക്കണോമിക്സ്, ഉരുത്തിരിയുന്ന. ഉദാഹരണത്തിന്, ഒരു ഗവേഷകൻ ഐസ്ക്രീം തിന്നും അല്ലെങ്കിൽ ജിമ്മിൽ പോകാതെ (പ്രസ്താവിച്ചു മുൻഗണനകൾ) അല്ലെങ്കിൽ ഗവേഷണ ജനം ഐസ് ക്രീം തിന്നു എത്ര തവണ നിരീക്ഷിക്കുകയും ജിം (അവതരിപ്പിക്കപ്പെട്ട മുൻഗണനകൾ) പോകണം ഇഷ്ടപ്പെടുന്നത് വേണ്ടയോ പ്രതികരിച്ചവരിൽ ചോദിക്കാം. ഇക്കണോമിക്സ് പ്രസ്താവിച്ചു മുൻഗണനകൾ ഡാറ്റ ചില തരത്തിലുള്ള ആഴത്തിലുള്ള കഷ്ണം ഉണ്ട് (Hausman 2012) .
ഈ സംവാദങ്ങൾ നിന്നുള്ള ഒരു പ്രധാന തീം റിപ്പോർട്ട് പ്രവർത്തനരീതി എപ്പോഴും കൃത്യമല്ല എന്നതാണ്. എന്നാൽ, സ്വയം രേഖപ്പെടുത്തി പ്രവർത്തനരീതി കൃത്യത, പലിശ ഒരു സാമ്പിൾ ശേഖരിച്ചു ചെയ്യാം പാടില്ല, അത് ഗവേഷകർ ആക്സസ്സുചെയ്യാവുന്നതാക്കും പാടില്ല. ഇപ്രകാരം, ചില സാഹചര്യങ്ങളിൽ, ഞാൻ റിപ്പോർട്ട് സ്വഭാവം ഉപയോഗപ്പെടും എന്നു തോന്നുന്നു. കൂടുതൽ, ഈ സംവാദങ്ങൾ നിന്ന് ഒരു രണ്ടാം പ്രധാന തീം വികാരങ്ങൾ കുറിച്ച് റിപ്പോർട്ടുകൾ, അറിവ്, പ്രതീക്ഷകൾ, അഭിപ്രായങ്ങളും എല്ലായ്പ്പോഴും കൃത്യവും എന്നതാണ്. എന്നാൽ, ഈ ആന്തരിക സംസ്ഥാനങ്ങളിൽ കുറിച്ചുള്ള വിവരങ്ങൾ ചില പെരുമാറ്റം വിശദീകരിക്കാൻ അല്ലെങ്കിൽ വിശദീകരിച്ചു-പിന്നീട് ചെയ്യാൻ ആവശ്യപ്പെട്ട് കാര്യം ഉചിതമായിരിക്കും പോലെ സഹായിക്കുന്നതിന് ഗവേഷകർ-ഒന്നുകിൽ ആവശ്യമാണെങ്കിൽ.
മൊത്തം സർവേ പിശക് ന് പുസ്തകം നീളം ചികിത്സകൾ, കാണുക Groves et al. (2009) അല്ലെങ്കിൽ Weisberg (2005) . മൊത്തം സർവേ പിശക് വികസന ഒരു ചരിത്രം കാണുക Groves and Lyberg (2010) .
ഒരു ഗവേഷണ അജണ്ട: പ്രാതിനിധ്യം കാര്യത്തിൽ നോൺ-പ്രതികരണവും നോൺ-പ്രതികരണ ബയസ് പ്രശ്നങ്ങളിൽ ഒരു വലിയ ആമുഖം സോഷ്യൽ സയൻസ് സർവേകളുടെ Nonresponse ദേശീയ ഗവേഷണ കൗൺസിൽ റിപ്പോർട്ട് (2013) . മറ്റൊരു ഉപയോഗപ്രദമായ അവലോകനം ലഭ്യമാക്കുന്നു (Groves 2006) . എതിരെ, ഔദ്യോഗിക സ്റ്റാറ്റിസ്റ്റിക്സ് ജേർണൽ, പൊതു അഭിപ്രായം ക്വാർട്ടർലി രാഷ്ട്രീയ അമേരിക്കൻ അക്കാദമി സോഷ്യൽ സയൻസ് ഓഫ് സയൻസസ് മുഴുവൻ പ്രത്യേക പ്രശ്നങ്ങൾ നോൺ-പ്രതികരണ വിഷയത്തെ പ്രസിദ്ധീകരിച്ചിട്ടുണ്ട്. ഒടുവിൽ, പ്രതികരണ നിരക്ക് കണക്കുകളുടെ യഥാർത്ഥത്തിൽ പല മാർഗങ്ങളിലൂടെയും ഉണ്ടു; ഇതിലേതെങ്കിലും പൊതുജനാഭിപ്രായം ഗവേഷകരുടെ അമേരിക്കൻ അസോസിയേഷൻ (AAPOR) ഒരു റിപ്പോർട്ടിൽ വിശദമായി പ്രതിപാദിച്ചിരിക്കുന്നു (Public Opinion Researchers} 2015) .
1936 സാഹിത്യ ഡൈജസ്റ്റ് വോട്ടെടുപ്പ് വിശദമായി പഠിച്ചിട്ടുണ്ട് ചെയ്തു (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . അത് haphazard ഡാറ്റ ശേഖരണം നേരെ മുന്നറിയിപ്പു ഒരു ഉപമ ആയി ഉപയോഗിച്ചു (Gayo-Avello 2011) . 1936 ൽ ജോർജ്ജ് ജൂതരുമാണ് ഒരുപറ്റം ഒരു വഴക്കങ്ങൾ ഫോം ഉപയോഗിച്ചു, ഒരു ചെറിയ സാമ്പിൾ ഉപയോഗിച്ച് കൂടുതൽ കൃത്യമായ എസ്റ്റിമേറ്റുകൾ ഉത്പാദിപ്പിക്കാൻ കഴിഞ്ഞു. സാഹിത്യ ഡൈജസ്റ്റ് മേൽ സർവെ വിജയം സർവേ റിസർച്ച് വികസനത്തിന് ഒരു നാഴികക്കല്ലായി (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .
അളക്കാനുള്ള കാര്യത്തിൽ ചോദ്യാവലി ഡിസൈന് മികച്ച ആദ്യ ഉറവിടമാണ് Bradburn, Sudman, and Wansink (2004) . മനോഭാവം ചോദ്യങ്ങൾ പ്രത്യേകമായി കേന്ദ്രീകരിച്ചായിരുന്നു കൂടുതൽ വിപുലമായ ചികിത്സ, കാണുക Schuman and Presser (1996) . പ്രീ-ടെസ്റ്റിംഗ് ചോദ്യങ്ങൾ കൂടുതൽ ലഭ്യമാണ് Presser and Blair (1994) , Presser et al. (2004) , ഒപ്പം അദ്ധ്യായം 8 Groves et al. (2009) .
ക്ലാസിക്, പുസ്തകം ദൈർഘ്യമുള്ള സർവേ ചെലവുകളും സർവേ പിശകുകൾ തമ്മിലുള്ള വ്യാപാര-ഓഫ് ചികിത്സ ആണ് Groves (2004) .
സാധാരണ പ്രോബബിലിറ്റി ഒരുപറ്റം എന്ന ക്ലാസിക് പുസ്തകം ദൈർഘ്യമുള്ള ചികിത്സയും മതിപ്പു ആകുന്നു Lohr (2009) (കൂടുതൽ ആമുഖ) ഉം Särndal, Swensson, and Wretman (2003) (കൂടുതൽ വിപുലമായ). പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു, അനുബന്ധ രീതികൾ ക്ലാസിക് പുസ്തകം ദൈർഘ്യമുള്ള ചികിത്സ Särndal and Lundström (2005) . ചില ഡിജിറ്റൽ യുഗത്തിൽ ക്രമീകരണം ഗവേഷകർ കഴിഞ്ഞ സത്യമാണ് പലപ്പോഴും ആയിരുന്ന നോൺ-പ്രതികരിച്ചവരിൽ ഏകദേശം അൽപ്പം അറിയുന്നു. ഗവേഷകർ നോൺ-പ്രതികരിച്ചവരിൽ കുറിച്ച് വിവരങ്ങൾ ലഭിക്കുമ്പോൾ നോൺ-പ്രതികരണ അഡ്ജസ്റ്റ്മെന്റ് വിവിധ രൂപങ്ങൾ സാധ്യമാണ് (Kalton and Flores-Cervantes 2003; Smith 2011) .
എന്ന എക്സ്ബോക്സ് പഠനം Wang et al. (2015) ഗവേഷകർ സെൽ ഒട്ടനേകം സെല്ലുകൾ അവിടെ പോലും മാർഗങ്ങൾ കണക്കുകൂട്ടുന്നു അനുവദിക്കുന്ന മൾട്ടിലെവൽ റിഗ്രഷൻ പോസ്റ്റ് നാടകമുണ്ടായിരുന്നു എന്ന ഒരു ടെക്നിക് (എംആർപി, ചിലപ്പോൾ "മിസ്റ്റർ പി" വിളിച്ചു) ഉപയോഗിക്കുന്നു. ഈ രീതി നിന്ന് കണക്കുകളെ കുറിച്ച് തർക്കങ്ങൾ ഉണ്ട് എങ്കിലും, പര്യവേക്ഷണം ഒരു വാഗ്ദാനമാണ് പ്രദേശം തോന്നും. ടെക്നിക്കുകളും ആദ്യം ഉപയോഗിച്ചത് Park, Gelman, and Bafumi (2004) , പിന്നീടുണ്ടായ ഉപയോഗം ആൻഡ് ഡിബേറ്റ് ഉണ്ടായിട്ടുണ്ട് (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . വ്യക്തിഗത തൂക്കവും സെൽ അധിഷ്ഠിത തൂക്കം തമ്മിലുള്ള ബന്ധം കൂടുതലറിയാൻ കാണുന്ന Gelman (2007) .
വെയ്റ്റേജിനു വെബ് സർവേകൾ മറ്റ് സമീപനങ്ങളിലും, കാണുക Schonlau et al. (2009) , Valliant and Dever (2011) , ഒപ്പം Bethlehem (2010) .
സാമ്പിൾ പൊരുത്തപ്പെടുത്തിയാണ് നിലവിലുണ്ടായിരുന്നില്ല Rivers (2007) . Bethlehem (2015) സാമ്പിൾ ചേരുന്ന പ്രകടനം സത്യത്തിൽ മറ്റു ഒരുപറ്റം സമീപനങ്ങളിലും (ഉദാ, തട്ടുകളായി ഒരുപറ്റം) മറ്റ് അഡ്ജസ്റ്റ് സമീപനങ്ങളിലും (ഉദാ, പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു) സമാനമായ ആയിരിക്കും വാദിക്കുന്നു. ഓൺലൈൻ പാനലുകൾ കൂടുതലറിയാൻ, കാണുക Callegaro et al. (2014) .
ചിലപ്പോൾ ഗവേഷകർ പ്രോബബിലിറ്റി സാമ്പിളുകളും നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ ഇത്തരത്തിലുള്ള ഗുണമേന്മയേറിയ കണക്കുകളെ കേടുവരുത്തുകയും കണ്ടെത്തിയിരിക്കുന്നു (Ansolabehere and Schaffner 2014) , എന്നാൽ മറ്റ് താരതമ്യത്തിനും നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ മോശമായ ചെയ്യുന്ന കണ്ടെത്തിയിരിക്കുന്നു (Malhotra and Krosnick 2007; Yeager et al. 2011) . ഈ വ്യത്യാസങ്ങൾ സാധ്യമായ കാരണം നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ സമയം മുന്നേറിയിട്ടുണ്ട് എന്നതാണ്. നോൺ-പ്രോബബിലിറ്റി ഒരുപറ്റം രീതികൾ കൂടുതൽ ആശങ്കപ്പെടുന്നുണ്ട് കാഴ്ച നോൺ-പ്രോബബലിറ്റി സാംപ്ലിങ് ന് AAPOR ടാസ്ക് ഫോഴ്സ് കാണാൻ (Baker et al. 2013) , ഞാനും സംഗ്രഹം റിപ്പോർട്ട് പിന്തുടരുന്ന കമന്ററി വായിക്കുന്നത് ശുപാർശ.
നോൺ-പ്രോബബിലിറ്റി മാതൃകയിൽ ബയസ് കുറയ്ക്കാൻ വെയ്റ്റേജിനു പ്രഭാവം ഒരു മെറ്റാ അനാലിസിസ് വേണ്ടി, പട്ടിക 2.4 കാണാൻ Tourangeau, Conrad, and Couper (2013) നിഗമനം ലേഖകരെ നയിക്കുന്നു, "അഡ്ജസ്റ്റ്മെന്റ് ഉപയോഗപ്രദമായ എന്നാൽ മറ്റുഷ്യനല്ല തിരുത്തലുകൾ തോന്നുന്നില്ല. . . "
Conrad and Schober (2008) ഭാവി സർവേ അഭിമുഖം നിറുത്തമാണ് എന്ന എഡിറ്റുചെയ്ത വോള്യം നൽകുന്നു, അതു ഈ വിഭാഗത്തിൽ തീമുകൾ പല സംബോധന. Couper (2011) സമാനമായ തീമുകൾ വിലാസങ്ങൾ, Schober et al. (2015) പുതിയ ക്രമീകരണം ബന്ധപ്പെടുത്തിയിരിക്കുന്ന ഡാറ്റ ശേഖരണം രീതികൾ ഉയർന്ന ഗുണമേന്മയുള്ള ഡാറ്റ ഇടയാക്കും എങ്ങനെ ഒരു നല്ല ഉദാഹരണം പ്രദാനം ചെയ്യുന്നു.
സോഷ്യൽ സയൻസ് സർവ്വേകൾ ഫേസ്ബുക്ക് അപ്ലിക്കേഷനുകൾ ഉപയോഗിച്ച് മറ്റൊരു രസകരമായ ഉദാഹരണത്തിന്, കാണുക Bail (2015) .
സർവ്വേകൾ പങ്കാളികൾക്കും ഒരു ആസ്വാദ്യകരവും വിലപ്പെട്ട അനുഭവം making കൂടുതൽ ഉപദേശങ്ങൾക്കായി താൽപ്പര്യങ്ങൾക്കിണങ്ങിയ ഡിസൈൻ മാർഗ്ഗം പ്രവൃത്തിയെ കാണും (Dillman, Smyth, and Christian 2014) .
Stone et al. (2007) പാരിസ്ഥിതിക നൈമിഷിക അസസ്സ്മെന്റ് ആൻഡ് അനുബന്ധ രീതികൾ പുസ്തകം നീളം ചികിത്സ പ്രദാനം ചെയ്യുന്നു.
Judson (2007) "വിവരങ്ങൾ സംയോജനം" ആയി സർവേകളിലും ഭരണപരമായ ഡാറ്റ ഉള്ള പ്രക്രിയ വിവരിച്ച ഈ സമീപനം ചില ഗുണങ്ങളുമുണ്ട് ചർച്ചചെയ്യുന്നുണ്ട്, ചില ഉദാഹരണങ്ങൾ പ്രദാനം ചെയ്യുന്നു.
ഗവേഷകർ ഡിജിറ്റൽ ട്രെയ്സുകൾ, അഡ്മിനിസ്ട്രേറ്റീവ് ഡാറ്റ ഉപയോഗിക്കാൻ കഴിയുന്ന മറ്റൊരു വഴി നിർദ്ദിഷ്ട സ്വഭാവസവിശേഷതകൾ ജനം ഒരുപറ്റം ഫ്രെയിം ആണ്. എന്നാൽ ആക്സസ് ഒരുപറ്റം ഫ്രെയിം ഉപയോഗിക്കാൻ ഈ റെക്കോർഡുകൾ പുറമേ സ്വകാര്യത ബന്ധപ്പെട്ട ചോദ്യങ്ങൾക്ക് സൃഷ്ടിക്കാൻ കഴിയും (Beskow, Sandler, and Weinberger 2006) .
ആവർത്തിക്കപ്പെട്ടു ചോദിക്കുന്ന സംബന്ധിച്ച് അവ സമീപനം ഞാൻ ഇത് വിവരിച്ച ചെയ്ത രീതിയും നിന്ന് ദൃശ്യമാകുന്ന പോലെ പുതിയ അല്ല. ഈ സമീപനം സ്ഥിതിവിവരക്കണക്കുകൾ-മോഡൽ അധിഷ്ഠിത പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു മൂന്ന് വലിയ പ്രദേശങ്ങൾ അഗാധമായി കണക്ഷനുകൾ ഉണ്ട് (Little 1993) , ബിഷപ്പ് (Rubin 2004) , ചെറിയ പ്രദേശം മതിപ്പു (Rao and Molina 2015) . അത് മെഡിക്കൽ റിസർച്ച് ലെ പിൻവാതിൽ ചരങ്ങളുടെ ഉപയോഗം ബന്ധപ്പെട്ടിരിക്കുന്നു (Pepe 1992) .
ഡിജിറ്റൽ അംശവും ഡേറ്റാ ലഭ്യമാക്കുന്നതിൽ സംബന്ധിച്ച നൈതിക പ്രശ്നം പുറമേ, പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന പുറമേ ജനം സർവേയിലാണ് വെളിപ്പെടുത്താൻ തിരഞ്ഞെടുക്കാൻ താണിരുന്നു സെൻസിറ്റീവ് സ്വഭാവങ്ങളെ അനുമാനിക്കാൻ ഉപയോഗിക്കാൻ കഴിഞ്ഞില്ല (Kosinski, Stillwell, and Graepel 2013) .
ൽ കുറഞ്ഞ സമയവും എസ്റ്റിമേറ്റുകൾ Blumenstock, Cadamuro, and On (2015) വേരിയബിൾ കോസ്റ്റ്-അധികമായി ഒരു ചെലവ് കൂടുതൽ കാണുക സർവേ-പോലുള്ള കോൾ ഡാറ്റ വൃത്തിയാക്കി പ്രോസസ്സ് ചിലവു സ്ഥിര ചെലവുകൾ ഉൾപ്പെടുന്നില്ല. പൊതുവേ, പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന ഒരുപക്ഷേ ഉയർന്ന ഫിക്സഡ് ചിലവും ഡിജിറ്റൽ പരീക്ഷണങ്ങളിൽ സമാനമായ കുറഞ്ഞ വേരിയബിൾ ചെലവ് (അദ്ധ്യായം 4 കാണുക) ഉണ്ടായിരിക്കും. ഉപയോഗിച്ച ഡാറ്റ കൂടുതൽ വിശദാംശങ്ങൾ Blumenstock, Cadamuro, and On (2015) പേപ്പർ ആകുന്നു Blumenstock and Eagle (2010) ഉം Blumenstock and Eagle (2012) . ഒന്നിലധികം imputuation നിന്ന് സമീപനങ്ങളിലും (Rubin 2004) പെരുപ്പിച്ചുകാട്ടൽ തേടുകയും കണക്കുകളിലെ അനിശ്ചിതത്വം ക്യാപ്ചർ സഹായിക്കുന്നു. ഗവേഷകർ പെരുപ്പിച്ചുകാട്ടൽ ചെയ്താൽ മാർക്കിൽ എണ്ണങ്ങളും പകരം വ്യക്തിഗത-ലവൽ നേതൃപാടവം അല്ലാത്തവര്ക്ക് ആവശ്യപ്പെട്ട് പിന്നീട് സമീപനങ്ങളെയും King and Lu (2008) ഉം Hopkins and King (2010) ഉപയോഗപ്പെടുന്നു. മെഷീൻ ലേണിംഗ് സമീപനങ്ങളിലും കൂടുതൽ വിവരങ്ങൾക്ക് Blumenstock, Cadamuro, and On (2015) , കാണുക James et al. (2013) (കൂടുതൽ ആമുഖ) അല്ലെങ്കിൽ Hastie, Tibshirani, and Friedman (2009) (കൂടുതൽ വിപുലമായ). മറ്റൊരു പ്രശസ്തമായ മെഷീൻ ലേണിംഗ് പാഠപുസ്തകം ആണ് Murphy (2012) .
സമ്പന്നന്മാർ ചോദിക്കുന്ന സംബന്ധിച്ച് Ansolabehere ആൻഡ് Hersh ഫലങ്ങൾ (2012) രണ്ട് പ്രധാനപെട്ട ഘട്ടങ്ങളിൽ വിജാഗിരി: 1) കൃത്യമായ മാസ്റ്റർ രസികന് ഉത്പാദിപ്പിക്കാൻ പല വ്യത്യസ്ത ഡാറ്റ ഉറവിടങ്ങളിൽ സംയോജിപ്പിച്ച് Catalist കഴിവ് ഉം 2) Catalist പ്രാപ്തിക്കു സർവേ ഡാറ്റ ലിങ്ക് ചെയ്യാൻ അതിന്റെ മാസ്റ്റർ രസികന്. അതുകൊണ്ടു, Ansolabehere ആൻഡ് Hersh ശ്രദ്ധാപൂർവ്വം ഓരോ നടപടികളിലും പരിശോധിക്കുക.
മാസ്റ്റർ രസികന് സൃഷ്ടിക്കാൻ, Catalist സംയോജിപ്പിക്കുകയും തുടങ്ങി വ്യത്യസ്ത സ്രോതസ്സുകളിൽ നിന്നുള്ള വിവരങ്ങൾ ക്രമീകരിച്ചിട്ടുണ്ടൺ്: ഓരോ സംസ്ഥാനത്തെയും നിന്ന് ഒന്നിലധികം വോട്ടിങ് രേഖകള് സ്നാപ്പ്ഷോട്ടുകൾ, വിലാസം രജിസ്ട്രി പോസ്റ്റ് ഓഫീസ് നാഷണൽ മാറ്റുക നിന്ന് ഡാറ്റ, മറ്റ് വ്യക്തമാക്കാതെ വാണിജ്യ ദാതാക്കളിൽ നിന്ന് ഡാറ്റ. ഇതൊക്കെയും ക്ലീനിംഗ് ലയിക്കുന്നത് സംഭവിക്കുന്നു എങ്ങനെ എത്താൻ ഈ പുസ്തകം പാഠത്ത്, ഈ പ്രക്രിയ, യാഥാർത്യമാക്കുമ്പോഴും ശ്രദ്ധിക്കൂ, യഥാർത്ഥ ഡാറ്റ സ്രോതസ്സുകളിൽ പിശകുകൾ പ്രചരിപ്പിക്കുന്ന ചെയ്യും പിശകുകൾ അവതരിപ്പിക്കും. Catalist അതിന്റെ ഡാറ്റാ പ്രോസസ്സിംഗ് ചർച്ച അതിന്റെ അസംസ്കൃത ചില ഡാറ്റ നൽകാൻ തയ്യാറായി എങ്കിലും, ഗവേഷകർ മുഴുവൻ Catalist ഡാറ്റ പൈപ്പ് അവലോകനം ചെയ്യുന്നതിന് വേണ്ടി ലളിതമായി അസാധ്യമാണ്. പകരം, ഗവേഷകർ Catalist ഡാറ്റ ഫയൽ ചില അജ്ഞാത, ഒരുപക്ഷേ ദുർജ്ഞേയനായ, പിശക് തുക ഉണ്ടായിരുന്നു എവിടെയാണ് സ്ഥിതി ആയിരുന്നു. ഒരു വിമർശകൻ അല്ല പ്രതികരിച്ചവരിൽ വഴി misreporting വഴി, Catalist മാസ്റ്റർ ഡാറ്റ ഫയലിൽ CCES സ്വഭാവം ന് സർവേ റിപ്പോർട്ടുകൾ തമ്മിൽ കാതലായ വ്യത്യാസങ്ങൾ മാസ്റ്റർ ഡാറ്റ ഫയൽ പിശകുകൾ മൂലമാണ് ബാധിച്ചവരെ .പ്രണയമായിരുന്നു കാരണം ഈ ഗുരുതരമായ സംശയിക്കുന്നു.
Ansolabehere ആൻഡ് Hersh ഡാറ്റ നിലവാര ആശങ്ക അഭിസംബോധന രണ്ട് വ്യത്യസ്ത സമീപനങ്ങളുടെ എടുത്തു. ആദ്യം,, Catalist മാസ്റ്റർ ഫയലിൽ വോട്ടിംഗ് സ്വയം റിപ്പോർട്ട് വോട്ടവകാശം തട്ടിച്ചു പുറമേ ഗവേഷകർ സ്വയം റിപ്പോർട്ട് പാർട്ടി, വംശം, വോട്ടർ രജിസ്ട്രേഷൻ നില (ഉദാ രജിസ്റ്റർ രജിസ്റ്റർ അല്ല) വോട്ടിംഗ് രീതി (ഉദാ, വ്യക്തി താരതമ്യപ്പെടുത്തിയ, ആബ്സൻറീ Catalist ഡാറ്റാബേസുകൾ കണ്ടെത്തി ആ മൂല്യങ്ങളെ ബാലറ്റ് മുതലായവ). ഈ നാലു ജനസംഖ്യാപരമായ വേരിയബിളുകള്ക്കായി ഗവേഷകർ ഒന്നാകെ അധികം Catalist മാസ്റ്റർ ഫയലിൽ സർവേ റിപ്പോർട്ട് ഡാറ്റ തമ്മിലുള്ള കരാറിൻറെ വളരെ ഉയർന്ന കണ്ടെത്തി. ഇപ്രകാരം, Catalist മാസ്റ്റർ ഡാറ്റ ഫയൽ, വോട്ടിങ് പാവപ്പെട്ടവന്റെ മൊത്തത്തിലുള്ള ഗുണനിലവാരം അല്ല നിഗമനത്തിൽ പുറമെ സ്വഭാവവിശേഷങ്ങൾ ഉയർന്ന നിലവാരത്തിലുള്ള വിവരങ്ങൾ ഉള്ളതായി തോന്നുന്നു. രണ്ടാമതായി, ഭാഗത്ത് Catalist, Ansolabehere ആൻഡ് Hersh നിന്ന് ഡാറ്റ ഉപയോഗിച്ച് കൗണ്ടി വോട്ടിംഗ് രേഖകള് ഗുണനിലവാരം മൂന്ന് വ്യത്യസ്ത നടപടികൾ വികസിപ്പിക്കുകയും തങ്ങളുടെ ഓവറിൽ-റിപ്പോർട്ടിംഗ് വോട്ടെടുപ്പ് കണക്കാക്കിയ നിരക്ക് ഈ ഡാറ്റ ഗുണമേന്മയുള്ള നടപടികൾ ഏതെങ്കിലും ലേക്ക് അടിസ്ഥാനപരമായി ബന്ധമില്ലാത്ത കണ്ടു; ഒരു കണ്ടെത്തിയിരിക്കുന്നത് ആ മേൽ-റിപ്പോർട്ടിംഗ് ഉയർന്ന നിരക്ക് അസാധാരണമാം കുറഞ്ഞ ഡാറ്റ ഗുണമേന്മയുള്ള രാജ്യങ്ങൾക്കായി നയിക്കപ്പെടുന്ന ലഭിക്കാത്ത നിർദ്ദേശിക്കുന്നു.
ഈ മാസ്റ്റർ വോട്ടിംഗ് ഫയല് സൃഷ്ടി കണക്കിലെടുക്കുമ്പോൾ സാധ്യതയുള്ള പിശകുകൾ രണ്ടാം സ്രോതസ്സ് അതിനോടു സർവേ റെക്കോർഡുകൾ ലിങ്കുചെയ്യുന്നു. ഉദാഹരണത്തിന്, ഈ ബന്ധം തെറ്റായി പ്രവർത്തിമൂലം അതു മേൽ-എസ്റ്റിമേറ്റ് റിപ്പോർട്ട് സാധൂകരിച്ചു വോട്ടിംഗ് സ്വഭാവം തമ്മിലുള്ള വ്യത്യാസം ഒരു നയിച്ചേക്കാം (Neter, Maynes, and Ramanathan 1965) . ഓരോ വ്യക്തിയും ഇരുവരും ഡാറ്റ ഉറവിടങ്ങളിൽ ഇരുന്ന സ്ഥിരതയുള്ള ഒരു അദ്വിതീയമായ ഐഡന്റിഫയർ എങ്കിൽ ബന്ധം ബാലിശമായ തന്നെ. യുഎസ് മറ്റ് മിക്ക രാജ്യങ്ങളിലും എന്നാൽ, യാതൊരു സാർവത്രിക ഐഡന്റിഫയർ. എന്നുതന്നെയല്ല, അവിടെ പോലും അത്തരം ഒരു ഐഡന്റിഫയർ ജനം ഒരുപക്ഷേ ഗവേഷകർ സർവേ അത് നൽകാൻ നല്ലതല്ലാത്തൊരു ആയിരിക്കും! പേര്, ലിംഗഭേദം, ജനന വർഷം വീട്ടിലും വിലാസം: അങ്ങനെ, Catalist ബന്ധം അപൂർണ ഐഡന്റിഫയറുകൾ ഉപയോഗിച്ച് ഈ കേസിൽ ഓരോ പ്രതികളുടെ വിവരങ്ങൾ നാലു കഷണങ്ങളായി ചെയ്യാൻ ഉണ്ടായിരുന്നു. ഉദാഹരണത്തിന്, Catalist CCES ലെ Homie ജെ സിംപ്സൺ തീരുമാനിക്കാൻ ഉണ്ടായിരുന്നു തങ്ങളുടെ യജമാനന്റെ ഡാറ്റ ഫയലിൽ ഹോമര് ജേ സിംപ്സൺ അതേ വ്യക്തി ആയിരുന്നു. പ്രായോഗികമായി പൊരുത്തപ്പെടുന്ന ഗവേഷകർ വേണ്ടി കാര്യങ്ങൾ കൂടുതൽ ഉണ്ടാക്കുവാൻ ബുദ്ധിമുട്ടുള്ളതും പൌരനെന്ന പ്രക്രിയ ആകുന്നു എന്നു Catalist അതിന്റെ പൊരുത്തപ്പെടുന്ന സാങ്കേതികതയെ കുത്തക കണക്കാക്കപ്പെടുന്നത്.
പൊരുത്തപ്പെടുന്ന അൽഗോരിതങ്ങൾ മൂല്യനിർണ്ണയം വേണ്ടിയാണ്, അവർ രണ്ടു വെല്ലുവിളികൾ ആശ്രയിച്ചിരുന്നു. MITRE കോർപ്പറേഷൻ: ആദ്യം, Catalist ഒരു സ്വതന്ത്ര മൂന്നാം കക്ഷി പ്രവർത്തിപ്പിക്കുന്നതുപോലെ ഒരു ചേരുന്ന മത്സരത്തിൽ പങ്കെടുത്തു. MITRE രണ്ട് ശബ്ദായമാനമായ ഡാറ്റാ ഫയലുകൾ പൊരുത്തപ്പെട്ട ലേക്കും, വിവിധ ടീമുകൾ മികച്ച ചേരുന്ന MITRE മടങ്ങാൻ പങ്കെടുത്ത എല്ലാ പങ്കെടുക്കുന്നവർ നൽകി. MITRE സ്വയം ടീമുകളിൽ സ്കോർ സാധിച്ചു ശരിയായ പൊരുത്തപ്പെടുന്ന അറിയാമായിരുന്നു. 40 കമ്പനികൾ പങ്കെടുത്ത ഇതിൽ Catalist രണ്ടാം സ്ഥാനത്ത് എത്തി. കുത്തക സാങ്കേതികവിദ്യ സ്വതന്ത്രമായ മൂന്നാം കക്ഷി മൂല്യനിർണ്ണയത്തിൽ ഇത്തരത്തിലുള്ള വളരെ അപൂർവവും അവിശ്വസനീയമായ അമൂല്യവുമായ; അതു നമ്മെ Catalist ന്റെ പൊരുത്തപ്പെടുന്ന സമ്പ്രദായങ്ങളാണ്-ഓഫ് ദി ആർട്ട് ന് അടിസ്ഥാനപരമായി ആകുന്നു ഉറപ്പു നൽകുകയും വേണം. എന്നാൽ മതിയായ സ്റ്റേറ്റ് ഓഫ് ദി ആർട്ട് നല്ലതു? ഈ പൊരുത്തപ്പെടുന്ന മത്സരത്തിൽ പുറമെ, Ansolabehere ആൻഡ് Hersh Catalist തങ്ങളുടെ പൊരുത്തപ്പെടുന്ന വെല്ലുവിളി സൃഷ്ടിച്ചു. ഒരു നേരത്തെ പദ്ധതി നിന്നും Ansolabehere ആൻഡ് Hersh ഫ്ലോറിഡ നിന്ന് വോട്ടർ രേഖകള് ശേഖരിച്ച. അവർ തങ്ങളുടെ യഥാർത്ഥ മൂല്യങ്ങൾ ഈ ഫീൽഡുകളിൽ Catalist ന്റെ റിപ്പോർട്ടുകൾ അപേക്ഷിച്ച് Catalist ലേക്ക് മറയ്ക്കാൻ വയലുകളുടെയും ചില ഈ ചില റെക്കോർഡുകൾ നൽകിയ തുടർന്ന്. ഭാഗ്യവശാൽ, Catalist ന്റെ റിപ്പോർട്ടുകൾ Catalist തങ്ങളുടെ യജമാനന്റെ ഡാറ്റ ഫയൽ ലേക്കായി ഭാഗിക വോട്ടർ രേഖകള് പൊരുത്തപ്പെടുന്നില്ല കഴിഞ്ഞില്ല സൂചിപ്പിക്കുന്ന, തടുത്തു മൂല്യങ്ങൾ അടുത്ത. ഈ രണ്ടു വെല്ലുവിളികളെയും, ഒരു മൂന്നാം കക്ഷി, Ansolabehere ആൻഡ് Hersh വഴി ഓരോന്നായി, നമുക്കു കൃത്യമായ നടപ്പിലാക്കൽ നമ്മെത്തന്നെ അവലോകനം കഴിയില്ല പോലും Catalist പൊരുത്തപ്പെടുന്ന അൽഗോരിതങ്ങൾ കൂടുതൽ ആത്മവിശ്വാസം തരും.
വോട്ടിംഗ് മൂല്യനിർണ്ണയം പല മുൻ ശ്രമങ്ങൾ ഉണ്ടായിട്ടുണ്ട്. സാഹിത്യത്തിൽ ഒരു അവലോകനം കാണുക Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , ഒപ്പം Hanmer, Banks, and White (2014) .
ഇത് ആണെങ്കിലും ഈ കേസിൽ ഗവേഷകർ Catalist നിന്ന് ഡാറ്റ ഗുണനിലവാരം പ്രോത്സാഹനം ലഭിച്ചു, വാണിജ്യ മാരുടെ മറ്റ് വാല്മൊഴി കുറവ് ഉത്സാഹത്തോടെ ചെയ്തിരിക്കുന്നു ശ്രദ്ധിക്കുക പ്രധാനമാണ്. : ഗവേഷകർ മാർക്കറ്റിങ് സിസ്റ്റംസ് ഗ്രൂപ്പ് (Acxiom, എക്സ്പെരിയൻ, ഒപ്പം InfoUSA സ്വയം മൂന്നു ദാതാക്കളിൽ നിന്ന് ഡാറ്റ രൂപവത്കരിച്ചത്) നിന്ന് ഒരു ഉപഭോക്തൃ-ഫയൽ ഒരു സർവേയിൽ നിന്ന് ഡാറ്റ ധനവാൻ ഗുണമേന്മയുള്ള കണ്ടെത്തിയിരിക്കുന്നു (Pasek et al. 2014) . അത് (ഡാറ്റ ഫയൽ ഗവേഷകർ ശരിയായ ആയിരിക്കും .കാരണം ആ സർവേ പ്രതികരണങ്ങൾ പൊരുത്തപ്പെടുന്നില്ല, ഡാറ്റ രസികന് കാണാതായ ഉണ്ടായിരുന്നു ചോദ്യങ്ങൾ ഒരു വലിയ എണ്ണം, കാണാതായ ഡാറ്റ പാറ്റേൺ റിപ്പോർട്ട് സർവേ മൂല്യമായി പ്രായവുമായി ചെയ്തു മറ്റ് വാക്കുകളിൽ കാണാതായ ഡാറ്റ സിസ്റ്റമാറ്റിക് ആയിരുന്നു , ആണു).
സർവേകൾ, അഡ്മിനിസ്ട്രേറ്റീവ് ഡാറ്റ തമ്മിലുള്ള റെക്കോർഡ് ബന്ധം കൂടുതലറിയാൻ, കാണുക Sakshaug and Kreuter (2012) ഉം Schnell (2013) . പൊതുവേ റെക്കോർഡ് ബന്ധം കൂടുതലറിയാൻ, കാണുക Dunn (1946) ഉം Fellegi and Sunter (1969) (ചരിത്ര) ഉം Larsen and Winkler (2014) (ആധുനിക). സമാനമായ അടുക്കുശപാള് പോലുള്ള ഡാറ്റ ഡീഡ്യൂപ്ലിക്കേഷൻ, ഉദാഹരണത്തിന് ഐഡന്റിഫിക്കേഷൻ, പേര് പൊരുത്തപ്പെടുന്ന പേരുകൾ കീഴിൽ കമ്പ്യൂട്ടർ സയൻസിൽ വികസിപ്പിച്ചെടുത്തത് കണ്ടെത്തൽ ഡ്യൂപ്ലിക്കേറ്റ്, റെക്കോർഡ് കണ്ടെത്തൽ ഡ്യൂപ്ലിക്കേറ്റ് (Elmagarmid, Ipeirotis, and Verykios 2007) . ഏത് വ്യക്തിപരമായി തിരിച്ചറിയുന്ന വിവരങ്ങളിൽ വ്യാപനവും ആവശ്യമില്ല റെക്കോർഡ് ബന്ധം ലേക്കുള്ള സമീപനങ്ങളെയും സൂക്ഷിക്കുന്നത് സ്വകാര്യത ഉണ്ട് (Schnell 2013) . ഫേസ്ബുക്ക് ഗവേഷകർ probabilisticsly വോട്ടിംഗ് സ്വഭാവം അവരുടെ റെക്കോർഡുകൾ കണ്ണികളുണ്ട് ഒരു നടപടിക്രമം വികസിപ്പിച്ചെടുത്തു (Jones et al. 2013) ; ഈ ബന്ധം ഞാൻ Chapter 4 കുറിച്ച് പറയാം ഒരു പരീക്ഷണം വിലയിരുത്താൻ സംഭവിച്ചതു (Bond et al. 2012) .
സർക്കാർ ഭരണ റെക്കോർഡുകൾ ഒരു വലിയ തോതിലുള്ള സാമൂഹിക സർവേ ലിങ്കിംഗ് മറ്റൊരു ഉദാഹരണമാണ് ആരോഗ്യം, റിട്ടയർമെന്റ് സർവേ ആൻഡ് സോഷ്യൽ സെക്യൂരിറ്റി അഡ്മിനിസ്ട്രേഷൻ നിന്ന് വരുന്നു. സമ്മതം നടപടിക്രമം വിവരങ്ങൾ ഉൾപ്പെടെ, ആ പഠനം കൂടുതലറിയാൻ, കാണുക Olson (1996) ഉം Olson (1999) .
ഒരു മാസ്റ്റർ രസികന്-Catalist ചില ദേശീയ സർക്കാരുകൾ സ്റ്റാറ്റിസ്റ്റിക്കൽ ഓഫീസുകളിൽ സാധാരണ ജീവനക്കാർ-എന്ന് പ്രക്രിയ കടന്നു ഭരണപരമായ രേഖകള് പല സ്രോതസ്സുകളിൽ ഉള്ള പ്രക്രിയ. സ്റ്റാറ്റിസ്റ്റിക്സ് സ്ലോവാക്യ നിന്ന് രണ്ട് ഗവേഷകർ വിഷയം വിശദമായ പുസ്തകം എഴുതിയ (Wallgren and Wallgren 2007) . യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് (Olmstead കൗണ്ടി മിനസോട്ടയിലെ; മായോ ക്ലിനിക് ഹോം) ഒരൊറ്റ കൗണ്ടിയിൽ ഈ സമീപനം ഒരു ഉദാഹരണം കാണുക Sauver et al. (2011) . അഡ്മിനിസ്ട്രേറ്റീവ് രേഖകള് ൽ തെളിയുന്ന പിശകുകൾ കൂടുതലറിയാൻ, കാണുക Groen (2012) .