സമഗ്രമായ ചോദിച്ച്, സർവേ ഡാറ്റാ ചില പ്രധാനപ്പെട്ട അളവുകൾ അടങ്ങിയിരിക്കുന്ന ഒരു വലിയ ഡാറ്റ ഉറവിടത്തെ ചുറ്റുമുള്ള സന്ദർഭം സൃഷ്ടിക്കുകയും മറ്റുള്ളവർ കുറവാണ്.
സർവേ ഡാറ്റയും വലിയ ഡാറ്റ ഉറവിടങ്ങളും സമന്വയിപ്പിക്കാനുള്ള ഒരു മാർഗമാണ് ഞാൻ ആവശ്യപ്പെടുന്ന ഒരു പ്രക്രിയ. സമഗ്രമായി ചോദിക്കുന്ന ഒരു വലിയ ഡാറ്റ സ്രോതസ്സിൽ ചില അളവുകൾ ഉണ്ട്, എന്നാൽ മറ്റു അളവുകൾ ഇല്ല, ഗവേഷകർ ഈ സർവേയിൽ ശേഖരിച്ച അളവുകൾ സർവേയിൽ ശേഖരിക്കുകയും രണ്ട് ഡാറ്റ സ്രോതസ്സുകളെ ഒന്നിച്ച് ബന്ധിപ്പിക്കുകയും ചെയ്യുന്നു. Burke and Kraut (2014) ഫേസ് ബുക്കിനെക്കുറിച്ച് ചർച്ചചെയ്യുമോ? Burke and Kraut (2014) , സെക്ഷൻ 3.2 ൽ വിവരിച്ച സൗഹൃദത്തെ ശക്തിപ്പെടുത്തുന്നുണ്ടോ എന്നതിനെക്കുറിച്ചാണ്. അത്തരം സാഹചര്യത്തിൽ, ബർക്ക്, ക്രൗട്ട് എന്നിവ സർവ്വെ ഡാറ്റയുമായി ഒത്തുചേർന്നു.
ബർക്ക്, ക്രാട്ട് പ്രവർത്തിച്ചുകൊണ്ടിരുന്ന ഒരു ക്രമീകരണം, എന്നാൽ, ഗവേഷകർ ചെയ്യുന്നതുപോലെ, പരസ്പരം അഭിമുഖീകരിക്കാൻ ആഗ്രഹിക്കുന്ന രണ്ടു വലിയ പ്രശ്നങ്ങൾ കൈകാര്യം ചെയ്യേണ്ടതില്ല. ഒന്നാമതായി, വ്യക്തിഗതതല ഡാറ്റ സെറ്റുകൾ ഒന്നിച്ച് ബന്ധിപ്പിക്കുന്ന , ഒരു ഡാറ്റാഗണത്തിലെ ശരിയായ റെക്കോർഡ് ശരിയായ റെക്കോർഡുമായി പൊരുത്തപ്പെടുന്നുണ്ടെന്ന് ഉറപ്പുവരുത്താൻ ഉപയോഗിക്കുന്ന ഡാറ്റാ ഉറവിടങ്ങളിൽ തനതായ ഐഡന്റിഫയർ ഇല്ലെങ്കിൽ റിക്കോർഡ് ലിങ്കേജ് എന്നു വിളിക്കുന്ന ഒരു പ്രക്രിയ ബുദ്ധിമുട്ടായിരിക്കും. മറ്റ് ഡാറ്റാഗണികളിൽ. രണ്ടാമത്തെ പ്രധാന പ്രശ്നം, വലിയ ഡാറ്റ സ്രോതസുകളുടെ ഗുണനിലവാരം ഗവേഷകരെ വിലയിരുത്താൻ പ്രയാസകരമാണ് എന്നതാണ്, കാരണം ഡാറ്റ സൃഷ്ടിക്കുന്ന പ്രോസസ് പ്രൊപ്രൈറ്റർ ആയിരിക്കാം, അത് അധ്യായം 2-ൽ വിവരിച്ചിരിക്കുന്ന അനേകം പ്രശ്നങ്ങൾക്ക് ആകുമായിരുന്നു. മറ്റൊരു രീതിയിൽ പറഞ്ഞാൽ, ആവശ്യപ്പെടുന്ന സമൃദ്ധി, അജ്ഞാതമായ ഗുണനിലവാരമുള്ള ബ്ലാക്ക്-ബോക്സ് ഡാറ്റാ ഉറവിടങ്ങളിലേക്ക് സർവ്വെയിൽ പിഴവ് സാധ്യതയുള്ള ലിങ്കുകൾ ഇടയ്ക്കിടെ ഉണ്ടാകും. എന്നിരുന്നാലും, ഈ പ്രശ്നങ്ങൾ ഉണ്ടെങ്കിലും, സുപ്രധാന ഗവേഷണം നടത്താൻ ഉപയോഗിക്കാവുന്ന സമൃദ്ധമായ ഉപയോഗം, സ്റ്റീഫൻ അൻസോളബേററിയും ഇറ്റാൻ ഹെർഷും (2012) നടത്തിയ സർവ്വേയിൽ, യുണൈറ്റഡ് സ്റ്റേറ്റ്സിലെ വോട്ടിംഗ് രീതികളെക്കുറിച്ച് നടത്തിയ ഗവേഷണത്തിലാണ്.
രാഷ്ട്രീയ ശാസ്ത്രത്തിൽ വിപുലമായ ഗവേഷണ വിഷയമാണ് വോട്ടർ കണക്കുകൾ. കഴിഞ്ഞ കാലങ്ങളിൽ, ആർക്കാണ് വോട്ടെടുപ്പ് നടത്തിയതെന്ന് ഗവേഷകർക്ക് അറിയാമായിരുന്നു, സർവ്വെ ഡാറ്റയുടെ വിശകലനത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്. എന്നിരുന്നാലും, ഓരോ പൗരനും വോട്ട് ചെയ്തിട്ടുണ്ടോ എന്ന കാര്യം സർക്കാർ രേഖപ്പെടുത്തുന്നത് അസാധാരണമായ ഒരു പെരുമാറ്റമാണ്. അമേരിക്കയിൽ ഓരോ പൌരനും വോട്ട് രേഖപ്പെടുത്തിയത് ഗവൺമെന്റല്ല. വർഷങ്ങളായി, ഈ സർക്കാർ വോട്ടിംഗ് രേഖകൾ രാജ്യത്തുടനീളം വിവിധ പ്രാദേശിക സർക്കാർ ഓഫീസുകളിൽ ചിതറിക്കിടന്ന പേപ്പർ ഫോമുകളിൽ ലഭ്യമാണ്. രാഷ്ട്രീയ ശാസ്ത്രജ്ഞർക്ക് വോട്ടർമാർക്ക് ഒരു പൂർണ്ണമായ ചിത്രം ലഭിക്കുകയും അത് യഥാർത്ഥ വോട്ടിംഗ് പെരുമാറ്റത്തോടു (Ansolabehere and Hersh 2012) വോട്ട് ചെയ്യുന്നതിനെ കുറിച്ച് ജനങ്ങൾ എന്താണ് പറയുന്നത് എന്നതിനെ താരതമ്യം ചെയ്യുക എന്നത് (Ansolabehere and Hersh 2012) .
എന്നാൽ ഈ വോട്ടിംഗ് രേഖകൾ ഡിജിറ്റൽവൽക്കരിക്കപ്പെട്ടു, എല്ലാ അമേരിക്കൻ കമ്പനികളുടെയും വോട്ടിംഗ് സ്വഭാവം ഉൾക്കൊള്ളുന്ന സമഗ്ര മാസ്റ്റർ വോട്ടിംഗ് ഫയൽ നിർമ്മിക്കാൻ അനേകം സ്വകാര്യ കമ്പനികൾ അവയെ കൂട്ടിയോജിപ്പിക്കുകയും ലയിപ്പിക്കുകയും ചെയ്തു. അസോരോബെയറും ഹെർഷും ഈ കമ്പനികളിലൊരാളുമായി ചേർന്ന് - കാലിസ്റ്റ് എൽസിസി - വോട്ടർഫോർമിന്റെ മെച്ചപ്പെട്ട ചിത്രം വികസിപ്പിക്കുന്നതിനായി അവരുടെ മാസ്റ്റർ വോട്ടിംഗ് ഫയൽ ഉപയോഗിക്കുന്നതിന്. ഡാറ്റാ ശേഖരണത്തിലും ഹർണൊണൈസേഷയിലും ഗണ്യമായ വിഭവങ്ങൾ നിക്ഷേപിച്ച കമ്പനിയാണ് അവരുടെ പഠനം ഡിജിറ്റൽ റെക്കോർഡുകളിൽ ആശ്രയിച്ചിരുന്നത്, കമ്പനികൾക്കുള്ള സഹായം കൂടാതെ അനലോഗ് റെക്കോർഡുകൾ ഉപയോഗിച്ച് മുൻകൂട്ടി നടത്തിയ പരിശ്രമങ്ങളെക്കുറിച്ച് ധാരാളം ഗുണങ്ങൾ നൽകി.
അദ്ധ്യായം 2 ലെ മിക്ക വലിയ വിവരസ്രോതസ്സുകളെപ്പോലെ കാസ്റ്റലിസ്റ്റ് മാസ്റ്റർ ഫയലിൽ അനലോലബേറും ഹെർഷും ആവശ്യമായ ജനസംഖ്യ, മനോഭാവം, പെരുമാറ്റ സംബന്ധമായ വിവരങ്ങൾ എന്നിവ ഉൾപ്പെടുത്തിയിട്ടില്ല. വാസ്തവത്തിൽ, സർവേകളിൽ വോട്ടെടുപ്പ് സംബന്ധിച്ച പെരുമാറ്റങ്ങൾ താരതമ്യപ്പെടുത്താൻ അവർക്ക് പ്രത്യേക താല്പര്യമുണ്ടായിരുന്നു. അതോടെ, വോട്ടെടുപ്പ് നടത്താനുള്ള സ്വഭാവം (അതായത്, കാറ്റലിസ്റ്റ് ഡാറ്റാബേസിലെ വിവരങ്ങൾ). അതിനാൽ അൻസോളബേറയും ഹെർഷും ഈ അധ്യായത്തിൽ പരാമർശിച്ച വലിയ സാമൂഹ്യ സർവേ, സിസിഇഎസിന് വേണ്ട വിവരങ്ങൾ ശേഖരിച്ചു. പിന്നീട് അവർ കാറ്റലിസ്റ്റിലേക്ക് അവരുടെ ഡാറ്റ നൽകി, കാറ്റലീസ്റ്റ് അവരെ ഒരു ലയന ഡേറ്റാ ഫയലിന് തിരികെ നൽകി. ഇതിൽ കാറ്റലോസ്റ്റിയിൽ നിന്നും, സ്വയം റിപ്പോർട്ട് ചെയ്ത വോട്ടിംഗ് സ്വഭാവം (CCES ൽ നിന്നും), ജനങ്ങളുടെ ജനസംഖ്യാശാസ്ത്രവും മനോഭാവവും (CCES ൽ നിന്ന്) 3.13). മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, വോട്ടെടുപ്പ് രേഖകൾ ഡാറ്റയെ സർവേ ഡാറ്റ ഉപയോഗിച്ച് അൻസലോബെറേയും ഹെർഷേയും കൂട്ടിച്ചേർത്തു.
അവരുടെ സംയുക്ത ഡാറ്റാ ഫയൽ ഉപയോഗിച്ച്, അൻസോലാബീറും ഹെർഷും മൂന്നു പ്രധാന നിഗമനങ്ങളിലേക്ക് എത്തി. ഒന്നാമതായി, വോട്ടെടുപ്പ് സംബന്ധിച്ച് കൂടുതൽ വിവരമറിയിക്കുന്നതാണ്: നോവെവോട്ടർമാരുടെ പകുതിയും വോട്ടിംഗ് റിപ്പോർട്ടുചെയ്തു, ഒരാൾ വോട്ടു ചെയ്തതായി റിപ്പോർട്ടുചെയ്താൽ അവർക്ക് 80% മാത്രമേ വോട്ട് ചെയ്യാൻ കഴിയൂ. രണ്ടാമത്, മേൽ-റിപ്പോർട്ടുചെയ്യൽ അസ്വാഭാവികമല്ല: ഉയർന്ന വരുമാനം, നല്ല വിദ്യാഭ്യാസമുള്ള പാർടി അംഗങ്ങൾ പൊതുകാര്യങ്ങളിൽ ഏർപ്പെട്ടിരിക്കുന്നവർക്കിടയിൽ കൂടുതൽ സാധാരണമാണ്. മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, വോട്ടുചെയ്യാൻ സാധ്യത കൂടുതലുള്ളവർക്ക് വോട്ടുചെയ്യാൻ കൂടുതൽ സാധ്യതയുണ്ട്. മൂന്നാമത്, ഏറ്റവും വിമർശനാത്മകമായി, മേൽപ്പറഞ്ഞ റിപ്പോർട്ടിന്റെ ക്രമാനുഗത സ്വഭാവം കാരണം, വോട്ടർമാർക്കും നോൺ വോട്ടർമാർക്കുമിടയിൽ ഉള്ള യഥാർത്ഥ വ്യത്യാസങ്ങൾ സർവേകളിൽ നിന്ന് ദൃശ്യമാകുന്നതിനേക്കാൾ ചെറുതാണ്. ഉദാഹരണത്തിന്, ഒരു ബാച്ചിലേഴ്സ് ബിരുദം ഉള്ളവർ 22 ശതമാനം വോട്ട് രേഖപ്പെടുത്താൻ കൂടുതൽ സാധ്യതയുണ്ട്, എന്നാൽ യഥാർത്ഥത്തിൽ വോട്ടുചെയ്യാൻ 10 ശതമാനം കൂടുതൽ സാധ്യതയുണ്ട്. വോട്ടുചെയ്യുമെന്ന് നിലവിലുള്ള വിഭവത്തെ അടിസ്ഥാനമാക്കിയുള്ള സിദ്ധാന്തങ്ങൾ മുന്നോട്ട് വെക്കുന്നതിൽ വളരെ ഫലപ്രദമായിരിക്കുന്നു എന്നത് ഒരു പക്ഷെ, ഒരുപക്ഷേ അത്ഭുതകരമല്ല. (യഥാർത്ഥത്തിൽ ഗവേഷകർ ഉപയോഗിക്കുന്നവർ മുൻകാലങ്ങളിൽ ഉപയോഗിച്ചിരിക്കുന്ന ഡാറ്റയെക്കാൾ) അവർ യഥാർത്ഥത്തിൽ വോട്ടുചെയ്യുന്നു എന്ന് പ്രവചിക്കുന്നു. അങ്ങനെ, Ansolabehere and Hersh (2012) അനുഭവത്തിന്റെ കണ്ടെത്തൽ മനസ്സിലാക്കാനും പ്രവചിക്കാനുമായി പുതിയ സിദ്ധാന്തങ്ങൾക്കുവേണ്ടി അപേക്ഷിക്കുന്നു.
എന്നാൽ ഈ ഫലങ്ങൾ ഞങ്ങൾ എങ്ങനെയാണ് വിശ്വസിക്കേണ്ടത്? ഓർമ്മപ്പെടുത്തൽ, അജ്ഞാത അളവ് പിശകുകളുള്ള കറുപ്പ്-ബോക്സ് ഡാറ്റയിലേക്ക് തെറ്റ്-സാധ്യതയുള്ള ലിങ്കുകൾ അടിസ്ഥാനമാക്കിയാണ് ഈ ഫലങ്ങൾ ഓർക്കുന്നത്. കൂടുതൽ വ്യക്തമായി പറഞ്ഞാൽ, രണ്ടു പ്രധാന ഘട്ടങ്ങളിലൂടെ ഫലങ്ങൾ വ്യാപിപ്പിക്കുക: (1) കൃത്യമായ മാസ്റ്റർ ഡാറ്റാഫയൽ നിർമ്മിക്കുന്നതിനായി വ്യത്യസ്ത വൈവിധ്യമാർന്ന ഡാറ്റ സ്രോതസ്സുകളെ സംയോജിപ്പിക്കാൻ കാറ്റലീസ്റ്റ് ശേഷി (2) സർട്ടിനെ ഡാറ്റ അതിന്റെ മാസ്റ്റർ ഡാറ്റഫയലിനു ബന്ധിപ്പിക്കാൻ കാറ്റലീസ്റ്റിന്റെ കഴിവ്. ഈ ഓരോ ഘട്ടത്തിലും പ്രയാസമാണ്, ഒന്നുകിൽ പിശകുകൾ ഗവേഷകരെ തെറ്റായ നിഗമനങ്ങളിലേക്ക് എത്തിക്കും. എന്നിരുന്നാലും, ഡേറ്റാ സംസ്ക്കരണവും ലിങ്കും രണ്ടും കമ്പൈലിസ്റ്റ് ഒരു കമ്പനിയായി നിലനിൽക്കുന്നതിനായാണ്, അതിനാൽ ഈ പ്രശ്നങ്ങൾ പരിഹരിക്കാനായി വിഭവങ്ങൾ നിക്ഷേപിക്കാൻ കഴിയും, പലപ്പോഴും അക്കാദമിക് റിസർച്ചർ യോജിക്കുന്നില്ല. അവരുടെ പേപ്പറിൽ Ansolabehere ഉം ഹെർഷും ഈ രണ്ടു പടികളുടെയും ഫലങ്ങൾ പരിശോധിക്കാൻ നിരവധി നടപടികളിലൂടെ കടന്നുപോകുന്നു - അവയിൽ ചിലത് പ്രൊപ്രൈറ്ററിന്റേതായാലും - സർവേ ഡാറ്റയെ ബ്ലാക്ക് ബോക്സ് വലിയ ഡാറ്റയിലേക്ക് ആകർഷിക്കാൻ ആഗ്രഹിക്കുന്ന മറ്റ് ഗവേഷകർക്ക് ഈ പരിശോധനകൾ സഹായകരമായിരിക്കും. ഉറവിടങ്ങൾ.
ഈ പഠനത്തിൽനിന്ന് പൊതുവായ പാഠങ്ങൾ ഗവേഷകർക്ക് എന്തെല്ലാമാണ്? ഒന്നാമതായി, സർവേ ഡാറ്റയോടുകൂടിയ വലിയ ഡാറ്റാ സ്രോതസ്സുകൾ മെച്ചപ്പെടുത്തുന്നതിലും വലിയ ഡാറ്റ സ്രോതസ്സുകളുമായി സർവേ ഡേറ്റയെ മെച്ചപ്പെടുത്തുന്നതിൽ നിന്നും അതിശയകരമായ മൂല്യം ഉണ്ട് (നിങ്ങൾക്ക് ഈ പഠനം ഒന്നുകിൽ കാണാൻ കഴിയും). ഈ രണ്ട് ഡാറ്റാ ഉറവിടങ്ങൾ സമന്വയിപ്പിക്കുന്നതിലൂടെ, ഗവേഷകർക്ക് വ്യക്തിപരമായി അസാധ്യമായ എന്തെങ്കിലും ചെയ്യാൻ സാധിച്ചു. രണ്ടാമത്തെ പ്രധാന പാഠം, കാറ്റലിസ്റ്റിൽ നിന്നുള്ള വിവരങ്ങൾ പോലെയുള്ള സമാഹരിച്ച, വാണിജ്യ വിവര ഉറവിടങ്ങൾ "ഗ്രൗണ്ട് ടുഡേ" ആയി കണക്കാക്കരുത് എന്നതാണ്. ചിലപ്പോൾ അത് ഉപയോഗപ്രദമാകും. സമ്പൂർണ്ണ സത്യവുമായി ഈ സംക്ഷിപ്ത, വാണിജ്യ ഡാറ്റ സ്രോതസ്സുകളെ ചിലപ്പോഴൊക്കെ വിദഗ്ധർ താരതമ്യപ്പെടുത്തുന്നു. എന്നിരുന്നാലും, ഈ സാഹചര്യത്തിൽ, സന്ദിഗ്ദ്ധർ തെറ്റായ താരതമ്യപ്പെടുത്തൽ നടത്തിക്കൊണ്ടിരിക്കുന്നു: ഗവേഷകർ ഉപയോഗിക്കുന്ന എല്ലാ ഡാറ്റയും സമ്പൂർണ സത്യത്തിന്റെ കുറവായി മാറുന്നു. പകരം, ലഭ്യമായ എല്ലാ ഡാറ്റ ഉറവിടങ്ങളുമായും (ഉദാഹരണത്തിന്, സ്വയം റിപ്പോർട്ടു ചെയ്ത വോട്ടിംഗ് പെരുമാറ്റം) കൂട്ടിച്ചേർത്ത, വാണിജ്യ ഡാറ്റ സ്രോതസ്സുകളുമായി താരതമ്യപ്പെടുത്താവുന്നതാണ് നല്ലത്, അത് നിരന്തരമായി പിശകുകൾ ഉള്ളതാണ്. അവസാനമായി, അൻസോളബേറയുടെയും ഹെർഷത്തിൻറെയും പഠനത്തിന്റെ മൂന്നാമത്തെ പൊതുവായ പാഠം, ചില സാഹചര്യങ്ങളിൽ, സങ്കീർണ്ണമായ സാമൂഹിക വിവര ശേഖരണങ്ങൾ ശേഖരിച്ച്, സ്വീകാര്യമാക്കുന്നതിൽ അനേകം സ്വകാര്യ കമ്പനികൾ ചെയ്യുന്ന വൻ നിക്ഷേപങ്ങളിൽ നിന്ന് ഗവേഷകർക്ക് പ്രയോജനം ലഭിക്കുന്നു എന്നതാണ്.