ജനപ്രാതിനിധ്യ നിങ്ങളുടെ ടാർഗെറ്റ് ജനസംഖ്യ നിങ്ങളുടെ പ്രതികരിച്ചവരിൽ ഊഹങ്ങൾ നടത്തുന്നത് സംബന്ധിച്ച് ആണ്.
പ്രതികരിച്ചവരിൽ നിന്നും വലിയ ജനസംഖ്യയിലേക്ക് വരുമ്പോൾ ഉണ്ടാകുന്ന പിഴവുകൾ മനസിലാക്കുന്നതിനായി, 1936 ലെ അമേരിക്കൻ പ്രസിഡന്റ് തെരഞ്ഞെടുപ്പിന്റെ ഫലം പ്രവചിക്കാൻ ശ്രമിച്ച സാഹിത്യജാലക വൈക്കോൽ വോട്ടെടുപ്പ് പരിഗണിക്കാം. 75 വർഷങ്ങൾക്കുമുമ്പ് ഇത് സംഭവിച്ചെങ്കിലും, ഗവേഷകർ ഇന്ന് പഠിപ്പിക്കുന്നതിൽ ഒരു സുപ്രധാന പാഠം ഇന്നും നിലനിൽക്കുന്നു.
സാഹിത്യരംഗത്ത് ജനകീയ ജനപ്രീതിയുള്ള മാഗസിൻ ആയിരുന്നു അത്. പിന്നീട് 1920 മുതൽ അവർ പ്രസിഡന്റ് തെരഞ്ഞെടുപ്പിന്റെ പ്രവചനങ്ങൾ പ്രവചിക്കാൻ വൈക്കോൽ തെരഞ്ഞെടുപ്പ് തുടങ്ങി. ഈ പ്രവചനങ്ങൾ നടത്താൻ, അവർക്ക് ധാരാളം ആളുകൾക്ക് ബോളോട്ടുകൾ അയക്കും, തുടർന്ന് മടങ്ങിയെത്തപ്പെട്ട ബാലറ്റുകൾ ചുരുക്കമായിരിക്കും. സാഹിത്യ ഡൈജസ്റ്റ് അഭിമാനത്തോടെ അവർ ലഭിച്ച ബാലറ്റുകൾ ആയിരുന്നില്ലെന്നും റിപ്പോർട്ട് ", വെയ്റ്റഡ് ക്രമീകരിച്ചു, അരുതു വ്യാഖ്യാനിച്ചു." ഈ പ്രക്രിയ ശരിയായി തെരഞ്ഞെടുപ്പ് വിജയികൾക്ക് 1920, 1924, 1928 നും 1932 1936-ൽ, കളിലെ നടുവിൽ മുൻപേ ലിറ്റററി ഡൈജസ്റ്റ് 10 മില്യൺ ജനങ്ങൾക്ക് അയച്ചു, അവരുടെ പേരുകൾ ടെലിഫോൺ ഡയറക്റ്ററികളിലും ഓട്ടോമൊബൈൽ രജിസ്ട്രേഷൻ റെക്കോർഡുകളിലും നിന്നായിരുന്നു. അവർ അവരുടെ രീതി വിശദീകരിക്കുന്നത് ഇതാ:
"ഡീജസ്റ്റ്സിന്റെ മിനുസപ്പെടുത്തിയ റണ്ണിംഗ് യന്ത്രം മുപ്പതു വർഷത്തെ അനുഭവത്തിന്റെ വേഗതയെ സൂക്ഷ്മമായി വിലയിരുത്തുന്നു, ഇത് ഹാർഡ് വസ്തുതകൾക്ക് ഊഹിക്കാൻ കഴിയുന്നു ... ഈ ആഴ്ചയിൽ, 500 പേരുകൾ ഒരു ദശലക്ഷം അഭിസംബോധന ദിനങ്ങൾ ഒരു ദിവസത്തിൽ കൂടുതൽ കവർ ചെയ്യുന്നു. എല്ലാദിവസവും ന്യൂയോർക്കിലെ ഫോർത്ത് അവന്യൂവിലെ മോട്ടോർ-റിബണിന്റെ മുകളിലുള്ള ഒരു വലിയ മുറിയിൽ, 400 തൊഴിലാളികൾ ഒരു മില്യൺ അച്ചടിച്ച സാധനങ്ങളെ, അതായത് നാല്പതു സിറ്റി ബ്ളോക്കുകൾ സജ്ജീകരിക്കാൻ മതിയാവുന്നു - അഭിസംബോധന ചെയ്തുകൊണ്ടിരിക്കുന്ന എൻവലപ്പുകളിലേക്ക്. ഓരോ മണിക്കൂറും, ഡീജസ്റ്റിന്റെ സ്വന്തം പോസ്റ്റ് ഓഫീസ് സബ്സ്റ്റേഷനിൽ, മൂന്നു ചുറ്റളവിലുള്ള തപാൽ മീറ്ററിംഗ് മെഷീനുകൾ വെളുത്ത കടമ്പകൾ മുദ്രയിടുകയും മുദ്രയിടക്കുകയും ചെയ്തു; വിദഗ്ധ പോസ്റ്റൽ ജീവനക്കാരും അവരെ തകരാറിലായ മെയിലുകളാക്കി മാറ്റി. മെയിൽ ട്രെയിനുകൾ തുറന്ന് പറക്കാൻ ഡിഎജിസ്റ്റ് ട്രക്കുകൾ സ്ഥാപിച്ചു. . . അടുത്ത ആഴ്ച, ഈ പത്തു ദശലക്ഷം വരുന്ന ആദ്യ ഉത്തരങ്ങൾ അടയാളപ്പെടുത്തിയ ബാലറ്റുകളുടെ ഇൻകമിംഗ് ടൈറ്റ് തുടങ്ങും, ഇത് ട്രിപ്പിൾ ചെക്കുചെയ്ത്, പരിശോധിച്ചു, അഞ്ചുതവണ ക്രോസ്-ക്ലാസിഫൈഡ് ചെയ്യണം. കഴിഞ്ഞ കണക്കുകൾ പരിശോധിക്കപ്പെടുമ്പോൾ, മുൻകാല അനുഭവം ഒരു മാനദണ്ഡമാണെങ്കിൽ, നാൽപത് ദശലക്ഷം വോട്ടർമാരുടെ യഥാർത്ഥ വോട്ടിന്റെ 1% വെറും ഒരു ശതമാനം മാത്രമേ രാജ്യത്തിന് അറിയാൻ കഴിയൂ. "(ഓഗസ്റ്റ് 22, 1936)
ഇന്നത്തെ "വലിയ ഡാറ്റ" ഗവേഷകനെ സൂചിപ്പിക്കുന്നതിന് ലിറ്റററി ഡൈജസ്റ്റ് ഫെയ്സിഷനിലയെ ഉടനടി തിരിച്ചറിയാൻ കഴിയും. 10 ദശലക്ഷം ബില്ലോട്ടുകളിൽ വിതരണം ചെയ്തതിൽ 2.4 മില്യൺ ആളുകൾ മടങ്ങിയെത്തി, ആധുനിക രാഷ്ട്രീയ തെരഞ്ഞെടുപ്പുകളേക്കാൾ 1,000 മടങ്ങ് കൂടുതലാണ് അത്. 2.4 ദശലക്ഷം ആളുകളിൽ നിന്ന് വിധി പ്രഖ്യാപിച്ചത് വ്യക്തമായിരുന്നു: ഫ്രാങ്ക്ലിൻ റൂസ്വെൽറ്റിനെതിരെ ആൽഫ് ലാൻഡൻ പരാജയപ്പെടുകയായിരുന്നു. വാസ്തവത്തിൽ, റൗണ്ട്വെൽറ്റ് ലാൻഡനെ ഒരു മണ്ണിടിച്ചിലിൽ തോൽപ്പിച്ചു. ലിറ്റററി ഡൈജസ്റ്റ് എങ്ങനെയാണ് ഇത്രയേറെ ഡാറ്റയിൽ തെറ്റാകുവാൻ പോകുന്നത്? സാംപ്ളിങ്ങിന്റെ ആധുനിക ധാരണ, സാഹിത്യ ഡൈജസ്റ്റ് തെറ്റുകൾ വ്യക്തമാക്കുകയും, ഭാവിയിൽ സമാനമായ തെറ്റുകൾ ഒഴിവാക്കാൻ ഞങ്ങളെ സഹായിക്കുകയും ചെയ്യുന്നു.
സാമ്പിളുകളെക്കുറിച്ച് ചിന്തിക്കുന്നത് വ്യക്തമായും, വ്യത്യസ്തമായ നാലു വ്യത്യസ്തവിഭാഗങ്ങളെ (ചിത്രം 3.2) പരിഗണിക്കേണ്ടതുണ്ട്. ആദ്യത്തെ ഗ്രൂപ്പ് ലക്ഷ്യം ജനസംഖ്യയാണ് ; ഗവേഷകൻ താത്പര്യക്കാരെ പ്രതിഫലിപ്പിക്കുന്ന ഗ്രൂപ്പാണ് ഇത്. സാഹിത്യ ഡൈജസ്റ്റ് കാര്യത്തിൽ, ജനസംഖ്യ 1936 പ്രസിഡന്റ് തെരഞ്ഞെടുപ്പിൽ വോട്ടർമാർക്ക് ആയിരുന്നു.
ഒരു ലക്ഷ്യം ജനസംഖ്യ തീരുമാനിച്ച ശേഷം, ഒരു ഗവേഷകൻ സാംപ്ളിങ് വേണ്ടി ഉപയോഗിക്കാൻ കഴിയുന്ന ആളുകളുടെ ഒരു ലിസ്റ്റ് വികസിപ്പിക്കേണ്ടതുണ്ട്. ഈ പട്ടികയെ ഒരു സാമ്പിൾ ഫ്രെയിം എന്ന് വിളിക്കുന്നു, അതിൽ ഉള്ളവർ ഫ്രെയിം ജനസംഖ്യ എന്ന് വിളിക്കുന്നു. സാധാരണയായി, ലക്ഷ്യം ജനസംഖ്യയും ഫ്രെയിം ജനസംഖ്യയും ഒന്നുതന്നെയായിരിക്കും, പക്ഷേ പ്രായോഗികമായി ഇത് പലപ്പോഴും കാര്യമല്ല. ഉദാഹരണത്തിന്, സാഹിത്യ ഡൈജസ്റ്റ് കാര്യത്തിൽ , ഫ്രെയിം പോപ്പുലേഷൻ 10 ദശലക്ഷം പേരാണ്, ടെലഫോൺ ഡയറക്ടറികൾ, ഓട്ടോമൊബൈൽ രജിസ്ട്രേഷൻ റെക്കോർഡുകൾ എന്നിവയിൽ നിന്നുള്ള പേരാണ് ഇവരുടെ പേരുകൾ. ലക്ഷ്യം ജനസംഖ്യയും ഫ്രെയിം ജനങ്ങളും തമ്മിലുള്ള വ്യത്യാസം കവറേജ് തെറ്റ് എന്നാണ് . കവറേജ് പ്രശ്നം തന്നെ, ഉറപ്പ്, ഗ്യാരണ്ടി പ്രശ്നങ്ങൾ ഇല്ല. എന്നിരുന്നാലും, ഫ്രെയിം ജനസംഖ്യയിൽ ആയിരക്കണക്കിന് ജനസംഖ്യയിൽ നിന്നുള്ള ജനങ്ങളിൽ നിന്ന് വ്യത്യാസമില്ലാതെ ഫ്രെയിം പോപ്പുലേഷനിൽ ആളുകൾ കവറേജ് പക്ഷപാതിത്വത്തിലേക്ക് നയിക്കും. വാസ്തവത്തിൽ, യഥാർത്ഥത്തിൽ, സാഹിത്യ ഡയജest വോട്ടെടുപ്പിൽ എന്താണ് സംഭവിച്ചത്? ആൽഫ് ലാൻഡനെ പിന്തുണക്കുന്നതിൽ കൂടുതൽ ആൾക്കാർ അവരുടെ ഫ്രെയിം ജനസംഖ്യയിൽ ഏർപ്പെട്ടിരുന്നു, കാരണം അവർ ധനികരാണ് (1936 ലെ ടെലിഫോണുകളും വാഹനങ്ങളും താരതമ്യേന പുതിയതും ചെലവേറിയതുമാണെന്ന കാര്യം ഓർക്കുക). അതിനാൽ, സാഹിത്യ ഡയജest വോട്ടെടുപ്പിൽ, കവറേജ് പിഴവ് കവറേജ് പക്ഷപാതത്തിന് ഇടയാക്കി.
ഫ്രെയിം ജനസംഖ്യയെ നിർവ്വചിച്ചതിനുശേഷം, അടുത്ത ഗവേഷകൻ സാമ്പിൾ ജനസംഖ്യ തിരഞ്ഞെടുക്കുന്നതിനുള്ള ഒരു ഗവേഷകനാണ്; ഗവേഷകന് അഭിമുഖത്തിന് ശ്രമിക്കുന്ന ആളുകൾ ഇതാണ്. സാമ്പിൾ ഫ്രെയിം ജനസംഖ്യയെക്കാളും വ്യത്യസ്ത സ്വഭാവസവിശേഷതകൾ ആണെങ്കിൽ, സാംപ്ളിങ് സാംപിംഗ് പിശക് അവതരിപ്പിക്കുന്നു. എന്നിരുന്നാലും, സാഹിത്യ ഡയജസ്റ്റ് ഫെയ്സിക്കിന്റെ കാര്യത്തിൽ, യഥാർഥത്തിൽ ഒരു സാമ്പിൾ പോലും ഇല്ല- ഫ്രെയിം ജനസംഖ്യയിൽ എല്ലാവരെയും ബന്ധപ്പെടാനുള്ള മാസിക - അതുകൊണ്ടാണ് ഒരു സാമ്പിൾ പിശക് ഉണ്ടായില്ല. പല ഗവേഷകർ സാംപ്ളിങ് പിശകിന്മേൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു - ഇത് സാധാരണയായി സർവേകളിൽ തെറ്റിന്റെ തെറ്റിന്റെ മാർജിനിൽ പിടിക്കപ്പെട്ട ഒരേയൊരു പിഴവ് മാത്രമാണ്. എന്നാൽ ലിറ്റററി ഡൈജസ്റ്റ് ഫെയ്സ്കോ നമ്മളോട് എല്ലാ തെറ്റായ സ്രോതസ്സുകളേയും ക്രമരഹിതവും ചിട്ടയുമായവയെക്കുറിച്ച് പരിശോധിക്കേണ്ടതുണ്ട്.
ഒടുവിൽ, ഒരു സാമ്പിൾ ജനസംഖ്യ തെരഞ്ഞെടുത്ത്, ഒരു ഗവേഷകൻ അതിന്റെ എല്ലാ അംഗങ്ങളെയും അഭിമുഖം നടത്താൻ ശ്രമിക്കുന്നു. വിജയകരമായ അഭിമുഖം ലഭിച്ചവർ പ്രതികരിക്കുന്നവരാണ് . മാതൃകാപരമായി, സാമ്പിൾ ജനസംഖ്യയും പ്രതികരിക്കുന്നവരും കൃത്യമായി ഒന്നു തന്നെ, എന്നാൽ പ്രായോഗികമായി നോൺ റസിഷൻസ് ഉണ്ട്. അതായത്, സാമ്പിളിൽ തിരഞ്ഞെടുക്കപ്പെട്ട ആളുകൾ ചിലപ്പോൾ പങ്കെടുക്കില്ല. പ്രതികരിക്കുന്ന ആളുകൾക്ക് പ്രതികരിക്കാത്തവരിൽ നിന്ന് വ്യത്യസ്ഥമാണെങ്കിൽ, നോൺ റീസൺസ് ബയസ് ഉണ്ടാകും . നൊംരെസ്പൊംസെ ബയസ് സാഹിത്യ ഡൈജസ്റ്റ് വോട്ടെടുപ്പിലൂടെ രണ്ടാം പ്രധാന പ്രശ്നം. ഒരു ബാലറ്റ് ലഭിച്ച ജനങ്ങളിൽ 24% പേർ മാത്രമാണ് പ്രതികരിച്ചത്. ലാൻഡനെ പിന്തുണയ്ക്കുന്നവർ പ്രതികരിക്കാനുള്ള സാധ്യത കൂടുതലാണ്.
പ്രാതിനിധ്യത്തിന്റെ ആശയങ്ങൾ പരിചയപ്പെടുത്തുന്നതിന് ഒരു ഉദാഹരണമായിട്ടാണ്, സാഹിത്യ ഡയജസ്റ്റ് വോട്ടെടുപ്പ് നിരന്തരം ആവർത്തിക്കപ്പെടുന്ന സുതാര്യവും, അബദ്ധ മാതൃകയെക്കുറിച്ചുള്ള അപകടങ്ങളെക്കുറിച്ച് ഗവേഷകർ മുന്നറിയിപ്പ് നൽകുന്നു. നിർഭാഗ്യവശാൽ, ഈ കഥയിൽ നിന്നും പലരും വരയ്ക്കുന്ന പാഠം തെറ്റാണെന്ന് ഞാൻ കരുതുന്നു. സംഭാവ്യതയുള്ള സാമ്പിളുകൾ (അതായത്, പങ്കെടുക്കുന്നവരെ തിരഞ്ഞെടുക്കുന്നതിന് കർശനമായ പ്രോബബിലിറ്റി അടിസ്ഥാനമാക്കിയുള്ള നിയമങ്ങൾ ഇല്ലാതെ സാമ്പിളുകൾ) നിന്ന് ഒന്നും പഠിക്കാനില്ല എന്നതാണ് കഥയുടെ ഏറ്റവും സാധാരണമായ ധാർമ്മികത. എന്നാൽ, ഞാൻ പിന്നീട് ഈ അധ്യായത്തിൽ കാണിക്കും പോലെ, അത് തികച്ചും ശരിയായതല്ല. പകരം, ഈ കഥയ്ക്ക് രണ്ടു ധാർമികതകളുണ്ടെന്ന് ഞാൻ കരുതുന്നു. 1936 ൽ ഉണ്ടായിരുന്നതുപോലെ ഇന്ന് സത്യമായിട്ടുള്ള ധാർമികതകളാണ്. ഒന്നാമതായി, വളരെ വലിയ അളവിൽ ശേഖരിച്ച ഡാറ്റ ഒരു നല്ല മതിപ്പ് ഉറപ്പുനൽകുന്നില്ല. പൊതുവേ, പ്രതികരിക്കപ്പെട്ട ധാരാളം ആൾക്കാർക്ക് മതിപ്പുളവാക്കുന്ന വ്യത്യാസങ്ങൾ കുറയുന്നുണ്ടെങ്കിലും, അത് പക്ഷപാതിത്വം കുറയ്ക്കുന്നില്ല. ഒരുപാട് ഡാറ്റ ഉപയോഗിച്ച്, ഗവേഷകർക്ക് ചിലപ്പോൾ തെറ്റായ കാര്യങ്ങൾ കൃത്യമായി കണക്കാക്കാം. കൃത്യമായ കൃത്യതയില്ലാത്തതാകാം (McFarland and McFarland 2015) . ലിറ്റററി ഡൈജസ്റ്റ് ഫിയസ്കോയിൽ നിന്നുള്ള രണ്ടാമത്തെ പ്രധാന പാഠം, ഗവേഷണങ്ങൾ നടത്തുമ്പോൾ എങ്ങനെയാണ് അവരുടെ സാമ്പിൾ ശേഖരിക്കപ്പെട്ടത് എന്നതിന് പരിശോധിക്കേണ്ടതുണ്ട്. മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, സാഹിത്യ ഡൈജസ്റ്റ് പോളിലെ സാമ്പിൾ പ്രോസസ് ചില പ്രതികരിക്കുന്നവരെ പതിവായി വയ്ക്കുന്നത് കാരണം, ഗവേഷകർ കൂടുതൽ സങ്കീർണ്ണമായ കണക്കാക്കൽ പ്രക്രിയകൾ ഉപയോഗിക്കേണ്ടതുണ്ട്, അത് ചില പ്രതികരിക്കാൻ മറ്റുള്ളവരെ സഹായിക്കും. ഈ അധ്യായത്തിൽ, ഞാൻ അത്തരം വെയിറ്റ് ചെയ്യൽ നടപടി-പോസ്റ്റ്-സ്ട്രേറ്റിഫിക്കേഷൻ കാണിച്ചുതരാം-അത് അദ്ഭുതകരമായ സാമ്പിളുകൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് കൂടുതൽ മതിപ്പുള്ളതാക്കാൻ നിങ്ങളെ പ്രാപ്തരാക്കും.