നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകൾ ഉപയോഗിച്ച്, തൂക്കം ഊഹിച്ചു ഒരുപറ്റം പ്രക്രിയ പരത്തിയ വ്യതിയാനങ്ങളെക്കുറിച്ച് പഴയപടിയാക്കാനുമാകും.
ഗവേഷകർ പ്രോബബിലിറ്റി സാമ്പിളുകൾ നിന്ന് പ്രതികരണങ്ങൾ ശരീരഭാരം അതേ വിധത്തിൽ, അവർ നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ നിന്ന് പ്രതികരണങ്ങൾ ഭാരം കഴിയും. ഉദാഹരണത്തിന്, തപ്പി പകരമായി, നിങ്ങൾ തൊഴിലില്ലായ്മ നിരക്ക് കണക്കാക്കാൻ ഒരു സർവേ വേണ്ടി പങ്കെടുക്കുന്നവരെ റിക്രൂട്ട് ആയിരകണക്കിന് വെബ്സൈറ്റുകളെ ന് ബാനർ പരസ്യങ്ങൾ സ്ഥാപിച്ചു കരുതുക. സ്വാഭാവികമായും, നിങ്ങളുടെ സാമ്പിൾ ലളിതമായ മാധ്യം തൊഴിലില്ലായ്മാനിരക്ക് നല്ല മതിപ്പ് ആയിരിക്കുമെന്ന് സംശയമുണ്ടായിരുന്ന തന്നെ. നിങ്ങൾ ചില ആളുകൾ മറ്റുള്ളവരെ അപേക്ഷിച്ച് നിങ്ങളുടെ സർവേ പൂർത്തിയാക്കാൻ കൂടുതൽ സാധ്യത ഗുണകരമാവുമെന്ന് നിങ്ങളുടെ കഷ്ണം ആവാം. ഉദാഹരണത്തിന്, വെബിൽ ധാരാളം സമയം ചെലവഴിക്കേണ്ടത് ആളുകൾ നിങ്ങളുടെ സർവേ പൂർത്തിയാക്കാൻ സാധ്യത കുറവാണ്.
കഴിഞ്ഞ വിഭാഗത്തിൽ കണ്ടതുപോലെ, എന്തായാലും, സാമ്പിൾ തിരഞ്ഞെടുത്ത-പോലെ നമുക്ക് എങ്ങനെ പ്രോബബിലിറ്റി സാമ്പിളുകൾ-പിന്നീട് തമ്മിൽ എന്തു അറിയാമെങ്കിൽ ഞങ്ങൾ ഒരുപറ്റം പ്രക്രിയ പരത്തിയ വ്യതിയാനങ്ങളെക്കുറിച്ച് പഴയപടിയാക്കാനുമാകും. നിർഭാഗ്യവശാൽ, നോൺ-രിച്ച് സാമ്പിളുകൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്ന സമയത്ത്, സാമ്പിൾ എങ്ങനെയാണ് തിരഞ്ഞെടുത്തത് അറിയില്ല. എങ്കിലും നാം ഒരുപറ്റം പ്രക്രിയ കുറിച്ച് ഒന്നാണ് തുടർന്ന് അതേ വിധത്തിൽ വെയ്റ്റേജിനു അപേക്ഷിക്കാം. ഈ അനുമാനങ്ങൾ ശരിയാണെങ്കിൽ, പിന്നെ വെയ്റ്റേജിനു ഒരുപറ്റം പ്രക്രിയ പരത്തിയ വ്യതിയാനങ്ങളെക്കുറിച്ച് തുടച്ചുനീക്കും.
ഉദാഹരണത്തിന്, നിങ്ങളുടെ ബാനർ പരസ്യങ്ങളിൽ പ്രതികരണമായി, നിങ്ങൾക്ക് 100,000 സർവേയിൽ റിക്രൂട്ട് കരുതുക. എന്നിരുന്നാലും, ഈ 100,000 സർവേയിൽ അമേരിക്കൻ മുതിർന്നവർക്കും ഒരു ലളിതമായ റാൻഡം സാമ്പിൾ ആകുന്നു വിശ്വസിക്കുന്നില്ല. സത്യത്തിൽ, അമേരിക്കൻ ജനസംഖ്യ നിങ്ങളുടെ പ്രതികരിച്ചവരിൽ താരതമ്യം ചെയ്യുമ്പോൾ, നിങ്ങൾ ചില സംസ്ഥാനങ്ങളിൽ (ഉദാ, ന്യൂയോർക്ക്) മുതൽ ജനമായ പ്രതിനീധീകരിക്കപ്പെടുന്നില്ല ചില രാജ്യങ്ങൾ (ഉദാ, അലാസ്ക) മുതൽ ജനം അണ്ടർ കാണിക്കുന്ന ആശ്രയത്വം. കണ്ടെത്താൻ ഇപ്രകാരം നിങ്ങളുടെ മാതൃകാ തൊഴിലില്ലായ്മ നിരക്ക് ജനസംഖ്യ തൊഴിലില്ലായ്മ നിരക്ക് ഒരു മോശം എസ്റ്റിമേറ്റ് സാധ്യത.
ഒരുപറ്റം പ്രക്രിയയിൽ സംഭവിച്ച വക്രീകരിക്കൽ ഇല്ലാതാക്കാന് ഒരു വഴി ഓരോ വ്യക്തിക്ക് തൂക്കം നൽകുവാനും എന്നതാണ്; സാമ്പിൾ ഓവറിൽ-കാണിക്കുന്ന സംസ്ഥാനങ്ങളിൽ (ഉദാ, ന്യൂയോർക്ക്) ഉയർന്ന തൂക്കം നിന്ന് കീഴിൽ പ്രതിനീധീകരിക്കപ്പെടുന്നില്ല സാമ്പിൾ (ഉദാ, അലാസ്ക) ഉള്ളവർ സംസ്ഥാനങ്ങളിൽ നിന്നും ജനങ്ങൾ ആളുകളെ ലേക്ക് താഴത്തെ തൂക്കവും. പോരാഞ്ഞ്, ഓരോ പ്രതികളുടെ വേണ്ടി ശരീരഭാരം യുഎസ് അവരുടെ ജനസംഖ്യയ്ക്ക് വരാനുള്ള നിങ്ങളുടെ സാമ്പിൾ ബന്ധു അവരുടെ വരാനുള്ള ബന്ധപ്പെട്ടാണ്. ഈ വെയ്റ്റേജിനു നടപടിക്രമം പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു വിളിക്കപ്പെടുന്നു, തൂക്കം ആശയം വിഭാഗം 3.4.1 എവിടെ റോഡ് ഐലൻഡ് മുതൽ പ്രതികരിച്ചവരിൽ കാലിഫോർണിയയിൽ പ്രതികരിച്ചവരിൽ കുറവ് ഭാരം നൽകപ്പെട്ട ലെ ഉദാഹരണം ഓർമ്മിപ്പിക്കണമെങ്കിൽ. പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു നിങ്ങൾ ഗ്രൂപ്പുകളായി നിങ്ങളുടെ പ്രതികരിച്ചവരിൽ ഇട്ടു ഓരോ ഗ്രൂപ്പിൽ ജനസംഖ്യ അനുപാതം അറിയാൻ വേണ്ടത്ര അറിവ് ആവശ്യപ്പെടുന്നു.
പ്രോബബിലിറ്റി ഫലപുഷ്ടി നോൺ-പ്രോബബിലിറ്റി ഫലപുഷ്ടി വെയ്റ്റേജിനു ഒരേ ആണെങ്കിലും ഗണിതശാസ്ത്രത്തിൽ (സാങ്കേതിക അനുബന്ധം കാണുക), വ്യത്യസ്ത സാഹചര്യങ്ങളിൽ നന്നായി ജോലി. ഗവേഷകൻ ഒരു തികഞ്ഞ സംഭാവ്യത സാമ്പിൾ (അതായത്, യാതൊരു കവറേജ് പിശക് യാതൊരു നോൺ-പ്രതികരണം) ഉണ്ടെങ്കിൽ, ഘനം എല്ലാ കേസുകളിലും എല്ലാ സ്വഭാവവിശേഷങ്ങൾ വേണ്ടി ബൈജു എസ്റ്റിമേറ്റുകൾ നൽകും. പ്രോബബിലിറ്റി സാമ്പിളുകൾ വക്താക്കൾ അവരെ വളരെ ആകർഷകമായ കണ്ടെത്താൻ ഇതുകൊണ്ടാണ് ശക്തമായ സൈദ്ധാന്തിക ഉറപ്പിന്. പ്രതികരണ propensities ഓരോ ഗ്രൂപ്പിൽ എല്ലാവർക്കും ഒരേ എങ്കിൽ മറുവശത്ത്, നോൺ-രിച്ച് സാമ്പിളുകൾ ഘനം മാത്രം എല്ലാ നേതൃപാടവം വേണ്ടി ബൈജു എസ്റ്റിമേറ്റുകൾ നൽകും. മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, ന്യൂയോർക്കിലെ എല്ലാവർക്കും പങ്കെടുക്കുന്ന അതേ സംഭാവ്യത ഉണ്ട് അലാസ്കയിൽ എല്ലാവർക്കും അങ്ങനെയുള്ളവ പങ്കെടുത്ത് അതേ സംഭാവ്യത ഉണ്ട് എങ്കിൽ പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു ബൈജു എസ്റ്റിമേറ്റുകൾ താനേ ഉപയോഗിച്ച് തിരികെ ഉദാഹരണം കൊതിച്ചു. ഈ അനുമാനം സമീകൃത-പ്രതികരണ-propensities-ഉള്ളിൽ-ഗ്രൂപ്പുകൾ അനുമാനം വിളിക്കപ്പെടുന്നു, പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ നന്നായി പ്രവർത്തിക്കാൻ എങ്കിൽ അറിയാതെ ഒരു മുഖ്യപങ്കു വഹിക്കുന്നു.
നിർഭാഗ്യവശാൽ, ഞങ്ങളുടെ ഉദാഹരണത്തിൽ, സമീകൃത-പ്രതികരണം-propensities-ഉള്ളിൽ-ഗ്രൂപ്പുകൾ അനുമാനം ശരിയാണെന്ന് ഇടയില്ല തോന്നുന്നു. അതായത് അതിന്റെ അലാസ്കയിൽ എല്ലാവർക്കും നിങ്ങളുടെ സർവേ ഒരാളായി അതേ സംഭാവ്യത ഉണ്ട് എന്ന് സാധ്യതയും കാണുന്നില്ല. പക്ഷേ, കൂടുതൽ ഉൾനാടൻ പരിവേഷം എല്ലാം പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു കുറിച്ച് മനസിൽ സൂക്ഷിക്കാൻ മൂന്ന് പ്രധാനപ്പെട്ട പോയിന്റ് ഉണ്ട്.
ആദ്യം, സമീകൃത-പ്രതികരണ-propensities-ഉള്ളിൽ-ഗ്രൂപ്പുകൾ അനുമാനം ഗ്രൂപ്പുകൾ എണ്ണം വർദ്ധിക്കുകയും കൂടുതൽ ശരിയാണെന്നു മാറുന്നു. പിന്നെ ഗവേഷകർ വെറും ഒറ്റ ഭൂമിശാസ്ത്ര മാനങ്ങൾ അടിസ്ഥാനമാക്കി ഗ്രൂപ്പുകൾ പരിമിതപ്പെടുത്തിയിരിക്കുന്നു. ഉദാഹരണത്തിന്, സംസ്ഥാന, വയസ്, ലിംഗഭേദം, വിദ്യാഭ്യാസം അടിസ്ഥാനത്തിൽ ഗ്രൂപ്പുകൾ സൃഷ്ടിക്കാൻ കഴിഞ്ഞില്ല. ഇത് അലാസ്കയിൽ താമസിക്കുന്നവർ എല്ലാ ആളുകളുടെ ഗ്രൂപ്പിലെ അധികം 18-29 എന്ന ഗ്രൂപ്പ് പെൺ, കോളേജ് ബിരുദം അലാസ്കയിൽ താമസിക്കുന്നവർ ഉള്ളിൽ മാറിയെന്നതാണ് പ്രതികരണ propensities ഇല്ല എന്നു കൂടുതൽ ശരിയാണെന്നു തോന്നുന്നു. ഇപ്രകാരം, പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു വർധന ഉപയോഗിക്കുന്ന ഗ്രൂപ്പുകളുടെ നമ്പർ ആയി, ഊഹങ്ങൾ കൂടുതൽ ന്യായമായ ആകുവാൻ പിന്തുണയ്ക്കാൻ ആവശ്യമായിരുന്നു. ഈ വസ്തുത, ഒരു ഗവേഷകർ പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു ഗ്രൂപ്പുകൾ ഒരു വലിയ സംഖ്യ സൃഷ്ടിക്കാൻ ആഗ്രഹിക്കുക തോന്നുന്നു. ഡാറ്റ sparsity: എന്നാൽ, ഗ്രൂപ്പുകൾ എണ്ണം വർദ്ധിക്കുകയും പോലെ ഗവേഷകർ മറ്റൊരു പ്രശ്നം. ആളുകളുടെ ഒരു ചെറിയ എണ്ണം മാത്രമേ ഓരോ ഗ്രൂപ്പിൽ ഉണ്ട് എങ്കിൽ, കണക്കുകളെ കൂടുതൽ തെളിവില്ലാത്ത ആയിരിക്കും; ആരും പ്രതികരിക്കുന്ന ഉണ്ട് ഒരു ഗ്രൂപ്പ് ഉള്ളേടത്തു അങ്ങേയറ്റത്തെ കേസിൽ, തുടർന്ന് പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു പൂർണമായി ആഖ്യാനം. homogeneous- പ്രതികരണ-ഒത്തു-ഉള്ളിൽ-ഗ്രൂപ്പുകൾ അനുമാനം ഓരോ ഗ്രൂപ്പിൽ ന്യായമായ സാമ്പിൾ വലുപ്പങ്ങൾക്കായി ആവശ്യം സാദ്ധ്യതയെങ്കിലുമുള്ളതുകൊണ്ടാണ് തമ്മിലുള്ള ഈ അന്തർലീനമായ ടെൻഷൻ നിന്നു രണ്ട് വഴികളുണ്ട്. വൺ സമീപനം ഘനം കണക്കുകൂട്ടുക മറ്റ് ഒരു വഴക്കങ്ങൾ സ്റ്റാറ്റിസ്റ്റിക്കൽ മോഡൽ നീങ്ങാൻ ഓരോ ഗ്രൂപ്പിലെ ന്യായമായ സാമ്പിൾ വലുപ്പത്തിലുമുള്ള ഉറപ്പാക്കാൻ സഹായിക്കുന്ന ഒരു വലിയ, കൂടുതൽ വ്യത്യസ്തമായ സാമ്പിൾ ശേഖരിക്കാൻ ആണ്. പിന്നെ, ചിലപ്പോൾ ഗവേഷകർ ഇരുവരും ഞാൻ താഴെ കൂടുതൽ വിശദമായി വിവരിക്കുക വരുമെന്നതിനാൽ ചെയ്യാൻ.
നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകൾ നിന്ന് പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു കൂടെ പ്രവർത്തിക്കുമ്പോൾ രണ്ടാമത്തെ പരിഗണന സമീകൃത-പ്രതികരണ-ഒത്തു-ഉള്ളിൽ-ഗ്രൂപ്പുകൾ അനുമാനം പ്രോബബലിറ്റി സാമ്പിളുകൾ വിശകലനം ചെയ്യുമ്പോൾ ഇതിനകം പതിവായി കഴിക്കുന്ന ആണ്. ഈ അനുമാനം പ്രാക്ടീസ് പ്രോബബിലിറ്റി സാമ്പിളുകൾ വേണ്ടി ആവശ്യമാണെന്ന് കാരണം പ്രോബബിലിറ്റി സാമ്പിളുകൾ നോൺ-പ്രതികരണ ഉണ്ടു; മുകളിൽ വിവരിച്ച പോലെ നോൺ-പ്രതികരണത്തിനായി ക്രമീകരിച്ചുകൊണ്ട് ഏറ്റവും സാധാരണമായ രീതി പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു ആണ്. ഗതി, കാരണം പല ഗവേഷകർ ചില അനുമാനം ചിലരെങ്കിലും ഇത് ചെയ്യണം ഇതിനർത്ഥമില്ല ഉണ്ടാക്കേണം. പക്ഷേ, ഇത് പ്രായോഗികമായി പ്രോബബിലിറ്റി സാമ്പിളുകൾ നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ തട്ടിച്ചു നോക്കിയാൽ നാം ഇരുവരും എസ്റ്റിമേറ്റുകൾ ഹാജരാക്കാൻ ക്രമത്തിൽ അനുമാനങ്ങൾ ആൻഡ് ഓക്സിലറി വിവരങ്ങൾ ആശ്രയിച്ചുള്ള മനസ്സിൽ നിലനിർത്തേണ്ടതുണ്ട് അർഥം. ഏറ്റവും റിയലിസ്റ്റിക് ക്രമീകരണങ്ങൾ ൽ കേവലം നിഗമനത്തിന്റെ യാതൊരു അനുമാനം-സ്വതന്ത്ര സമീപനമാണ്.
അവസാനമായി, ഞങ്ങളുടെ മാതൃക തൊഴിലില്ലായ്മ നിരക്ക്-പിന്നീട് പ്രത്യേക-ഇൻ ഒരു കണക്ക് അസ്വസ്ഥരാക്കുന്നെങ്കിൽ നിങ്ങൾ സമീകൃത-പ്രതികരണ-ഒത്തു-ഉള്ളിൽ-ഗ്രൂപ്പുകൾ അനുമാനം അധികം ദുർബല ഒരു കണ്ടീഷൻ ആവശ്യമാണ്. സവിശേഷമായും, എല്ലാവർക്കും ഒരേ പ്രതികരണ ഒത്തു ഞങ്ങൾ ഊഹിച്ചെടുക്കില്ല ആവശ്യമില്ല, നിങ്ങൾ മാത്രം ഓരോ ഗ്രൂപ്പിലും പ്രതികരണ ഒത്തു, തൊഴിലില്ലായ്മ നിരക്ക് തമ്മിൽ യാതൊരു ബന്ധമുണ്ടെന്ന് കരുതുന്നു വേണം. തീർച്ചയായും, ഈ ദുർബല കണ്ടീഷൻ ചില സാഹചര്യങ്ങളിൽ പിടിക്കുക ചെയ്യില്ല. ഉദാഹരണത്തിന്, വളണ്ടിയർ പ്രവൃത്തി ചെയ്യുന്ന അമേരിക്കക്കാർ അനുപാതം നിർണയിക്കാനും ഊഹിക്കാവുന്നതേയുള്ളൂ. സന്നദ്ധപ്രവർത്തനത്തിലൂടെയും ആളുകളെ സർവേയിലാണ് അംഗീകരിക്കുന്നു കൂടുതൽ സാധ്യത എങ്കിൽ, ഗവേഷകർ വ്യവസ്ഥാപിതമായി വഴി ആശങ്കകളെ തെളിയിക്കപ്പെട്ടതാണ് എന്നു സന്നദ്ധപ്രവർത്തനം അവർ പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു അഡ്ജസ്റ്റുമെന്റുകൾ ചെയ്യാൻ പോലും, തൽഫലമായി തുക മേൽ-കണക്കുകൂട്ടുന്നു ചെയ്യും Abraham, Helms, and Presser (2009) .
ഞാൻ നേരത്തേ പറഞ്ഞതു പോലെ, നോൺ-രിച്ച് സാമ്പിളുകൾ വലിയ കഷ്ണം സോഷ്യൽ ശാസ്ത്രജ്ഞർ, ഭാഗത്ത് കാരണം സർവേ റിസർച്ച് തുടക്കത്തിലെ ഏറ്റവും നാണംകെട്ട പരാജയങ്ങൾ ചില തങ്ങളുടെ ധർമം വരുമായിരുന്നോ. എത്ര ദൂരം ഞങ്ങൾ നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ വരുന്നുണ്ടെന്ന് ഒരു വ്യക്തമായ ഉദാഹരണമാണ് ശരിയായി അമേരിക്കൻ എക്സ്ബോക്സ് ഉപയോക്താക്കളുടെ ഒരു നോൺ-പ്രോബബലിറ്റി സാമ്പിൾ ഉപയോഗിച്ച് 2012 യുഎസ് തെരഞ്ഞെടുപ്പ് ഫലത്തെ കണ്ടെടുത്തു എന്നു വെയ് വാങ്, ഡേവിഡ് സുഗുണന്, ശരദ് ഗോയൽ, ആൻഡ്രൂ Gelman ഗവേഷണ ആണ് അമേരിക്കക്കാർ ഓഹരിയാകുന്നു തീരുമാനിക്കപ്പെട്ടതുപോലെ നോൺ-റാൻഡം സാമ്പിൾ (Wang et al. 2015) . ഗവേഷകർ XBox ഗെയിമിംഗ് സിസ്റ്റത്തിൽ നിന്നും പ്രതികരിച്ചവരിൽ റിക്രൂട്ട്, നിങ്ങൾ പ്രതീക്ഷിക്കും പോലെ, എക്സ്ബോക്സ് സാമ്പിൾ ശോചനീയമാണ് ആണും ശോചനീയമാണ് യുവ: 18 - 29 വയസുള്ള വോട്ടർമാരിൽ 19% എങ്കിലും എക്സ്ബോക്സ് സാമ്പിൾ 65% ഉണ്ടാക്കുന്നത് പുരുഷന്മാരുടെ 47% ഉണ്ടാക്കുന്നത് വോട്ടർമാർ ആൻഡ് എക്സ്ബോക്സ് സാമ്പിൾ (ചിത്രം 3.4) 93% ന്റെ. കാരണം ഈ ശക്തമായ ജനസംഖ്യാപരമായ പക്ഷപാത എന്ന അസംസ്കൃത എക്സ്ബോക്സ് കണക്കുകള് തിരഞ്ഞെടുപ്പ് റിട്ടേൺ ഒരു പാവപ്പെട്ട സൂചകം ആയിരുന്നു. ഇത് ബറാക് ഒബാമ മേൽ മിറ്റ് റോംനി ശക്തമായ വിജയം പ്രവചിച്ചിരുന്നു. വീണ്ടും, ഈ അസംസ്കൃത, unadjusted നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകൾ അപകടത്തെ മറ്റൊരു ഉദാഹരണമാണ് സാഹിത്യ ഡൈജസ്റ്റ് ആന്റ്ടുമാറോ രൂപമാണ്.
എന്നാൽ വാങ് സഹപ്രവർത്തകരും ഈ പ്രശ്നങ്ങൾ കാരണം പറഞ്ഞ് ഒപ്പം ഒരുപറ്റം പ്രക്രിയ തിരുത്താൻ പ്രതികരിച്ചവരിൽ ഭാരം ശ്രമിച്ചു. പ്രത്യേകിച്ചും, അവർ പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു ഞാൻ നിനക്ക് ഒരു വഴക്കങ്ങൾ മാതൃകയാക്കിയത്. അതു പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു കുറിച്ച് സഹജാവബോധം പണിയുകയും പ്രത്യേക പതിപ്പ് വാങ് സഹപ്രവർത്തകരും ഉപയോഗിക്കുന്ന ഘനം നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകൾ ലേക്കുള്ള ഏറ്റവും ആവേശകരമായ സമീപനങ്ങളുടെ ഒന്നാണ് കാരണം അവരുടെ സമീപനം കുറച്ച് പഠന രൂപയുടെ.
വിഭാഗം 3.4.1 തൊഴിലില്ലായ്മ നിർണയിക്കാനും കുറിച്ച് നമ്മുടെ ലളിതമായ ഉദാഹരണം, ഞങ്ങൾ താമസിക്കുന്ന സംസ്ഥാന അടിസ്ഥാനത്തിൽ ഗ്രൂപ്പുകളായി ജനസംഖ്യ പിരിച്ചു. നേരെമറിച്ച്, വാങ് സഹപ്രവർത്തകരും ജനസംഖ്യ കയറി നിർവചിച്ചിരിക്കുന്നത് 176.256 ഗ്രൂപ്പുകളായി വിഭജിച്ചിരിക്കുന്നു: ലിംഗഭേദം (2 വിഭാഗങ്ങൾ), റേസ് (4 വിഭാഗങ്ങൾ), പ്രായം (4 വിഭാഗങ്ങൾ), വിദ്യാഭ്യാസം (4 വിഭാഗങ്ങൾ), സംസ്ഥാന (51 വിഭാഗങ്ങൾ), പാർട്ടി ഐഡി (3 വിഭാഗങ്ങൾ), പ്രത്യയശാസ്ത്രം (3 വിഭാഗങ്ങൾ) 2008 വോട്ട് (3 വിഭാഗങ്ങൾ). കൂടുതൽ ഗ്രൂപ്പുകളുമായി, ഗവേഷകരുടെ ഓരോ ഗ്രൂപ്പിലും, പ്രതികരണ ഒത്തു ഒബാമ പിന്തുണ ഉപയോഗിച്ച് uncorrelated എന്നു കൂടുതലായി സാധ്യത കരുതിയിരുന്നു. അടുത്തതായി, വ്യക്തിഗത-ലെവൽ തൂക്കം നിർമിക്കാൻ അധികം, നമ്മുടെ ഉദാഹരണത്തിൽ ചെയ്തതുപോലെ, വാങ് സഹപ്രവർത്തകരും ഒരു സങ്കീർണ്ണമായ മോഡൽ ഒബാമ വോട്ട് ചെയ്യുന്ന ഓരോ ഗ്രൂപ്പിൽ ജനങ്ങളുടെ അനുപാതം കണക്കാക്കാൻ ഉപയോഗിച്ച. ഒടുവിൽ അവർ പിന്തുണ കണക്കാക്കുന്ന മൊത്തത്തിൽ ലെവൽ നിർമ്മിക്കാനുള്ള ഓരോ ഗ്രൂപ്പിന്റെ അറിയപ്പെടുന്ന വലിപ്പം പിന്തുണ ഈ ഗ്രൂപ്പ് എസ്റ്റിമേറ്റുകൾ കൂട്ടിച്ചേർക്കാം. മറ്റു വാക്കുകളിൽ, അവർ ജനസംഖ്യ വിവിധ ഗ്രൂപ്പുകളായി അരിഞ്ഞത് ഓരോ ഗ്രൂപ്പിൽ ഒബാമ പിന്തുണ കണക്കുകൾ തുടർന്ന് റാങ്ക് എസ്റ്റിമേറ്റ് നിർമ്മിക്കാനുള്ള ഗ്രൂപ്പ് കണക്കുകളെ ശരാശരി എടുത്തു.
ഇപ്രകാരം, സമീപിക്കുന്ന വലിയ വെല്ലുവിളി ഈ 176.256 ഗ്രൂപ്പുകൾ ഓരോന്നും ഒബാമയുടെ പിന്തുണ കണക്കാക്കാൻ ആണ്. അവരുടെ പാനൽ 345.858 അതുല്യമായ പങ്കെടുക്കുന്നവർ ഉൾപ്പെടുത്തിയിട്ടുണ്ട് ആണെങ്കിലും, തെരഞ്ഞെടുപ്പ് പോളിംഗ് നിലവാരം ഒരു വലിയ സംഖ്യ, അവിടെ വാങ് സഹപ്രവർത്തകരും ഏകദേശം സർവേയിൽ വസ്തുക്കളെ പല ഗ്രൂപ്പുകൾ ആയിരുന്നു. അതുകൊണ്ടു അവർ പല ഗവേഷകർ വാത്സല്യപൂർവം പി ഒരു പ്രത്യേക ഗ്രൂപ്പിൽ ഒബാമ പിന്തുണ കണക്കാക്കാൻ, അടിസ്ഥാനപരമായി വിളിക്കുന്ന പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു കൂടെ മൾട്ടിലെവൽ റിഗ്രഷൻ എന്ന ഒരു ടെക്നിക്കുകളും, പി കുളങ്ങള് വിവരം ഉപയോഗിക്കുന്ന ഓരോ ഗ്രൂപ്പിൽ പിന്തുണ കണക്കാക്കാൻ അടുത്തുനിന്ന് ബന്ധപ്പെട്ട ഗ്രൂപ്പുകൾ. ഉദാഹരണത്തിന്, പെൺ, ഹിസ്പാനിക് ഇടയിൽ ഒബാമ പിന്തുണ നിർണയിക്കാനും എന്ന വെല്ലുവിളി പരിഗണിക്കുക, 18-29 നും വയസ്സുള്ള രജിസ്റ്റർ ഡെമോക്രാറ്റ് ആർ കോളേജ് ബിരുദം, മിതവാദികൾ പോലെ സ്വയം തിരിച്ചറിയാൻ, ആർ, ആർ 2008 ഇത് ഒബാമയുടെ വോട്ട് എത്രയും പ്രത്യേക ഗ്രൂപ്പ്, അത് ഇതിൻറെ കൂടെ സാമ്പിൾ ആരും ഇല്ല സാധ്യതയുണ്ട്. അതുകൊണ്ടു ഒരുമിച്ചു ഈ ഗ്രൂപ്പിൽ കുറിച്ച് എസ്റ്റിമേറ്റുകൾ ഉണ്ടാക്കുവാൻ പി കുളങ്ങൾ വളരെ സമാനമായ ഗ്രൂപ്പുകളിൽ ആളുകളെ നിന്ന് കണക്കാക്കുന്നു.
ഈ വിശകലനം ഉപായമാണ്, വാങ് സഹപ്രവർത്തകരും വളരെ അടുത്തുനിന്ന് ഒബാമ 2012 തിരഞ്ഞെടുപ്പിൽ (ചിത്രം 3.5) ൽ ലഭിച്ച മൊത്തത്തിലുള്ള പിന്തുണ കണക്കാക്കാൻ XBox നോൺ-പ്രോബബലിറ്റി സാമ്പിൾ ഉപയോഗിച്ച് സാധിച്ചു. വാസ്തവത്തിൽ അവരുടെ കണക്കുകളെ പൊതുജനാഭിപ്രായ സർവെകൾ ഒരു കുറയാത്ത അധികം കൃത്യതയുള്ള ആയിരുന്നു. ഇപ്രകാരം, ഈ സാഹചര്യത്തിൽ, വെയ്റ്റേജിനു-പ്രത്യേകമായി മിസ്റ്റർ നോൺ-പ്രോബബലിറ്റി ഡാറ്റ പക്ഷപാത തെറ്റുതിരുത്താനും ഒരു നല്ല ജോലി ചെയ്യാൻ പി-തോന്നും; നിങ്ങൾ unadjusted എക്സ്ബോക്സ് ഡാറ്റ നിന്ന് കണക്കുകളെ നോക്കുമ്പോൾ ദൃശ്യമാകുന്ന പക്ഷപാത.
വാങ് സഹപ്രവർത്തകരും പഠനങ്ങളിൽ നിന്നാണ് രണ്ട് പ്രധാന പാഠങ്ങൾ ഉണ്ട്. ആദ്യം, unadjusted നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ മോശം കണക്കുകൾ ഇടയാക്കും; ഈ നിരവധി ഗവേഷകർ മുമ്പ് കേട്ട ഒരു പാഠമാണ്. എന്നാൽ, രണ്ടാമത്തെ പാഠം നോൺ-സംഭാവ്യത സാമ്പിളുകൾ ആണ്, ശരിയായി വെയ്റ്റഡ് വരുമ്പോൾ ഡീസന്റായിപ്പോയി നല്ല എസ്റ്റിമേറ്റുകൾ ഉത്പാദിപ്പിക്കാൻ കഴിയും. വാസ്തവത്തിൽ, അവരുടെ കണക്കുകളെ, കൂടുതൽ പരമ്പരാഗത തെരഞ്ഞെടുപ്പ് തിരഞ്ഞെടുപ്പിൽ ഒരു സമാഹരണ pollster.com നിന്ന് എസ്റ്റിമേറ്റുകൾ അധികം കൃത്യതയുള്ള ആയിരുന്നു.
ഒടുവിൽ, ഈ ഒരു നിർദ്ദിഷ്ട പഠനത്തിൽ പഠിക്കാം എന്തു പ്രധാനമാണ് പരിമിതികൾ ഉണ്ട്. പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു ഈ പ്രത്യേക സാഹചര്യത്തിൽ നന്നായി ജോലി മാത്രം അതിനെ മറ്റ് കേസുകളിൽ നന്നായി പ്രവർത്തിക്കുന്നില്ല ചവിട്ടി ഇല്ല. നടത്താതെ ഏകദേശം 100 വർഷത്തോളം തെരഞ്ഞെടുപ്പിൽ പഠിക്കുന്ന ഫലമായി ചെയ്തു, പതിവ് ഫീഡ്ബാക്ക് ഉണ്ടാകില്ല (നാം തിരഞ്ഞെടുപ്പിൽ വിജയിയെ കാണാം), പാർട്ടി തിരിച്ചറിയൽ ജനസംഖ്യാപരമായ സ്വഭാവസവിശേഷതകൾ വോട്ടെടുപ്പ് താരതമ്യേന പ്രവചിക്കാനാകുന്നത് സത്യത്തിൽ, തെരഞ്ഞെടുപ്പ് ഒരുപക്ഷേ ഏറ്റവും എളുപ്പമുള്ള ക്രമീകരണങ്ങൾ ഒന്നാണ്. ഈ സമയത്ത്, ഞങ്ങൾ നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകൾ ലേക്കുള്ള വെയ്റ്റേജിനു അഡ്ജസ്റ്റുമെന്റുകൾ കൃത്യതയാർന്ന എസ്റ്റിമേറ്റുകൾ താനേ അറിയുന്നതിന് ഖര സിദ്ധാന്തവും അനുഭവവേദ്യമായ അനുഭവം കുറവുണ്ടോ. വ്യക്തമാണ് ഒരു കാര്യം ഒരുപക്ഷേ, നിങ്ങൾ നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ ഉപയോഗിച്ച് നിർബന്ധിതരാകുന്നു എങ്കിൽ, പിന്നെ ക്രമീകരിച്ച കണക്കുകളെ-ക്രമീകരിച്ചു നോൺ എസ്റ്റിമേറ്റുകൾ നല്ലതു എന്നു വിശ്വസിക്കാൻ ശക്തമായ കാരണം ഉണ്ട് എന്നതാണ്.