બિન-સંભાવના નમૂનાઓ સાથે, વજન ધારણ નમૂના પ્રક્રિયા કારણે વિકૃતિઓનો પૂર્વવત્ કરી શકો છો.
એ જ રીતે જે સંશોધકો સંભાવના નમૂનાઓ માંથી પ્રતિસાદ વજન, તેઓ પણ બિન-સંભાવના નમૂનાઓ માંથી પ્રતિસાદ વજન શકો છો. ઉદાહરણ તરીકે, CPS માટે વૈકલ્પિક તરીકે, કલ્પના કરો કે તમે જે હજારો વેબસાઇટ્સને પર બેનર જાહેરાતો મૂકવામાં બેરોજગારીનો દર અંદાજ સર્વેક્ષણ માટે સહભાગીઓ ભરતી. કુદરતી રીતે, તમે શંકા છે કે જે તમારા નમૂના સરળ સરેરાશ બેરોજગારી દર એક સારી અંદાજ હશે હશે. તમારી નાસ્તિકતા કદાચ કારણ કે તમને લાગે છે કે કેટલાક લોકો અન્યો કરતાં વધુ તમારા સર્વે પૂર્ણ થવાની શક્યતા છે. ઉદાહરણ તરીકે, જે લોકો વેબ પર સમય ઘણો પસાર નથી ઓછી તમારા મોજણી પૂર્ણ થવાની શક્યતા છે.
અમે છેલ્લા વિભાગમાં જોયું, જો કે, અમે જાણીએ છીએ કે કેવી રીતે નમૂના પસંદગી તરીકે કરવામાં આવી હતી અમે સંભાવના સાથે શું નમૂનાઓ-પછી અમે નમૂના પ્રક્રિયા કારણે વિકૃતિઓનો પૂર્વવત્ કરી શકો છો. કમનસીબે, જ્યારે બિન-સંભાવના નમૂનાઓ સાથે કામ, અમે કેવી રીતે ખબર નથી નમૂના પસંદ કરવામાં આવી હતી. પરંતુ, અમે નમૂના પ્રક્રિયા વિશે ધારણા કરી શકો છો અને પછી એ જ રીતે વજન લાગુ પડે છે. આ ધારણા સાચી છે, તો પછી વજન નમૂના પ્રક્રિયા કારણે વિકૃતિઓનો પૂર્વવત્ થશે.
ઉદાહરણ તરીકે, કલ્પના કરો કે તમારા બેનર જાહેરાતો જવાબમાં, તમે 100,000 ઉત્તરદાતાઓ ભરતી કરી હતી. જો કે, જો તમે ન માનતા કે આ 100,000 ઉત્તરદાતાઓ અમેરિકન પુખ્ત એક સરળ રેન્ડમ નમૂનો છે. હકીકતમાં, જ્યારે તમે યુ વસ્તી માટે તમારા ઉત્તરદાતાઓ સરખાવવા માટે, તમે શોધવા કે કેટલાક રાજ્યોમાં (દા.ત., ન્યૂ યોર્ક) ના લોકો કેટલાક રાજ્યોમાં (દા.ત., અલાસ્કા) માંથી રજૂ અને તે લોકો છે હેઠળ રજૂ થાય છે. આમ, તમારા નમૂના બેરોજગારીનો દર લક્ષ્ય વસ્તી બેરોજગારીનો દર એક ખરાબ અંદાજ હોઈ શકે તેવી શક્યતા છે.
એક માર્ગ વિકૃતિ કે નમૂના પ્રક્રિયા થયું પૂર્વવત્ દરેક વ્યક્તિ માટે વજન સોંપી છે; રાજ્યો પાસેથી લોકોને નીચા વજન જે દર્શાવે છે કે નમૂના (દા.ત., અલાસ્કા) હેઠળ રજૂ થાય છે નમૂના (દા.ત., ન્યૂ યોર્ક) અને ઉચ્ચ વજન લોકો માટે ઓવર રજૂ થાય છે. વધુ ખાસ રીતે, દરેક પ્રતિવાદી માટે વજન અમેરિકી વસ્તી તેમના વ્યાપ માટે તમારા નમૂના સંબંધિત તેમના વ્યાપ સાથે સંબંધિત છે. આ વજન પ્રક્રિયા પોસ્ટ સ્તરીકરણ કહેવામાં આવે છે, અને વજન વિચાર વિભાગ 3.4.1 ઉદાહરણ તમને યાદ કરીશું જ્યાં રહોડ આઇલેન્ડ થી ઉત્તરદાતાઓ કેલિફોર્નિયાના ઉત્તરદાતાઓ કરતાં ઓછા વજન આપવામાં આવી હતી. પોસ્ટ સ્તરીકરણ જરૂરી છે કે તમે જૂથો માં તમારા ઉત્તરદાતાઓ મૂકી અને દરેક જૂથ લક્ષ્ય વસ્તી પ્રમાણ જાણવા માટે પૂરતી ખબર છે કે.
તેમ છતાં સંભાવના નમૂનાના અને બિન-સંભાવના નમૂના વજન જ ગાણિતિક (ટેકનિકલ પરિશિષ્ટ જુઓ), તેઓ અલગ અલગ પરિસ્થિતિઓમાં સાથે કામ કરે છે. સંશોધક એક સંપૂર્ણ સંભાવના નમૂના (એટલે કે, કોઈ કવરેજ ભૂલ અને કોઈ બિન-પ્રતિભાવ) હોય, તો પછી વજન તમામ કિસ્સાઓમાં બધા લક્ષણો માટે unbiased અંદાજ પેદા થાય છે. આ મજબૂત સૈદ્ધાંતિક ગેરંટી છે કેમ કે સંભાવના નમૂનાઓ હિમાયત તેમને જેથી આકર્ષક શોધો. બીજી બાજુ, વજન બિન-સંભાવના નમૂનાઓ માત્ર જો પ્રતિભાવ propensities દરેક જૂથમાં દરેક માટે સમાન હોય છે બધા લક્ષણો માટે unbiased અંદાજ પેદા થાય છે. અન્ય શબ્દોમાં, પોસ્ટ સ્તરીકરણ મદદથી જો ન્યૂ યોર્ક માં દરેક ભાગ અને અલાસ્કા માં દરેક ભાગ અને તેથી પર જ સંભાવના છે જ સંભાવના છે unbiased અંદાજ પેદા કરશે અમારી ઉદાહરણ પર પાછા વિચારવાનો. આ ધારણા સજાતીય રિસ્પોન્સ-propensities-અંદર-જૂથો ધારણા કહેવામાં આવે છે, અને તે જાણીને માં કી ભૂમિકા ભજવે છે, તો પોસ્ટ સ્તરીકરણ બિન-સંભાવના નમૂનાઓ સાથે સારી રીતે કામ કરશે.
કમનસીબે, અમારા ઉદાહરણમાં, સજાતીય રિસ્પોન્સ-propensities-અંદર-જૂથો ધારણા સાચી હોઈ અશક્ય લાગે છે. એટલે કે, તે અશક્ય લાગે છે અલાસ્કામાં દરેકને તમારી મોજણી હોવા જ સંભાવના છે. પરંતુ, ત્યાં ત્રણ મહત્વપૂર્ણ બિંદુઓ પોસ્ટ સ્તરીકરણ વિશે ધ્યાનમાં રાખવા, જે તમામ તે વધુ આશાસ્પદ લાગે બનાવે છે.
પ્રથમ, સજાતીય રિસ્પોન્સ-propensities-અંદર-જૂથો ધારણા જૂથો વધે છે સંખ્યા વધુ બુદ્ધિગમ્ય બની જાય છે. અને, સંશોધકો માત્ર એક જ ભૌગોલિક પરિમાણ પર આધારિત જૂથો માટે મર્યાદિત નથી. ઉદાહરણ તરીકે, અમે રાજ્ય, ઉંમર, લિંગ અને શિક્ષણ સ્તર પર આધારિત જૂથો બનાવી શકે છે. તે વધુ બુદ્ધિગમ્ય છે કે 18-29 જૂથ અંદર સજાતીય પ્રતિભાવ propensities લાગે છે, અલાસ્કા રહેતા બધા લોકો જૂથ અંદર કરતાં અલાસ્કા રહેતા સ્ત્રી, કોલેજ ગ્રેજ્યુએટ. આમ, પોસ્ટ સ્તરીકરણ વધે માટે વપરાય જૂથો નંબર તરીકે, ધારણાઓ તેને વધુ વાજબી બની આધાર આપવા માટે જરૂરી. આ હકીકત જોતાં, તે એક સંશોધકો પોસ્ટ સ્તરીકરણ માટે જૂથો એક વિશાળ સંખ્યા બનાવવા માંગો છો કરશે જેવી લાગે છે. માહિતી sparsity: પણ, જૂથો વધે નંબર તરીકે, સંશોધકો એક અલગ સમસ્યા માં ચલાવો. જો ત્યાં માત્ર દરેક જૂથ લોકો એક નાની સંખ્યા છે, તો પછી અંદાજ વધુ અનિશ્ચિત હોય છે, અને આત્યંતિક કિસ્સામાં એક જૂથ કોઈ ઉત્તરદાતાઓ છે કે ત્યાં છે જ્યાં, પછી પોસ્ટ સ્તરીકરણ સંપૂર્ણપણે તોડી પાડે છે. ત્યાં homogeneous- પ્રતિસાદ ઝોક-અંદર-જૂથો ધારણા તર્કસંગતતા અને દરેક જૂથ વાજબી નમૂના કદ માટે માંગ વચ્ચે આ સહજ તણાવ બહાર બે માર્ગો છે. એક અભિગમ વજન ગણવા માટે એક વધુ આધુનિક આંકડાકીય મોડલ પર જવા માટે છે અને અન્ય એક વિશાળ, વધુ વિવિધ નમૂના છે, જે દરેક જૂથ વાજબી નમૂના કદ ખાતરી કરવામાં મદદ કરે એકત્રિત છે. અને, ક્યારેક સંશોધકો બંને કરવું, કારણ હું નીચે વધુ વિગતવાર વર્ણન કરીશું.
બીજી વિચારણા જ્યારે બિન-સંભાવના નમૂનાઓ પરથી પોસ્ટ સ્તરીકરણ સાથે કામ કે સજાતીય-પ્રતિભાવ-ઝોક-અંદર-જૂથો ધારણા પહેલેથી વારંવાર જ્યારે સંભાવના નમૂનાઓ વિશ્લેષણ કરવામાં આવે છે. કારણ કે આ ધારણા વ્યવહારમાં સંભાવના નમૂનાઓ માટે જરૂરી છે કે સંભાવના નમૂનાઓ બિન-પ્રતિભાવ હોય છે, અને બિન-પ્રતિભાવ માટે એડજસ્ટ માટે સૌથી સામાન્ય પદ્ધતિ પોસ્ટ સ્તરીકરણ ઉપર વર્ણવ્યા છે. અલબત્ત, માત્ર કારણ કે ઘણા સંશોધકો ચોક્કસ ધારણા અર્થ એ નથી કે તમે પણ તે કરી જોઈએ. પરંતુ, તેનો અર્થ એ નથી કે જ્યારે વ્યવહારમાં સંભાવના નમૂનાઓ બિન-સંભાવના નમૂનાઓ સરખામણી, અમે ધ્યાનમાં છે કે જે બંને ક્રમમાં અંદાજ પેદા કરવા માટે ધારણાઓ અને સહાયક માહિતી પર આધાર રાખે છે રાખવા જ જોઈએ. સૌથી વધુ વાસ્તવવાદી સેટિંગ્સ, ત્યાં ખાલી કોઈ ધારણા મુક્ત અભિગમ અનુમાન છે.
છેલ્લે, તમે એક અંદાજ કાળજી જો અમારી ઉદાહરણ બેરોજગારી ખાસ કરીને દર-તો પછી તમે એક શરત સજાતીય રિસ્પોન્સ-ઝોક-અંદર-જૂથો ધારણા કરતાં નબળા જરૂર છે. ખાસ કરીને, તમે છે કે દરેક વ્યક્તિ એક જ જવાબ ઝોક ધરાવે છે ધારે, તમે માત્ર ધારે દરેક જૂથ અંદર જવાબ ઝોક અને બેરોજગારી દર વચ્ચે કોઈ સંબંધ છે કે જરૂર નથી. અલબત્ત, આ નબળા સ્થિતિ કેટલીક પરિસ્થિતિ માં પકડી નહીં. ઉદાહરણ તરીકે, અમેરિકનો કે સ્વયંસેવક કામ કરવા પ્રમાણ અંદાજ કલ્પના. જે લોકો સ્વયંસેવક કામ કરવા વધુ એક સર્વેક્ષણ હોઈ સંમત થવાની સંભાવના છે, તો પછી સંશોધકો કરશે વ્યવસ્થિત ઓવર અંદાજ સ્વયંસેવી જથ્થો છે, પણ જો તેઓ પોસ્ટ સ્તરીકરણ ગોઠવણો પરિણામ એ છે કે દ્વારા અનુભવ દર્શાવવામાં આવ્યું છે શું, Abraham, Helms, and Presser (2009) .
હું અગાઉ જણાવ્યું હતું કે, બિન-સંભાવના નમૂનાઓ મહાન નાસ્તિકતા સાથે સામાજિક વૈજ્ઞાનિકો દ્વારા, સર્વે રિસર્ચ શરૂઆતના દિવસોમાં સૌથી મૂંઝવતી નિષ્ફળતાઓ કેટલાક તેમની ભૂમિકા કારણ કે જોવામાં આવે છે ભાગ છે. અત્યાર સુધી કેવી રીતે અમે બિન-સંભાવના નમૂનાઓ સાથે આવે છે કે સ્પષ્ટ ઉદાહરણ યોગ્ય રીતે અમેરિકન એક્સબોક્સ વપરાશકર્તાઓ બિન સંભાવના નમૂના ઉપયોગ કરીને 2012 યુએસ ચૂંટણી પરિણામ પ્રાપ્ત વેઇ વાંગ, ડેવિડ રોથસચાઈલ્ડ, શરદ ગોયલ, અને એન્ડ્રુ GELMAN સંશોધન છે -A અમેરિકનો નિઃસંદેહ બિન-રેન્ડમ નમૂના (Wang et al. 2015) . સંશોધકો XBox ગેમિંગ સિસ્ટમ માંથી ઉત્તરદાતાઓ ભરતી કરી હતી, અને તમે આશા રાખી શકે, એક્સબોક્સ નમૂના પુરૂષ તરફ વળ્યુ અને યુવાન તરફ વળ્યુ: 18 - 29 વર્ષની વયના મતદારોના 19% પરંતુ એક્સબોક્સ નમૂના 65% બનાવે છે અને પુરુષો 47% જેટલા છે મતદારોના અને Xbox નમૂના (આકૃતિ 3.4) ના 93% ના. કારણ કે આ મજબૂત વસ્તી વિષયક પક્ષપાતને છે, કાચા એક્સબોક્સ માહિતી ચૂંટણી વળતર એક ગરીબ સૂચક હતું. તે બરાક ઓબામા પર Mitt Romney માટે એક મજબૂત વિજય આગાહી કરી હતી. ફરીથી, આ કાચા, બિન-મેળ બિન-સંભાવના નમૂનાઓ જોખમો અન્ય એક ઉદાહરણ છે અને સાહિત્યિક ડાઈજેસ્ટ ફિયાસ્કા યાદ અપાવે છે.
જો કે, વાંગ અને સહકર્મીઓ આ સમસ્યા પરિચિત હતા અને નમૂના પ્રક્રિયા સુધારવા માટે ઉત્તરદાતાઓ વજન પ્રયાસ કર્યો હતો. ખાસ કરીને, તેઓ પોસ્ટ સ્તરીકરણ હું તમને કહ્યું હતું કે વધુ આધુનિક સ્વરૂપ ઉપયોગ થાય છે. તે છે, કારણ કે તે પોસ્ટ સ્તરીકરણ વિશે અંતર્જ્ઞાન બનાવે છે તેમના અભિગમ વિશે થોડી વધુ શીખવા વર્થ છે, અને ચોક્કસ આવૃત્તિ વાંગ અને સહકર્મીઓ ઉપયોગ વજન બિન-સંભાવના નમૂનાઓ સૌથી ઉત્તેજક અભિગમ છે.
વિભાગ 3.4.1 માં બેરોજગારી અંદાજ વિશે અમારા સરળ ઉદાહરણમાં, અમે નિવાસ રાજ્ય પર આધારિત જૂથો માં વસ્તી વિભાજિત. તેનાથી વિપરીત, વાંગ અને સાથીઓ દ્વારા વ્યાખ્યાયિત 176.256 જૂથોમાં માં વસ્તી વિભાજિત: લિંગ (2 વર્ગોમાં), રેસ (4 વર્ગોમાં), ઉંમર (4 વર્ગોમાં), શિક્ષણ (4 વર્ગોમાં), રહે છે (51 વર્ગોમાં), પક્ષ આઈડી (3 વર્ગોમાં), વિચારધારા (3 વર્ગોમાં) અને 2008 મત (3 વર્ગોમાં). વધુ જૂથો સાથે, સંશોધકો આશા હતી કે તે વધુને વધુ શક્યતા છે કે દરેક જૂથ અંદર, પ્રતિભાવ ઝોક ઓબામા માટે આધાર સાથે uncorrelated હતી હશે. આગળ, તેના બદલે, વ્યક્તિગત સ્તર વજન બાંધવા કારણ કે અમે અમારા ઉદાહરણમાં કર્યું કરતાં, વાંગ અને સાથીઓ એક જટિલ મોડેલ દરેક જૂથ છે કે જે ઓબામા માટે મત આપશે લોકોની સંખ્યા અંદાજ માટે વપરાય છે. છેલ્લે, તેઓ દરેક જૂથ ના જાણીતા માપ સાથે આધાર આ જૂથ અંદાજ સંયુક્ત આધાર અંદાજે એકંદર સ્તર પેદા કરે છે. અન્ય શબ્દોમાં, તેઓ અલગ અલગ જૂથોમાં વસ્તી સમારેલી, ઓબામા માટે આધાર અંદાજ દરેક જૂથ, અને પછી એકંદર અંદાજ પેદા કરવા માટે જૂથ અંદાજ એક ભારિત સરેરાશ લીધો હતો.
આમ, તેમના અભિગમ મોટા પડકાર આ 176.256 જૂથો દરેક ઓબામા માટે આધાર અંદાજ છે. જોકે તેમના પેનલ 345.858 અનન્ય સહભાગીઓ, ચૂંટણી મતદાન ના ધોરણો દ્વારા એક વિશાળ સંખ્યા સમાવેશ થાય છે, ત્યાં ઘણી જૂથો છે, જે માટે વાંગ અને સહકર્મીઓ લગભગ કોઈ ઉત્તરદાતાઓ હતી. તેથી, દરેક જૂથ તેઓ એક ટેકનિક ઉપયોગ પોસ્ટ સ્તરીકરણ સાથે મલ્ટિલેવલ રીગ્રેસન કહેવાય છે, જે સંશોધકો પ્રેમથી અનિવાર્યપણે શ્રી પી કૉલ, એક ચોક્કસ જૂથ અંદર ઓબામા માટે આધાર અંદાજ, શ્રી પી પુલ ઘણા માહિતી આધાર અંદાજ નજીકથી સંબંધિત જૂથો. ઉદાહરણ તરીકે, 18-29 વર્ષ જૂના વચ્ચે, સ્ત્રી હિસ્પેનિક્સ વચ્ચે ઓબામા માટે આધાર અંદાજ પડકાર ધ્યાનમાં, જે કોલેજના સ્નાતક છે, જે રજીસ્ટર કરવામાં આવે છે ડેમોક્રેટ્સ, ઉદારમતવાદીઓ જે લોકો પોતાની જાતને ઓળખવા છે, અને આ 2008 માં ઓબામા માટે મતદાન કર્યું ખૂબ, ખૂબ ચોક્કસ જૂથ છે, અને તે આ લક્ષણો સાથે નમૂના કોઇ છે કે શક્ય છે. તેથી, આ જૂથ વિશે અંદાજ બનાવવા માટે, શ્રી પી પુલ સાથે મળીને ખૂબ જ સમાન જૂથો લોકો અંદાજ.
આ વિશ્લેષણ વ્યૂહરચના મદદથી, વાંગ અને સહકર્મીઓ XBox બિન-સંભાવના નમૂના વાપરવા માટે ખૂબ જ નજીકથી સમગ્ર આધાર છે કે ઓબામા 2012 ચૂંટણીમાં પ્રાપ્ત અંદાજ મેળવી શકતા હતા (આકૃતિ 3.5). હકીકતમાં તેમના અંદાજ જાહેર મંતવ્ય સર્વેક્ષણમાં એક એકંદર કરતાં વધુ ચોક્કસ હતાં. આમ, આ કિસ્સામાં, વજન-ખાસ કરીને શ્રી સારી બિન-સંભાવના માહિતી પક્ષપાતને સુધારક નોકરી કરવા માટે પી-લાગે છે; પક્ષપાતને કે દેખાય છે જ્યારે તમે અસમાયોજિત એક્સબોક્સ માહિતી અંદાજ જુઓ.
ત્યાં વાંગ અને સાથીદારો અભ્યાસ પરથી બે મુખ્ય પાઠ છે. પ્રથમ, બિન-મેળ બિન-સંભાવના નમૂનાઓ ખરાબ અંદાજ તરફ દોરી શકે છે; આ એક પાઠ કે ઘણા સંશોધકો પહેલાં સાંભળ્યું છે. જો કે, બીજા પાઠ કે બિન સંભાવના નમૂનાઓ, જ્યારે યોગ્ય રીતે ભારાંક, ખરેખર ખૂબ સારી અંદાજ પેદા કરી શકે છે. હકીકતમાં, તેમના અંદાજ pollster.com, વધુ પરંપરાગત ચૂંટણી ચૂંટણી એકંદર અંદાજ કરતાં વધુ ચોક્કસ હતાં.
છેલ્લે, ત્યાં આપણે શું આ એક ચોક્કસ અભ્યાસ પરથી જાણી શકો છો મહત્વનું મર્યાદાઓ હોય છે. જસ્ટ કારણ કે પોસ્ટ સ્તરીકરણ આ ચોક્કસ કિસ્સામાં સારી રીતે કામ કર્યું, ત્યાં કોઈ ગેરેંટી નથી કે તે અન્ય કિસ્સાઓમાં સારી રીતે કામ કરશે. હકીકતમાં, ચૂંટણી, કારણ કે pollsters લગભગ 100 વર્ષ ચૂંટણી અભ્યાસ કરવામાં આવી છે કદાચ સૌથી સરળ સેટિંગ્સ એક છે, ત્યાં નિયમિત પ્રતિસાદ (અમે જોઈ શકો છો કે જે ચૂંટણી જીતી જાય છે), અને પક્ષ ઓળખ છે અને વસ્તી વિષયક લક્ષણો મતદાન પ્રમાણમાં આગાહી છે. આ બિંદુએ, અમે ઘન સિદ્ધાંત અને તે જાણવા માટે જ્યારે બિન-સંભાવના નમૂનાઓ વજન ગોઠવણો પૂરતી સચોટ અંદાજ પેદા કરશે પ્રયોગમૂલક અનુભવ અભાવ હોય છે. એક વસ્તુ છે કે સ્પષ્ટ છે, જો કે, જો તમે બિન-સંભાવના નમૂનાઓ સાથે કામ કરવા માટે ફરજ પાડવામાં આવે છે, તો પછી ત્યાં માને છે કે સમાયોજિત અંદાજ બિન-ગોઠવ્યો અંદાજ કરતાં વધુ સારી હશે મજબૂત કારણ છે.