પ્રતિનિધિત્વ તમારા લક્ષ્ય વસ્તી માટે તમારા ઉત્તરદાતાઓ ના અનુમાન બનાવે છે.
મોટી વસ્તી માટે ઉત્તરદાતાઓના ઉલ્લંઘન કરતી વખતે જે પ્રકારની ભૂલો થઇ શકે છે તે સમજવા માટે, ચાલો આપણે લિટરરી ડાઇજેસ્ટ સ્ટ્રો પોલને ધ્યાનમાં લઈએ જે 1 9 36 ના અમેરિકી રાષ્ટ્રપ્રમુખની ચુંટણીના પરિણામની આગાહી કરવાનો પ્રયાસ કર્યો. 75 કરતાં વધુ વર્ષ પહેલાં થયું હોવા છતાં, આજે પણ સંશોધકોને શીખવવા માટે આ રકાસનો અગત્યનો અભ્યાસ છે.
લિટરરી ડાઇજેસ્ટ લોકપ્રિય સામાન્ય રસ ધરાવતી મેગેઝિન હતી, અને 1920 થી શરૂ કરીને તેઓ રાષ્ટ્રપતિ ચુંટણીઓના પરિણામોની આગાહી કરવા માટે સ્ટ્રો પોલ્સ શરૂ કરવાનું શરૂ કર્યું. આ આગાહીઓ કરવા માટે, તેઓ ઘણાં લોકો માટે મતપત્ર મોકલશે અને પછી પરત ફર્યા હતા તે મતપત્રો અપ કરશે; લિટરરી ડાઇજેસ્ટે ગર્વથી અહેવાલ આપ્યો કે તેઓ જે મતદાન પ્રાપ્ત કરે છે તે ન તો "ભારિત, સમાયોજિત, કે અર્થઘટન ન હતા." આ પ્રક્રિયા 1920, 1 9 24, 1 928 અને 1 9 32 ના ચુંટણીના વિજેતાઓની યોગ્ય આગાહી કરી હતી. 1 9 36 માં, મહામંદીની વચ્ચે, સાહિત્યિક ડાયજેસ્ટે 10 મિલીયન લોકો માટે મતપત્રો મોકલ્યા, જેમના નામો મુખ્યત્વે ટેલિફોન ડિરેક્ટીવ્સ અને ઑટોમોબાઇલ રજીસ્ટ્રેશન રેકોર્ડ્સમાંથી આવ્યા. તેઓ કેવી રીતે તેમની પદ્ધતિ વર્ણવે છે તે અહીં છે:
"ડિગસ્ટની સરળ ચાલતી મશીન હાર્ડ હકીકતોને અનુમાનોની ધારણા ઘટાડવા માટે ત્રીસ વર્ષના અનુભવની ગતિ સુધારે છે ... આ અઠવાડિયે 500 પેન એક દિવસના એક ક્વાર્ટરથી વધુ એક દિવસના સંબોધન કરતા હતા. દરરોજ, ન્યૂ યૉર્કમાં મોટર-રિબન ફોર્થ એવેન્યૂથી ઉપરની એક મોટી ઓરડીમાં, 400 કર્મચારીઓ ચપળતાપૂર્વક એક મિલિયન ટુકડાઓ મુદ્રિત પદાર્થને ખેંચે છે- ચાળીસ શહેરના બ્લોકોને મોકલેલા પૂરતાં-સંબોધિત એન્વલપ્સ [એસઆઇસીએ] માં. પ્રત્યેક કલાક, ડિગસ્ટના પોતાના પોસ્ટ ઓફિસ સબસ્ટેશનમાં, ત્રણ અસ્પષ્ટ પોસ્ટેજ મીટરિંગ મશીન્સ સીલ અને સફેદ આચ્છાદનથી મુદ્રાંકન; કુશળ ટપાલ કર્મચારીઓએ તેમને મેઇલ્સેક્સ બનાવવાની ફરજ પાડવી; કાફલો ડિગસ્ટ ટ્રૅક્સે તેમને મેલ-ટ્રેન વ્યક્ત કરવા માટે ઉત્તેજિત કર્યાં. . . આગામી સપ્તાહમાં, આ દસ મિલિયનથી પ્રથમ જવાબોમાં ચિહ્નિત મતપત્રોની આવનારી ભરતી શરૂ થશે, ટ્રિપલ-ચેક, ચકાસેલ, પાંચ વખત ક્રોસ-વર્ગીકૃત અને કુલ. જ્યારે છેલ્લો આંકડો ટૉક અને ચકાસાયેલ છે, જો ભૂતકાળનો અનુભવ એક માપદંડ છે, તો દેશમાં 1 ટકાના અપૂર્ણાંકમાં 40 લાખ મતદારોના વાસ્તવિક લોકપ્રિય મત જાણવા મળશે. "(ઓગસ્ટ 22, 1936)
લિટરરી ડાયજેસ્ટનું કદવૃદ્ધિ આજે કોઈપણ "મોટા ડેટા" સંશોધકને તરત જ ઓળખી શકાય છે. 10 મિલિયન મતદાન વહેંચવામાં આવ્યા હતા, જેમાંથી 2.4 મિલિયન જેટલા વળતર મળ્યા હતા-જે આધુનિક રાજકીય ચૂંટણી કરતાં આશરે 1,000 ગણું વધારે છે. આ 2.4 મિલિયન પ્રતિવાદીઓ તરફથી, આ ચુકાદો સ્પષ્ટ હતો: આલ્ફ લેન્ડન હાલના ફ્રેન્કલીન રૂઝવેલ્ટને હરાવવા જતા હતા. પરંતુ, હકીકતમાં, રૂઝવેલ્ટએ ભૂસ્ખલનમાં લેન્ડનને હરાવ્યો હતો. સાહિત્યિક ડાયજેસ્ટ એટલા ડેટા સાથે કેવી રીતે ખોટું થઈ શકે? નમૂનારૂપ અમારી આધુનિક સમજ લિટરરી ડાયજેસ્ટની ભૂલોને સ્પષ્ટ કરે છે અને ભવિષ્યમાં સમાન ભૂલો કરવાથી અમને દૂર કરવામાં સહાય કરે છે.
નમૂના વિશે સ્પષ્ટ રીતે વિચારીએ તો આપણે ચાર અલગ અલગ જૂથો (આકૃતિ 3.2) ને ધ્યાનમાં લેવાની જરૂર છે. પ્રથમ જૂથ લક્ષ્ય વસ્તી છે ; આ જૂથ છે કે સંશોધક વ્યાજની વસ્તી તરીકે વ્યાખ્યાયિત કરે છે. સાહિત્યિક ડાયજેસ્ટના કિસ્સામાં, લક્ષિત વસ્તી 1936 ની રાષ્ટ્રપ્રમુખની ચુંટણીમાં મતદારો હતી.
લક્ષ્ય વસ્તી નક્કી કર્યા પછી, સંશોધકને એવા લોકોની યાદી વિકસિત કરવાની જરૂર છે કે જે નમૂના લેવા માટે વાપરી શકાય છે. આ સૂચિને નમૂનારૂપ ફ્રેમ કહેવામાં આવે છે અને તેના પરના લોકોને ફ્રેમ વસ્તી કહેવામાં આવે છે. આદર્શ રીતે, લક્ષ્ય વસ્તી અને ફ્રેમ વસ્તી બરાબર તે જ હશે, પરંતુ વ્યવહારમાં આ વારંવાર કોઈ કેસ નથી. ઉદાહરણ તરીકે, લિટરરી ડાયજેસ્ટના કિસ્સામાં, ફ્રેમ વસ્તી 10 મિલિયન લોકો હતી જેમના નામો મુખ્યત્વે ટેલિફોન ડિરેક્ટીવ્સ અને ઓટોમોબાઇલ રજીસ્ટ્રેશન રેકોર્ડ્સમાંથી આવ્યા હતા. લક્ષ્ય વસ્તી અને ફ્રેમ વસ્તી વચ્ચેનો તફાવત કવરેજ ભૂલ કહેવાય છે. કવરેજ ભૂલ, પોતાના દ્વારા, સમસ્યાઓની બાંયધરી આપતી નથી. જોકે, તે કવરેજ પૂર્વગ્રહ પરિણમી શકે જો ફ્રેમ વસ્તી લોકો લક્ષ્ય વસ્તી જે લોકો ફ્રેમ વસ્તી નથી છે પદ્ધતિસર અલગ હોય છે. હકીકતમાં, લિટરરી ડાઈજેસ્ટ પોલમાં શું થયું છે તે હકીકત છે. તેમની ફ્રેમની વસ્તી ધરાવતા લોકો એલ્ફ લેન્ડનને ટેકો આપવા માટે વધુ સંભાવના ધરાવતા હતા, કારણ કે તેઓ સમૃદ્ધ હતા (યાદ છે કે ટેલિફોન અને ઓટોમોબાઇલ્સ બંને પ્રમાણમાં નવા અને ખર્ચાળ છે 1936 માં). તેથી, લિટરરી ડાયજેસ્ટ મતદાનમાં, કવરેજ ભૂલને કવરેજ પૂર્વગ્રહ તરફ દોરી.
ફ્રેમ વસ્તી વ્યાખ્યાયિત કર્યા પછી, આગળનું પગલું એ સંશોધકો માટે નમૂનો વસ્તી પસંદ કરવાનું છે; આ એ લોકો છે કે જે સંશોધક ઇન્ટરવ્યુ લેવાનો પ્રયત્ન કરશે. જો નમૂનામાં ફ્રેમ વસ્તી કરતાં જુદી જુદી લાક્ષણિકતાઓ હોય તો, સેમ્પલીંગ નમૂનાની ભૂલ રજૂ કરી શકે છે. લિટરરી ડાયજેસ્ટ ફિયાસ્કાના કિસ્સામાં, જો કે, વાસ્તવમાં કોઈ નમૂના ન હતો- ફ્રેમની વસ્તીમાં દરેકને સંપર્ક કરવા માટે સામયિક- અને તેથી કોઈ નમૂનાની ભૂલ ન હતી. ઘણા સંશોધકો નમૂનાની ભૂલ પર ધ્યાન કેન્દ્રિત કરે છે - સર્વેક્ષણોમાં ભૂલની સીમા દ્વારા મેળવવામાં આવતી ભૂલનો સામાન્ય રીતે એકમાત્ર પ્રકારની ભૂલ છે - પરંતુ લિટરરી ડાયજેસ્ટ ફિયાસ્કો અમને યાદ કરાવે છે કે અમને રેન્ડમ અને વ્યવસ્થિત બન્ને ભૂલની તમામ સ્રોતો ધ્યાનમાં લેવાની જરૂર છે.
છેવટે, નમૂનાની વસ્તી પસંદ કર્યા પછી, સંશોધક તેના તમામ સભ્યોને ઇન્ટરવ્યુ કરવાનો પ્રયાસ કરે છે. જે લોકો સફળતાપૂર્વક ઇન્ટરવ્યુ કરે છે તેઓ ઉત્તરદાતા તરીકે ઓળખાય છે. આદર્શરીતે, નમૂના વસ્તી અને પ્રતિવાદીઓ બરાબર એ જ હશે, પરંતુ વ્યવહારમાં ત્યાં કોઈ પ્રતિભાવ નથી. એટલે કે, જે લોકો નમૂનામાં પસંદ કરવામાં આવે છે તેઓ ભાગ લેતા નથી. જો લોકો પ્રતિસાદ આપે છે, જે પ્રતિસાદ આપતા નથી તેના કરતા અલગ છે, તો પછી બિનઅનુભવી પૂર્વગ્રહ હોઈ શકે છે. લિટરરી ડાઈજેસ્ટ પોલ સાથે બીજી મુખ્ય સમસ્યા નોનપ્રોસ્પેન્સ પૂર્વગ્રહ હતી. મતદાન મેળવનાર લોકોમાંથી માત્ર 24% લોકોએ જવાબ આપ્યો, અને તે બહાર આવ્યું કે લેન્ડનને ટેકો આપનારા લોકોએ આનો જવાબ આપવાની શક્યતા વધારે છે.
પ્રતિનિધિત્વનાં વિચારો રજૂ કરવાના ઉદાહરણ તરીકે બિયોન્ડ, લિટરરી ડાઈજેસ્ટ મતદાન વારંવારના દૃષ્ટાંતરૂપ છે, અવૈધ નમૂનાના જોખમો વિશે સંશોધકોને ચેતવે છે. કમનસીબે, મને લાગે છે કે ઘણા લોકો આ વાર્તામાંથી જે પાઠ લે છે તે ખોટું છે. વાર્તાનો સૌથી સામાન્ય નૈતિકતા એ છે કે સંશોધકો બિન-સંભાવનાના નમૂનામાંથી (એટલે કે સેમ્પલ સહભાગીઓ પસંદ કરવા માટે સખત સંભાવના-આધારિત નિયમો વગર) કંઈ પણ શીખી શકતા નથી. પરંતુ, હું આ પ્રકરણમાં પછી બતાવીશ, તે તદ્દન યોગ્ય નથી. તેના બદલે, હું આ વાર્તા ખરેખર બે નૈતિકતા છે લાગે છે; નૈતિકતા જે સાચા છે તે આજે પણ છે કારણ કે તે 1 9 36 માં હતા. પ્રથમ, મોટાભાગના સંકુચિત આંકડાઓ એક સારી અંદાજની બાંયધરી આપશે નહીં. સામાન્ય રીતે, મોટી સંખ્યામાં પ્રતિસાદકર્તાઓ અંદાજોના વિરાગે ઘટે છે, પરંતુ તે પૂર્વગ્રહને ઘટાડતું નથી. ઘણાં બધાં ડેટા સાથે, સંશોધકોને ઘણીવાર ખોટી વસ્તુનો ચોક્કસ અંદાજ મળી શકે છે; તેઓ ચોક્કસપણે અચોક્કસ હોઈ શકે છે (McFarland and McFarland 2015) . લિટરરી ડાઈજેસ્ટ ફિયાસ્કાના બીજા મુખ્ય પાઠ એ છે કે અંદાજો કરતી વખતે સંશોધકોને કેવી રીતે તેમના નમૂના એકત્રિત કરવામાં આવ્યા તે માટે એકાઉન્ટ કરવાની જરૂર છે. અન્ય શબ્દોમાં, કારણ કે લિટરરી ડાઈજેસ્ટ મતદાનમાં નમૂનાની પ્રક્રિયામાં કેટલાક ઉત્તરદાતાઓ તરફ વ્યવસ્થિત રીતે વળેલું હતું, સંશોધકોએ વધુ જટિલ અંદાજ પ્રક્રિયાને વાપરવી જરૂરી છે કે જે કેટલાક ઉત્તરદાતાઓ અન્ય લોકો કરતા વધુ ભારિત છે. પાછળથી આ પ્રકરણમાં, હું તમને એક આવું ભારતીકરણ પ્રક્રિયા-પોસ્ટ-સ્તરીકરણ બતાવીશ - જે તમને અવગણના નમૂનાથી વધુ સારા અંદાજો બનાવવા માટે સક્ષમ બનાવશે.