రిప్రజెంటేషన్ మీ ప్రతివాదులు మీ లక్ష్య జనాభా అనుమితులు నూతనముగా.
ప్రతివాదులు పెద్ద సంఖ్యలో ఉన్నవారికి అవగాహన కలిగించే లోపాలను అర్థం చేసుకోవటానికి, 1936 US అధ్యక్ష ఎన్నికల ఫలితాన్ని అంచనా వేసేందుకు ప్రయత్నించిన సాహిత్య డైజెస్ట్ స్ట్రా పోల్ ను పరిశీలిద్దాం. ఇది 75 ఏళ్ళకు పైగా జరిగినప్పటికీ, ఈ ఓటమి ఇప్పటికీ పరిశోధకులకు బోధించడానికి ఒక ముఖ్యమైన పాఠం ఉంది.
సాహిత్య డైజెస్ట్ ఒక ప్రముఖ జనరల్-వడ్డీ పత్రిక, మరియు 1920 లో వారు అధ్యక్ష ఎన్నికల ఫలితాలను అంచనా వేసేందుకు ఎండుగడ్డి పోల్స్ను ప్రారంభించడం ప్రారంభించారు. ఈ అంచనాలు చేయడానికి, వారు బ్యాలెట్లను చాలామంది ప్రజలకు పంపుతారు మరియు తిరిగి వచ్చిన బ్యాలెట్లను సరిచేసుకుంటారు; సాహిత్య డైజెస్ట్ సగర్వంగా వారు అందుకున్న బ్యాలెట్లను ఎవరికీ ", బరువు సర్దుబాటు, లేదా వివరించబడతాయి." ఈ ప్రక్రియ సరిగ్గా 1936 లో 1920, 1924, 1928 మరియు 1932 లో ఎన్నికల విజేతలు అంచనా, గ్రేట్ డిప్రెషన్ మధ్యలో, సాహిత్య ఉన్నట్లు నివేదిక డైజెస్ట్ బ్యాలెట్లను 10 మిలియన్ల మందికి పంపింది, దీని పేర్లు టెలిఫోన్ డైరెక్టరీలు మరియు ఆటోమొబైల్ రిజిస్ట్రేషన్ రికార్డుల నుండి వచ్చాయి. వారు వారి పద్దతి గురించి వివరించారు:
"Digest యొక్క మృదువైన నడుస్తున్న యంత్రం హార్డ్ వాస్తవాలకు ఊహించడం తగ్గించేందుకు ముప్పై సంవత్సరాల అనుభవం వేగంగా సున్నితమైన కదులుతుంది ... ఈ వారం 500 పదుల ఒక మిలియన్ చిరునామాలను ఒక రోజు కంటే ఎక్కువ గోకడం. ప్రతీరోజు, న్యూయార్క్లోని మోటార్-రిబ్బన్డ్ ఫోర్త్ అవెన్యూ పై ఉన్న గొప్ప గదిలో, 400 కార్మికులు, నలభై నగర బ్లాకులను - ప్రసంగించిన ఎన్విలాప్లను [sic] లోకి నెట్టడానికి ఒక మిలియన్ ముక్కలు ముద్రించిన విషయం విపరీతంగా పడిపోయింది. ప్రతి గంట, DIGEST యొక్క సొంత పోస్ట్ ఆఫీస్ సబ్స్టేషన్లో, మూడు చుక్కలుగల తపాలా మీటరింగ్ యంత్రాలు మూసివేసి తెల్లటి పొరలు తిప్పబడ్డాయి; నైపుణ్యం కలిగిన తపాలా ఉద్యోగులు వాటిని ఉప్పొంగే మెయిల్ స్లాక్లలో పడవేశారు; విమానాల DIGEST ట్రక్కులు వాటిని మెయిల్ రైళ్లను వ్యక్తపర్చాయి. . . వచ్చే వారం, ఈ పది మిలియన్ల నుండి మొదటి సమాధానాలు మార్క్ బ్యాలెట్ల యొక్క వచ్చే టైడ్ను ప్రారంభిస్తుంది, ఇది ట్రిపుల్-చెక్ చేసిన, ధృవీకరించబడినది, ఐదు-సార్లు క్రాస్-వర్గీకరింపబడి మొత్తంలో ఉంటుంది. గతంలో ఉన్న అనుభవం ఒక ప్రమాణం ఉంటే, చివరి దేశం ఫిర్యాదు చేయబడి తనిఖీ చేయబడినప్పుడు, దేశం నలభై మిలియన్ల మంది ఓటర్లు (ఓటర్లు) 1 శాతం తక్కువగా ఉంటుంది. "(ఆగష్టు 22, 1936)
లిటరరీ డైజెస్ట్ యొక్క పరిమాణాన్ని ఇప్పుడు ఏ "పెద్ద డేటా" పరిశోధకుడికి తక్షణమే గుర్తిస్తారు. పంపిణీ చేసిన 10 మిలియన్ బ్యాలెట్లలో, అద్భుతమైన 2.4 మిలియన్లు తిరిగి వచ్చాయి-ఇది ఆధునిక రాజకీయ పోల్స్ కంటే సుమారు 1,000 రెట్లు పెద్దది. ఈ 2.4 మిలియన్ల మంది ప్రతినిధుల నుండి తీర్పు స్పష్టమైనది: ఫ్రాంక్లిన్ రూజ్వెల్ట్ ను ఓడించటానికి ఆల్ఫ్ లాన్డన్ వెళుతున్నాడు. వాస్తవానికి, రూజ్వెల్ట్ ల్యాండ్లైన్లో లాన్డాన్ను ఓడించాడు. లిటరరీ డైజెస్ట్ చాలా డేటాతో ఎలా తప్పు చెయ్యగలదు ? నమూనా యొక్క మా ఆధునిక అవగాహన సాహిత్య డైజెస్ట్ యొక్క తప్పులను స్పష్టంగా చేస్తుంది మరియు భవిష్యత్తులో ఇలాంటి తప్పులు చేయకుండా మాకు సహాయం చేస్తుంది.
మాదిరి గురించి స్పష్టంగా ఆలోచిస్తే మనకు నాలుగు వేర్వేరు సమూహాలను పరిగణించాలి (ఫిగర్ 3.2). మొదటి సమూహం లక్ష్యం జనాభా ; ఈ సమూహం పరిశోధకుడు ఆసక్తి జనాభాగా నిర్వచించేది. లిటరరీ డైజెస్ట్ విషయంలో, 1936 అధ్యక్ష ఎన్నికల్లో లక్షిత జనాభాలో ఓటర్లు ఉన్నారు.
లక్ష్య జనాభాపై నిర్ణయించిన తరువాత, ఒక పరిశోధకుడు నమూనా కోసం ఉపయోగించే వ్యక్తుల జాబితాను అభివృద్ధి చేయాలి. ఈ జాబితాను ఒక మాదిరి ఫ్రేమ్ అంటారు మరియు దానిలోని వ్యక్తులు ఫ్రేమ్ జనాభా అని పిలుస్తారు. ఆదర్శవంతంగా, లక్ష్యం జనాభా మరియు ఫ్రేమ్ జనాభా సరిగ్గా అదే, కానీ ఆచరణలో ఈ తరచుగా కేసు కాదు. ఉదాహరణకు, సాహిత్య డైజెస్ట్ విషయంలో, ఫ్రేమ్ జనాభా 10 మిలియన్ల మంది ఉన్నారు, వీరి పేర్లు ఎక్కువగా టెలిఫోన్ డైరెక్టరీలు మరియు ఆటోమొబైల్ రిజిస్ట్రేషన్ రికార్డుల నుండి వచ్చాయి. లక్ష్య జనాభా మరియు ఫ్రేమ్ జనాభా మధ్య భేదాలు కవరేజ్ లోపం అంటారు. కవరేజ్ లోపం, దానికదే, హామీ ఇబ్బంది లేదు. అయితే, ఫ్రేమ్ జనాభాలో లేని ప్రజలు లక్ష్య జనాభాలో వ్యక్తుల నుండి ఫ్రేమ్ జనాభాలో క్రమపద్ధతిలో ఉంటే అది కవరేజ్ పక్షపాతానికి దారి తీస్తుంది. వాస్తవానికి, లిటరరీ డైజెస్ట్ పోల్లో సరిగ్గా అదే జరిగింది. వారి ఫ్రేమ్ జనాభాలో ప్రజలు అల్ఫన్ లాన్డాన్కు మద్దతుగా ఉంటారు, ఎందుకంటే వారు ధనవంతులై ఉన్నారు (1936 లో టెలిఫోన్లు మరియు ఆటోమొబైల్స్ రెండూ కూడా కొత్తవి మరియు ఖరీదైనవి అని గుర్తుంచుకోండి). కాబట్టి, సాహిత్య డైజెస్ట్ ఎన్నికలో, కవరేజ్ లోపం కవరేజ్ పక్షపాతానికి దారి తీసింది.
ఫ్రేమ్ జనాభా నిర్వచించిన తరువాత, తదుపరి దశలో నమూనా జనాభాను ఎంచుకునే పరిశోధకుడు; ఈ పరిశోధకులు ఇంటర్వ్యూ చేయడానికి ప్రయత్నిస్తారు. మాదిరి ఫ్రేమ్ జనాభా కంటే వేర్వేరు లక్షణాలను కలిగి ఉంటే, మాదిరిని నమూనా దోషాన్ని ప్రవేశపెట్టవచ్చు. అయితే, సాహిత్య డైజెస్ట్ ఫియాక్కో విషయంలో, వాస్తవానికి మాదిరి లేదు-ఫ్రేమ్ జనాభాలో ప్రతిఒక్కరినీ సంప్రదించడానికి పత్రిక-మరియు అందువల్ల ఏ మాదిరి లోపం లేదు. చాలామంది పరిశోధకులు నమూనా దోషంపై దృష్టి పెట్టారు-ఇది సాధారణంగా సర్వేల్లో నివేదించబడిన లోపం యొక్క మార్జిన్ ద్వారా స్వాధీనం చేసుకున్న ఒకే విధమైన లోపం మాత్రమే. కాని లిటరరీ డైజెస్ట్ ఫియాసకో మాకు అన్ని మూలాల లోపాలను, యాదృచ్ఛిక మరియు క్రమబద్ధమైన రెండింటినీ పరిగణనలోకి తీసుకోవాలని మాకు గుర్తు చేస్తుంది.
చివరగా, నమూనా జనాభాను ఎంచుకున్న తర్వాత, ఒక పరిశోధకుడు తన సభ్యులను ఇంటర్వ్యూ చేయడానికి ప్రయత్నిస్తాడు. విజయవంతంగా ఇంటర్వ్యూ చేసిన వారు ప్రతివాదులు అని పిలుస్తారు. ఆదర్శవంతంగా, నమూనా జనాభా మరియు ప్రతివాదులు ఒకే విధంగా ఉంటారు, కానీ ఆచరణలో నాన్ రిప్రెషన్ ఉంది. అనగా, నమూనాలో ఎంపిక చేసుకున్న వ్యక్తులు కొన్నిసార్లు పాల్గొనరు. ప్రతిస్పందించే వారు ప్రతిస్పందించని వారి నుండి భిన్నంగా ఉంటే, అప్పుడు నాన్ రిప్రెషన్ పక్షపాతం ఉండవచ్చు . సాహిత్య డైజెస్ట్ పోల్తో రెండో ప్రధాన సమస్యగా నాన్ రిప్రెసెస్ పక్షపాతం ఉంది. బ్యాలెట్ పొందిన వ్యక్తులలో కేవలం 24% మాత్రమే స్పందించారు, మరియు లాన్డాన్కు మద్దతు ఇచ్చిన వారు ప్రతిస్పందించడానికి ఎక్కువగా ఉన్నారు.
ప్రాతినిధ్య భావనలను పరిచయం చేయడానికి ఒక ఉదాహరణగా కాకుండా, లిటరరీ డైజెస్ట్ పోల్ అనేది చాలాసార్లు పునరావృతమయ్యే పునరావృతమైంది, అస్తవ్యస్త నమూనా యొక్క ప్రమాదాల గురించి పరిశోధకుల హెచ్చరిక. దురదృష్టవశాత్తు, నేను ఈ కథ నుండి చాలామంది డ్రా చేసిన పాఠం తప్పు. కథ యొక్క అత్యంత సాధారణమైన నైతికత ఏమిటంటే పరిశోధకులు కాని సంభావ్యత నమూనాలను (అంటే, పాల్గొనేవారిని ఎంచుకోవడానికి కఠినమైన సంభావ్యత-ఆధారిత నియమాల లేకుండా నమూనాలను) నుండి ఏదైనా నేర్చుకోలేరు. కానీ, నేను ఈ అధ్యాయంలో తరువాత చూపించాను, ఇది చాలా సరైనది కాదు. బదులుగా, ఈ కథకు నిజంగా రెండు నైతికతలు ఉన్నాయని నేను భావిస్తున్నాను. 1936 లో ఉన్నట్లు నిజాయితీగా ఉన్న నైతిక విలువలు. మొదటిది, అరుదుగా సేకరించిన సమాచారం యొక్క పెద్ద మొత్తంలో ఒక మంచి అంచనాలకు హామీ ఇవ్వదు. సాధారణంగా, పెద్ద సంఖ్యలో ప్రతివాదులు అంచనా వేసిన వ్యత్యాసాలను తగ్గిస్తారు, కానీ ఇది తప్పనిసరిగా బయాస్ను తగ్గించదు. డేటా చాలా, పరిశోధకులు కొన్నిసార్లు తప్పు విషయం ఖచ్చితమైన అంచనా పొందవచ్చు; వారు ఖచ్చితమైన సరికానిది కాదు (McFarland and McFarland 2015) . సాహిత్య డైజెస్ట్ ఫియస్కో యొక్క రెండవ ప్రధాన పాఠం ఏమిటంటే అంచనాలను తయారు చేసేటప్పుడు వారి నమూనా ఎలా సేకరించాలో పరిశోధకులు లెక్కించాల్సిన అవసరం ఉంది. మరో మాటలో చెప్పాలంటే, సాహిత్య డైజెస్ట్ ఎన్నికలో నమూనా ప్రక్రియ కొంతమంది ప్రతివాదులకు క్రమంగా వక్రంగా ఉంది, ఎందుకంటే పరిశోధకులు మరింత క్లిష్టమైన అంచనా వేసే ప్రక్రియను ఉపయోగించడం అవసరమవుతుంది, దీని వలన కొంతమంది ప్రతివాదులు ఇతరులకన్నా ఎక్కువగా ఉన్నారు. ఈ అధ్యాయంలో, నేను మీకు అటువంటి వెయిటింగ్ ప్రక్రియ-పోస్ట్-స్ట్రాటిఫికేషన్ను చూపుతాను-ఇది అస్తవ్యస్త నమూనాల నుండి మెరుగైన అంచనాలను చేయగలదు.