డిజిటల్ వయస్సు ప్రాక్టీస్ గట్టిగా సంభావ్యత నమూనాను తయారు చేస్తోంది మరియు సంభావ్యత నమూనా కోసం కొత్త అవకాశాలను సృష్టిస్తుంది.
నమూనా యొక్క చరిత్రలో, రెండు పోటీ పద్ధతులు ఉన్నాయి: సంభావ్యత నమూనా పద్ధతులు మరియు సంభావ్యత నమూనా పద్ధతులు. నమూనా యొక్క ప్రారంభ రోజులలో రెండు విధానాలను ఉపయోగించినప్పటికీ, సంభావ్యత నమూనా ఆధిపత్యం చెలాయించబడింది, మరియు చాలామంది సామాజిక పరిశోధకులు గొప్ప సంశయవాదంతో కాని సంభావ్యత నమూనాను వీక్షించడానికి బోధించారు. అయితే, నేను క్రింద వివరించే విధంగా, డిజిటల్ యుగం ద్వారా సృష్టించబడిన మార్పులు అర్థం కాని సంభావ్యత నమూనాను పునఃపరిశీలించే పరిశోధకులకు సమయం అని అర్థం. ప్రత్యేకంగా, సంభావ్యత నమూనాలో ఆచరణలో చేయటానికి కష్టపడి ఉంది, మరియు సంభావ్యత సంభావ్యత వేగంగా, చౌకగా మరియు మెరుగైంది. వేగవంతమైన మరియు చౌకైన సర్వేలు కేవలం తాము ముగుస్తుంది: వారు మరింత తరచుగా సర్వేలు మరియు పెద్ద నమూనా పరిమాణాల్లో కొత్త అవకాశాలను చేస్తాయి. ఉదాహరణకు, సంభావ్యతా పద్ధతులను ఉపయోగించడం ద్వారా సహకార సంకీర్ణ ఎన్నికల అధ్యయనం (CCES) సంభావ్యత నమూనాను ఉపయోగించి మునుపటి అధ్యయనాల కంటే సుమారు 10 రెట్లు ఎక్కువ మంది పాల్గొనే అవకాశం ఉంది. ఈ పెద్ద నమూనా ఉప పరిశోధకులు మరియు సాంఘిక సందర్భాలలో అంతటా వైఖరులలో మరియు ప్రవర్తనలో అధ్యయనం చేయడానికి రాజకీయ పరిశోధకులను అనుమతిస్తుంది. అంతేకాకుండా, ఈ జోడించిన మొత్తం అన్ని అంచనాల నాణ్యతను తగ్గిస్తూ వచ్చింది (Ansolabehere and Rivers 2013) .
ప్రస్తుతం, సాంఘిక పరిశోధన కోసం మాదిరిగా ప్రాముఖ్యత నమూనా అనేది సంభావ్యత నమూనా . సంభావ్యత నమూనాలో, లక్ష్య జనాభాలోని అన్ని సభ్యులకి తెలిసిన, సున్నాకి సంభావ్యత ఉంటుంది, మరియు సర్వేలో పాల్గొనేవారికి సర్వే చేసిన వారు. ఈ పరిస్థితులు నెరవేరినప్పుడు, ఆకర్షణీయమైన గణిత ఫలితాలు లక్ష్య జనాభా గురించి అనుమతులను చేయడానికి నమూనాను ఉపయోగించే పరిశోధకుడి సామర్థ్యాన్ని గురించి నిరూపించగల హామీలను అందిస్తాయి.
వాస్తవిక ప్రపంచంలో, అయితే, ఈ గణిత ఫలితాలకు సంబంధించిన పరిస్థితులు అరుదుగా కలుస్తాయి. ఉదాహరణకు, తరచుగా కవరేజ్ లోపాలు మరియు nonresponse ఉన్నాయి. ఈ సమస్యల కారణంగా, పరిశోధకులు వారి నమూనా జనాభా నుండి వారి లక్ష్య జనాభాకు అనుగుణంగా చేయడానికి అనేక రకాల గణాంక సర్దుబాట్లను ఉపయోగిస్తారు. అందువలన, సిద్ధాంతంలో సంభావ్యత నమూనా మధ్య తేడాను గుర్తించడం ముఖ్యం, ఇది బలమైన సైద్ధాంతిక హామీలు మరియు ఆచరణలో సంభావ్యత నమూనాను కలిగి ఉంటుంది , ఇది ఇటువంటి హామీలను అందించదు మరియు వివిధ రకాల గణాంక సర్దుబాట్లు ఆధారపడి ఉంటుంది.
కాలక్రమేణా, సిద్ధాంతంలో సంభావ్యత నమూనా మరియు సంభావ్యత నమూనాలో తేడాలు పెరుగుతున్నాయి. ఉదాహరణకు, అధిక నాణ్యత, ఖరీదైన సర్వేల్లో (ఫిగర్ 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) కూడా nonresponse రేట్లు స్థిరంగా పెరుగుతూ ఉన్నాయి. వాణిజ్య టెలిఫోన్ సర్వేల్లోని నాన్ రిరాన్స్ రేట్లు ఎక్కువగా ఉంటాయి - కొన్నిసార్లు 90% (Kohut et al. 2012) . నాన్ రిప్రెస్స్లో ఈ పెరుగుదల అంచనాల నాణ్యతను బెదిరించింది, ఎందుకంటే అంచనాలు నిరాశావాదం కోసం సర్దుబాటు చేయడానికి ఉపయోగించే గణాంక నమూనాలపై ఆధారపడి ఉంటాయి. అంతేకాకుండా, అధిక ప్రతిస్పందన రేట్లను నిర్వహించడానికి సర్వే పరిశోధకులచే ఖరీదైన ప్రయత్నాలు ఉన్నప్పటికీ ఈ నాణ్యత తగ్గుతుంది. కొంతమంది ప్రజలు తగ్గుతున్న నాణ్యత మరియు పెరుగుతున్న వ్యయం యొక్క ఈ జంట పోకడలు సర్వే పరిశోధన యొక్క పునాదిని బెదిరించాయని భయపడుతున్నాయి (National Research Council 2013) .
సంభావ్యత పరిశీలనా విధానాలు పెరుగుతున్న ఇబ్బందులు వస్తోందని అదే సమయంలో, కూడా కాని సంభావ్యత పరిశీలనా విధానాలు లో ఉత్తేజకరమైన పరిణామాలను ఉంది. కాని సంభావ్యత నమూనా పద్ధతుల యొక్క విభిన్న శైలులు ఉన్నాయి, కానీ అవి సాధారణంగా కలిగి ఉన్న ఒక విషయం ఏమిటంటే వారు సంభావ్యత నమూనా యొక్క గణితశాస్త్ర చట్రంలో (Baker et al. 2013) సులువుగా సరిపోవడం సాధ్యపడదు. ఇంకో మాటలో చెప్పాలంటే, సంభావ్యత లేని నమూనా పద్ధతుల్లో ప్రతిఒక్కరికీ చేర్చబడని తెలిసిన మరియు nonzero సంభావ్యత ఉండదు. నాన్-సంభావ్యత నమూనా పద్ధతులు సాంఘిక పరిశోధకుల మధ్య ఒక భయంకరమైన కీర్తిని కలిగి ఉన్నాయి మరియు అవి సాహిత్య డైజెస్ట్ ఫియస్కో (ముందు చర్చించబడ్డాయి) మరియు "డ్యూయీ డిఫ్యూట్స్ ట్రూమాన్" వంటి సర్వే పరిశోధకుల అత్యంత నాటకీయ వైఫల్యాలతో సంబంధం కలిగి ఉంటాయి, US గురించి తప్పుడు అంచనా అధ్యక్ష ఎన్నికలు 1948 (సంఖ్య 3.6).
డిజిటల్ వయస్సుకి సరిపోయే ప్రత్యేకమైన కాని సంభావ్యత నమూనా ఒక రూపం ఆన్లైన్ ప్యానెళ్ల ఉపయోగం. ఆన్లైన్ ప్యానెళ్లను ఉపయోగిస్తున్న పరిశోధకులు కొంతమంది పానెల్ ప్రొవైడర్-సాధారణంగా ఒక సంస్థ, ప్రభుత్వం లేదా యూనివర్సిటీ మీద ఆధారపడతారు-సర్వేలకు ప్రతినిధిగా పనిచేయడానికి అంగీకరిస్తున్న పెద్ద, విభిన్న సమూహాన్ని నిర్మించడానికి. ఈ ప్యానెల్ పాల్గొనేవారు తరచు ఆన్లైన్ బ్యానర్ యాడ్స్ వంటి వివిధ రకాల హాక్ పద్ధతులను ఉపయోగించి నియమిస్తారు. అప్పుడు, ఒక పరిశోధకుడు ప్యానెల్ ప్రొవైడర్కు కావలసిన లక్షణాలు కలిగిన ప్రతివాదుల నమూనాకు ప్రాప్తి చేయవచ్చు (ఉదా., వయోజనుల జాతీయ ప్రతినిధి). ఈ ఆన్లైన్ ప్యానెల్లు సంభావ్యత పద్ధతులు కావు ఎందుకంటే ప్రతిఒక్కరూ అందరికీ తెలిసిన, సున్నారైన సంభావ్యతను కలిగి ఉంటారు. సంభావ్యత లేని ఆన్లైన్ ప్యానెల్లు ఇప్పటికే సామాజిక పరిశోధకులు (ఉదా. CCES) ఉపయోగించినప్పటికీ, వాటి నుండి వచ్చే అంచనాల నాణ్యతను గురించి కొన్ని చర్చలు ఇప్పటికీ ఉన్నాయి (Callegaro et al. 2014) .
ఈ చర్చలు ఉన్నప్పటికీ, సాంఘిక పరిశోధకులు నాన్-సంభావ్యత నమూనాను పునఃపరిశీలించాలనే సమయం ఎందుకు సరైనదని రెండు కారణాలు ఉన్నాయి. మొదట, డిజిటల్ యుగంలో, సంభావ్యత లేని నమూనాల సేకరణ మరియు విశ్లేషణలో అనేక అభివృద్ధిలు ఉన్నాయి. ఈ నూతన పద్దతులు గతంలో సమస్యలను కలిగించే పద్ధతుల నుండి వేర్వేరుగా ఉంటాయి, అవి నాన్-సంభావ్యత నమూనా 2.0 గా భావించటానికి అర్ధమేనని నేను భావించాను. పరిశోధకులు సంభావ్యత నమూనాను పునఃపరిశీలించాల్సిన రెండో కారణం ఎందుకంటే సంభావ్యత నమూనా అభ్యాసం చాలా కష్టంగా మారాయి. ప్రతిస్పందించే అధిక రేట్లు ఉన్నప్పుడు-ఇప్పుడు నిజ సర్వేలో ఉన్నాయి- ప్రతివాదులకు చేర్చడానికి వాస్తవ సంభావ్యత తెలియదు, అందువల్ల సంభావ్యత నమూనాలు మరియు సంభావ్యత నమూనాలు చాలామంది పరిశోధకులు నమ్మకంతో ఉండవు.
నేను ముందు చెప్పినట్లుగా, సంభావ్యత నమూనాలు చాలామంది సాంఘిక పరిశోధకులచే గొప్ప సంశయవాదంతో చూడబడతాయి, కొంతమందిలో సర్వే పరిశోధన ప్రారంభ రోజులలో అత్యంత ఇబ్బందికరమైన వైఫల్యాలలో వారి పాత్ర. మేము సంభావ్యత లేని నమూనాలను ఎంతవరకూ తీసుకున్నారనేదానికి స్పష్టమైన ఉదాహరణ ఏమిటంటే, వెయి వాంగ్, డేవిడ్ రోత్స్చైల్డ్, శరద్ గోయల్ మరియు ఆండ్రూ గెల్మాన్ (2015) ద్వారా పరిశోధన జరిగింది. అమెరికన్ Xbox వినియోగదారుల-అమెరికన్ల నిర్ణయాత్మక nonrandom నమూనా. పరిశోధకులు XBox గేమింగ్ సిస్టమ్ నుండి ప్రతివాదిని నియమించారు, మరియు మీరు ఆశించిన విధంగా, Xbox నమూనా మగవాడికి వక్రీకృత మరియు వక్రీకరించిన యువత: 18- నుంచి 29 ఏళ్ల వయస్సు 19% నియోజకవర్గం కాని Xbox నమూనాలో 65%, పురుషులు ఓటు 47% కానీ Xbox నమూనాలో 93% (Figure 3.7) తయారు. ఈ బలమైన జనాభా పక్షాల కారణంగా, ముడి Xbox డేటా ఎన్నికల రిటర్న్లను బలహీనమైన సూచికగా చెప్పవచ్చు. ఇది బరాక్ ఒబామాపై మిట్ రోమ్నీకి బలమైన విజయాన్ని ఊహించింది. మళ్ళీ, ఇది ముడి, తృప్తిలేని, సంభావ్యత కాని నమూనాల ప్రమాదాలకి మరొక ఉదాహరణ, మరియు సాహిత్య డైజెస్ట్ ఫియస్కో యొక్క ప్రతిబింబం.
ఏదేమైనప్పటికీ, వాంగ్ మరియు సహచరులు ఈ సమస్యలను గురించి తెలుసుకున్నారు మరియు అంచనా వేసేటప్పుడు తమ యాదృచ్ఛిక నమూనా ప్రక్రియ కోసం సర్దుబాటు చేయడానికి ప్రయత్నించారు. ముఖ్యంగా, వారు పోస్ట్-స్ట్రాటిఫికేషన్ను ఉపయోగించారు, కవరేజ్ లోపాలు మరియు ప్రతిస్పందన లేని సంభావ్యత నమూనాలను సర్దుబాటు చేయడానికి కూడా విస్తృతంగా ఉపయోగించబడే ఒక సాంకేతికత.
పోస్ట్ స్ట్రాటిఫికేషన్ యొక్క ముఖ్య ఉద్దేశం, నమూనా నుండి వచ్చే అంచనాను మెరుగుపరచడానికి లక్ష్య జనాభా గురించి సహాయక సమాచారాన్ని ఉపయోగించడం. వారి సంభావ్యత నమూనా నుండి అంచనా వేయడానికి పోస్ట్ స్ట్రాటిఫికేషన్ను ఉపయోగించినప్పుడు, వాంగ్ మరియు సహోద్యోగి జనాభాను వేర్వేరు సమూహాలలోకి కత్తిరించారు, ప్రతి సమూహంలో ఒబామా మద్దతును అంచనా వేశారు, తర్వాత మొత్తం అంచనాను ఉత్పత్తి చేయడానికి బృందం అంచనాల సగటును తీసుకున్నారు. ఉదాహరణకు, వారు జనాభాను రెండు గ్రూపులుగా (పురుషులు మరియు మహిళలు) విభజించగలిగారు, పురుషులు మరియు మహిళలు మధ్య ఒబామా కోసం మద్దతును అంచనా వేశారు, తరువాత ఒబామా కోసం మొత్తం మద్దతును అంచనా వేయడం ద్వారా మహిళలు సగటున 53% ఓటర్లు మరియు పురుషులు 47%. సమూహాల పరిమాణాల గురించి సహాయక సమాచారంలో తీసుకురావడం ద్వారా, సమతుల్యత నమూనాకు సరిగ్గా, పోస్ట్-స్ట్రాటిఫికేషన్ సరిదిద్దడానికి సహాయపడుతుంది.
పోస్ట్-స్ట్రాటిఫికేషన్కు కీ అనేది కుడి సమూహాలను ఏర్పరచడం. ప్రతి సమూహానికి ప్రతి ఒక్కరికీ ప్రతిస్పందించే ప్రవృత్తిని ఒకే విధంగా ఉంచి, మీరు ఒకే విధమైన సమూహాలను చాప్ చేయగలిగితే, పోస్ట్-స్ట్రాటిఫికేషన్ నిష్పాక్షికమైన అంచనాలను ఉత్పత్తి చేస్తుంది. ఇతర మాటల్లో చెప్పాలంటే, పురుషులందరూ ప్రతిస్పందన ప్రవృత్తిని కలిగి ఉంటే, లింగంచే పోస్ట్-స్ట్రాటిఫికేషన్ నిష్పాక్షికమైన అంచనాలను ఉత్పత్తి చేస్తుంది మరియు అన్ని మహిళలకు అదే ప్రతిస్పందన ప్రవృత్తి ఉంటుంది. ఈ భావనను సజాతీయ-స్పందన-ప్రవృత్తుల-సమూహాల భావనగా పిలుస్తారు మరియు నేను ఈ అధ్యాయం ముగిసేలోనే గణిత శాస్త్ర నోట్లలో కొంచం ఎక్కువగా వివరించాను.
వాస్తవానికి, ప్రతి పురుషులందరికీ, అందరు మహిళలకూ స్పందన ప్రవృత్తి ఉంటుందని చెప్పలేము. ఏదేమైనప్పటికీ, సమూహాల పెరుగుదలల సంఖ్యలో సజాతీయ-స్పందన-ప్రవృత్తుల-సమూహాల భావన మరింత ఆమోదయోగ్యం అవుతుంది. మీరు మరింత సమూహాలను సృష్టించినట్లయితే, జనాభాను సజాతీయ సమూహంగా ముక్కలుగా చేయడం సులభంగా మారుతుంది. ఉదాహరణకు, అన్ని మహిళలు ఒకే స్పందనను కలిగి ఉన్నారని ఊహించదగినదిగా అనిపించవచ్చు, కానీ కళాశాల నుండి పట్టభద్రులైన 18-29 సంవత్సరాల వయస్సు ఉన్న మహిళలందరికీ అదే ప్రతిస్పందన ప్రవృత్తి ఉందని, మరియు కాలిఫోర్నియాలో నివసిస్తున్న వారు . ఆ విధంగా, పోస్ట్-స్ట్రాటిఫికేషన్లో ఉపయోగించిన సమూహాల సంఖ్య పెద్దదిగా ఉండటంతో, పద్ధతికి మద్దతు ఇవ్వడానికి అవసరమైన అంచనాలు మరింత సహేతుకంగా మారతాయి. ఈ వాస్తవం, పరిశోధకులు తరచూ పోస్ట్-స్ట్రాటిఫికేషన్ కోసం భారీ సంఖ్యలో సమూహాలను సృష్టించాలనుకుంటున్నారు. ఏదేమైనా, సమూహాల సంఖ్య పెరుగుతుండటంతో, పరిశోధకులు వేరొక సమస్యలోకి వచ్చారు: డేటా స్పాసిటీ. ప్రతి సమూహంలో కొద్దిమంది మాత్రమే ప్రజలు ఉంటే, అప్పుడు అంచనాలు చాలా అనిశ్చితంగా ఉంటాయి మరియు తీవ్రవాదిలో ప్రతివాదులు లేని సమూహం ఉన్నట్లయితే, పోస్ట్-స్ట్రాటిఫికేషన్ పూర్తిగా విచ్ఛిన్నమవుతుంది.
సజాతీయ స్పందన-ప్రవృత్తి-లోపల-సమూహాల భావన మరియు ప్రతి సమూహంలో సహేతుకమైన మాదిరి పరిమాణాల కోసం డిమాండ్ యొక్క సామర్ధ్యం మధ్య ఈ అంతర్లీన ఉద్రిక్తత నుండి రెండు మార్గాలు ఉన్నాయి. మొదట, పరిశోధకులు ఒక పెద్ద, విభిన్నమైన నమూనాను సేకరిస్తారు, ఇది ప్రతి సమూహంలో సహేతుకమైన నమూనా పరిమాణాలను నిర్ధారించడానికి సహాయపడుతుంది. రెండవది, వారు సమూహాలలో అంచనా వేయడానికి మరింత అధునాతన గణాంక నమూనాను ఉపయోగించవచ్చు. నిజానికి, కొన్నిసార్లు, కొన్నిసార్లు పరిశోధకులు రెండింటినీ, వాంగ్ మరియు సహచరులు తమ ప్రతినిధుల అధ్యయనంతో Xbox నుండి ప్రతివాదులు ఉపయోగించారు.
కంప్యూటర్-ఇంటర్వ్యూ చేసిన ఇంటర్వ్యూలతో వారు కాని సంభావ్యత నమూనా పద్ధతిని ఉపయోగించడం వలన (విభాగం 3.5 లో కంప్యూటర్-నిర్వహించిన ఇంటర్వ్యూల గురించి నేను మరింత మాట్లాడతాను), వాంగ్ మరియు సహచరులు చాలా చవకైన డేటా సేకరణను కలిగి ఉన్నారు, ఇది సమాచారాన్ని సేకరించేందుకు 345,858 మంది పాల్గొనేవారు , ఎన్నికల పోలింగ్ ప్రమాణాల ద్వారా భారీ సంఖ్య. ఈ భారీ నమూనా పరిమాణానికి, పెద్ద సంఖ్యలో పోస్ట్-స్ట్రాటిఫికేషన్ సమూహాలను ఏర్పరుస్తాయి. వందలాది సమూహాలుగా జనాభాను వేరుచేయడంతో, స్టాండింగ్ స్టాండింగ్లో సాధారణంగా వంగ్ మరియు సహచరులు జనాభా లింగం (2 విభాగాలు), జాతి (4 కేటగిరీలు), వయస్సు (4 కేటగిరీలు), విద్య (4 కేటగిరీలు), రాష్ట్రం (51 కేటగిరీలు), పార్టీ ఐడి (3 కేటగిరీలు), సిద్ధాంతం (3 కేటగిరీలు), మరియు 2008 ఓటు (3 వర్గాలు). మరో మాటలో చెప్పాలంటే, తక్కువ ఖర్చుతో కూడిన డేటా సేకరణ ద్వారా ప్రారంభించిన వారి భారీ నమూనా పరిమాణం, వారి అంచనా ప్రక్రియలో మరింత ఆమోదయోగ్యమైన భావనను రూపొందించడానికి వారికి సహాయపడింది.
అయినప్పటికీ, 345,858 మంది పాల్గొనేవారు కూడా ఉన్నారు, వాంగ్ మరియు సహోద్యోగులకు దాదాపు ఎటువంటి ప్రతివాదులు లేరు, అనేక గ్రూపులు ఇప్పటికీ ఉన్నాయి. అందువల్ల, వారు ప్రతి సమూహానికి మద్దతును అంచనా వేయడానికి బహుళస్థాయి రిగ్రెషన్ అనే సాంకేతికతను ఉపయోగించారు. ప్రత్యేకంగా, ఒక నిర్దిష్ట సమూహంలో ఒబామా మద్దతును అంచనా వేయడానికి, బహుళస్థాయి తిరోగమనం అనేక దగ్గరి సంబంధాల నుండి సమాచారాన్ని విస్తరించింది. ఉదాహరణకి, 18 మరియు 29 ఏళ్ళ మధ్య వయస్సు గల స్త్రీలకు మధ్య ఒబామా మద్దతును అంచనా వేయాలని ఊహించుకొని, కళాశాల గ్రాడ్యుయేట్లు, వారు డెమోక్రాట్లు నమోదు చేసుకున్నవారు, మితవాదులుగా స్వీయ-గుర్తింపు పొందిన వారు 2008 లో ఒబామాకు ఓటు వేశారు. , చాలా నిర్దిష్ట సమూహం, మరియు ఈ లక్షణాలతో నమూనాలో ఎవరూ లేరు. అందువలన, ఈ గుంపు గురించి అంచనా వేయడానికి, మల్టీలెవల్ రిగ్రెషన్ ఒకే విధమైన సమూహాలలో వ్యక్తుల నుండి అంచనా వేయడానికి ఒక గణాంక నమూనాను ఉపయోగిస్తుంది.
అందువల్ల, వాంగ్ మరియు సహచరులు బహుళస్థాయి రిగ్రెషన్ మరియు పోస్ట్-స్ట్రాటిఫికేషన్లను కలిపి ఒక పద్ధతిని ఉపయోగించారు, తద్వారా వారి వ్యూహాన్ని పోస్ట్-స్ట్రాటిఫికేషన్తో బహుళ వ్యూహరచన అని పిలుస్తారు లేదా, మరింత ప్రేమతో, "మిస్టర్. P. "XBox నాన్-సంభావ్యత నమూనా నుండి అంచనా వేయడానికి వాంగ్ మరియు సహచరులు మిస్టర్ P ను ఉపయోగించినప్పుడు, 2012 ఎన్నికలో ఒబామా పొందిన మొత్తం మద్దతుకు వారు చాలా దగ్గరగా అంచనా వేశారు (సంఖ్య 3.8). వాస్తవానికి వారి అంచనాలు సాంప్రదాయ ప్రజాభిప్రాయ పోల్స్ సగటు కంటే మరింత ఖచ్చితమైనవి. అందువలన, ఈ సందర్భంలో, గణాంక సర్దుబాట్లు-ప్రత్యేకించి మిస్టర్ P.- సంభావ్యత డేటాలో పక్షపాతాలను సరిచేసే మంచి ఉద్యోగం చేయాలని కనిపిస్తుంది; మీరు సరిదిద్దలేని Xbox డేటా నుండి అంచనాలను చూసినప్పుడు స్పష్టంగా కనిపించే పక్షపాతాలు.
వాంగ్ మరియు సహచరుల అధ్యయనం నుండి రెండు ప్రధాన పాఠాలు ఉన్నాయి. మొదటిది, సరికాని కాని సంభావ్యత నమూనాలు చెడు అంచనాలకు దారితీయవచ్చు; ఇది అనేకమంది పరిశోధకులు ముందు విన్న ఒక పాఠం. అయితే రెండవ పాఠం, కాని సంభావ్యత నమూనాలు, సరిగ్గా విశ్లేషించినప్పుడు, నిజానికి మంచి అంచనాలను ఉత్పత్తి చేయగలవు; కాని సంభావ్యత నమూనాలను స్వయంచాలకంగా సాహిత్య డైజెస్ట్ అపజయం వంటి ఏదో దారి లేదు.
మీరు ఒక సంభావ్యత నమూనా విధానం మరియు ఒక సంభావ్యత నమూనాను ఉపయోగించడం మధ్య నిర్ణయం తీసుకోవడానికి ప్రయత్నిస్తున్నట్లయితే, మీరు కష్టమైన ఎంపికను ఎదుర్కొంటున్నారు. కొన్నిసార్లు పరిశోధకులు త్వరిత మరియు దృఢమైన నిబంధన (ఉదా, ఎల్లప్పుడూ సంభావ్యత నమూనా పద్ధతులను వాడతారు) ను కోరుకుంటారు, కానీ అలాంటి నిబంధనను అందించడం చాలా కష్టం. ఆచరణలో సంభావ్యత నమూనా పద్ధతుల మధ్య పరిశోధకులకు కష్టమైన ఎంపిక ఉంది-ఇది ఖరీదైనది మరియు చాలా తక్కువ ఖరీదు మరియు వేగవంతమైనది, తక్కువగా తెలిసిన మరియు మరింత విభిన్నమైన వాటి ఉపయోగం-మరియు సంభావ్యత నమూనా పద్ధతులను సమర్ధించే సిద్ధాంత ఫలితాల నుండి చాలా దూరంగా ఉంటాయి. అయినప్పటికీ, స్పష్టంగా ఉన్న ఒక విషయం ఏమిటంటే, మీరు సంభావ్యత లేని నమూనాలను లేదా నిర్దేశించని పెద్ద డేటా మూలాల (చాప్టర్ 2 కు తిరిగి ఆలోచించండి) తో పని చేయాలని ఒత్తిడి చేస్తే, పోస్ట్-స్ట్రాటిఫికేషన్ను ఉపయోగించిన అంచనాలు మరియు సంబంధిత పద్ధతులు సరికాని, ముడి అంచనాల కంటే ఉత్తమంగా ఉంటాయి.