దారుణంగా ఉంటుంది అయినప్పటికీ, సుసంపన్నం అడుగుతూ శక్తివంతంగా ఉంటాయి.
డిజిటల్ ట్రేస్ డేటా అసంపూర్ణ వ్యవహరించే ఒక విభిన్నమైన పద్ధతిలో సర్వే డేటా, నేను సమృద్ధ అడుగుతూ పిలుస్తాను ఒక ప్రక్రియలో నేరుగా అది సంపన్నం ఉంది. సుసంపన్నం అడుగుతున్నప్పుడు ఒక ఉదాహరణ యొక్క అధ్యయనంగా ఉంది Burke and Kraut (2014) నేను Facebook పరస్పర స్నేహం బలాన్ని పెంచుతుంది అని గురించి అధ్యాయంలో ముందుగా వర్ణించారు (విభాగం 3.2). ఆ సందర్భంలో, బర్క్ మరియు Kraut ఫేస్బుక్ లాగ్ డేటాను సర్వే డేటా కలిపి.
బర్క్ మరియు Kraut పని చేస్తున్నట్లు సెట్టింగ్, అయితే, వారు సమృద్ధ అడుగుతూ ముఖం చేయడం పరిశోధకులు రెండు పెద్ద సమస్యలు పరిష్కరించుకోవాలి లేదని అర్థం. మొదటి, నిజానికి డేటా సెట్లు-అనే ప్రక్రియలో రికార్డు లింకేజ్, క్రింద ఈ సమస్య ఇతర ఉదాహరణగా డేటాసెట్-కష్టం మరియు పొరపాట్లకు అవకాశం ఉంటుంది (మేము చూస్తారు తగిన రికార్డుతో ఒక డేటాసెట్ రికార్డు సరిపోలే కలిసి లింక్ ). సుసంపన్నం అడుగుతున్నప్పుడు రెండవ ప్రధాన సమస్య డిజిటల్ ఆనవాళ్ళ నాణ్యత తరచుగా పరిశోధకులు అంచనా కోసం కష్టం అని ఉంది. ఉదాహరణకు, కొన్ని సార్లు అది సేకరించిన ఇది ద్వారా ప్రక్రియ యాజమాన్య మరియు చాప్టర్ 2 లో వర్ణించిన ఇతర మాటలలో సమస్యలకు ఉంటాది అని అనుమానించవచ్చు, సుసంపన్నం అడగడం తరచుగా తెలియని బ్లాక్ బాక్స్ డేటా మూలాల సర్వేలు దోషరహితం లింకింగ్ కలిగి ఉంటుంది నాణ్యత. ఈ రెండు సమస్యలను పరిచయం చేసే ఆందోళనలు ఉన్నప్పటికీ, ఈ వ్యూహం స్టీఫెన్ Ansolabehere మరియు రెండువేలు హెర్ష్ ద్వారా నిరూపించబడింది వంటి ముఖ్యమైన పరిశోధన సాధ్యమే (2012) US లో ఓటు నమూనాలు వారి పరిశోధనలో. ఇది కొన్ని వివరాలు ఈ అధ్యయనం మీద వెళ్ళడానికి విలువైనదే ఉంది Ansolabehere మరియు హెర్ష్ అభివృద్ధి అని సమృద్ధ అడుగుతున్నప్పుడు ఇతర అప్లికేషన్లు ఉపయోగకరంగా ఉంటుంది వ్యూహాలు అనేక ఎందుకంటే.
ఓటరు సభ రాజనీతి శాస్త్రంలో విస్తృతమైన పరిశోధనలు జరుగుతున్నాయి, మరియు గతంలో, ఓటు ఎందుకు సాధారణంగా సర్వే డేటా విశ్లేషణ ఆధారంగా చేయబడిన పరిశోధకులు 'అవగాహన. (అయితే, ప్రభుత్వానికి ఎవరు ప్రతి పౌరుడు ఓట్లు రికార్డు లేదు) అతి ఓటింగ్, అయితే, ప్రతి పౌరునికి ఓటు వేశారు అని ప్రభుత్వ రికార్డులు ఒక అసాధారణ ప్రవర్తన. అనేక సంవత్సరాలు, ఈ ప్రభుత్వ ఓటింగ్ రికార్డులు దేశవ్యాప్తంగా వివిధ స్థానిక ప్రభుత్వ కార్యాలయాల్లో చెల్లాచెదురుగా, కాగితం రూపాల్లో అందుబాటులో ఉన్నాయి. ఈ అది కష్టం, కానీ అసాధ్యం కాదు, రాజకీయ శాస్త్రజ్ఞులు ఓటర్లు యొక్క పూర్తి చిత్రాన్ని కలిగి మరియు ప్రజలు వారి అసలు ఓటింగ్ ప్రవర్తనకు ఓటింగ్ గురించి సర్వేలు ఏమి పోల్చడానికి కోసం చేసిన (Ansolabehere and Hersh 2012) .
కానీ, ఇప్పుడు ఈ ఓటింగ్ రికార్డులు డిజిటైజ్ చేయబడ్డాయి, మరియు ప్రైవేట్ కంపెనీలు అనేక క్రమపద్ధతిలో సేకరించినట్లు మరియు అన్ని అమెరికన్లు ఓటింగ్ ప్రవర్తనను రికార్డ్ సమగ్ర మాస్టర్ ఓటింగ్ ఫైళ్లు ఉత్పత్తి చేయడానికి ఈ ఓటింగ్ రికార్డులు విలీనమైంది. Ansolabehere మరియు హెర్ష్ ఓటర్లు ఒక మంచి చిత్రాన్ని అభివృద్ధి సహాయం చేయడానికి వారి మాస్టర్ ఓటింగ్ ఫైలు ఉపయోగించడానికి క్రమంలో LCC-ఈ కంపెనీల-Catalist ఒకటి భాగస్వామిగా. ఇంకా, ఇది సేకరించిన మరియు ఒక సంస్థ ద్వారా నిర్వహిస్తున్న డిజిటల్ రికార్డులు ఆధారపడింది ఎందుకంటే, అది కంపెనీలు సాయం మరియు అనలాగ్ రికార్డులు ఉపయోగించి లేకుండా పూర్తి చేసినట్లు పరిశోధకులు మునుపటి కృషి అనేక రకాల అనుకూలతలను అందిస్తారు.
చాప్టర్ 2 లో డిజిటల్ ట్రేస్ మూలాల అనేక వలె, Catalist మాస్టర్ ఫైల్ను Ansolabehere మరియు హెర్ష్ అవసరమని, జనాభా ప్రవర్తన, మరియు ప్రవర్తనా సమాచారాన్ని చాలా చేర్చలేదు. ఈ సమాచారం పాటు, Ansolabehere మరియు హెర్ష్ చెల్లుబాటు ఓటింగ్ ప్రవర్తన (అంటే, Catalist డేటాబేస్ లో సమాచారం) నివేదించబడింది ఓటింగ్ ప్రవర్తన పోల్చడం ముఖ్యంగా ఆసక్తి చూపారు. కాబట్టి, పరిశోధకులు వారు కోఆపరేటివ్ కాంగ్రెస్ ఎన్నికల స్టడీ (CCES), ఒక పెద్ద సాంఘిక సర్వే భాగంగా కోరుకున్నాడు డేటా సేకరించిన. తరువాత, పరిశోధకులు Catalist ఈ డేటాను ఇచ్చింది, మరియు Catalist పరిశోధకులు చెల్లుబాటు ఓటింగ్ ప్రవర్తన (Catalist నుండి) చేర్చినందుకు విలీనమైన డేటా ఫైలు, స్వీయ నివేదిత ఓటింగ్ ప్రవర్తన (CCES నుండి) మరియు జనాభా మరియు ప్రతివాదులు వైఖరులు వెనుకకు (CCES నుండి ఇచ్చారు ). ఇతర మాటలలో, Ansolabehere మరియు హెర్ష్ పర్యవేక్షణ డేటా ఓటింగ్ డేటాను సమృద్ధ, మరియు ఫలితంగా విలీనమైన ఫైల్కు వాటిని ఎవరికీ ఫైలు వ్యక్తిగతంగా ఎనేబుల్ ఏదో చేయాలని అనుమతిస్తుంది.
పర్యవేక్షణ డేటా Catalist మాస్టర్ డేటా ఫైలు చేర్చి ద్వారా, Ansolabehere మరియు హెర్ష్ మూడు ముఖ్యమైన తీర్మానాలను వచ్చింది. మొదటి, ఓవర్ రిపోర్టింగ్ ఓటింగ్ విచ్చలవిడిగా: కాని ఓటర్లు దాదాపు సగం ఓటింగ్ నివేదించారు. లేదా, అది చూడటం మరొక మార్గం ఎవరైనా ఓటింగ్ నివేదించారు ఉంటే, వారు నిజానికి ఓటు అవి కేవలం 80% అవకాశం ఉంది. రెండవది, ఓవర్ రిపోర్టింగ్ కాదు యాదృచ్ఛిక; ఓవర్ రిపోర్టింగ్ బాగా చదువుకున్న, అధిక ఆదాయ మధ్య ఎక్కువ సాధారణంగా ఉంది, మరియు ప్రజా వ్యవహారాలలో నిమగ్నమై ఉన్న దళాలు. ఇతర మాటలలో, ఓటు ఎక్కువగా వ్యక్తులు కూడా చాలా ఓటింగ్ గురించి పడుకుని ఉంటారు. మూడవ, మరియు ఎందుకంటే ఓవర్ నివేదన ఓటర్లు మరియు కాని ఓటర్లు మధ్య అసలైన తేడాలు వారు సర్వేలు నుండి కేవలం కనిపిస్తాయి కంటే చిన్నవిగా ఉంటాయి క్రమబద్ధమైన స్వభావం చాలా దూషిస్తూ. ఉదాహరణకు, ఒక బాచిలర్స్ డిగ్రీ ఉన్నవారు సుమారు 22 శాతం పాయింట్లు ఓటింగ్ రిపోర్ట్ అవకాశం, కానీ వాస్తవ ఓటు మాత్రమే 10 శాతం పాయింట్లు ఎక్కువ అవకాశం ఉంది. ఇంకా, ఓటింగ్ ఇప్పటికే వనరుల ఆధారిత సిద్ధాంతాలను వాస్తవానికి ఎవరు ఓట్లు నూతన సిద్ధాంతాలను అర్థం మరియు ఓటింగ్ అంచనా పిలుపు ఆ ఒక అనుభావిక కనుగొనడంలో కంటే ఓటింగ్ నివేదిస్తాము అంచనా వద్ద చాలా మంచివి.
కానీ, ఎంత మేము ఈ ఫలితాలు నమ్మాలి? ఈ ఫలితాలు లోపం యొక్క తెలియని మొత్తంలో బ్లాక్ బాక్స్ డేటా దోషరహితం లింకింగ్ ఆధారపడి గుర్తుంచుకోండి. మరింత ప్రత్యేకంగా, ఫలితాలు రెండు ముఖ్యమైన దశలను కీలు: 1) ఒక ఖచ్చితమైన మాస్టర్ datafile మరియు 2) దాని మాస్టర్ datafile సర్వే డేటా లింక్ Catalist యొక్క సామర్థ్యం ఉత్పత్తి అనేక అసమాన డేటా మూలాల మిళితం Catalist సామర్థ్యం ఉండాలి. ఈ దశలను ప్రతి చాలా కష్టం మరియు గాని అడుగు వద్ద లోపాలు తప్పు ముగింపులు పరిశోధకులు దారి తీయవచ్చు. అయితే, అందుచే దీనిని తరచుగా పరిశోధకుల సంఖ్య ప్రత్యేక విద్యా పరిశోధకుడు లేదా సమూహం మ్యాచ్ ఒక స్థాయిలో, ఈ సమస్యలు పరిష్కరించడంలో వనరులను పెట్టుబడి డేటా ప్రాసెసింగ్ మరియు సరిపోలే రెండు ఒక కంపెనీగా Catalist యొక్క నిరాటంక ఉనికి క్లిష్టమైనవి. అధ్యాయం చివర మరింత పఠనం, నేను మరింత వివరంగా మరియు ఎలా Ansolabehere మరియు హెర్ష్ వారి ఫలితాల్లో విశ్వాసాన్ని నిర్మించేందుకు ఈ సమస్యలను వివరించడానికి. ఈ వివరాలను ఈ అధ్యయనం ప్రత్యేకమైన ఉన్నప్పటికీ, ఈ పోలి సమస్యలు బ్లాక్ బాక్స్ డిజిటల్ ట్రేస్ డేటా మూలాల లింకు ఆశించింది ఇతర పరిశోధకులకు ఉద్భవిస్తుంది.
సాధారణ పాఠాలు పరిశోధకులు ఈ అధ్యయనం నుండి డ్రా చేయవచ్చు ఏమిటి? మొదటి, పర్యవేక్షణ డేటా డిజిటల్ జాడలు చేర్చి నుంచి విపరీతమైన విలువ ఉంది. రెండవది, ఈ సమగ్రం అయినప్పటికీ, వాణిజ్య డేటా మూలాల "గ్రౌండ్ నిజం" పరిగణించరాదు, కొన్ని సందర్భాల్లో వారు ఉపయోగపడుతుంది. నిజానికి, ఈ డేటా మూలాల (వారు ఎప్పుడూ చిన్న పడటం నుండి) నిజమో కాదు సరిపోల్చండి ఉత్తమం. అయితే, వారిని స్థిరముగా అలాగే లోపాలు కలిగిన ఇతర అందుబాటులో సమాచార వనరుల సరిపోల్చండి ఉత్తమం.