వ్యాపారాలు మరియు ప్రభుత్వాల నిర్వహించిన డేటా యాక్సెస్ పరిశోధకులకు కష్టం.
మే 2014 లో, US నేషనల్ సెక్యూరిటీ అజెండా ఒక ఇబ్బందికరమైన పేరు ఉందని ఇంటెలిజెన్స్ కమ్యూనిటీ సమగ్ర జాతీయ సైబర్ సెక్యూరిటీ ఇన్షియేటివ్ డేటా సెంటర్ గ్రామీణ ఉటా ఒక డేటా సెంటర్ ప్రారంభించబడింది. అయితే, ఉటా డేటా సెంటర్ అని ప్రాచుర్యంలోకి వచ్చిన ఈ డేటాను కేంద్రం, నమ్మశక్యంకాని సామర్థ్యాలు ఉన్నట్లు ప్రకటించింది. ఒక నివేదిక ఉటా డేటా సెంటర్ నిల్వ మరియు ప్రైవేట్ ఇమెయిళ్ళు "పూర్తి సారములను, సెల్ ఫోన్ కాల్స్ మరియు Google శోధనలు సహా కమ్యూనికేషన్ అన్ని రకాల, అలాగే వ్యక్తిగత డేటా ట్రైల్స్ పార్కింగ్ రసీదులు, ప్రయాణ మార్గం అన్ని రకాల పరీక్షలు నిర్వహించగలిగారు అని ఆరోపించింది పుస్తక దుకాణానికి కొనుగోళ్లు, మరియు ఇతర డిజిటల్ `జేబులో ఈతలో '" (Bamford 2012) . మరింత క్రింద వివరించిన చేయబడుతుంది పెద్ద డేటాలోని స్వాధీనం సమాచారాన్ని, చాలా సున్నితమైన స్వభావం గురించి పెంపుదల ఆందోళనలు పాటు, ఉటా డేటా సెంటర్ పరిశోధకులు అసాధ్యమైన అని ఒక గొప్ప డేటా మూలం యొక్క ఒక ఉదాహరణ ఉంది. సర్వసాధారణంగా, పరిశోధకులు నియంత్రిత మరియు ప్రభుత్వాలు (ఉదా, పన్ను డేటా మరియు విద్యా డేటా) గా మరియు సంస్థలు పరిమితులకు లోబడి ఉంటాయి ఉపయోగకరంగా అని పెద్ద డేటా అనేక మూలాలు (ఉదాహరణ, ప్రశ్నలు ఇంజిన్లు మరియు ఫోన్ కాల్ మెటా డేటా శోధించండి). అందువలన, ఈ డేటా విశ్వవిద్యాలయాల్లో పరిశోధకులు వెంటనే అందుబాటులో వుండదు, మరియు అత్యంత కూడా ప్రభుత్వాలు లేదా సంస్థలు పరిశోధకులకు అందుబాటులో వుండదు.
నా అనుభవం లో, విశ్వవిద్యాలయాలలో ఆధారంగా అనేక పరిశోధకులు ఈ కొరత యొక్క మూలం తప్పుగా అర్థం. ఈ డేటాను కంపెనీలు మరియు ప్రభుత్వాలు వద్ద ప్రజలు, తెలివితక్కువదని సోమరితనం, లేదా అంత పట్టింపు లేనట్టుగా ఎందుకంటే అసాధ్యమైన కాదు. అయితే, తీవ్రమైన న్యాయపరమైన, సాంకేతిక, వ్యాపార మరియు డేటా యాక్సెస్ నిరోధించే నైతిక అడ్డంకులు ఉన్నాయి. ఉదాహరణకు, వెబ్సైట్లు కొన్ని పదాలను ఆఫ్ సేవా ఒప్పందాలు మాత్రమే డేటా ఉద్యోగుల ఉపయోగించిన లేదా సేవను మెరుగుపరచడానికి అనుమతిస్తాయి. కాబట్టి డేటా భాగస్వామ్య కొన్ని రకాల వినియోగదారుల నుండి చట్టబద్ధమైన వ్యాజ్యాలకు కంపెనీలు బహిర్గతం కాలేదు. భాగస్వామ్య డేటా ఉన్న కంపెనీలు గణనీయమైన వ్యాపార నష్టాలకు కూడా ఉన్నాయి. వ్యక్తిగత శోధన డేటా అనుకోకుండా ఒక విశ్వవిద్యాలయ పరిశోధన ప్రాజెక్టులో భాగంగా Google నుండి బహిర్గతమైంది ఉంటే ప్రజా స్పందించడం ఎలా ఊహించవచ్చు ప్రయత్నించండి. ఇటువంటి డేటా ఉల్లంఘన, తీవ్రమైన ఉంటే, కంపెనీ కోసం మనుగడకి ప్రమాదం కావచ్చు. సో Google మరియు చాలా పెద్ద చాలా ప్రమాదాన్ని అధిగమించే పరిశోధకులు డేటాను భాగస్వామ్యం గురించి కంపెనీలకు అనుకూలంగా ఉన్నాయి.
యొక్క డేటా అబ్దుర్ చౌదరి కథ తెలుసు నిజానికి, ఒక స్థితిలో ఉన్న దాదాపు ప్రతి ఒక్కరూ పెద్ద మొత్తంలో ప్రాప్తి చేయడానికి. 2006 లో, అతను AOL పరిశోధన యొక్క తల ఉన్నప్పుడు, అతను ఉద్దేశ్యపూర్వకంగా తాను పరిశోధన 650,000 AOL వినియోగదారులు నుండి శోధన ప్రశ్నలుగా anonymized భావించి గురించి ప్రకటించింది. చాలా నేను తెలియజేయవచ్చు గా, చౌదరి మరియు AOL పరిశోధకులు మంచి ఆలోచనలను కలిగి మరియు వారు డేటా anonymized అని ఆలోచన. కానీ, వారు తప్పు ఉన్నారు. ఇది త్వరగా డేటా పరిశోధకులు భావించినట్లు పేరులేకుండా కావని కనుగొనబడింది, మరియు న్యూ యార్క్ టైమ్స్ నుండి రిపోర్టర్ల సులభంగా డేటాసెట్ వ్యక్తులతో గుర్తించడానికి పోయారు (Barbaro and Zeller Jr 2006) . ఈ సమస్యలు కనుగొన్నారు ఒకసారి, చౌదరి AOL యొక్క వెబ్సైట్ నుండి డేటా తొలగించబడింది, కానీ అప్పటికే చాలా ఆలస్యం. డేటా ఇతర వెబ్సైట్లలో మళ్ళీ పోస్ట్ చేయబడింది మరియు మీరు ఈ పుస్తకం చదివిన చేసినప్పుడు అది బహుశా ఇప్పటికీ అందుబాటులో ఉంటుంది. పరిశోధన తో డేటాను పంచుకోవడానికి అతని ప్రయత్నం కారణంగా, చౌదరి తొలగించాడు మరియు AOL యొక్క చీఫ్ టెక్నాలజీ అధికారి రాజీనామా (Hafner 2006) . ఈ ఉదాహరణ చూపిస్తుంది వంటి, లోపల డేటా యాక్సెస్ సులభతరం కంపెనీల నిర్దిష్ట వ్యక్తులకు చాలా ఉపయోగకరముగా అందమైన చిన్న మరియు చెత్త దృష్టాంత భయంకరమైన ఉంది.
పరిశోధన, అయితే, సాధారణ ప్రజలకు అందుబాటులో లేకుండా అని డేటా పొందటం చేయవచ్చు. ప్రభుత్వాలు పరిశోధకులు యాక్సెస్ కోసం దరఖాస్తు చేసే విధానాలు కలిగి, మరియు తరువాతి ఈ అధ్యాయం షోలో, పరిశోధకులు అప్పుడప్పుడూ కార్పొరేట్ డేటా పొందటం చేయవచ్చు. ఉదాహరణకు, Einav et al. (2015) ఆన్లైన్ వేలం నుండి డిజిటల్ జాడలు అధ్యయనం eBay లో ఒక పరిశోధకుడు భాగస్వామి అయ్యారు. నేను తరువాత అధ్యాయం (విభాగం 2.4.3.2) లో ఈ సహకారం నుండి వచ్చిన పరిశోధన గురించి మరింత మాట్లాడదాము కానీ నేను విజయవంతమైన భాగస్వామ్యాలు చూసే పదార్థాలు అన్ని నాలుగు ఉన్నాయి ఎందుకంటే నేను ఇప్పుడు అది పేర్కొన్నారు: పరిశోధకుడు వడ్డీ, పరిశోధకుడు సామర్ధ్యం, కంపెనీ ఆసక్తి, మరియు కంపెనీ సామర్ధ్యం. ఇతర మాటలలో, Einav మరియు సహచరులు ఆసక్తి మరియు ఆన్లైన్ వేలం అధ్యయనం సామర్థ్యం ఉన్నాయి. మరియు, ebay కూడా ఉంది. అయితే, నేను చూసిన అనేక సాధ్యం సహకారం పరిశోధకుడు లేదా సంస్థ గాని ఈ పదార్ధాల్లో ఒకటిగా లేదు ఎందుకంటే విఫలం.
మీరు అయితే, ఒక వ్యాపార ఒక భాగస్వామ్యాన్ని అభివృద్ధి చేయగలరు పోయినా, మీరు కోసం కొన్ని దుష్ప్రభావాలు ఉన్నాయి. మొదటి, మీరు అవకాశం పరిమితం చేయబడుతుంది తో సమాచారంతో అడగవచ్చు ఆ ప్రశ్నలు; కంపెనీలు వాటిని చెడు కనిపించేలా పరిశోధన అనుమతించటానికి అవకాశం లేదు. రెండవది, మీరు బహుశా ఇతర పరిశోధకులు ధృవీకరించి మీ ఫలితాలు విస్తరించడానికి చేయలేరు అంటే ఇతర పరిశోధకులు, మీ డేటాను పంచుకోవడానికి చేయలేరు. ఇతరత్రా, ఈ భాగస్వామ్యాలు కనీసం ప్రజలు మీ ఫలితాలు మీ భాగస్వామ్యాలు ప్రభావితం అయ్యేవి అని అనుకుంటున్నాను ఉండవచ్చు వడ్డీ యొక్క ఒక సంఘర్షణ రూపాన్ని సృష్టించవచ్చు. ఈ దుష్ప్రభావాలు అన్ని ప్రసంగించారు చేయవచ్చు, కానీ అది అందరికీ అందుబాటులో కాదని సమాచారంతో పనిచేసే చేయబడనపుడు మరియు దుష్ప్రభావాలు సమకూర్చారు స్పష్టం ఉండాలి ముఖ్యం.
సారాంశంలో, పెద్ద డేటా మా పరిశోధకులకు అసాధ్యమైన ఉంది. తీవ్రమైన న్యాయపరమైన, సాంకేతిక, వ్యాపార ఉన్నాయి, మరియు డేటా యాక్సెస్ నిరోధించే నైతిక అడ్డంకులు, మరియు ఈ అడ్డంకులు దూరంగా కాదు. జాతీయ ప్రభుత్వాలు సాధారణంగా డేటా ప్రవేశించే అవకాశం నియమాలను ఏర్పాటు, కానీ ప్రక్రియ రాష్ట్ర మరియు స్థానిక స్థాయిలో మరింత తదర్థ ఉంటుంది. అలాగే, కొన్ని సందర్భాల్లో, పరిశోధకులు సంస్థలతో భాగస్వామిగా డేటా ప్రాప్తిని పొందే చేయవచ్చు, కానీ ఈ పరిశోధకులకు సమస్యలు వివిధ సృష్టించవచ్చు.