कारोबार र सरकारको द्वारा आयोजित डाटा अनुसन्धानकर्ताहरूले पहुँच गर्न को लागि कठिन छन्।
मे 2014 मा, अमेरिकी राष्ट्रीय सुरक्षा एजेन्डा एक अजीब नाम छ कि, खुफिया समुदाय व्यापक राष्ट्रिय Cybersecurity पहल डाटा केन्द्र ग्रामीण यूटा मा एक डाटा सेन्टर खुलेको छ। तर, यो डाटा मध्य, यूटा डाटा केन्द्र रूपमा चिनिने गर्न आएको छ जो, उदेकलाग्दा क्षमताहरु छ रिपोर्ट छ। एक रिपोर्ट यूटा डाटा केन्द्र भण्डारण र निजी इमेल को "पूर्ण सामग्रीहरू, सेल फोन कल, र Google खोजहरू सहित संचार सबै प्रकारका, साथै व्यक्तिगत डाटा ट्रेल्स-पार्किङ रसिद, यात्रा मार्गहरू सबै प्रकारका प्रक्रिया गर्न सक्षम छ भनेर अभियोग , पुस्तक पसल खरिद, र अन्य डिजिटल `खल्तीमा फोहर फाल्न '" (Bamford 2012) । थप तल वर्णन गरिने ठूलो डाटा क्याप्चर जानकारी, धेरै को संवेदनशील स्वभावको बारेमा स्थापना चिन्ता गर्न साथै, यूटा डाटा केन्द्र अनुसन्धानकर्ताहरूले गर्न दुर्गम छ कि एक धनी डेटा स्रोत को एक चरम उदाहरण हो। थप सामान्यतया, अनुसन्धानकर्ताहरूले नियन्त्रण र सरकारको (जस्तै, कर डाटा र शैक्षिक डाटा) र कम्पनीहरु प्रतिबन्धित छन् गर्न उपयोगी हुनेछ भन्ने ठूलो डाटा को धेरै स्रोतहरु (जस्तै, इन्जिन र फोन कल मेटा-डेटा खोज प्रश्नहरु गर्न)। तसर्थ, यी डाटा तुरुन्त विश्वविद्यालय मा शोधकर्ताओं उपलब्ध छैन, र सबै भन्दा पनि सरकार वा कम्पनीहरु मा अनुसन्धानकर्ताहरूले उपलब्ध हुने छैन।
मेरो अनुभव मा, विश्वविद्यालय मा आधारित धेरै अनुसन्धानकर्ताहरूले यो inaccessibility स्रोत गलत अर्थ लाउनु। यी डाटा कम्पनीहरु र सरकारको मा मान्छे, मूर्ख अल्छी, वा uncaring छन् किनभने दुर्गम छैनन्। बरु, गम्भीर कानुनी, प्राविधिक, व्यापार, र डाटा पहुँच रोक्न भनेर नैतिक बाधा छन्। उदाहरणका लागि, वेबसाइट लागि केही सर्तहरू-को-सेवा सम्झौताहरू मात्र डाटा कर्मचारीहरु द्वारा प्रयोग हुने वा सेवा सुधार गर्न अनुमति दिन्छ। त्यसैले डाटा साझेदारी केही प्रकारका ग्राहकबाट वैध lawsuits गर्न कम्पनीहरु पर्दाफास सक्छ। साझेदारी डाटा संलग्न कम्पनीहरु पर्याप्त व्यापार जोखिम पनि छन्। व्यक्तिगत खोज डाटा गल्ति विश्वविद्यालय अनुसन्धान परियोजना को भाग रूपमा Google बाट बाहिर लीक यदि सार्वजनिक प्रतिक्रिया कसरी कल्पना गर्ने प्रयास गर्नुहोस्। यस्तो डाटा उल्लंघन, यदि चरम, पनि कम्पनी को लागि एक अस्तित्व जोखिम हुन सक्छ। त्यसैले गुगल-र सबै भन्दा ठूलो धेरै जोखिम-averse अनुसन्धानकर्ताहरूले डाटा साझेदारी बारे कम्पनीहरु-छन्।
वास्तवमा, स्थिति छैन जो लगभग सबैको ठूलो रकम पहुँच प्रदान गर्न डाटा अब्दुर्रज्जाक Chowdhury को कथा थाह को। 2006 मा, त्यो एओएल अनुसन्धान को टाउको थियो, उहाँले जानाजानी उहाँले अनुसन्धान समुदायमा 650.000 एओएल प्रयोगकर्ताहरूबाट खोज प्रश्नहरु anonymized थिए लाग्यो के जारी। जहाँसम्म म बता गर्न सक्छन्, Chowdhury र एओएल मा शोधकर्ताओं राम्रो मनसाय थियो र तिनीहरूले डाटा anonymized थियो लाग्यो। तर, तिनीहरूले गलत थिए। यो चाँडै डाटा शोधकर्ताओं लाग्यो रूपमा अज्ञात थिएनन् फेला पारेका थिए, र न्यूयोर्क टाइम्स देखि संवाददाता सजिलो संग डेटासेटमा मान्छे पहिचान गर्न सके (Barbaro and Zeller Jr 2006) । यी समस्या पत्ता थिए भएपछि, Chowdhury एओएल वेबसाइटमा देखि डाटा हटाइएको, तर ढिलो थियो। डाटा अन्य वेबसाइटमा reposted गरिएको थियो, र यो तपाईं यो पुस्तक पढ्दै हुनुहुन्छ गर्दा शायद अझै पनि उपलब्ध हुनेछ। अनुसन्धान समुदायसँग डाटा साझेदारी गर्न आफ्नो प्रयास को कारण, Chowdhury निकाल थियो, र एओएल मुख्य प्रविधि अधिकारी resigned (Hafner 2006) । यो उदाहरण देखाउँछ रूपमा, भित्र डाटा पहुँच सहज बनाउन कम्पनीहरु को विशिष्ट व्यक्तिहरूलाई लाभ राम्रो साना र खराब-मामला परिदृश्य भयानक छ।
अनुसन्धान, तथापि, सामान्य सार्वजनिक गर्न दुर्गम छ कि डाटा पहुँच पाउन सक्छौं। सरकारले भनी अनुसन्धानकर्ताहरू पहुँचका लागि लागू गर्न पछ्याउन सक्छौं प्रक्रियाहरु छ, र यो अध्याय शो मा उदाहरणहरू पछि रूपमा, अनुसन्धानकर्ताहरूले कहिले काँही कर्पोरेट डाटा पहुँच पाउन सक्छौं। उदाहरणका लागि, Einav et al. (2015) अनलाइन नीलामी देखि डिजिटल निशान अध्ययन गर्न eBay मा एक शोधकर्ता साथ सहयोगी। म पछि अध्याय (धारा 2.4.3.2) मा सहयोग यस बाट आएको अनुसन्धान बारेमा थप कुरा छौँ, तर किनभने यो म सफल भागीदारी मा देख्न कि सामाग्री को सबै चार थियो म अब यो उल्लेख: शोधकर्ता चासो, शोधकर्ता क्षमता, कम्पनी ब्याज र कम्पनी क्षमता। अर्को शब्दमा, Einav र सहयोगिहरु रुचि र अनलाइन नीलामी अध्ययन सक्षम थिए। र, eBay पनि थियो। तर, मैले देखेको छु धेरै सम्भव सहकार्य असफल किनभने शोधकर्ता वा कम्पनी या त यी सामाग्री को एक अभाव।
तपाईं, तर एक व्यापार संग एक साझेदारी विकास गर्न सक्षम छन् भने पनि, तपाईं को लागि केही downsides छन्। पहिलो, कि तपाईं संग संभावना सीमित हुन डाटा संग सोध्न सक्ने प्रश्नहरू; कम्पनीहरु तिनीहरूलाई खराब हेर्न बनाउन सक्छ कि अनुसन्धान अनुमति असम्भाव्य छन्। दोस्रो, तपाईं शायद अन्य अनुसन्धानकर्ताहरूले प्रमाणित र आफ्नो परिणाम विस्तार गर्न सक्षम हुने छैन मतलब जो अन्य अनुसन्धानकर्ताहरूले, तपाईंको डाटा साझेदारी गर्न सक्नुहुने छैन। यसबाहेक, यी भागीदारी मान्छे आफ्नो परिणाम आफ्नो भागीदारी प्रभावित थिए भन्ने सोचाइ हुन सक्छ जहाँ ब्याज को संघर्ष को कम से कम उपस्थिति सिर्जना गर्न सक्नुहुन्छ। यी downsides सबै सम्बोधन गर्न सकिन्छ, तर यो काम गरिरहेको छ कि छैन सबैलाई सुलभ डाटा संग upsides र downsides दुवै थियो स्पष्ट हुन जरुरी छ।
सारांश मा, ठूलो डाटा धेरै अनुसन्धानकर्ताहरूले गर्न दुर्गम छ। त्यहाँ छन् गम्भीर कानुनी, प्राविधिक, व्यापार, र डाटा पहुँच रोक्न भनेर नैतिक बाधा, र यी बाधा दूर जाने छैनन्। राष्ट्रिय सरकारको साधारण डाटा पहुँच सक्षम लागि प्रक्रियाहरु स्थापित गरेको छ, तर प्रक्रिया थप तदर्थ राज्य र स्थानीय स्तर मा हुन सक्छ। साथै, केही अवस्थामा, अनुसन्धानकर्ताहरूले डाटा पहुँच प्राप्त गर्न सक्नुहुन्छ कम्पनीहरु संग साझेदार, तर यो अनुसन्धानकर्ताहरूले लागि समस्या को एक किसिम सिर्जना गर्न सक्नुहुन्छ।