தொழில்கள் மற்றும் அரசாங்கங்களால் கடைப்பிடிக்கப்படும் தரவு ஆராய்ச்சியாளர்கள் அணுக கடினமாக இருக்கும்.
மே 2014 ல் அமெரிக்க தேசிய பாதுகாப்பு செயற்திட்டம் ஒரு மோசமான பெயர், புலனாய்வுப் பிரிவு விரிவான தேசிய சைபர் முனைப்பு தரவு மையம் உள்ளது என்று கிராமப்புற உட்டா ஒரு தரவு மையம் திறக்கப்பட்டது. எனினும், Utah தரவு மையம் என அழைக்கப்படும் என வந்துள்ள இந்த தரவு மையத்தை, அதிர்ச்சியூட்டும் திறமைகள் கூறப்படுகிறது. ஒரு அறிக்கை Utah தரவு மையம் சேமிக்க மற்றும் தனியார் மின்னஞ்சல்கள் "முழு உள்ளடக்கங்களை, செல் தொலைபேசி அழைப்புகள், கூகிள் தேடல்கள் உள்ளிட்ட தகவல் தொடர்பு, அனைத்து விதமான அத்துடன் தனிப்பட்ட தரவுச் சுவடுகளாக பார்க்கிங் ரசீதுகள், சுற்றுப்பயணங்கள் அனைத்து வகையான செயல்படுத்த முடியும் என்று குற்றம் சாட்டியுள்ளது , புத்தகக் கடைகளில் வாங்கியவை, மற்றும் பிற டிஜிட்டல்: கிறுக்கல் குப்பைகள் ' " (Bamford 2012) . மேலும் கீழே விவரித்தார் வேண்டிய பெரிய தரவு கைப்பற்றப்பட்ட தகவல், மிகவும் உணர்வுபூர்வமான தன்மை பற்றி திரட்டும் பிரச்சினைகளுக்குக் கூடுதலாக, Utah தரவு மையம் ஆராய்ச்சியாளர்கள் அணுக என்று ஒரு பணக்கார தரவு மூலங்களின் ஒரு உதாரணம்தான். மேலும் பொதுவாக, ஆராய்ச்சியாளர்கள் கட்டுப்பாட்டில் மற்றும் அரசாங்கங்கள் (எ.கா., வரி தரவு மற்றும் கல்வி தகவல்) மற்றும் நிறுவனங்கள் கட்டுப்படுத்தப்பட்ட பயனுள்ளதாக இருக்க வேண்டும் என்று பெரிய தரவு பல ஆதாரங்கள் (எ.கா., கேள்விகளுக்கு எஞ்சின்கள் மற்றும் தொலைபேசி அழைப்பு மெட்டா தரவு தேட). எனவே, இந்த தரவு பல்கலைக்கழகங்கள் ஆராய்ச்சியாளர்கள் உடனடியாக கிடைக்காது, மற்றும் மிகவும் கூட அரசாங்கங்கள் அல்லது நிறுவனங்கள் ஆராய்ச்சியாளர்கள் இருக்க மாட்டேன்.
என் அனுபவத்தில், பல்கலைக்கழகங்களில் சார்ந்த பல ஆராய்ச்சியாளர்கள் இந்த அடைய இயலாத ஆதாரம் புரிஞ்சிட்டிருக்கஆம். இந்த தரவு நிறுவனங்கள் மற்றும் அரசாங்கங்கள் மக்கள், முட்டாள், சோம்பேறி, அல்லது கவலை இல்லா ஏனெனில் அணுக இல்லை. மாறாக, கடுமையான சட்ட, தொழில்நுட்ப, வணிக, மற்றும் தரவு அணுகல் தடுக்க நன்னெறி தடைகள் உள்ளன. உதாரணமாக, சில சொற்கள்-ன்-சேவை வலைத்தளங்களில் உடன்பாடுகள் தரவு ஊழியர்கள் பயன்படுத்தப்படும் அல்லது சேவையை மேம்படுத்த வேண்டும் அனுமதிக்க. எனவே தரவு பகிர்வு சில வடிவங்கள் வாடிக்கையாளர்கள் நியாயமான வழக்குகளில் நிறுவனங்கள் அம்பலப்படுத்த முடியும். தரவு பகிர்ந்து ஈடுபட்டுள்ள நிறுவனங்கள் கணிசமான வியாபார சங்கடங்கள் உள்ளன. தனிப்பட்ட தேடல் தரவு தற்செயலாக ஒரு பல்கலைக்கழக ஆராய்ச்சி திட்டத்தின் ஒரு பகுதியாக, Google வெளியாச்சா என்றால் எப்படி பொது பதிலளிக்க வேண்டும் கொஞ்சம் கற்பனை செய்து பாருங்கள். அத்தகைய ஒரு தரவு மீறி, தீவிர, கூட நிறுவனம் ஒரு இருத்தலியல் ஆபத்து இருக்கலாம். எனவே கூகுள் மற்றும் மிகவும் பெரியதாகவும், மிகவும் ஆபத்து தயங்கினர் ஆராய்ச்சியாளர்கள் தரவைப் பகிர்வது பற்றி நிறுவனங்கள் உள்ளன.
உண்மையில், தரவு அப்துர் சவுத்ரி கதை தெரியும் ஒரு நிலையில் யார் கிட்டத்தட்ட அனைவரும் அதிக அளவில் அணுகலை வழங்க. 2006 ஆம் ஆண்டில், அவர் ஏஓஎல் ஆராய்ச்சி தலைவர் இருந்த போது, அவர் வேண்டுமென்றே அவர் ஆராய்ச்சி சமூகத்திற்கு 650,000 ஏஓஎல் செய்த இருந்து தேடல் கேள்விகளுக்கு அநாமதேய என்று நினைத்தேன் என்ன வெளியிடப்பட்டது. இதுவரை நான் சொல்ல முடியும் என, சவுத்ரி மற்றும் AOL ஆராய்ச்சியாளர்கள் நல்ல எண்ணம் இருந்தது மற்றும் அவர்கள் அநாமதேய தரவே என்று நினைத்தேன். ஆனால், அவர்கள் தவறு. அது விரைவில் தரவு ஆராய்ச்சியாளர்கள் நினைத்தது போல் அநாமதேய இல்லை என்று கண்டுபிடிக்கப்பட்டது, மற்றும் நியூயார்க் டைம்ஸ் நிருபர்கள் எளிதாக தரவுத்தொகுப்பில் மக்கள் கண்டறிய முடிந்தது (Barbaro and Zeller Jr 2006) . இந்த பிரச்சினைகள் கண்டுபிடிக்கப்பட்டது முறை, சவுத்ரி ஏஓஎல் இணையதளத்தில் இருந்து நீக்கப்பட்ட தகவல்களை, ஆனால் இது மிகவும் தாமதமாக இருந்தது. தரவு மற்ற வலைத்தளங்களில் இடுகையிடப்பட்டிருந்தால் வந்திருந்தது, நீங்கள் இந்த புத்தகத்தை படிக்கும் போது அது அநேகமாக இன்னும் கிடைக்க வேண்டும். ஆராய்ச்சி தரவு பகிர்ந்து முயற்சியில் ஏனெனில், சவுத்ரி நீக்கப்பட்டார், மற்றும் AOL தலைமை தொழில்நுட்ப அதிகாரி ராஜினாமா (Hafner 2006) . இந்த உதாரணம் காட்டுவதுபோல், தரவு அணுகல் எளிதாக்கும் நிறுவனங்கள் உள்ளே குறிப்பிட்ட தனிநபர்கள் நன்மைகளை அழகான சிறிய மற்றும் மோசமான சூழ்நிலையில் கொடூரமான உள்ளது.
ஆராய்ச்சி, எனினும், தரவு அணுகல் பொது அணுக என்று பெற முடியும். அரசாங்கங்கள் ஆராய்ச்சியாளர்கள் அணுகல் விண்ணப்பிக்க பின்பற்ற முடியும் என்று நடைமுறைகள், மற்றும் உதாரணங்கள் பின்னர் இந்த அத்தியாயத்தில் நிகழ்ச்சியில் என, ஆராய்ச்சியாளர்கள் எப்போதாவது பெருநிறுவன தரவு அணுக முடியும். உதாரணமாக, Einav et al. (2015) ஆன்லைன் ஏலங்களில் இருந்து டிஜிட்டல் தடயங்கள் படிக்க ஈபே ஒரு ஆராய்ச்சியாளர் கூட்டுசேர்ந்து. நான் அதிகாரத்தில் (பிரிவு 2.4.3.2) இந்த ஒத்துழைப்பு இருந்து வந்தது என்று ஆய்வு பற்றி மேலும் பேச வேண்டும், ஆனால் அதை நான் வெற்றிகரமான கூட்டு பார்க்க அந்த பொருட்கள் அனைத்தையும் நான்கு இருந்தது, ஏனெனில் நான் இப்போது அதை குறிப்பிட: ஆராய்ச்சியாளர் வட்டி, ஆராய்ச்சியாளர் திறனை, நிறுவனத்தின் வட்டி, மற்றும் நிறுவனம் திறன். வேறு வார்த்தைகளில் கூறுவதானால், Einav மற்றும் சக ஆர்வம் மற்றும் ஆன்லைன் ஏலம் படிக்கும் திறன் இருந்தது. மற்றும், ஈபே இருந்தது. எனினும், நான் பார்த்த பல ஒத்துழைப்பின் சாத்தியம் ஆராய்ச்சியாளர் அல்லது நிறுவனம் ஒன்று இந்த பொருட்கள் ஒரு இல்லை, ஏனெனில் தோல்வி.
எனினும், நீங்கள் ஒரு வணிக ஒரு கூட்டு உருவாக்க முடியும் என்றால், நீங்கள் சில குறைகளை உள்ளன. முதல், நீங்கள் வாய்ப்பு மட்டுமே இருக்க தரவு கொண்டு கேட்கும் கேள்விகளாகவும்; நிறுவனங்கள் அவற்றை கெட்ட செய்ய முடியும் என்று ஆராய்ச்சி அனுமதிக்க கொண்டுள்ளன. இரண்டாவது, ஒருவேளை நீங்கள் மற்ற ஆராய்ச்சியாளர்களும், இது மற்ற ஆராய்ச்சியாளர்களும் சரிபார்க்கவும் உங்கள் முடிவுகளை நீட்டிக்க முடியாது என்று அர்த்தம் உங்கள் தரவு பகிர்ந்து முடியாது. மேலும், இந்த கூட்டு மக்கள் உங்கள் முடிவுகளை உங்கள் பங்காளித்துவத்தை தாக்கம் என்று நினைக்கலாம் வட்டி எங்கே, ஒரு மோதல் ஒரு தோற்றத்தை உருவாக்க முடியும். இந்த குறைகளை அனைத்து உரையாற்றினார் முடியும், ஆனால் அது எல்லோருக்கும் அணுக முடியாது என்று தரவு வேலை upsides மற்றும் குறைகளை இரண்டும் என்று தெளிவாக இருக்க வேண்டியது அவசியம் ஆகிறது.
சுருக்கமாக, பெரிய தரவு நிறைய ஆராய்ச்சியாளர்கள் அணுக உள்ளது. கடுமையான சட்ட, தொழில்நுட்ப, வணிக உள்ளன, மற்றும் தரவு அணுகல் தடுக்க நன்னெறி தடைகள், மற்றும் இந்த தடைகளை விட்டு போக மாட்டேன். தேசிய அரசுகள் தரவு அணுகல் செயல்படுத்த நடைமுறைகள் நிறுவப்பட்டது, ஆனால் செயல்முறை மாநில மற்றும் உள்ளூர் மட்டங்களில் இன்னும் தற்காலிக இருக்க முடியும். மேலும், சில சந்தர்ப்பங்களில், ஆராய்ச்சியாளர்கள் சக நிறுவனங்களுடன் தரவு அணுகல் பெற முடியும், ஆனால் இந்த ஆராய்ச்சியாளர்கள் பல்வேறு பிரச்சினைகளுக்கு உருவாக்க முடியும்.