ஆராய்ச்சியாளர்கள் அணுகுவதற்கு நிறுவனங்கள் மற்றும் அரசாங்கங்கள் வைத்திருக்கும் தரவு கடினம்.
மே 2014 இல், அமெரிக்க தேசிய பாதுகாப்பு முகமை கிராமப்புற உட்டாவில் தரவு மையத்தை ஒரு மோசமான பெயராக, புலனாய்வு சமூக விரிவான தேசிய சைபர்ப்ரிட்டி இன்டிட்டிவ் டேட்டா சென்டரில் திறந்தது. எனினும், இந்த தரவு மையம், யூட்டா டேட்டா சென்டர் என அழைக்கப்படும், இது அதிர்ச்சியூட்டும் திறன்களைக் கொண்டிருக்கின்றது என அறிவிக்கப்பட்டுள்ளது. "தனியார் மின்னஞ்சல்கள், செல் போன் அழைப்புகள், மற்றும் Google தேடல்கள், அதே போல் எல்லா வகையான தனிப்பட்ட தரவுத் தடங்களான-பார்க்கிங் ரசீதுகள், பயண வழிகள், புத்தக அங்காடி கொள்முதல் ஆகியவற்றை உள்ளடக்கிய அனைத்து தகவல்களையும் சேமித்து செயல்படுத்த முடியும் என்று ஒரு அறிக்கை கூறுகிறது. , மற்றும் பிற டிஜிட்டல் 'பாக்கெட் லிட்டர்' " (Bamford 2012) . பெரிய தரவுகளில் கைப்பற்றப்பட்ட தகவல்களின் முக்கிய தன்மை பற்றிய கவலைகளைத் தவிர்த்து, மேலும் கீழே விவரிக்கப்படும், யூட்டா டேட்டா சென்டர், ஆராய்ச்சியாளர்களுக்கு அணுக முடியாத பணக்கார தரவு மூலத்தின் ஒரு தீவிர உதாரணம். பொதுவாக, பெரிய தரவுகளின் பல ஆதாரங்கள் பயனுள்ளதாக இருக்கும், அவை அரசாங்கங்கள் (எ.கா., வரி தரவு மற்றும் கல்வித் தரவு) அல்லது நிறுவனங்கள் (எ.கா., தேடுபொறிகள் மற்றும் தொலைபேசி அழைப்பு மெட்டா-டேட்டாவை தேடுதல்) மூலம் கட்டுப்படுத்தப்பட்டு கட்டுப்படுத்தப்படுகின்றன. எனவே, இந்த தரவு ஆதாரங்கள் இருந்தாலும்கூட, அவை அணுக முடியாதவை என்பதால் அவை சமூக ஆராய்ச்சி நோக்கங்களுக்காக பயனற்றவை.
என் அனுபவத்தில், பல்கலைகழகங்களில் உள்ள பல ஆராய்ச்சியாளர்கள் இந்த அணுகுமுறையின் மூலத்தை தவறாக புரிந்து கொள்கிறார்கள். நிறுவனங்கள் மற்றும் அரசாங்கங்களில் உள்ள மக்கள் முட்டாள், சோம்பேறி அல்லது அக்கறையற்றவர்கள் என்பதால் இந்த தகவல்கள் அணுக முடியாதவை. மாறாக, தரவு அணுகலை தடுக்க கடுமையான சட்ட, வணிக, மற்றும் நெறிமுறை தடைகள் உள்ளன. உதாரணமாக, வலைத்தளங்களுக்கான சில விதிமுறைகள்-சேவை ஒப்பந்தங்கள் பணியாளர்களால் பயன்படுத்தப்படுவதை அனுமதிக்க அல்லது சேவையை மேம்படுத்த அனுமதிக்கின்றன. எனவே தரவுப் பகிர்வுகளின் சில வடிவங்கள் வாடிக்கையாளர்களிடமிருந்து சட்டபூர்வமான வழக்குகளுக்கு நிறுவனங்களை அம்பலப்படுத்தக்கூடும். தரவுகளை பகிர்ந்து கொள்வதில் சம்பந்தப்பட்ட நிறுவனங்களுக்கு கணிசமான வர்த்தக அபாயங்களும் உள்ளன. பல்கலைக்கழக ஆராய்ச்சி திட்டத்தின் ஒரு பகுதியாக, தனிப்பட்ட தேடற் தரவு தற்செயலாக Google இலிருந்து வெளியேற்றப்பட்டால், பொது எப்படி பதிலளிக்கும் என்பதை கற்பனை செய்து பாருங்கள். அத்தகைய ஒரு தரவு மீறல், தீவிரமாக இருந்தால், நிறுவனத்தின் ஒரு இருத்தலியல் ஆபத்து கூட இருக்கலாம். எனவே கூகுள் மற்றும் மிகப்பெரும் நிறுவனங்கள் - ஆராய்ச்சியாளர்களுடன் தரவைப் பகிர்ந்து கொள்வதில் மிகவும் ஆபத்தானவை.
உண்மையில், பெரிய அளவிலான தரவுகளை வழங்குவதற்கான ஒரு நிலையில் இருக்கும் அனைவருக்கும் அப்துர் சௌதிரி கதை தெரியும். 2006 ஆம் ஆண்டில், அவர் AOL இல் ஆராய்ச்சியின் தலைவராக இருந்தபோது, அவர் வேண்டுமென்றே ஆராய்ச்சிக் குழுவிற்கு 650,000 AOL பயனர்களிடமிருந்து அநாமதேயமான தேடல் வினவல்கள் என்று கருதினார். நான் சொல்வது போல, சௌத்ரி மற்றும் ஏஓஎல் ஆய்வாளர்கள் நல்ல நோக்கங்களைக் கொண்டிருந்தனர், மேலும் அவர்கள் தரவை அநாமதேயப்படுத்தியதாக அவர்கள் நினைத்தார்கள். ஆனால் அவர்கள் தவறு செய்தனர். ஆராய்ச்சியாளர்கள் நினைத்ததைப் போல தரவு அநாமதேயமாக இல்லை என்று விரைவாக கண்டுபிடிக்கப்பட்டது, மேலும் நியூ யார்க் டைம்ஸில் இருந்து செய்தியாளர்களால் எளிதாக தரவுத்தளங்களில் (Barbaro and Zeller 2006) அடையாளம் காண முடிந்தது. இந்த பிரச்சினைகள் கண்டுபிடிக்கப்பட்டதும், சௌதிரி AOL வலைத்தளத்திலிருந்து தரவை நீக்கியது, ஆனால் அது மிகவும் தாமதமாக இருந்தது. தரவு மற்ற வலைத்தளங்களில் மறுபதிப்பு செய்யப்பட்டது, மேலும் நீங்கள் இந்தப் புத்தகத்தை படிக்கும்போது அது இன்னும் கிடைக்கலாம். சௌதிரி பணிநீக்கம் செய்யப்பட்டார், மற்றும் AOL இன் தலைமை தொழில்நுட்ப அதிகாரி பதவி (Hafner 2006) ராஜினாமா செய்தார். இந்த உதாரணம் காட்டுகிறது என, தரவு அணுகல் வசதிகளை நிறுவனங்களின் உள்ளே குறிப்பிட்ட நபர்கள் நன்மைகளை அழகான சிறிய மற்றும் மோசமான சூழ்நிலையில் கொடூரமான உள்ளது.
இருப்பினும், ஆராய்ச்சியாளர்கள் சில நேரங்களில் பொது மக்களுக்கு அணுக முடியாத தரவை அணுகலாம். ஆராய்ச்சியாளர்கள் அணுகல் விண்ணப்பிக்க பின்பற்ற முடியும் என்று சில அரசாங்கங்கள், மற்றும் இந்த அத்தியாயத்தில் நிகழ்ச்சிகள் பின்னர் உதாரணங்கள், ஆராய்ச்சியாளர்கள் அவ்வப்போது பெருநிறுவன தரவு அணுக முடியும். உதாரணமாக, Einav et al. (2015) eBay ஒரு ஆராய்ச்சியாளர் பங்குதாரர் ஆன்லைன் ஏலம் படிக்க. ஆராய்ச்சியாளர் வட்டி, ஆராய்ச்சியாளர் திறன், நிறுவனத்தின் ஆர்வம் மற்றும் நிறுவனத்தின் திறன் ஆகியவற்றை நான் வெற்றிகரமாக பகிர்ந்து கொள்ளும் அனைத்து பொருட்களிலும் இருந்த நான்கு காரணங்களைக் காட்டியுள்ளேன். . ஆராய்ச்சியாளர் அல்லது பங்குதாரர் ஒரு நிறுவனம் அல்லது அரசாங்கத்தால் இந்த பல பொருட்களில் ஒன்றில் இல்லாதிருந்ததால் பல சாத்தியமான ஒத்துழைப்பு தோல்வியடைவதை நான் கண்டிருக்கிறேன்.
நீங்கள் ஒரு வியாபாரத்துடன் ஒரு கூட்டணியை உருவாக்கிக் கொள்ளலாம் அல்லது தடைசெய்யப்பட்ட அரசாங்கத் தரவிற்கான அணுகலைப் பெற முடிந்தாலும் கூட, உங்களுக்காக சில குறைபாடுகள் உள்ளன. முதலில், உங்கள் தரவை மற்ற ஆய்வாளர்களுடன் பகிர்ந்து கொள்ள முடியாமல் போகலாம், அதாவது மற்ற ஆராய்ச்சியாளர்கள் உங்கள் முடிவுகளை சரிபார்க்க முடியாது மற்றும் நீட்டிக்க முடியாது. இரண்டாவதாக, நீங்கள் கேட்கக்கூடிய கேள்விகள் குறைவாக இருக்கலாம்; நிறுவனங்கள் மோசமானதாக இருக்கும் என்று ஆராய்ச்சி அனுமதிக்க சாத்தியம் இல்லை. இறுதியாக, இந்த கூட்டணி குறைந்தபட்சம் ஆர்வமுள்ள மோதல் தோற்றத்தை உருவாக்கும், உங்கள் முடிவு உங்கள் பங்களிப்பால் பாதிக்கப்பட்டதாக மக்கள் நினைக்கலாம். இந்த குறைபாடுகள் அனைத்து உரையாற்றினார், ஆனால் எல்லோருக்கும் அணுக முடியாது என்று தரவு பணிபுரியும் இருவரும் அதிக upsides மற்றும் downsides என்று தெளிவாக இருக்க வேண்டும்.
சுருக்கமாக, பெரிய தரவு நிறைய ஆராய்ச்சியாளர்கள் அணுக முடியாது. தரவு அணுகலை தடுக்க தீவிர சட்ட, வணிக, மற்றும் நெறிமுறை தடைகளை உள்ளன, மற்றும் தொழில்நுட்ப தடைகள் இல்லை, ஏனெனில் தொழில்நுட்ப தடைகள் இந்த தடைகளை விட்டு போக மாட்டேன். சில தரவுத் தரங்களுக்கு தரவு அணுகலைச் செயல்படுத்த சில தேசிய அரசாங்கங்கள் நடைமுறைகளை ஏற்படுத்தியுள்ளன, ஆனால் இந்த செயல்முறை குறிப்பாக மாநில மற்றும் உள்ளூர் மட்டங்களில் குறிப்பாக தற்காலிகமாக உள்ளது. மேலும், சில சந்தர்ப்பங்களில், ஆராய்ச்சியாளர்கள் தரவு அணுகலை பெற நிறுவனங்களுடன் கூட்டுறவு கொள்ளலாம், ஆனால் இது ஆராய்ச்சியாளர்கள் மற்றும் நிறுவனங்களுக்கான பல்வேறு சிக்கல்களை உருவாக்கும்.