நிறுவனங்கள் மற்றும் அரசாங்கங்களை வேண்டும் என்று தகவல் சில தூண்டக்கூடியதாக உள்ளது.
சுகாதார காப்பீட்டு நிறுவனங்கள் தங்கள் வாடிக்கையாளர்களால் பெற்ற மருத்துவ பராமரிப்பு பற்றிய விரிவான தகவல்களைக் கொண்டுள்ளன. உடல்நலத்தைப் பற்றிய முக்கியமான ஆராய்ச்சிக்கு இந்தத் தகவல் பயன்படுத்தப்படலாம், ஆனால் அது பொதுமக்களித்திருந்தால், அது உணர்ச்சிபூர்வமான தீங்கிற்கு வழிவகுக்கலாம் (எ.கா. சங்கடம்) அல்லது பொருளாதார தீங்கு (எ.கா., வேலை இழப்பு). பல பெரிய தரவு ஆதாரங்களும் முக்கியமானவை , அவை பெரும்பாலும் அணுக முடியாதவற்றுக்கான காரணத்தின் பகுதியாகும்.
துரதிருஷ்டவசமாக, இது நெட்ஃபிக்ஸ் பரிசை எடுத்துக்காட்டுவது போல், உண்மையில் தகவல் என்னவென்றால் (Ohm 2015) என்ன முடிவு செய்ய வேண்டுமென்று மிகவும் தந்திரமானதாக மாறிவிடும். நான் 5 ஆம் அதிகாரத்தில் விவரிக்கின்றேன், 2006 ஆம் ஆண்டில் நெட்ஃபிக்ஸ் கிட்டத்தட்ட 500,000 உறுப்பினர்கள் வழங்கிய 100 மில்லியன் திரைப்பட தரவரிசைகளை வெளியிட்டது மற்றும் உலகெங்கிலும் உள்ள மக்கள் அனைவருக்கும் திரைப்படங்களை பரிந்துரைக்க நெட்ஃபிக்ஸ் திறனை மேம்படுத்தக்கூடிய வழிமுறைகளை சமர்ப்பித்த ஒரு வெளிப்படையான அழைப்பு இருந்தது. தரவு வெளியிடும் முன், Netflix பெயர்கள் போன்ற தெளிவான தனிப்பட்ட முறையில் அடையாளம் காணும் தகவலை நீக்கியது. ஆனால், தரவு வெளியிடப்பட்ட இரண்டு வாரங்களுக்கு பிறகு அர்விந்த் நாராயணன் மற்றும் விடிலி ஷமடிகோவ் (2008) குறிப்பிட்ட நபரின் திரைப்பட மதிப்பீட்டைப் பற்றி தெரிந்து கொள்ள முடிந்தது என்று காட்டியது, நான் உங்களை 6-ம் அதிகாரத்தில் காண்பிப்பேன். நபரின் திரைப்பட மதிப்பீடுகள், இங்கே இன்னும் முக்கியமானதாக இருப்பதாகத் தெரியவில்லை. பொதுவாக இது உண்மையாக இருக்கலாம், குறைந்தபட்சம், தரவுத்தளத்தில் 500,000 பேரில் குறைந்தபட்சம், திரைப்பட தரவரிசைகள் மிக முக்கியமானவை. உண்மையில், தரவு வெளியீடு மற்றும் மீண்டும் அடையாளப்படுத்தலுக்கு பதில், ஒரு மூடப்பட்ட லெஸ்பியன் பெண் நெட்ஃபிக்ஸ் எதிராக ஒரு வர்க்க நடவடிக்கை நடவடிக்கை சேர்ந்தது. இந்த வழக்கில் எப்படி பிரச்சனை வெளிப்பட்டது (Singel 2009) :
"[M] ovie மற்றும் தரவரிசை தரவு ஒரு தகவலை கொண்டுள்ளது ... மிகவும் தனிப்பட்ட மற்றும் உணர்ச்சி இயல்பு. பாலினம், மனநோய், மதுபானம், மற்றும் பாலியல் துஷ்பிரயோகம், வீட்டு வன்முறை, விபச்சாரம் மற்றும் கற்பழிப்பு ஆகியவற்றில் இருந்து பழிவாங்குவது உட்பட பாலியல், மனநோய், பல்வேறு உயர்ந்த தனிப்பட்ட பிரச்சினைகள் ஆகியவற்றுடன் உறுப்பினர் நெட்ஃபிக்ஸ் உறுப்பினரின் தனிப்பட்ட நலன் மற்றும் / அல்லது போராட்டத்தை உறுப்பினரின் திரைப்பட தரவு அம்பலப்படுத்துகிறது. "
இந்த உதாரணம், சில மக்கள் தீங்கான தரவுத்தளமாக தோன்றக்கூடிய விஷயங்களைக் கவனத்தில் கொள்ளும் தகவலைக் கொண்டிருக்கலாம் என்பதைக் காட்டுகிறது. மேலும், ஆராய்ச்சியாளர்கள் முக்கிய தரவுகளைப் பாதுகாப்பதற்கான ஒரு முக்கியப் பாதுகாப்பு, டி-அடையாளத்தை தக்கவைத்துக்கொள்வது ஆச்சரியமான வழிகளில் தோல்வி அடைவதாக காட்டுகிறது. அத்தியாயம் 6-ல் அதிகமான விவரங்களில் இந்த இரண்டு கருத்துகளும் வளர்ந்துள்ளன.
முக்கியமான தகவல்களைப் பற்றி மனதில் கொள்ள வேண்டிய இறுதி விஷயம், மக்களின் அனுமதியின்றி அதை சேகரிப்பது, குறிப்பிட்ட தீங்கு விளைவிக்காவிட்டாலும், நெறிமுறை கேள்விகளை எழுப்புகிறது. தங்கள் அனுமதியின்றி ஒரு மழை எடுக்கும் யாரேனும் அந்த நபரின் தனியுரிமையை மீறி, முக்கியமான தகவல்களை சேகரித்து, உணர்திறன் என்ன என்பதை தீர்மானிக்க எவ்வளவு கடினமாக இருக்க முடியும் என்பதை நினைவில் கொள்ள வேண்டும். நான் தனியுரிமை பற்றிய கேள்விகள் 6-ஆம் அதிகாரத்தில் திரும்புவேன்.
முடிவில், சமூக தரவு ஆராய்ச்சி நோக்கத்திற்காக பொதுவாக அரசாங்க மற்றும் வணிக நிர்வாக பதிவுகள் போன்ற பெரிய தரவு ஆதாரங்கள் உருவாக்கப்படவில்லை. இன்றைய பெருமளவிலான தரவு மூலங்கள் மற்றும் நாளை வாய்ப்புக் கொண்டிருக்கும் 10 குணாதிசயங்கள் உள்ளன. பொதுவாக, ஆராய்ச்சிக்கு பெரியதாக இருப்பதாகக் கருதப்படும் பல சொத்துக்கள், டிஜிட்டல் வயது நிறுவனங்கள் மற்றும் அரசாங்கங்கள் ஆகியவற்றில் உண்மையில் இருந்து வரமுடியாத ஒரு அளவிலான தரவை சேகரிக்க முடிகிறது. ஆராய்ச்சியாளர்கள் ஆராய்ச்சியாளர்களால் சேகரிக்கப்பட்டவைகளிலிருந்து சேகரிக்கப்படாத உண்மைகளிலிருந்து, ஆராய்ச்சிக்கு தவறானதாகக் கருதப்படுபவை, பொதுவாக அணுக முடியாதவை, அணுக முடியாதவை, குறிக்கப்படாதவை, டிரிஃப்டிங், அல்காரிதம், குழப்பம், அணுக முடியாதவை, அழுக்கு மற்றும் உணர்திறன் ஆகியவற்றிற்கு பொதுவாகக் கருதப்படும் பண்புகள். இதுவரை, நான் அரசாங்க மற்றும் வணிக தரவு பற்றி பேசினேன், ஆனால் இரண்டு இடையே வேறுபாடுகள் உள்ளன. என் அனுபவத்தில், அரசாங்க தரவு குறைவான குறிக்கோள் இல்லாதது, குறைவாக அல்காரிதம் ரீதியாக குழப்பமடைந்துள்ளது, குறைவான டிரிஃப்டிங். ஒருபுறம், வணிக நிர்வாக பதிவுகள் எப்பொழுதும் எப்போதும் இருக்கும். இந்த 10 பொதுவான சிறப்பியல்புகளைப் புரிந்துகொள்வது பெரிய தரவு ஆதாரங்களில் இருந்து கற்றுக்கொள்வதற்கான ஒரு முதல் படி ஆகும். இப்போது நாம் இந்த தரவுடன் பயன்படுத்தக்கூடிய ஆராய்ச்சி மூலோபாயங்களை நோக்கி செல்கிறோம்.