நிறுவனங்கள் மற்றும் அரசாங்கங்களை வேண்டும் என்று தகவல் சில தூண்டக்கூடியதாக உள்ளது.
சுகாதார காப்பீடு நிறுவனங்கள் தங்கள் வாடிக்கையாளர்களுக்கு மூலம் பெறப்படும் மருத்துவ பராமரிப்பு பற்றிய தகவல்கள் விவரித்துள்ளோம். இந்த தகவல் சுகாதார பற்றி முக்கிய ஆராய்ச்சி பயன்படுத்த முடியும், ஆனால் அது பொது ஆனது என்றால் அது சாத்தியமான உணர்ச்சி தீங்கு (எ.கா., சங்கடம்) மற்றும் பொருளாதார தீங்கு (எ.கா., தொழில் இழப்பு) வழிவகுக்கலாம். தூர தனித்துவமான, பல பெரிய தரவு மூலங்களிலிருந்து தூண்டக்கூடியதாக உள்ளது என்று தகவல் இல்லை. இந்த தகவலை உணர்வு பூர்வமான பெரிய தரவு மூலங்கள் அடிக்கடி அணுக (மேலே விவரிக்கப்பட்ட) என்று காரணம் ஒரு பகுதியாக உள்ளது.
ஆராய்ச்சியாளர்கள் இந்த நிலைமையை சமாளிக்க முயற்சிக்கும் என்று ஒரு வழி முக்கிய தகவல்களை வைத்திருக்க என்று டி-அடையாளம் தரவுகளும் உள்ளது. ஆனால், நான் அத்தியாயம் 6 (நெறிமுறைகள்) தீவிரமாக பரவலாக சமூக விஞ்ஞானிகள் மற்றும் தரவு விஞ்ஞானிகள் இருவரும் பாராட்டப்படுகிறது இல்லை என்று வழிகளில் வரம்புகளைக் இந்த அணுகுமுறை விரிவாக காண்பிக்கும் என.
முடிவில், இன்று (நாளை) பெரிய தரவு மூலங்கள் பொதுவாக பத்து பண்புகள் உண்டு. நல்ல பண்புகள்-பெரிய, எப்போதும், மற்றும் பல டிஜிட்டல் வயது நிறுவனங்கள் உண்மையில் இருந்து nonreactive-வந்து அரசாங்கங்கள் முன்பு சாத்தியம் இல்லை என்று ஒரு அளவில் தரவுகளை சேகரிக்க முடியும். மற்றும், கெட்ட பண்புகள்-முழுமையற்ற, அணுக, அல்லாத பிரதிநிதி பல, டிரிஃப்டிங், வழிமுறை, அண்ட முடியாத அழுக்கு, மற்றும் முக்கிய வந்தவர்களுக்கு தரவு ஆராய்ச்சியாளர்கள் ஆராய்ச்சியாளர்கள் சேகரிக்கப்பட்ட இல்லை என்று உண்மையில் இருந்து குழப்பத்தில் ஆழ்த்தியது. இந்த பண்புகள் புரிந்து பெரிய தரவு இருந்து கற்றல் ஒரு தேவையான முதல் படிதான். மேலும், இப்போது நாம் இந்த தரவு பயன்படுத்த முடியும் உத்திகள் ஆய்வு திரும்ப.