कम्पनीहरु र सरकारको भन्ने केही जानकारी संवेदनशील छ।
स्वास्थ्य बीमा कम्पनीहरु आफ्नो ग्राहकहरु द्वारा प्राप्त चिकित्सा हेरविचार बारेमा जानकारी विस्तृत छ। यो जानकारी स्वास्थ्य महत्त्वपूर्ण अनुसन्धान को लागि प्रयोग गर्न सक्छ, तर यसलाई सार्वजनिक भए भने यो संभावित भावनात्मक हानि (जस्तै, असजिलोपन) र आर्थिक नोक्सानी (जस्तै, रोजगारी को हानि) गर्न लगाउन सक्छ। विशिष्ट, धेरै ठूलो डाटा स्रोतहरु टाढा संवेदनशील छ भन्ने जानकारी छ। यो जानकारी संवेदनशील प्रकृति ठूलो डाटा स्रोतहरु अक्सर दुर्गम (माथि वर्णन) हो कि कारण भाग हो।
भनी अनुसन्धानकर्ताहरू यो अवस्था सामना गर्न प्रयास एउटा तरिका संवेदनशील जानकारी छ कि de-पहिचान डेटासेट छ। तर, म अध्याय 6 (नीतिशास्त्र) यो दृष्टिकोण गम्भीर व्यापक सामाजिक वैज्ञानिकहरूले र डाटा वैज्ञानिकहरूले दुवै मूल्यांकन छैन भनेर तरिकामा सीमित मा विस्तार देखाउन रूपमा।
निष्कर्ष मा, आज (र भोलि) को ठूलो डाटा स्रोतहरु साधारण दस विशेषताहरु छ। असल गुणहरू-ठूलो, सधैं-, र धेरै डिजिटल उमेर कम्पनीहरु मा तथ्यलाई देखि nonreactive-आउन र सरकारको सम्भव थियो कि पहिले एक मात्रा मा डेटा सङ्कलन गर्न सक्षम छन्। र, खराब गुणहरू-अपूर्ण, दुर्गम, गैर-प्रतिनिधि को धेरै, बहने, क्रमबद्ध, दुर्गम फोहोर र संवेदनशील-आउने डाटा अनुसन्धानकर्ताहरूले लागि अनुसन्धानकर्ताहरूले संकलित छैन भन्ने तथ्यलाई देखि हैरान। यी विशेषताहरु बुझ्ने ठूलो डाटा सिक्नु एउटा आवश्यक पहिलो कदम हो। र, अहिले हामी यो डाटा प्रयोग गर्न सक्नुहुनेछ रणनीति अनुसन्धान बारी।