2.3.2.7 संवेदनशील

माहिती कंपन्या आणि सरकार आहे की काही संवेदनशील आहे.

आरोग्य विमा कंपन्या त्यांच्या ग्राहकांना प्राप्त वैद्यकीय माहिती सविस्तर आहे. ही माहिती आरोग्य महत्वपूर्ण संशोधन वापर केला जाऊ शकतो, पण तो सार्वजनिक बनले तर हे संभवत भावनिक हानी (उदा, पेच) आणि आर्थिक हानी (रोजगार उदा, नष्ट होणे) होऊ शकते. आतापर्यंत विशिष्ट, अनेक मोठे डेटा स्रोत पासून संवेदनशील आहे की माहिती आहे. ही माहिती संवेदनशील निसर्ग मोठा डेटा स्रोत अनेकदा प्रवेश (वर वर्णन) आहेत या कारणासाठी भाग आहे.

संशोधक या परिस्थितीची पाहणी करण्यासाठी प्रयत्न एक मार्ग डेटाबेस संवेदनशील माहिती आहे की डि-ओळखण्यास आहे. पण, मी Chapter 6 (एथिक्स) गंभीरपणे मोठ्या प्रमाणावर सामाजिक शास्त्रज्ञ आणि डेटा शास्त्रज्ञ दोन्ही कौतुक नाही अशा प्रकारे मर्यादित हा दृष्टिकोन तपशील सांगण्यात आले आहे.

शेवटी, आज (आणि उद्या) मोठ्या डेटा स्रोत साधारणपणे दहा वैशिष्ट्ये आहेत. चांगल्या अवस्थेत मोठा, नेहमी चालू, आणि अनेक डिजिटल वय कंपन्या खरं पासून nonreactive येतात आणि सरकार पूर्वी शक्य होते की नाही प्रमाणात माहिती गोळा करण्यास सक्षम आहेत. आणि, वाईट गुणधर्म-अपूर्ण प्रवेश, नॉन-प्रतिनिधी अनेक दिशेने प्रवाहित, अल्गोरिथमपणे: खी, प्रवेश गलिच्छ आणि संवेदनशील येतात डेटा संशोधक यांच्यासाठी संशोधक वसूल केला जात नाही की. या वैशिष्ट्ये समजून घेणे, मोठे डेटा शिकत एक आवश्यक पहिली पायरी आहे. आणि आता आम्ही ही डेटा वापरू शकता धोरण संशोधन करा.