ਜਾਣਕਾਰੀ ਕੰਪਨੀ ਅਤੇ ਸਰਕਾਰ ਹੈ, ਜੋ ਕਿ ਕੁਝ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ.
ਸਿਹਤ ਬੀਮਾ ਕੰਪਨੀਆਂ ਕੋਲ ਉਹਨਾਂ ਦੇ ਗਾਹਕਾਂ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੀ ਗਈ ਡਾਕਟਰੀ ਦੇਖਭਾਲ ਬਾਰੇ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਹੈ ਇਹ ਜਾਣਕਾਰੀ ਸਿਹਤ ਦੇ ਮਹੱਤਵਪੂਰਣ ਖੋਜ ਲਈ ਵਰਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਪਰ ਜੇ ਇਹ ਜਨਤਕ ਹੋ ਗਈ ਹੈ, ਤਾਂ ਇਹ ਸੰਭਾਵੀ ਤੌਰ ਤੇ ਭਾਵਨਾਤਮਕ ਨੁਕਸਾਨ (ਜਿਵੇਂ ਕਿ ਸ਼ਰਮਿੰਦਗੀ) ਜਾਂ ਆਰਥਿਕ ਨੁਕਸਾਨ (ਜਿਵੇਂ ਕਿ ਰੁਜ਼ਗਾਰ ਦੇ ਨੁਕਸਾਨ) ਵੱਲ ਵਧ ਸਕਦਾ ਹੈ. ਹੋਰ ਬਹੁਤ ਸਾਰੇ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਵਿੱਚ ਵੀ ਅਜਿਹੀ ਜਾਣਕਾਰੀ ਹੁੰਦੀ ਹੈ ਜੋ ਸੰਵੇਦਨਸ਼ੀਲ ਹੁੰਦੀ ਹੈ , ਜੋ ਕਿ ਇਸ ਕਾਰਨ ਦਾ ਹਿੱਸਾ ਹੈ ਕਿ ਉਹ ਅਕਸਰ ਪਹੁੰਚ ਵਿੱਚ ਕਿਉਂ ਨਹੀਂ ਆਉਂਦੇ.
ਬਦਕਿਸਮਤੀ ਨਾਲ, ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਬਹੁਤ ਮੁਸ਼ਕਲ ਹੈ ਕਿ ਕਿਹੜੀ ਜਾਣਕਾਰੀ ਅਸਲ ਵਿੱਚ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ (Ohm 2015) , ਜਿਵੇਂ ਕਿ ਨੈੱਟਫਿਲਕਸ ਇਨਾਮ ਦੁਆਰਾ ਦਰਸਾਇਆ ਗਿਆ ਸੀ. ਜਿਵੇਂ ਕਿ ਮੈਂ 5 ਦੇ ਅੰਕ ਵਿਚ ਬਿਆਨ ਕਰਾਂਗਾ, 2006 ਵਿਚ ਨੈੱਟਫਲਾਈਕਸ ਨੇ ਤਕਰੀਬਨ 500,000 ਸਦੱਸਾਂ ਦੁਆਰਾ ਮੁਹੱਈਆ 100 ਮਿਲੀਅਨ ਫਿਲਮ ਰੇਟਿੰਗ ਜਾਰੀ ਕੀਤੀ ਅਤੇ ਇਕ ਖੁੱਲ੍ਹਾ ਕਾਲ ਮਿਲਿਆ ਜਿਸ ਵਿਚ ਦੁਨੀਆਂ ਭਰ ਦੇ ਲੋਕਾਂ ਨੇ ਐਲਗੋਰਿਥਮ ਭੇਜੇ ਜਿਨ੍ਹਾਂ ਨਾਲ ਫ਼ਿਲਮਾਂ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਨ ਲਈ Netflix ਦੀ ਸਮਰੱਥਾ ਵਿਚ ਸੁਧਾਰ ਹੋ ਸਕੇ. ਡਾਟਾ ਜਾਰੀ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਨੈੱਟਫਿਲਸ ਨੇ ਕਿਸੇ ਵੀ ਸਪੱਸ਼ਟ ਨਿੱਜੀ ਪਛਾਣ ਜਾਣਕਾਰੀ ਨੂੰ ਹਟਾ ਦਿੱਤਾ, ਜਿਵੇਂ ਕਿ ਨਾਂ. ਪਰ, ਡੇਟਾ ਜਾਰੀ ਹੋਣ ਤੋਂ ਸਿਰਫ ਦੋ ਹਫਤੇ ਬਾਅਦ ਅਰਵਿੰਦ ਨਰਾਇਣਨ ਅਤੇ ਵਿitalੀ ਸ਼ਮਾਤਿਕੋਵ (2008) ਨੇ ਦਿਖਾਇਆ ਕਿ ਕੁੱਝ ਲੋਕਾਂ ਦੀ ਫ਼ਿਲਮ ਰੇਟਿੰਗ ਬਾਰੇ ਸਿੱਖਣਾ ਸੰਭਵ ਹੈ ਜੋ ਮੈਂ ਤੁਹਾਨੂੰ 6 ਵੇਂ ਭਾਗ ਵਿੱਚ ਦਿਖਾ ਦਿਆਂਗਾ. ਵਿਅਕਤੀ ਦੀ ਫ਼ਿਲਮ ਰੇਟਿੰਗ, ਹਾਲੇ ਵੀ ਇੱਥੇ ਕੁਝ ਸੰਵੇਦਨਸ਼ੀਲ ਨਹੀਂ ਜਾਪਦੀ ਹੈ. ਹਾਲਾਂਕਿ ਇਹ ਆਮ ਤੌਰ 'ਤੇ ਸਹੀ ਵੀ ਹੋ ਸਕਦਾ ਹੈ, ਕਿਉਂਕਿ ਡਾਟਾਸੈਟ' ਤੇ ਘੱਟੋ ਘੱਟ 5,00,000 ਲੋਕਾਂ ਵਿੱਚੋਂ ਕੁਝ, ਫਿਲਮ ਰੇਟਿੰਗਾਂ ਸੰਵੇਦਨਸ਼ੀਲ ਸਨ. ਵਾਸਤਵ ਵਿੱਚ, ਰੀਲਿਜ਼ ਦੇ ਜਵਾਬ ਵਿੱਚ ਅਤੇ ਡਾਟਾ ਦੀ ਮੁੜ ਪਛਾਣ, ਇੱਕ ਸਮੂਹਿਕ ਲੇਸੀਬੀ ਔਰਤ ਨੇ Netflix ਦੇ ਖਿਲਾਫ ਇੱਕ ਵਰਗ ਐਕਸ਼ਨ ਮੁਕੱਦਮੇ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਏ. ਇਸ ਮੁਕੱਦਮੇ ਵਿਚ ਸਮੱਸਿਆ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਗਟ ਕੀਤਾ ਗਿਆ ਹੈ (Singel 2009) :
"[ਐੱਮ] ਓਵੀ ਅਤੇ ਰੇਟਿੰਗ ਅੰਕੜਿਆਂ ਵਿਚ ਬਹੁਤ ਨਿੱਜੀ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ ਕੁਦਰਤ ਦੀ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੈ. ਸਦੱਸ ਦੇ ਮੂਵੀ ਡੇਟਾ ਵਿੱਚ ਨੈਟਫਲਿਕਸ ਦੇ ਮੈਂਬਰ ਦੇ ਵਿਅਕਤੀਗਤ ਹਿੱਤ ਅਤੇ / ਜਾਂ ਵੱਖ-ਵੱਖ ਬਹੁਤ ਸਾਰੇ ਨਿੱਜੀ ਮੁੱਦਿਆਂ ਦੇ ਨਾਲ ਸੰਘਰਸ਼ ਹੁੰਦਾ ਹੈ, ਜਿਨਸੀ ਝੁਕਾਓ, ਮਾਨਸਿਕ ਬੀਮਾਰੀ, ਅਲਕੋਹਲ ਤੋਂ ਰਿਕਵਰੀ, ਅਤੇ ਨਜਾਇਜ਼ਾਂ, ਸਰੀਰਕ ਸ਼ੋਸ਼ਣ, ਘਰੇਲੂ ਹਿੰਸਾ, ਵਿਭਚਾਰ ਅਤੇ ਬਲਾਤਕਾਰ ਤੋਂ ਅਿਤਿਆਚਾਰ.
ਇਹ ਉਦਾਹਰਨ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਅਜਿਹੀ ਜਾਣਕਾਰੀ ਹੋ ਸਕਦੀ ਹੈ ਜਿਸ ਵਿੱਚ ਕੁਝ ਲੋਕ ਇੱਕ ਸੰਜੀਦਾ ਡਾਟਾਬੇਸ ਹੋਣ ਦੇ ਅੰਦਰ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਬਾਰੇ ਵਿਚਾਰ ਕਰਦੇ ਹਨ. ਇਸਤੋਂ ਇਲਾਵਾ, ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਇੱਕ ਮੁੱਖ ਬਚਾਅ ਜੋ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟਾ-ਡੀ-ਪਛਾਣ ਦੀ ਰੱਖਿਆ ਕਰਨ ਲਈ ਨੌਕਰੀ 'ਤੇ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ- ਇਹ ਹੈਰਾਨੀਜਨਕ ਤਰੀਕੇ ਨਾਲ ਅਸਫਲ ਹੋ ਸਕਦਾ ਹੈ ਅਧਿਆਇ 6 ਵਿਚ ਇਨ੍ਹਾਂ ਦੋਨਾਂ ਵਿਚਾਰਾਂ ਨੂੰ ਵਿਸਥਾਰ ਵਿਚ ਬਿਆਨ ਕੀਤਾ ਗਿਆ ਹੈ.
ਸੰਵੇਦਨਸ਼ੀਲ ਡੇਟਾ ਦੇ ਬਾਰੇ ਵਿੱਚ ਮਨ ਵਿੱਚ ਰੱਖਣ ਦਾ ਅਖੀਰਲਾ ਗੱਲ ਇਹ ਹੈ ਕਿ ਲੋਕਾਂ ਦੀ ਸਹਿਮਤੀ ਤੋਂ ਬਗੈਰ ਇਕੱਠੇ ਕਰਨਾ ਨੈਤਿਕ ਸਵਾਲ ਉਠਾਉਂਦਾ ਹੈ, ਭਾਵੇਂ ਕੋਈ ਖਾਸ ਨੁਕਸਾਨ ਨਹੀਂ ਹੁੰਦਾ ਹੈ. ਕਿਸੇ ਨੂੰ ਆਪਣੀ ਸਹਿਮਤੀ ਤੋਂ ਬਗੈਰ ਸ਼ਾਕਾਹਾਰੀ ਲੈਂਦੇ ਦੇਖਣਾ, ਉਸ ਵਿਅਕਤੀ ਦੀ ਗੋਪਨੀਯਤਾ ਦੀ ਉਲੰਘਣਾ ਮੰਨਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਇਕੱਠੀ ਕਰਨਾ - ਅਤੇ ਯਾਦ ਰੱਖਣਾ ਕਿ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਕੀ ਹੈ - ਇਹ ਬਿਨਾਂ ਕਿਸੇ ਸਹਿਮਤੀ ਤੋਂ ਸੰਭਾਵੀ ਗੁਪਤਤਾ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕਰਦੀ ਹੈ ਮੈਂ ਚੈਪਟਰ 6 ਵਿੱਚ ਰਹੱਸ ਨੂੰ ਬਾਰੇ ਸਵਾਲਾਂ ਵਿੱਚ ਵਾਪਸ ਆਵਾਂਗਾ
ਸਿੱਟਾ ਵਿੱਚ, ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ, ਜਿਵੇਂ ਕਿ ਸਰਕਾਰ ਅਤੇ ਕਾਰੋਬਾਰੀ ਪ੍ਰਬੰਧਕੀ ਰਿਕਾਰਡ, ਆਮ ਤੌਰ ਤੇ ਸਮਾਜਿਕ ਖੋਜ ਦੇ ਮਕਸਦ ਲਈ ਨਹੀਂ ਬਣਾਏ ਗਏ ਹਨ ਅੱਜ ਦੇ ਵੱਡੇ ਅੰਕੜੇ, ਅਤੇ ਕੱਲ੍ਹ ਸੰਭਾਵਿਤ ਤੌਰ ਤੇ 10 ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ ਆਮ ਤੌਰ 'ਤੇ ਖੋਜ-ਵੱਡੀਆਂ, ਹਮੇਸ਼ਾਂ, ਅਤੇ ਗ਼ੈਰ-ਕਿਰਿਆਸ਼ੀਲ-ਲਈ ਕਾਫੀ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ - ਡਿਜੀਟਲ ਏਜ ਦੀਆਂ ਕੰਪਨੀਆਂ ਅਤੇ ਸਰਕਾਰਾਂ ਵਿੱਚ ਅਸਲ ਤੱਥ ਆਉਂਦੇ ਹਨ ਜੋ ਅਜਿਹੇ ਅੰਕੜਿਆਂ ਨੂੰ ਇਕੱਤਰ ਕਰਨ ਦੇ ਯੋਗ ਹੁੰਦੇ ਹਨ ਜੋ ਕਿ ਪਹਿਲਾਂ ਸੰਭਵ ਨਹੀਂ ਸੀ. ਅਤੇ ਅਜਿਹੀਆਂ ਬਹੁਤ ਸਾਰੀਆਂ ਸੰਪਤੀਆਂ ਜੋ ਆਮ ਤੌਰ 'ਤੇ ਖੋਜ-ਅਧੂਰੀਆਂ, ਨਾ-ਪਹੁੰਚਯੋਗ, ਨਿਰਪੱਖ, ਡ੍ਰਾਈਪਿੰਗ, ਐਲਗੋਰਿਥਮਿਕ ਤੌਰ ਤੇ ਸ਼ਰਮ, ਪਹੁੰਚਯੋਗ, ਗੰਦੇ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ ਲਈ ਬੁਰਾ ਸਮਝੀਆਂ ਜਾਂਦੀਆਂ ਹਨ - ਇਹ ਤੱਥ ਇਸ ਗੱਲ ਤੋਂ ਮਿਲਦਾ ਹੈ ਕਿ ਇਹ ਡਾਟਾ ਖੋਜਕਰਤਾਵਾਂ ਦੁਆਰਾ ਖੋਜਕਾਰਾਂ ਦੁਆਰਾ ਇਕੱਤਰ ਨਹੀਂ ਕੀਤਾ ਗਿਆ. ਅਜੇ ਤੱਕ, ਮੈਂ ਸਰਕਾਰ ਅਤੇ ਬਿਜਨਸ ਡਾਟਾ ਇਕੱਠੇ ਇਕੱਠੇ ਕਰਨ ਬਾਰੇ ਗੱਲ ਕੀਤੀ ਹੈ, ਪਰ ਦੋਵਾਂ ਦੇ ਵਿਚਕਾਰ ਕੁਝ ਫਰਕ ਹਨ. ਮੇਰੇ ਤਜ਼ਰਬੇ ਵਿਚ, ਸਰਕਾਰੀ ਅੰਕੜੇ ਘੱਟ ਪ੍ਰਤੀਨਿਧਤਾ ਵਾਲੇ ਹੁੰਦੇ ਹਨ, ਘੱਟ ਅਲਗੋਰਿਥਮਿਕ ਤੌਰ ਤੇ ਸ਼ਰਮਿੰਦਾ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਘੱਟ ਵਗਣ ਵਾਲਾ. ਇਕ ਦੂਜੇ ਪਾਸੇ, ਵਪਾਰਕ ਪ੍ਰਸ਼ਾਸਨਿਕ ਰਿਕਾਰਡ ਹਮੇਸ਼ਾ ਜ਼ਿਆਦਾ ਹੁੰਦੇ ਰਹਿੰਦੇ ਹਨ. ਇਨ੍ਹਾਂ 10 ਆਮ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸਮਝਣਾ ਵੱਡੀ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਤੋਂ ਸਿੱਖਣ ਵੱਲ ਇੱਕ ਸਹਾਇਕ ਕਦਮ ਹੈ. ਅਤੇ ਹੁਣ ਅਸੀਂ ਖੋਜ ਦੀਆਂ ਰਣਨੀਤੀਆਂ ਵੱਲ ਮੁੜਦੇ ਹਾਂ ਜੋ ਅਸੀਂ ਇਸ ਡੇਟਾ ਨਾਲ ਵਰਤ ਸਕਦੇ ਹਾਂ.