ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਸਮਾਜਿਕ ਖੋਜ ਵਿੱਚ ਸਭ ਆਮ ਖਤਰਾ ਹੈ; ਇਸ ਨੂੰ ਨਾਟਕੀ ਵਾਧਾ ਹੋਇਆ ਹੈ; ਅਤੇ ਇਸ ਨੂੰ ਸਮਝਣ ਲਈ ਕਠਿਨ ਦਾ ਖਤਰਾ ਹੈ.
ਸਮਾਜਿਕ ਉਮਰ ਦੇ ਡਿਜ਼ੀਟਲ ਖੋਜ ਲਈ ਦੂਜਾ ਨੈਤਿਕ ਚੁਣੌਤੀ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਹੈ, ਜਾਣਕਾਰੀ ਦਾ ਖੁਲਾਸਾ ਤੱਕ ਨੁਕਸਾਨ ਦੀ ਸੰਭਾਵਨਾ ਹੈ (Council 2014) . ਨਿੱਜੀ ਜਾਣਕਾਰੀ ਦਾ ਖੁਲਾਸਾ ਤੱਕ ਜਾਣਕਾਰੀ ਪਹੁੰਚਾਉਣ ਆਰਥਿਕ ਹੋ ਸਕਦਾ ਹੈ (ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਨੌਕਰੀ ਗੁਆਉਣ), ਸਮਾਜਿਕ (ਉਦਾਹਰਨ ਲਈ, ਸ਼ਰਮ), ਮਨੋਵਿਗਿਆਨਕ (ਉਦਾਹਰਨ ਲਈ, ਡਿਪਰੈਸ਼ਨ), ਜ ਵੀ ਅਪਰਾਧਿਕ (ਉਦਾਹਰਨ ਲਈ, ਗੈਰ ਕਾਨੂੰਨੀ ਵਿਹਾਰ ਲਈ ਗ੍ਰਿਫਤਾਰੀ). ਬਦਕਿਸਮਤੀ ਨਾਲ, ਡਿਜ਼ੀਟਲ ਦੀ ਉਮਰ ਨੂੰ ਵਧਾ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਨਾਟਕੀ-ਉੱਥੇ ਸਾਡਾ ਵਿਵਹਾਰ ਬਾਰੇ ਹੁਣੇ ਹੀ ਇਸ ਲਈ ਬਹੁਤ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਹੈ. ਅਤੇ, ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਸਮਝਣ ਅਤੇ ਪਰਬੰਧਨ ਕਰਨ ਲਈ ਬਹੁਤ ਹੀ ਮੁਸ਼ਕਲ ਸਾਬਤ ਕੀਤਾ ਹੈ ਖ਼ਤਰੇ ਕਿ ਅਜਿਹੇ ਸਰੀਰਕ ਨੂੰ ਖਤਰਾ ਹੈ ਦੇ ਰੂਪ ਵਿੱਚ ਐਨਾਲਾਗ ਦੀ ਉਮਰ ਸਮਾਜਿਕ ਖੋਜ ਵਿਚ ਚਿੰਤਾ, ਸਨ ਮੁਕਾਬਲੇ. ਨੂੰ ਡਿਜ਼ੀਟਲ ਦੀ ਉਮਰ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਵਧਾ ਵੇਖਣ ਲਈ, ਇਲੈਕਟ੍ਰਾਨਿਕ ਮੈਡੀਕਲ ਰਿਕਾਰਡ ਪੇਪਰ ਤੱਕ ਤਬਦੀਲੀ 'ਤੇ ਵਿਚਾਰ. ਦੇ ਰਿਕਾਰਡ ਦੇ ਦੋਨੋ ਕਿਸਮ ਦਾ ਖਤਰਾ ਬਣਾਏ ਹਨ, ਪਰ ਇਲੈਕਟ੍ਰਾਨਿਕ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਬਹੁਤ ਵੱਡਾ ਜੋਖਮ ਬਣਾਉਣ, ਕਿਉਕਿ ਇੱਕ ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਉਹ ਇੱਕ ਅਣਅਧਿਕਾਰਤ ਪਾਰਟੀ ਨੂੰ ਪ੍ਰਸਾਰਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜ ਹੋਰ ਦੇ ਰਿਕਾਰਡ ਨਾਲ ਮਿਲਾ. ਡਿਜ਼ੀਟਲ ਦੀ ਉਮਰ ਵਿਚ ਸੋਸ਼ਲ ਖੋਜਕਾਰ ਹੀ ਉਹ ਪੂਰੀ ਸਮਝ ਨਾ ਸੀ ਮਾਤਰਾ ਹੈ ਅਤੇ ਇਸ ਨੂੰ ਦਾ ਪਰਬੰਧ ਕਰਨਾ ਹਿੱਸੇ ਵਿੱਚ, ਜਾਣਕਾਰੀ ਜੋਖਮ ਨਾਲ ਸਮੱਸਿਆ ਵਿੱਚ ਚਲਾਉਣ ਲਈ ਹੈ. ਇਸ ਲਈ, ਮੈਨੂੰ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਹੈ, ਬਾਰੇ ਸੋਚਣ ਦੀ ਇੱਕ ਸਹਾਇਕ ਢੰਗ ਨਾਲ ਪੇਸ਼ ਕਰਨ ਲਈ ਜਾ ਰਿਹਾ ਰਿਹਾ ਹੈ, ਅਤੇ ਫਿਰ ਮੈਨੂੰ ਤੁਹਾਡੇ ਆਪਣੇ ਖੋਜ ਵਿਚ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਦਾ ਪਰਬੰਧ ਕਰਨ ਲਈ ਅਤੇ ਹੋਰ ਖੋਜਕਾਰ ਨੂੰ ਡਾਟਾ ਜਾਰੀ ਵਿਚ ਕੁਝ ਸਲਾਹ ਦੇਣ ਲਈ ਜਾ ਰਿਹਾ ਰਿਹਾ ਹੈ.
ਇਕ ਤਰੀਕਾ ਹੈ, ਜੋ ਕਿ ਸਮਾਜਿਕ ਖੋਜਕਾਰ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਘੱਟ ਡਾਟਾ ਦੀ "anonymization" ਹੈ. "Anonymization" ਅਜਿਹੇ ਨਾਮ, ਪਤਾ, ਅਤੇ ਡਾਟਾ ਤੱਕ ਟੈਲੀਫੋਨ ਨੰਬਰ ਦੇ ਤੌਰ ਤੇ ਸਪੱਸ਼ਟ ਨਿੱਜੀ ਪਛਾਣਕਰਤਾ ਨੂੰ ਹਟਾਉਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ. ਪਰ, ਇਸ ਪਹੁੰਚ ਡੂੰਘਾ ਹੈ ਅਤੇ ਬੁਨਿਆਦੀ ਸੀਮਤ ਬਹੁਤ ਘੱਟ ਅਸਰਦਾਰ ਵੱਧ ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਇਹ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਇਸ ਨੂੰ ਅਸਲ ਵਿੱਚ, ਹੈ,. ਹੈ, ਜੋ ਕਿ ਇਸ ਦਾ ਕਾਰਨ ਲਈ, ਜਦ ਵੀ ਮੈਨੂੰ ਦਾ ਵਰਣਨ "anonymization," ਮੈਨੂੰ ਹਵਾਲਾ ਨਿਸ਼ਾਨ ਤੁਹਾਨੂੰ ਯਾਦ ਕਰਨ ਲਈ ਹੈ, ਜੋ ਕਿ ਇਸ ਪ੍ਰਕਿਰਿਆ ਛਾਪੱਣ ਦੀ ਦਿੱਖ ਪਰ ਨਾ ਇਹ ਸੱਚ ਹੈ, ਛਾਪੱਣ ਬਣਾਉਦਾ ਹੈ ਨੂੰ ਵਰਤਣ ਹੋਵੋਗੇ.
"Anonymization" ਦੀ ਅਸਫਲਤਾ ਦੇ ਇਕ ਸਪੱਸ਼ਟ ਉਦਾਹਰਨ ਮੈਸੇਚਿਉਸੇਟਸ ਵਿਚ ਦੇਰ 1990 ਤੱਕ ਮਿਲਦੀ ਹੈ (Sweeney 2002) . ਗਰੁੱਪ ਬੀਮਾ ਕਮਿਸ਼ਨ (GIC) ਇੱਕ ਸਰਕਾਰੀ ਏਜੰਸੀ ਨੂੰ ਸਾਰੇ ਸੂਬੇ ਦੇ ਕਰਮਚਾਰੀ ਦੇ ਲਈ ਸਿਹਤ ਬੀਮਾ ਖਰੀਦਣ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਸੀ. ਇਸ ਕੰਮ ਦੇ ਜ਼ਰੀਏ, GIC ਨੂੰ ਰਾਜ ਕਰਮਚਾਰੀ ਦੇ ਹਜ਼ਾਰ ਦੇ ਬਾਰੇ ਵੇਰਵੇ ਦੀ ਸਿਹਤ ਦਾ ਰਿਕਾਰਡ ਇਕੱਠਾ ਕੀਤਾ. ਸਿਹਤ ਵਿੱਚ ਸੁਧਾਰ ਕਰਨ ਲਈ ਤਰੀਕੇ ਬਾਰੇ ਖੋਜ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਇੱਕ ਜਤਨ ਵਿੱਚ, GIC ਖੋਜਕਾਰ ਨੂੰ ਇਹ ਰਿਕਾਰਡ ਦਾ ਜਾਰੀ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ ਹੈ. ਪਰ, ਉਹ ਆਪਣੇ ਡਾਟੇ ਦੀ ਸਭ ਨੂੰ ਸ਼ੇਅਰ ਨਾ ਕੀਤਾ; ਇਸ ਦੀ ਬਜਾਇ, ਉਹ ਅਜਿਹੇ ਨਾਮ ਅਤੇ ਪਤਾ ਦੇ ਤੌਰ ਤੇ ਜਾਣਕਾਰੀ ਨੂੰ ਹਟਾ ਕੇ "ਬੇਨਾਮ" ਇਸ ਨੂੰ. ਪਰ, ਉਹ ਵੀ ਹੋਰ ਜਾਣਕਾਰੀ ਹੈ ਕਿ ਉਹ ਨੇ ਸੋਚਿਆ ਕਿ ਅਜਿਹੇ ਜਨ ਜਾਣਕਾਰੀ (ਜ਼ਿਪ ਕੋਡ, ਜਨਮ ਮਿਤੀ, ਨਸਲੀ, ਅਤੇ ਸੈਕਸ) ਅਤੇ ਮੈਡੀਕਲ ਜਾਣਕਾਰੀ (ਦੌਰੇ ਡਾਟਾ, ਤਸ਼ਖੀਸ, ਵਿਧੀ) (ਚਿੱਤਰ 6.4) ਦੇ ਤੌਰ ਤੇ ਖੋਜਕਾਰ ਲਈ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦਾ ਹੈ ਨੂੰ ਛੱਡ (Ohm 2010) . ਬਦਕਿਸਮਤੀ ਨਾਲ, ਇਸ ਨੂੰ "anonymization" ਡਾਟਾ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਲਈ ਕਾਫੀ ਨਹੀ ਸੀ.
GIC "anonymization" ਦੇ shortcomings ਮਿਸਾਲ ਲਈ, Latanya Sweeney-ਫਿਰ $ 20 ਐਮਆਈਟੀ-ਦਾ ਭੁਗਤਾਨ ਕੈਮਬ੍ਰਿਜ, ਮੈਸੇਚਿਉਸੇਟਸ ਗਵਰਨਰ ਵਿਲੀਅਮ ਨੂੰ ਸੁਕਾਉਣ ਦੇ ਜੱਦੀ ਸ਼ਹਿਰ ਵੋਟਿੰਗ ਦੇ ਰਿਕਾਰਡ ਹਾਸਲ ਕਰਨ ਲਈ 'ਤੇ ਇੱਕ ਗ੍ਰੈਜੂਏਟ ਵਿਦਿਆਰਥੀ. ਇਹ ਵੋਟ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਅਜਿਹੇ ਨਾਮ, ਪਤਾ, ਜ਼ਿਪ ਕੋਡ, ਜਨਮ ਮਿਤੀ, ਅਤੇ ਲਿੰਗ ਦੇ ਤੌਰ ਤੇ ਜਾਣਕਾਰੀ ਵੀ ਸ਼ਾਮਲ ਸੀ. ਤੱਥ ਇਹ ਹੈ ਕਿ ਮੈਡੀਕਲ ਡਾਟਾ ਫਾਇਲ ਅਤੇ ਵੋਟਰ ਫਾਇਲ ਸ਼ੇਅਰ ਖੇਤਰ-ਜ਼ਿਪ ਕੋਡ, ਜਨਮ ਮਿਤੀ, ਅਤੇ ਸੈਕਸ-ਦਾ ਮਤਲਬ ਹੈ ਕਿ Sweeney ਨੂੰ ਲਿੰਕ ਕਰ ਸਕਦਾ ਹੈ. Sweeney ਜਾਣਦਾ ਸੀ ਕਿ ਸੁਕਾਉਣ ਦੇ ਜਨਮ ਦਿਨ 31 ਜੁਲਾਈ, 1945 ਦਾ ਸੀ, ਅਤੇ ਵੋਟਿੰਗ ਦੇ ਰਿਕਾਰਡ ਹੈ, ਜੋ ਕਿ ਜਨਮਦਿਨ ਨਾਲ ਕੈਮਬ੍ਰਿਜ ਵਿਚ ਸਿਰਫ ਛੇ ਲੋਕ ਸ਼ਾਮਲ ਸਨ. ਅੱਗੇ, ਜਿਹੜੇ ਛੇ ਲੋਕ, ਸਿਰਫ ਤਿੰਨ ਪੁਰਸ਼ ਸਨ. ਅਤੇ, ਉਹ ਤਿੰਨ ਆਦਮੀ ਦੇ, ਸਿਰਫ ਇੱਕ ਹੀ ਨੂੰ ਸੁਕਾਉਣ ਦੀ ਜ਼ਿਪ ਕੋਡ ਕੀਤੀ ਹੈ. ਇਸ ਲਈ, ਵੋਟਿੰਗ ਡਾਟਾ ਜਨਮ ਮਿਤੀ, ਲਿੰਗ, ਅਤੇ ਜ਼ਿਪ ਕੋਡ ਦੇ ਸੁਕਾਉਣ ਦੇ ਸੁਮੇਲ ਨਾਲ ਮੈਡੀਕਲ ਡਾਟਾ ਵਿਚ ਕਿਸੇ ਵੀ ਵਿਅਕਤੀ ਨੂੰ ਵਿਲੀਅਮ ਨੂੰ ਸੁਕਾਉਣ ਸੀ ਦਿਖਾਇਆ. ਤੱਤ ਵਿੱਚ, ਜਾਣਕਾਰੀ ਦੀ ਇਹ ਤਿੰਨ ਟੁਕੜੇ ਡਾਟਾ ਵਿਚ ਉਸ ਨੂੰ ਇੱਕ ਵਿਲੱਖਣ ਫਿੰਗਰਪਰਿੰਟ ਦਿੱਤਾ ਹੈ. ਇਸ ਗੱਲ ਦਾ ਇਸਤੇਮਾਲ ਕਰਕੇ, Sweeney ਨੂੰ ਸੁਕਾਉਣ ਦਾ ਮੈਡੀਕਲ ਰਿਕਾਰਡ ਲੱਭਣ ਲਈ, ਅਤੇ ਉਸ ਨੂੰ ਉਸ ਦੇ ਕਾਰਨਾਮਾ ਦੇ ਸੂਚਿਤ ਕਰਨ ਦੇ ਯੋਗ ਸੀ, ਉਸ ਨੇ ਉਸ ਨੂੰ ਉਸ ਦੇ ਰਿਕਾਰਡ ਦੀ ਇੱਕ ਕਾਪੀ ਮੇਲ (Ohm 2010) .
Sweeney ਦਾ ਕੰਮ ਡੀ-anonymization ਹਮਲੇ ਦੇ ਬੁਨਿਆਦੀ ਬਣਤਰ ਲੱਗਦਾ ਲਈ ਠਹਿਰਾਇਆ ਹੈ ਕੰਪਿਊਟਰ ਨੂੰ ਸੁਰੱਖਿਆ ਭਾਈਚਾਰੇ ਨੂੰ ਇੱਕ ਮਿਆਦ ਅਪਣਾਉਣ. ਇਹ ਹਮਲੇ ਵਿੱਚ, ਦੋ ਡਾਟਾ ਸੈੱਟ, ਨਾ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਆਪ ਨੂੰ ਦੇ ਕੇ ਦੇ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਪਤਾ ਲੱਗਦਾ ਹੈ, ਨਾਲ ਜੁੜੇ ਰਹੇ ਹਨ, ਅਤੇ ਇਸ ਕੜੀ ਦੇ ਜ਼ਰੀਏ, ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ. ਕੁਝ ਤਰੀਕੇ ਵਿੱਚ ਇਸ ਕਾਰਜ ਨੂੰ ਤਰੀਕੇ ਨਾਲ ਹੈ, ਜੋ ਕਿ ਸੋਡਾ ਅਤੇ ਸਿਰਕੇ, ਦੋ ਪਦਾਰਥ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਆਪ ਨੂੰ ਦੇ ਕੇ ਸੁਰੱਖਿਅਤ ਹਨ ਬੇਕਿੰਗ, ਇੱਕ nasty ਨਤੀਜੇ ਪੈਦਾ ਕਰਨ ਲਈ ਜੋੜਿਆ ਜਾ ਸਕਦਾ ਹੈ ਕਰਨ ਦੇ ਸਮਾਨ ਹੈ.
Sweeney ਦਾ ਕੰਮ, ਅਤੇ ਹੋਰ ਸਬੰਧਿਤ ਕੰਮ ਦੇ ਜਵਾਬ ਵਿਚ, ਖੋਜਕਾਰ ਹੁਣ ਆਮ ਤੌਰ 'ਤੇ ਬਹੁਤ ਕੁਝ ਹੋਰ ਜਾਣਕਾਰੀ-ਸਾਰੇ, ਇਸ ਲਈ ਕਹਿੰਦੇ ਹਨ, "ਨਿੱਜੀ ਪਛਾਣ ਜਾਣਕਾਰੀ" (PII) ਹਟਾਉਣ (Narayanan and Shmatikov 2010) ਬਹੁਤ ਸਾਰੇ ਖੋਜਕਾਰ ਹੁਣ ਦੀ ਪ੍ਰਕਿਰਿਆ -during "anonymization." ਅੱਗੇ, ਪਤਾ ਹੈ ਕਿ ਕੁਝ ਡਾਟਾ-ਅਜਿਹੇ ਮੈਡੀਕਲ ਰਿਕਾਰਡ, ਵਿੱਤੀ ਰਿਕਾਰਡ, ਸਰਵੇਖਣ ਕਰਨ ਲਈ ਗੈਰ ਕਾਨੂੰਨੀ ਬਾਰੇ ਸਵਾਲ ਦੇ ਜਵਾਬ ਦੇ ਤੌਰ ਤੇ ਸੰਭਵ ਹੈ ਕਿ ਬਾਅਦ ਵੀ ਜਾਰੀ ਕਰਨ ਲਈ ਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਵਿਵਹਾਰ ਨੂੰ-ਹੈ "anonymization." ਪਰ, ਹੋਰ ਹਾਲ ਹੀ ਉਦਾਹਰਣ ਹੈ, ਜੋ ਕਿ ਮੈਨੂੰ ਹੇਠ ਦਾ ਵਰਣਨ ਲੱਗੇਗਾ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਸਮਾਜਿਕ ਖੋਜਕਾਰ ਕਰਨ ਦੀ ਲੋੜ ਹੈ ਆਪਣੀ ਸੋਚ ਨੂੰ ਬਦਲਣ. ਇੱਕ ਪਹਿਲੇ ਕਦਮ ਹੈ ਦੇ ਰੂਪ ਵਿੱਚ, ਇਸ ਨੂੰ ਮੰਨ ਲਈ ਹੈ, ਜੋ ਕਿ ਸਭ ਡਾਟਾ ਸੰਭਾਵਿਤ ਪਛਾਣ ਹੈ ਅਤੇ ਸਭ ਡਾਟਾ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ ਅਕਲਮੰਦੀ ਦੀ ਗੱਲ ਹੈ. ਹੋਰ ਸ਼ਬਦ ਵਿੱਚ, ਨਾ ਕਿ ਇਹ ਸੋਚ ਹੈ ਕਿ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਪ੍ਰਾਜੈਕਟ ਦੇ ਇੱਕ ਛੋਟੇ ਸਮੂਹ ਨੂੰ ਲਾਗੂ ਹੁੰਦਾ ਹੈ, ਸਾਨੂੰ ਮੰਨ ਲੈਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਇਹ ਲਾਗੂ ਹੁੰਦਾ ਹੈ-ਕਰਨ ਲਈ ਕੁਝ ਸਭ ਪ੍ਰਾਜੈਕਟ ਡਿਗਰੀ-ਨੂੰ.
ਇਸ ਮੁੜ-ਸਥਿਤੀ ਦੇ ਦੋਨੋ ਪੱਖ Netflix ਪੁਰਸਕਾਰ ਦੇ ਕੇ ਸਮਝਾਇਆ ਕਰ ਰਹੇ ਹਨ. ਅਧਿਆਇ 5 ਵਿਚ ਦੱਸਿਆ ਗਿਆ ਹੈ ਦੇ ਰੂਪ ਵਿੱਚ, Netflix 100 ਕਰੋੜ ਫਿਲਮ ਲਗਭਗ 500,000 ਅੰਗ ਦੁਆਰਾ ਮੁਹੱਈਆ ਰੇਟਿੰਗ ਜਾਰੀ ਕੀਤੇ ਹਨ, ਅਤੇ ਇੱਕ ਓਪਨ ਕਾਲ ਹੈ, ਜਿੱਥੇ ਸਾਰੇ ਸੰਸਾਰ ਉਪਰ ਤੱਕ ਲੋਕ ਪੇਸ਼ ਐਲਗੋਰਿਥਮ ਹੈ, ਜੋ ਕਿ Netflix ਦੀ ਫਿਲਮ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਨ ਦੀ ਯੋਗਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰ ਸਕਦਾ ਹੈ ਸੀ. ਡਾਟਾ ਜਾਰੀ ਪਿਹਲ, Netflix ਅਜਿਹੇ ਨਾਮ ਦੇ ਤੌਰ ਤੇ ਕਿਸੇ ਵੀ ਸਪੱਸ਼ਟ ਨਿੱਜੀ ਤੌਰ-ਪਛਾਣ ਜਾਣਕਾਰੀ, ਨੂੰ ਹਟਾ ਦਿੱਤਾ. Netflix ਨੂੰ ਵੀ ਇੱਕ ਵਾਧੂ ਕਦਮ ਹੈ ਚਲਾ ਗਿਆ ਹੈ ਅਤੇ ਰਿਕਾਰਡ ਦੀ ਕੁਝ ਵਿਚ ਮਾਮੂਲੀ perturbations (ਉਦਾਹਰਨ ਲਈ, 3 ਸਿਤਾਰੇ ਦਾ 4 ਸਿਤਾਰੇ ਕੁਝ ਰੇਟਿੰਗ ਨੂੰ ਬਦਲਣ) ਪੇਸ਼ ਕੀਤਾ. Netflix ਛੇਤੀ ਹੀ ਲੱਭੇ, ਪਰ, ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਯਤਨ ਦੇ ਬਾਵਜੂਦ, ਡਾਟਾ ਕੋਈ ਗਏ ਅਗਿਆਤ ਹੈ.
ਡਾਟਾ ਬਾਅਦ ਬਸ ਦੋ ਹਫਤੇ ਜਾਰੀ ਕੀਤੇ ਗਏ ਸਨ Narayanan and Shmatikov (2008) ਨੇ ਦਿਖਾਇਆ ਹੈ ਕਿ ਇਹ ਖਾਸ ਲੋਕ ਦੇ ਫਿਲਮ ਪਸੰਦ ਬਾਰੇ ਸਿੱਖਣ ਲਈ ਸੰਭਵ ਸੀ. ਆਪਣੇ ਮੁੜ-ਪਛਾਣ ਹਮਲੇ ਨੂੰ ਹੈਟ੍ਰਿਕ Sweeney ਦੇ ਸਮਾਨ ਸੀ: ਇਕੱਠੇ ਅਭੇਦ ਦੋ ਜਾਣਕਾਰੀ ਸਰੋਤ ਹੈ, ਇੱਕ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਹੈ ਅਤੇ ਕੋਈ ਵੀ ਸਪੱਸ਼ਟ ਪਛਾਣ ਜਾਣਕਾਰੀ ਅਤੇ ਇੱਕ ਹੈ, ਜੋ ਕਿ ਲੋਕ ਦੀ ਪਛਾਣ ਰੱਖਦਾ ਹੈ ਦੇ ਨਾਲ. ਇਹ ਡਾਟਾ ਸਰੋਤ ਦੇ ਹਰ ਵੱਖਰੇ ਸੁਰੱਖਿਅਤ ਹੋ ਸਕਦਾ ਹੈ, ਪਰ ਜਦ ਉਹ ਮਿਲਾ ਰਹੇ ਹਨ ਸ਼ਮੂਲੀਅਤ dataset ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਬਣਾ ਸਕਦੇ ਹੋ. Netflix ਡਾਟਾ ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਇੱਥੇ ਇਸ ਨੂੰ ਕੀ ਹੋ ਸਕਦਾ ਹੈ. ਕਲਪਨਾ ਕਰੋ ਕਿ ਮੈਨੂੰ ਕਾਰਵਾਈ ਅਤੇ ਮੇਰੇ ਸਹਿ-ਕਾਮੇ ਦੇ ਨਾਲ ਕਾਮੇਡੀ ਫਿਲਮ ਦੇ ਬਾਰੇ ਮੇਰੇ ਵਿਚਾਰ ਸ਼ੇਅਰ ਕਰਨ ਦੀ ਚੋਣ ਹੈ, ਪਰ ਮੈਨੂੰ ਧਾਰਮਿਕ ਅਤੇ ਸਿਆਸੀ ਫਿਲਮ ਦੇ ਬਾਰੇ ਮੇਰੇ ਵਿਚਾਰ ਸ਼ੇਅਰ ਕਰਨ ਲਈ, ਨਾ ਪਸੰਦ ਕਰਦੇ ਹਨ. ਮੇਰੀ ਸਹਿ-ਕਾਮੇ ਜਾਣਕਾਰੀ ਹੈ ਕਿ ਮੈਨੂੰ Netflix ਡਾਟਾ ਵਿੱਚ ਮੇਰੇ ਦੇ ਰਿਕਾਰਡ ਦਾ ਪਤਾ ਕਰਨ ਲਈ ਆਪਣੇ ਨਾਲ ਸ਼ੇਅਰ ਕੀਤਾ ਹੈ ਵਰਤ ਸਕਦਾ ਹੈ; ਜਾਣਕਾਰੀ ਹੈ ਕਿ ਮੈਨੂੰ ਸ਼ੇਅਰ ਹੁਣੇ ਹੀ ਵਿਲੀਅਮ ਨੂੰ ਸੁਕਾਉਣ ਦੇ ਜਨਮ ਦੀ ਤਾਰੀਖ, ਜ਼ਿਪ ਕੋਡ, ਅਤੇ ਸੈਕਸ ਵਰਗੇ ਇੱਕ ਵਿਲੱਖਣ ਫਿੰਗਰਪਰਿੰਟ ਹੋ ਸਕਦਾ ਹੈ. ਫਿਰ, ਜੇ ਉਹ ਡਾਟਾ ਵਿੱਚ ਮੇਰੇ ਵਿਲੱਖਣ ਫਿੰਗਰਪਰਿੰਟ ਨੂੰ ਲੱਭਣ, ਉਹ ਮੇਰੇ ਰੇਟਿੰਗ ਮੂਵੀ, ਜਿੱਥੇ ਮੈਨੂੰ ਸ਼ੇਅਰ ਕਰਨ ਲਈ, ਨਾ ਚੁਣਨ ਸਮੇਤ ਸਾਰੇ ਮੂਵੀ, ਬਾਰੇ ਸਿੱਖ ਸਕਦਾ ਸੀ. ਇੱਕ ਇੱਕਲੇ ਵਿਅਕਤੀ 'ਤੇ ਧਿਆਨ ਨੂੰ ਨਿਸ਼ਾਨਾ ਹਮਲੇ ਦੇ ਇਸ ਕਿਸਮ ਦੀ ਕਰਨ ਦੇ ਨਾਲ, Narayanan and Shmatikov (2008) ਨੂੰ ਵੀ ਦਿਖਾਇਆ ਹੈ, ਜੋ ਕਿ ਇਸ ਨੂੰ ਨਿੱਜੀ ਅਤੇ ਫਿਲਮ ਦੀ ਰੇਟਿੰਗ ਡਾਟੇ ਨਾਲ Netflix ਡਾਟਾ ਅਭੇਦ-ਦੇ ਕੇ ਲੋਕ ਇੱਕ ਵਿਆਪਕ ਹਮਲੇ ਲਈ ਪ੍ਰਾਸਚਿਤ ਕਰ ਬਹੁਤ ਸਾਰੇ ਸ਼ਾਮਲ ਨੂੰ ਕੀ ਕਰਨ ਦੀ ਸੰਭਵ ਸੀ ਕਿ ਕੁਝ ਲੋਕ ਨੂੰ ਇੰਟਰਨੈੱਟ ਦੀ ਫਿਲਮ ਡਾਟਾਬੇਸ (ਆਈਐਮਡੀਬੀ) ਤੇ ਪੋਸਟ ਲਈ ਚੁਣਿਆ ਹੈ. ਕੋਈ ਵੀ ਜਾਣਕਾਰੀ ਨੂੰ ਇੱਕ ਖਾਸ ਵਿਅਕਤੀ ਨੂੰ ਵੀ ਆਪਣੇ ਫਿਲਮ ਦੇ ਸੈੱਟ ਕਰਨ ਲਈ ਵਿਲੱਖਣ ਫਿੰਗਰਪਰਿੰਟ ਹੈ, ਜੋ ਕਿ ਉਹ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਰੇਟਿੰਗ-ਕਰ ਸਕਦਾ ਹੈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ.
ਪਰ Netflix ਡਾਟਾ ਇੱਕ ਨਿਸ਼ਾਨਾ ਜ ਵਿਆਪਕ ਹਮਲੇ ਵਿਚ ਮੁੜ-ਪਛਾਣ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਇਸ ਨੂੰ ਹਾਲੇ ਵੀ ਘੱਟ ਖਤਰਾ ਹੈ ਹੋਣ ਲਈ ਵਿਖਾਈ ਹੋ ਸਕਦਾ ਹੈ. ਸਭ ਦੇ ਬਾਅਦ, ਫਿਲਮ ਰੇਟਿੰਗ ਬਹੁਤ ਹੀ ਸੰਵੇਦਨਸ਼ੀਲ ਨਹੀ ਜਾਪਦੀ ਹੈ. ਹੈ, ਜੋ ਕਿ ਆਮ ਵਿੱਚ ਇਹ ਸੱਚ ਹੈ, ਹੋ ਸਕਦਾ ਹੈ, ਜਦਕਿ, dataset ਵਿਚ 500,000 ਲੋਕ ਦੇ ਕੁਝ ਲਈ, ਫਿਲਮ ਰੇਟਿੰਗ ਕਾਫ਼ੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੋ ਸਕਦਾ ਹੈ. ਅਸਲ ਵਿਚ, ਡੀ-anonymization ਦੇ ਜਵਾਬ ਵਿਚ ਇਕ closeted ਲੈਸਬੀਅਨ ਔਰਤ ਨੂੰ Netflix ਦੇ ਖਿਲਾਫ ਇੱਕ ਕਲਾਸ-ਐਕਸ਼ਨ ਮੁਕੱਦਮੇ ਵਿਚ ਸ਼ਾਮਲ ਹੋ. ਇੱਥੇ ਸਮੱਸਿਆ ਦਾ ਆਪਣੇ ਮੁਕੱਦਮੇ ਵਿਚ ਪ੍ਰਗਟ ਕੀਤਾ ਗਿਆ ਸੀ, ਦੀ ਹੈ (Singel 2009) :
"[ਐਮ] ovie ਅਤੇ ਰੇਟਿੰਗ ਡਾਟਾ ਇੱਕ ਹੋਰ ਬਹੁਤ ਹੀ ਨਿੱਜੀ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ ਕੁਦਰਤ [SIC] ਦੀ ਜਾਣਕਾਰੀ ਸ਼ਾਮਿਲ ਹੈ. ਮਬਰ ਦੀ ਫਿਲਮ ਡਾਟਾ ਨੂੰ ਇੱਕ Netflix ਸਦੱਸ ਦੇ ਨਿੱਜੀ ਦਿਲਚਸਪੀ ਅਤੇ / ਜ ਝੁਕਾਓ, ਮਾਨਸਿਕ ਬੀਮਾਰੀ, ਸ਼ਰਾਬ ਤੱਕ ਰਿਕਵਰੀ, ਅਤੇ ਅਿਤਆਚਾਰ incest ਤੱਕ, ਸਰੀਰਕ ਸ਼ੋਸ਼ਣ, ਘਰੇਲੂ ਹਿੰਸਾ, ਹਰਾਮਕਾਰੀ ਅਤੇ ਬਲਾਤਕਾਰ ਸਮੇਤ ਵੱਖ-ਵੱਖ ਬਹੁਤ ਹੀ ਨਿੱਜੀ ਮੁੱਦੇ, ਦੇ ਨਾਲ ਸੰਘਰਸ਼ ਪਰਦਾਫ਼ਾਸ਼. "
Netflix ਪੁਰਸਕਾਰ ਡਾਟਾ ਦੇ ਡੀ-anonymization ਲੱਗਦਾ ਹੈ ਦੋਨੋ ਹੈ, ਜੋ ਕਿ ਸਭ ਡਾਟਾ ਸੰਭਾਵਿਤ ਪਛਾਣ ਹੈ ਅਤੇ ਸਭ ਡਾਟਾ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ, ਜੋ ਕਿ. ਇਸ ਮੌਕੇ 'ਤੇ, ਤੁਹਾਨੂੰ ਸੋਚਦੇ ਹੋ ਸਕਦਾ ਹੈ, ਜੋ ਕਿ ਇਸ ਨੂੰ ਸਿਰਫ ਡਾਟਾ ਹੈ, ਜੋ ਕਿ ਹੈ ਕਿ ਲੋਕ ਇਸ ਬਾਰੇ ਹੋਣ ਲਈ ਹਕੀਕਤ ਨੂੰ ਲਾਗੂ ਹੁੰਦਾ ਹੈ. ਹੈਰਾਨੀ ਦੀ ਗੱਲ ਹੈ, ਜੋ ਕਿ ਇਸ ਕੇਸ ਨਹੀ ਹੈ. ਜਾਣਕਾਰੀ ਦੇ ਕਾਨੂੰਨ ਦੀ ਬੇਨਤੀ ਦੀ ਇੱਕ ਆਜ਼ਾਦੀ ਦੇ ਜਵਾਬ ਵਿੱਚ, ਨਿਊਯਾਰਕ ਸਿਟੀ ਸਰਕਾਰ 2013 ਵਿਚ ਨਿਊਯਾਰਕ ਵਿਚ ਹਰ ਟੈਕਸੀ ਰਾਈਡ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਜਾਰੀ, ਪਿੱਕਅੱਪ ਵੀ ਸ਼ਾਮਲ ਹੈ ਅਤੇ ਅਧਿਆਇ 2 ਵਾਰ, ਸਥਾਨ, ਅਤੇ ਕਿਰਾਏ ਮਾਤਰਾ (ਯਾਦ ਬੰਦ ਨੂੰ ਖਤਮ ਹੈ, ਜੋ ਕਿ Farber (2015) ਲੇਬਰ ਅਰਥਸ਼ਾਸਤਰ ਵਿਚ ਮਹੱਤਵਪੂਰਨ ਮਨਮਤਿ) ਨੂੰ ਟੈਸਟ ਕਰਨ ਲਈ ਇਸ ਨੂੰ ਡਾਟਾ ਵਰਤਿਆ. ਪਰ ਟੈਕਸੀ ਸਫ਼ਰ ਬਾਰੇ ਇਹ ਡਾਟਾ ਸ਼ੁਰੂਆਤੀ ਲੱਗਦਾ ਹੈ ਹੋ ਸਕਦਾ ਹੈ, ਕਿਉਕਿ ਇਸ ਨੂੰ ਲੋਕ ਬਾਰੇ ਜਾਣਕਾਰੀ ਹੋਣ ਦਾ ਨਹੀ ਹੈ, Anthony Tockar ਨੂੰ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ ਇਸ ਟੈਕਸੀ dataset ਅਸਲ ਵਿੱਚ ਲੋਕ ਬਾਰੇ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਦੀ ਲਾਟ ਸ਼ਾਮਿਲ ਹੈ. ਮਿਸਾਲ ਲਈ, ਉਸ ਨੇ ਸਭ ਨੂੰ ਸਫ਼ਰ 'ਤੇ ਵੇਖਿਆ hustler ਕਲੱਬ-ਇੱਕ ਵਿਸ਼ਾਲ ਪੱਟੀ ਨਿਊ ਵਿਚ ਕਲੱਬ ਅੱਧੀ ਹੈ ਅਤੇ ਸਵੇਰੇ 6 ਅਤੇ ਫਿਰ ਨਿਊਯਾਰਕ-ਵਿਚਕਾਰ' ਤੇ ਆਪਣੇ ਬੂੰਦ-ਬੰਦ ਟਿਕਾਣੇ ਸ਼ੁਰੂ ਹੋ ਪਾਇਆ. ਇਹ ਖੋਜ ਪ੍ਰਗਟ-ਵਿੱਚ ਤੱਤ-ਇੱਕ ਕੁਝ ਲੋਕ ਜੋ hustler ਕਲੱਬ ਅਕਸਰ ਦੇ ਪਤੇ ਦੀ ਸੂਚੀ (Tockar 2014) . ਇਹ ਕਲਪਨਾ ਕਰਨ ਨੂੰ ਸ਼ਹਿਰ ਦੀ ਸਰਕਾਰ ਦੇ ਮਨ ਵਿਚ ਇਸ ਲਈ ਸੀ, ਜੋ ਕਿ ਜਦ ਇਸ ਨੂੰ ਡਾਟਾ ਜਾਰੀ ਕੀਤੇ ਔਖਾ ਹੈ. ਅਸਲ ਵਿਚ, ਇਸ ਨੂੰ ਵੀ ਉਸੇ ਤਕਨੀਕ ਜੋ ਲੋਕ ਸ਼ਹਿਰ ਦੇ-ਇੱਕ ਮੈਡੀਕਲ ਕਲੀਨਿਕ, ਇੱਕ ਸਰਕਾਰ ਨੂੰ ਇਮਾਰਤ, ਜ ਇੱਕ ਧਾਰਮਿਕ ਸੰਸਥਾ ਵਿੱਚ ਕਿਸੇ ਵੀ ਜਗ੍ਹਾ 'ਤੇ ਜਾਓ ਦੇ ਘਰ ਦੇ ਪਤੇ ਦਾ ਪਤਾ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ.
ਕੋਈ ਵਿਲੱਖਣ ਦਾ ਮਤਲਬ ਹੈ ਕੇ ਇਹ ਦੋ ਕੇਸ-Netflix ਪੁਰਸਕਾਰ ਅਤੇ ਨਿਊਯਾਰਕ ਸਿਟੀ ਟੈਕਸੀ ਡਾਟਾ-ਪ੍ਰਦਰਸ਼ਨ, ਜੋ ਕਿ ਮੁਕਾਬਲਤਨ ਹੁਨਰਮੰਦ ਲੋਕ ਠੀਕ ਡਾਟਾ ਹੈ ਕਿ ਉਹ ਜਾਰੀ ਕੀਤੇ ਵਿਚ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਹੈ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਫੇਲ੍ਹ ਹੈ, ਅਤੇ ਇਹ ਕੇਸ ਹਨ (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . ਅੱਗੇ, ਇਹ ਕੇਸ ਦੇ ਬਹੁਤ ਸਾਰੇ ਵਿੱਚ, ਸਮੱਸਿਆ ਡਾਟਾ ਅਜੇ ਵੀ ਮੁਫ਼ਤ ਉਪਲੱਬਧ ਆਨਲਾਈਨ ਹੈ, ਕਦੇ ਇੱਕ ਡਾਟਾ ਰੀਲਿਜ਼ ਵਿਗਾੜੇ ਦੀ ਮੁਸ਼ਕਲ ਦਾ ਸੰਕੇਤ. ਸਮੂਹਿਕ ਇਹ ਮਿਸਾਲ-ਦੇ ਨਾਲ-ਨਾਲ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸਿੱਟੇ ਨੂੰ ਨਿੱਜਤਾ-ਖੜਦਾ ਦੇ ਬਾਰੇ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਵਿੱਚ ਖੋਜ. ਖੋਜਕਾਰ ਮੰਨਦੇ ਚਾਹੀਦਾ ਹੈ ਕਿ ਸਭ ਡਾਟਾ ਸੰਭਾਵਿਤ ਪਛਾਣ ਹੈ ਅਤੇ ਸਭ ਡਾਟਾ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ.
ਬਦਕਿਸਮਤੀ ਨਾਲ, ਉਥੇ ਜੋ ਕਿ ਇਸ ਤੱਥ ਨੂੰ ਸਾਰੇ ਡਾਟੇ ਨੂੰ ਸੰਭਾਵਿਤ ਪਛਾਣ ਹੈ ਅਤੇ ਸਭ ਡਾਟਾ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ ਦਾ ਕੋਈ ਸਧਾਰਨ ਦਾ ਹੱਲ ਹੈ. ਪਰ, ਇਕ ਤਰੀਕਾ ਹੈ ਜਾਣਕਾਰੀ ਖਤਰੇ ਨੂੰ ਘੱਟ ਕਰਨ ਲਈ, ਜਦਕਿ ਤੁਹਾਨੂੰ ਡਾਟਾ ਦੇ ਨਾਲ ਕੰਮ ਕਰ ਰਹੇ ਹਨ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਇੱਕ ਡਾਟਾ ਸੁਰੱਖਿਆ ਯੋਜਨਾ ਦੀ ਪਾਲਣਾ ਕਰਨ ਲਈ ਹੈ. ਇਹ ਯੋਜਨਾ ਮੌਕਾ ਹੈ, ਜੋ ਕਿ ਤੁਹਾਡੇ ਡਾਟਾ ਲੀਕ ਕਰਨਗੇ ਅਤੇ ਜੇਕਰ ਇੱਕ ਲੀਕ ਅੱਜਕੱਲ੍ਹ ਹੁੰਦਾ ਹੈ ਨੁਕਸਾਨ ਘੱਟ ਹੋ ਘਟਦੀ ਜਾਵੇਗੀ. ਡਾਟਾ ਨੂੰ ਸੁਰੱਖਿਆ ਦੀ ਯੋਜਨਾ ਦੇ ਖਾਸ, ਅਜਿਹੇ ਦਾ ਜੋ ਕਿ ਇੰਕ੍ਰਿਪਸ਼ਨ ਦੇ ਰੂਪ ਵਿੱਚ ਵਰਤਣ ਲਈ, ਵਾਰ ਵੱਧ ਨੂੰ ਬਦਲ ਜਾਵੇਗਾ, ਪਰ ਯੂਕੇ ਡਾਟਾ ਸਰਵਿਸਿਜ਼ ਮਦਦ 5 ਵਰਗ ਹੈ, ਜੋ ਕਿ ਉਹ 5 safes ਨੂੰ ਕਾਲ ਵਿੱਚ ਇੱਕ ਡਾਟਾ ਸੁਰੱਖਿਆ ਦੀ ਯੋਜਨਾ ਦੇ ਤੱਤ ਦਾ ਆਯੋਜਨ: ਸੁਰੱਖਿਅਤ ਪ੍ਰਾਜੈਕਟ, ਸੁਰੱਖਿਅਤ ਲੋਕ , ਸੁਰੱਖਿਅਤ ਸੈਟਿੰਗ, ਸੁਰੱਖਿਅਤ ਡਾਟਾ, ਅਤੇ ਸੁਰੱਖਿਅਤ ਆਊਟਪੁੱਟ (ਸਾਰਣੀ 6.2) (Desai, Ritchie, and Welpton 2016) . ਪੰਜ safes ਦਾ ਕੋਈ ਵੱਖਰੇ ਸੰਪੂਰਣ ਸੁਰੱਖਿਆ ਮੁਹੱਈਆ ਕਰਦਾ ਹੈ. ਪਰ, ਮਿਲ ਕੇ ਉਹ ਕਾਰਕ ਹੈ, ਜੋ ਕਿ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਘੱਟ ਹੋ ਸਕਦਾ ਹੈ ਦੀ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਮੂਹ ਨੂੰ ਬਣਾਉਣ.
ਸੁਰੱਖਿਅਤ | ਐਕਸ਼ਨ |
---|---|
ਸੁਰੱਖਿਅਤ ਪ੍ਰਾਜੈਕਟ | ਜੋ ਕਿ ਜਿਹੜੇ ਨੈਤਿਕ ਹਨ ਡੇਟਾ ਦੇ ਨਾਲ ਪ੍ਰਾਜੈਕਟ ਸੀਮਿਤ |
ਸੁਰੱਖਿਅਤ ਲੋਕ | ਪਹੁੰਚ ਲੋਕ ਜੋ ਡਾਟੇ ਨਾਲ ਭਰੋਸਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਤੱਕ ਹੀ ਸੀਮਿਤ ਹੈ (ਉਦਾਹਰਨ ਲਈ, ਲੋਕ ਕਰਵਾਈ ਹੈ ਨੈਤਿਕ ਸਿਖਲਾਈ) |
ਸੁਰੱਖਿਅਤ ਡਾਟਾ | ਡਾਟਾ ਡੀ-ਪਛਾਣ ਹੈ ਅਤੇ ਹੱਦ ਸੰਭਵ ਕਰਨ ਲਈ ਏਕੀਕ੍ਰਿਤ |
ਸੁਰੱਖਿਅਤ ਸੈਟਿੰਗ | ਡਾਟਾ ਉਚਿਤ ਸਰੀਰਕ (ਉਦਾਹਰਨ ਲਈ, ਨੂੰ ਲਾਕ ਕਮਰੇ) ਅਤੇ ਸਾਫਟਵੇਅਰ (ਉਦਾਹਰਨ ਲਈ, ਪਾਸਵਰਡ ਦੀ ਸੁਰੱਖਿਆ, ਇੰਕ੍ਰਿਪਟਡ) ਸੁਰੱਖਿਆ ਦੇ ਨਾਲ ਕੰਪਿਊਟਰ ਵਿੱਚ ਸਟੋਰ ਕੀਤਾ ਗਿਆ ਹੈ |
ਸੁਰੱਖਿਅਤ ਆਉਟਪੁੱਟ | ਖੋਜ ਆਉਟਪੁੱਟ ਅਚਾਨਕ ਗੋਪਨੀਯਤਾ ਉਲੰਘਣਾ ਨੂੰ ਰੋਕਣ ਲਈ ਸਮੀਖਿਆ ਕੀਤੀ ਹੈ |
ਜਦਕਿ ਤੁਹਾਨੂੰ ਇਸ ਨੂੰ ਵਰਤ ਰਹੇ ਹੋ ਤੁਹਾਡੇ ਡਾਟਾ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਲਈ ਇਸ ਦੇ ਨਾਲ, ਖੋਜ ਕਾਰਜ ਨੂੰ, ਜਿੱਥੇ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਮੁੱਖ ਹੈ ਇੱਕ ਕਦਮ ਹੋਰ ਖੋਜਕਾਰ ਨਾਲ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਹੈ. ਵਿਗਿਆਨੀ ਆਪਸ ਵਿੱਚ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਵਿਗਿਆਨਕ ਕੋਸ਼ਿਸ਼ ਦੇ ਇੱਕ ਕੋਰ ਮੁੱਲ ਹੈ, ਅਤੇ ਇਸ ਨੂੰ ਬਹੁਤ ਸਹੂਲਤ ਗਿਆਨ ਦੀ ਤਰੱਕੀ. ਇੱਥੇ ਕਾਮਨਜ਼ ਦੇ ਯੂਕੇ ਹਾਊਸ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਦੀ ਮਹੱਤਤਾ ਬਾਰੇ ਦੱਸਿਆ ਹੈ:
"ਡਾਟਾ ਤੱਕ ਪਹੁੰਚ ਬੁਨਿਆਦੀ ਜੇ ਖੋਜਕਾਰ, ਪੈਦਾ ਤਸਦੀਕ ਅਤੇ ਨਤੀਜੇ ਹੈ, ਜੋ ਕਿ ਸਾਹਿਤ 'ਚ ਰਿਪੋਰਟ ਕਰ ਰਹੇ ਹਨ ਤੇ ਬਣਾਉਣ ਲਈ ਹੈ. ਰਵ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਜੋ ਕਿ, ਜਦ ਤੱਕ ਉਥੇ ਇੱਕ ਮਜ਼ਬੂਤ ਕਾਰਨ ਹੈ ਹੋਰ ਹੈ, ਡਾਟਾ ਪੂਰੀ ਖੁਲਾਸਾ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲੱਬਧ ਕੀਤੀ ਹੈ. ਇਸ ਅਸੂਲ ਹੈ, ਜਿੱਥੇ ਵੀ ਸੰਭਵ ਹੈ, ਸਭ ਜਨਤਕ ਫੰਡ ਖੋਜ ਨਾਲ ਸੰਬੰਧਿਤ ਡਾਟਾ ਵਿਆਪਕ ਅਤੇ ਮੁਫ਼ਤ ਉਪਲੱਬਧ ਕੀਤੀ ਜਾਣੀ ਚਾਹੀਦੀ ਹੈ ਦੇ ਨਾਲ ਲਾਈਨ ਵਿਚ. " (Molloy 2011)
ਪਰ, ਇਕ ਹੋਰ ਖੋਜਕਾਰ ਨਾਲ ਆਪਣੇ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਕੇ, ਤੁਹਾਨੂੰ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਆਪਣੇ ਹਿੱਸਾ ਲੈਣ ਲਈ ਵਧ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ. ਇਸ ਲਈ, ਇਸ ਨੂੰ ਲੱਗਦਾ ਹੈ, ਜੋ ਕਿ ਖੋਜਕਾਰ ਜੋ ਆਪਣੇ ਸ਼ੇਅਰ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਡਾਟਾ-ਜ ਆਪਣੇ ਸ਼ੇਅਰ ਕਰਨ ਲਈ ਲੋੜ ਹੁੰਦੀ ਹੈ ਡਾਟਾ-ਕਰ ਰਹੇ ਹਨ ਕਿ ਇੱਕ ਬੁਨਿਆਦੀ ਤਣਾਅ ਦਾ ਸਾਹਮਣਾ ਕਰ. ਇਕ ਪਾਸੇ ਉਹ ਹੋਰ ਵਿਗਿਆਨੀ ਨਾਲ ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਸ਼ੇਅਰ ਕਰਨ ਲਈ ਇੱਕ ਨੈਤਿਕ ਫ਼ਰਜ਼ ਬਣਦਾ ਹੈ, ਖ਼ਾਸ ਕਰਕੇ ਜੇ ਅਸਲੀ ਖੋਜ ਜਨਤਕ ਫੰਡ ਹੈ. ਪਰ, ਉਸੇ ਵੇਲੇ 'ਤੇ, ਖੋਜਕਾਰ ਨੂੰ ਘੱਟ ਕਰਨ ਲਈ ਇੱਕ ਨੈਤਿਕ ਜ਼ਿੰਮੇਵਾਰੀ, ਸੰਭਵ ਤੌਰ' ਤੇ ਤੌਰ 'ਤੇ ਬਹੁਤ ਹੈ, ਆਪਣੇ ਹਿੱਸਾ ਲੈਣ ਲਈ ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਹੈ.
ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ, ਇਸ ਸਮੱਸਿਆ ਦੇ ਇਸ ਨੂੰ ਦਿਸਦਾ ਰੂਪ ਵਿੱਚ ਦੇ ਰੂਪ ਗੰਭੀਰ ਨਹੀ ਹੈ. ਇਹ ਕੋਈ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਤੱਕ ਨਿਰੰਤਰਤਾ ਨਾਲ ਸ਼ੇਅਰ ਜਾਰੀ ਹੈ ਅਤੇ ਭੁੱਲ ਹੈ, ਜਿੱਥੇ ਡਾਟਾ "ਬੇਨਾਮ" ਅਤੇ ਤੱਕ ਪਹੁੰਚ ਕਰਨ ਲਈ ਕਿਸੇ ਵੀ ਵਿਅਕਤੀ ਲਈ ਤਾਇਨਾਤ ਹੈ ਡਾਟਾ (ਚਿੱਤਰ 6.6) ਦੇ ਸੋਚਦੇ ਕਰਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ. ਇਹ ਬਹੁਤ ਅਹੁਦੇ ਦੇ ਦੋਨੋ ਖਤਰੇ ਅਤੇ ਲਾਭ ਹੈ. ਜੋ ਕਿ ਇਸ ਨੂੰ ਆਪਣੇ ਆਪ ਹੀ ਆਪਣੇ ਡਾਟਾ ਸ਼ੇਅਰ ਨਾ ਕਰਨ ਲਈ ਸਭ ਨੈਤਿਕ ਗੱਲ ਇਹ ਨਹੀ ਹੈ, ਹੈ; ਅਜਿਹੇ ਇੱਕ ਪਹੁੰਚ ਸਮਾਜ ਲਈ ਬਹੁਤ ਸਾਰੇ ਸੰਭਾਵੀ ਲਾਭ ਖਤਮ ਕਰਦਾ ਹੈ. ਰਿਟਰਨਿੰਗ ਸੁਆਦ ਨੂੰ, ਸਬੰਧ ਅਤੇ ਟਾਈਮ, ਇੱਕ ਮਿਸਾਲ ਅਧਿਆਇ ਵਿਚ ਪਿਛਲੇ ਚਰਚਾ ਕੀਤੀ, ਡਾਟਾ ਰੀਲਿਜ਼ ਦੇ ਖਿਲਾਫ ਬਹਿਸ ਹੈ, ਜੋ ਕਿ ਸਿਰਫ ਸੰਭਵ ਪਹੁੰਚਾਉਣ 'ਤੇ ਧਿਆਨ ਹੈ ਅਤੇ ਹੈ, ਜੋ ਕਿ ਸੰਭਵ ਲਾਭ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਜ਼ਿਆਦਾ ਇਕ-ਪਾਸੜ ਹਨ; ਮੈਨੂੰ ਹੇਠ ਵਿੱਚ ਹੋਰ ਵਿਸਥਾਰ ਵਿੱਚ ਇਸ ਨੂੰ ਇੱਕ-ਪਾਸੜ, ਜ਼ਿਆਦਾ ਸੁਰੱਖਿਆ ਪਹੁੰਚ ਨਾਲ ਸਮੱਸਿਆ ਦਾ ਵਰਣਨ ਜਦ ਮੈਨੂੰ ਅਨਿਸ਼ਚਿਤਤਾ (ਹਿੱਸਾ 6.6.4) ਦੇ ਬਾਵਜੂਦ ਫ਼ੈਸਲੇ ਕਰਨ ਬਾਰੇ ਸਲਾਹ ਦੀ ਪੇਸ਼ਕਸ਼ ਹੋਵੋਗੇ.
ਅੱਗੇ, ਇਹ ਦੋ ਅਤਿ ਮਾਮਲੇ ਦੇ ਵਿਚਕਾਰ ਵਿੱਚ ਕੀ ਮੈਨੂੰ ਇੱਕ ਚਾਰਦੀਵਾਰੀ ਬਾਗ ਪਹੁੰਚ, ਜਿੱਥੇ ਡਾਟਾ, ਜੋ ਲੋਕ ਕੁਝ ਮਾਪਦੰਡ ਨੂੰ ਪੂਰਾ ਹੈ ਅਤੇ ਜੋ ਕੁਝ ਨਿਯਮ ਕੇ ਬੰਨ੍ਹ ਲਈ ਸਹਿਮਤ ਨਾਲ ਸ਼ੇਅਰ ਕੀਤੀ ਹੈ ਕਹਿੰਦੇ ਹੋਵੋਗੇ ਹੈ (ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਆਈਆਰਬੀ ਤੱਕ ਨਿਗਰਾਨੀ ਹੈ ਅਤੇ ਇੱਕ ਡਾਟਾ ਪ੍ਰੋਟੈਕਸ਼ਨ ਪਲਾਨ) . ਇਹ ਚਾਰਦੀਵਾਰੀ ਬਾਗ ਪਹੁੰਚ ਰੀਲਿਜ਼ ਦੇ ਲਾਭ ਦੇ ਕਈ ਦਿੰਦਾ ਹੈ ਅਤੇ ਘੱਟ ਜੋਖਮ ਨਾਲ ਭੁੱਲੋ. ਬੇਸ਼ੱਕ, ਇੱਕ ਚਾਰਦੀਵਾਰੀ ਬਾਗ ਪਹੁੰਚ ਬਹੁਤ ਸਾਰੇ ਸਵਾਲ-ਜੋ ਪਹੁੰਚ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ, ਕੀ ਹਾਲਾਤ ਦੇ ਤਹਿਤ, ਇਸ ਲਈ ਕਿੰਨਾ ਚਿਰ ਹੈ, ਜੋ ਬਣਾਈ ਰੱਖਣ ਅਤੇ ਚਾਰਦੀਵਾਰੀ ਬਾਗ ਪੁਲਿਸ ਨੂੰ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ ਆਦਿ-ਪਰ ਇਹ ਪਹਾੜ ਨਹੀ ਹਨ ਬਣਾਉਦਾ ਹੈ. ਅਸਲ ਵਿਚ, ਉੱਥੇ ਹੀ ਜਗ੍ਹਾ 'ਹੈ, ਜੋ ਕਿ ਖੋਜਕਾਰ ਅਜਿਹੇ ਡਾਟਾ ਮਿਸ਼ੀਗਨ ਯੂਨੀਵਰਸਿਟੀ' ਤੇ ਸਿਆਸੀ ਅਤੇ ਸਮਾਜਿਕ ਰਿਸਰਚ ਦੇ ਲਈ ਇੰਟਰ-ਯੂਨੀਵਰਸਿਟੀ ਕਨਸੋਰਟੀਅਮ ਦੇ ਅਕਾਇਵ ਦੇ ਤੌਰ ਤੇ ਹੁਣ ਇਸਤੇਮਾਲ ਕਰ ਸਕਦੇ ਹੋ, ਵਿੱਚ ਚਾਰਦੀਵਾਰੀ ਬਾਗ ਕੰਮ ਕਰ ਰਹੇ ਹਨ.
ਇਸ ਲਈ, ਜਿੱਥੇ ਕਿ ਆਪਣੇ ਅਧਿਐਨ ਤੱਕ ਡਾਟਾ ਕੋਈ ਸ਼ੇਅਰਿੰਗ, ਚਾਰਦੀਵਾਰੀ ਬਾਗ ਦੇ ਨਿਰੰਤਰਤਾ 'ਤੇ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਜਾਰੀ ਹੈ ਅਤੇ ਭੁੱਲ? ਇਹ ਤੁਹਾਡੇ ਡਾਟਾ ਦਾ ਵੇਰਵਾ ਤੇ ਨਿਰਭਰ; ਖੋਜਕਾਰ ਕਾਨੂੰਨ ਅਤੇ ਪਬਲਿਕ ਦਿਲਚਸਪੀ ਲਈ ਪਰਸਨਜ਼, ਭਲਾਈ, ਜਸਟਿਸ ਦੇ ਲਈ ਆਦਰ ਹੈ, ਅਤੇ ਆਦਰ ਸੰਤੁਲਨ ਚਾਹੀਦਾ ਹੈ. ਜਦ ਹੋਰ ਫੈਸਲੇ ਲਈ ਉਚਿਤ ਸੰਤੁਲਨ ਦਾ ਜਾਇਜ਼ਾ ਖੋਜਕਾਰ ਸਲਾਹ ਅਤੇ IRBs ਦੀ ਪ੍ਰਵਾਨਗੀ ਦੀ ਮੰਗ ਹੈ, ਅਤੇ ਡਾਟਾ ਰੀਲਿਜ਼ ਹੁਣੇ ਹੀ ਹੈ, ਜੋ ਕਿ ਕਾਰਜ ਦੇ ਇਕ ਹੋਰ ਹਿੱਸਾ ਹੋ ਸਕਦਾ ਹੈ. ਹੋਰ ਸ਼ਬਦ ਵਿੱਚ, ਪਰ ਕੁਝ ਲੋਕ ਇੱਕ ਨਿਕੰਮਾ ਨੈਤਿਕ ਖੁੱਭੇ ਦੇ ਤੌਰ ਤੇ ਡਾਟਾ ਰੀਲਿਜ਼ ਦੀ ਸੋਚਦੇ, ਸਾਨੂੰ ਹੀ ਸਿਸਟਮ ਜਗ੍ਹਾ ਵਿੱਚ ਖੋਜਕਾਰ ਨੈਤਿਕਤਾ ਦੇ ਇਹ ਕਿਸਮ ਸੰਤੁਲਨ ਦੀ ਮਦਦ ਲਈ ਹੈ.
ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਬਾਰੇ ਸੋਚਣ ਦੀ ਇਕ ਫਾਈਨਲ ਦਾ ਰਾਹ ਉਦਾਹਰਣ ਹੈ. ਹਰ ਸਾਲ ਕਾਰ ਮੌਤ ਦੇ ਹਜ਼ਾਰ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਹਨ, ਪਰ ਸਾਨੂੰ ਡਰਾਈਵਿੰਗ ਪਾਬੰਦੀ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਨਾ ਕਰੋ. ਅਸਲ ਵਿਚ, ਅਜਿਹੇ ਇੱਕ ਕਾਲ ਡਰਾਇਵਿੰਗ ਲਗਾਉਣੀ ਬੇਹੂਦਾ ਹੋਣਾ ਸੀ, ਕਿਉਕਿ ਗੱਡੀ ਚਲਾਉਣ ਲਈ ਬਹੁਤ ਸਾਰੇ ਸ਼ਾਨਦਾਰ ਕੁਝ ਯੋਗ ਕਰਦਾ ਹੈ. ਇਸ ਦੀ ਬਜਾਇ, ਸਮਾਜ ਰੱਖਦਾ ਹੈ ਜੋ ਗੱਡੀ ਚਲਾ ਸਕਦੇ ਹੋ ਤੇ ਪਾਬੰਦੀ (ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਖਾਸ ਉਮਰ ਹੋਣ ਦੀ ਲੋੜ ਹੈ, ਕੁਝ ਟੈਸਟ ਪਾਸ ਕਰਨ ਦੀ ਲੋੜ ਹੈ) ਅਤੇ ਉਹ ਗੱਡੀ ਚਲਾ ਸਕਦੇ ਹੋ (ਉਦਾਹਰਨ ਲਈ, ਗਤੀ ਸੀਮਾ ਦੇ ਅਧੀਨ). ਸੁਸਾਇਟੀ ਨੇ ਇਹ ਵੀ ਇਹ ਨਿਯਮ (ਉਦਾਹਰਨ ਲਈ, ਪੁਲਿਸ ਨੂੰ) ਨੂੰ ਲਾਗੂ ਕਰਨ ਦੇ ਨਾਲ ਕਰਦਾ ਲੋਕ ਹਨ, ਅਤੇ ਸਾਨੂੰ, ਜੋ ਲੋਕ ਨੂੰ ਉਲੰਘਣਾ ਫੜਿਆ ਰਹੇ ਹਨ, ਨੂੰ ਸਜ਼ਾ. ਸੰਤੁਲਿਤ ਸੋਚ ਦੀ ਇਹ ਉਸੇ ਹੀ ਕਿਸਮ ਦਾ ਹੈ, ਜੋ ਕਿ ਸਮਾਜ ਗੱਡੀ ਚਲਾਉਣ ਦਾ ਪ੍ਰਬੰਧ ਕਰਨ ਲਈ ਲਾਗੂ ਹੈ ਨੂੰ ਵੀ ਡਾਟਾ ਸ਼ੇਅਰ ਕਰਨ ਲਈ ਲਾਗੂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ. ਜੋ ਕਿ ਨਾ ਲਈ ਜ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਵਿਰੁੱਧ ਨਿਰੰਕੁਸ਼ ਬਹਿਸ ਬਣਾਉਣ ਦੀ ਬਜਾਇ, ਮੈਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਵੱਡੀ ਲਾਭ ਬਾਹਰ ਦਾ ਿਹਸਾਬ ਸਾਨੂੰ ਹੋਰ ਡਾਟਾ ਨੂੰ ਹੋਰ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਸ਼ੇਅਰ ਕਰ ਸਕਦਾ ਹੈ ਨੂੰ ਤੱਕ ਆ ਹੈ,.
ਸਿੱਟਾ ਕਰਨ ਲਈ, ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਨਾਟਕੀ ਵਾਧਾ ਹੋਇਆ ਹੈ, ਅਤੇ ਇਸ ਨੂੰ ਲਗਾਉਣਾ ਅਤੇ ਮਾਤਰਾ ਕਰਨ ਲਈ ਬਹੁਤ ਹੀ ਔਖਾ ਹੈ. ਇਸ ਲਈ, ਇਸ ਮੰਨ ਨੂੰ ਹੈ, ਜੋ ਕਿ ਸਭ ਡਾਟਾ ਸੰਭਾਵਿਤ ਪਛਾਣ ਹੈ ਅਤੇ ਸੰਭਾਵੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ ਵਧੀਆ ਹੈ. ਜਾਣਕਾਰੀ ਖਤਰੇ ਨੂੰ ਘੱਟ ਕਰਨ ਲਈ ਹੈ, ਜਦਕਿ ਖੋਜ ਕਰ, ਖੋਜਕਾਰ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਇੱਕ ਡਾਟਾ ਸੁਰੱਖਿਆ ਯੋਜਨਾ ਦੀ ਪਾਲਣਾ ਕਰ ਸਕਦੇ ਹੋ. ਅੱਗੇ, ਜਾਣਕਾਰੀ ਨੂੰ ਖਤਰਾ ਹੋਰ ਵਿਗਿਆਨੀ ਦੇ ਨਾਲ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਤੱਕ ਖੋਜਕਾਰ ਰੋਕਣ ਨਹੀ ਕਰਦਾ ਹੈ.