2.3.2.7 সংবেদনশীল

তথ্য কোম্পানি এবং সরকার আছে কিছু স্পর্শকাতর.

স্বাস্থ্য বীমা কোম্পানি চিকিৎসা তাদের গ্রাহকদের দ্বারা গৃহীত যত্ন সম্পর্কে তথ্য পুঙ্খানুপুঙ্খ বর্ননা করেছি. এই তথ্য স্বাস্থ্য সম্পর্কে গুরুত্বপূর্ণ গবেষণার জন্য ব্যবহার করা যেতে পারে, কিন্তু যদি এটা হয়ে ওঠে জনসাধারণের এটা সম্ভাব্য মানসিক ক্ষতি (যেমন, বিমূঢ়তা) এবং অর্থনৈতিক ক্ষতি (কর্মসংস্থানের যেমন, ক্ষতি) হতে পারে. স্বাতন্ত্র্যসূচক, অনেক বড় তথ্য সূত্র থেকে এ পর্যন্ত যে তথ্য সংবেদনশীল আছে. এই তথ্য সংবেদনশীল প্রকৃতি কারণ যে বড় তথ্য সূত্র প্রায়ই অনধিগম্য (উপরে বর্ণিত) হয় অংশ.

ওয়ান ওয়ে যে গবেষকরা এই পরিস্থিতি মোকাবেলা করার চেষ্টা ডি চিহ্নিত ডেটাসেট সংবেদনশীল তথ্য আছে হয়. কিন্তু, হিসাবে আমি অধ্যায় 6 (নীতিশাস্ত্র) এই পদ্ধতির গুরুত্ব সহকারে যে উপায়ে ব্যাপকভাবে উভয় সমাজবিজ্ঞানীদের এবং তথ্য বিজ্ঞানীদের দ্বারা প্রশংসা করা হয় সীমিত বিস্তারিতভাবে দেখাব.

উপসংহার ইন, আজ (এবং আগামীকাল) এর বড় তথ্য সূত্র সাধারণত দশ বৈশিষ্ট্য আছে. ভাল বৈশিষ্ট্য-বড়, সর্বদা চলমান, এবং অনেকেই ডিজিটাল বয়স কোম্পানিতে সত্য থেকে nonreactive আসা এবং সরকার একটি স্কেল যা পূর্বে সম্ভব ছিল না এ তথ্য সংগ্রহ করতে সক্ষম হয়. আর খারাপ বৈশিষ্ট্য-অসম্পূর্ণ, দুর্গম, অ প্রতিনিধির অনেক, drifting, আলগোরিদিমিক্যালি, কিংকর্তব্যবিমূঢ়, দুর্গম মলিন, এবং সংবেদনশীল-আসা সত্য যে তথ্য গবেষকদের জন্য গবেষকরা দ্বারা সংগ্রহ করা হয় থেকে. এই বৈশিষ্ট্য বুঝতে বিগ ডাটা থেকে শেখার একটি প্রয়োজনীয় প্রথম পদক্ষেপ. আর এখন আমরা কৌশল আমরা এই তথ্য সঙ্গে ব্যবহার করতে পারেন গবেষণা কাজে লাগান.