গবেষকরা অ্যাক্সেসের জন্য কোম্পানি ও সরকারগুলির দ্বারা পরিচালিত তথ্যগুলি কঠিন।
২014 সালের মে মাসে, মার্কিন ন্যাশনাল সিকিউরিটি এজেন্সি গ্রামাঞ্চলের উটাহে একটি অদ্ভুত নাম দিয়ে গোয়েন্দা সংস্থা সমন্বিত জাতীয় সাইবারসিকিউটিটি ইনিশিয়েটিভ ডেটা সেন্টার চালু করেছে। যাইহোক, এই তথ্য কেন্দ্র, যা উটাহ ডেটা সেন্টার হিসাবে পরিচিত হয়, অদ্ভুত ক্ষমতা আছে রিপোর্ট করা হয় এক রিপোর্টে অভিযোগ করা হয়েছে যে এটি "ব্যক্তিগত ইমেইল, সেল ফোন কল এবং গুগল অনুসন্ধানগুলির সম্পূর্ণ বিষয়বস্তু, ব্যক্তিগত তথ্য ট্রেইস-পার্কিং রিসিটস, ভ্রমণ ভ্রমণপথ, বুকস্টোর ক্রয়ের সম্পূর্ণ বিষয়বস্তু সহ সব ধরনের যোগাযোগ এবং সংরক্ষণ করতে সক্ষম"। , এবং অন্যান্য ডিজিটাল 'পকেট লিটার' " (Bamford 2012) । উটাহ ডেটা সেন্টারটি এমন একটি সমৃদ্ধ তথ্য উত্সের একটি চরম উদাহরণ যা গবেষকদের কাছে প্রবেশযোগ্য নয়। বড় ডেটাতে প্রাপ্ত তথ্যের বেশিরভাগ সংবেদনশীলতার বিষয়ে উদ্বেগ উত্থাপনের পাশাপাশি ইউটা ডেটা সেন্টার একটি চরম উদাহরণ। আরো সাধারণভাবে, বড় ডেটার অনেকগুলি সূত্র যা সরকারগুলির দ্বারা নিয়ন্ত্রিত এবং সীমিত (যেমন, ট্যাক্স ডেটা এবং শিক্ষাগত তথ্য) বা কোম্পানিগুলি (উদাহরণস্বরূপ অনুসন্ধান ইঞ্জিন এবং ফোন কল মেটা-ডেটার জন্য প্রশ্ন) অতএব, যদিও এই তথ্য উত্স বিদ্যমান, তারা সামাজিক গবেষণা উদ্দেশ্যে অকর্মণ্য কারণ তারা প্রবেশযোগ্য নয়।
আমার অভিজ্ঞতায়, বিশ্ববিদ্যালয়গুলির উপর ভিত্তি করে গবেষকরা এই অপ্রতুলতার উৎসকে ভুল বুঝেছেন। এই তথ্যগুলি অপ্রাসঙ্গিক নয় কারণ কোম্পানীর মানুষ এবং সরকারগুলি মূঢ়, অলস, অথবা অশ্রদ্ধ। বরং, গুরুতর আইনি, ব্যবসা এবং নৈতিক বাধা রয়েছে যা ডেটা অ্যাক্সেস প্রতিরোধ করে। উদাহরণস্বরূপ, ওয়েবসাইটগুলির জন্য কিছু শর্তাদির অফারের চুক্তি কেবল কর্মচারীদের দ্বারা ডেটা ব্যবহার করতে বা পরিষেবাটি উন্নত করার অনুমতি দেয় তাই কিছু অংশীদারিত্বের তথ্য শেয়ারিং কোম্পানিগুলি গ্রাহকদের কাছ থেকে বৈধ মামলাগুলি প্রকাশ করতে পারে। তথ্য ভাগ করা জড়িত কোম্পানীর উল্লেখযোগ্য ব্যবসায়িক ঝুঁকি রয়েছে। একটি বিশ্ববিদ্যালয় গবেষণা প্রকল্পের অংশ হিসাবে Google থেকে ব্যক্তিগত অনুসন্ধান ডেটা অকার্যকরভাবে ফাঁস হয়ে গেলে জনসাধারণ কিভাবে প্রতিক্রিয়া করবে তা কল্পনা করুন। এই ধরনের তথ্য লঙ্ঘন, যদি চরম, এমনকি কোম্পানির জন্য একটি অস্তিত্বগত ঝুঁকি হতে পারে। তাই গুগল-এবং সর্বাধিক বড় সংস্থা-গবেষকদের সাথে ডেটা ভাগাভাগি সম্পর্কে খুব ঝুঁকি-বিপরীত।
বস্তুত, বিপুল সংখ্যক তথ্য অ্যাক্সেস প্রদানের পক্ষে অবস্থানকারী প্রায় সবাইই আব্দুর চৌধুরীর গল্প জানে। 2006 সালে, তিনি যখন এওএল গবেষণার প্রধান ছিলেন, তখন তিনি ইচ্ছাকৃতভাবে গবেষণা সম্প্রদায়ের কাছে মুক্তি পেয়েছিলেন যা তিনি 650,000 AOL ব্যবহারকারীদের দ্বারা অনুসন্ধানের নাম বলেছিলেন। যতদূর আমি বলতে পারি, চৌধুরী এবং এএলএলের গবেষকরা ভাল উদ্দেশ্য ছিল, এবং তারা মনে করেছিল যে তারা তথ্যকে বেনামী করেছে। কিন্তু তারা ভুল ছিল। এটি দ্রুত আবিষ্কার করা হয় যে গবেষকরা ধারণা করছেন যে তথ্যগুলি বেনামী নয়, এবং নিউইয়র্ক টাইমস থেকে সংবাদদাতারা সহজে ডেটাসেটে (Barbaro and Zeller 2006) কেউ সনাক্ত করতে সক্ষম হয়েছে। একবার এই সমস্যাগুলি আবিষ্কৃত হয়, চৌধুরী এএল এর ওয়েবসাইট থেকে তথ্য মুছে ফেলা হয়, কিন্তু এটি খুব দেরী ছিল। তথ্য অন্যান্য ওয়েবসাইটগুলিতে পুনরায় পোস্ট করা হয়েছে, এবং আপনি সম্ভবত এই বইটি পড়ার সময় পাওয়া যাবে। চৌধুরীকে বহিস্কার করা হয়েছিল এবং এএল এর প্রধান প্রযুক্তি কর্মকর্তা পদত্যাগ করেছেন (Hafner 2006) । হিসাবে এই উদাহরণ দেখায়, কোম্পানীর ভিতর নির্দিষ্ট ব্যক্তিদের জন্য উপকারিতা ডেটা অ্যাক্সেস সুবিধা খুব ছোট এবং সবচেয়ে খারাপ কেস দৃশ্যকল্প ভয়ঙ্কর হয়।
গবেষকরা সাধারণত, যে তথ্যগুলি সাধারন জনসাধারণের কাছে অ্যাক্সেসযোগ্য না হয়েও অ্যাক্সেসের সুযোগ পায়, কিছু সরকার পদ্ধতি আছে যা গবেষকরা অ্যাক্সেসের জন্য আবেদন করার জন্য অনুসরণ করতে পারে এবং পরে এই অধ্যায়ে দেখানো উদাহরণ হিসাবে, গবেষকরা মাঝে মাঝে কর্পোরেট ডেটার অ্যাক্সেস লাভ করতে পারেন উদাহরণস্বরূপ, Einav et al. (2015) অনলাইনে নিলামের জন্য ইবেতে একজন গবেষক অংশীদার। আমি এই অধ্যয়নের মধ্যে পরে সহযোগিতার গবেষণা থেকে আরও কিছু আলোচনা করব, কিন্তু আমি এখন এটি উল্লেখ করছি কারণ এটি সবগুলি চারটি উপাদান ছিল যা আমি সফল অংশীদারিগুলিতে দেখেছি: গবেষক আগ্রহ, গবেষক ক্ষমতা, কোম্পানির আগ্রহ এবং কোম্পানির সামর্থ্য । আমি অনেক সম্ভাব্য সহযোগিতা ব্যর্থ দেখেছি কারণ গবেষক বা অংশীদার- এটি একটি কোম্পানী বা সরকার-এই উপাদানগুলির মধ্যে একটির অভাব।
এমনকি যদি আপনি একটি ব্যবসার সাথে অংশীদারিত্ব বিকাশ করতে বা সীমিত সরকার তথ্য অ্যাক্সেস করতে সক্ষম হয়, তবে, আপনার জন্য কিছু downsides আছে। প্রথমত, আপনি সম্ভবত আপনার তথ্য অন্যান্য গবেষকদের সাথে ভাগ করতে পারবেন না, যার অর্থ অন্যান্য গবেষকরা আপনার ফলাফল যাচাই এবং প্রসারিত করতে সক্ষম হবে না। দ্বিতীয়ত, আপনি যে প্রশ্নগুলি চাইতে পারেন তা সীমাবদ্ধ হতে পারে; কোম্পানি তাদের খারাপ চেহারা করতে পারে যে গবেষণা অনুমোদন অসম্ভাব্য। অবশেষে, এই অংশীদারিত্ব অন্তত অন্তর্বর্তী স্বার্থের সংঘাতের সৃষ্টি করতে পারে, যেখানে লোকেরা মনে করতে পারে যে আপনার ফলাফলগুলি আপনার অংশীদারিত্বের দ্বারা প্রভাবিত ছিল। এই সমস্ত downsides উদ্দেশ্য করা যেতে পারে, কিন্তু এটি পরিষ্কার করা গুরুত্বপূর্ণ যে তথ্য যে সমস্ত অ্যাক্সেসযোগ্য না হয় সঙ্গে কাজ করে উভয় upsides এবং downsides উভয় আছে
সারসংক্ষেপে, বড় বড় তথ্য গবেষকদের কাছে অ্যাক্সেসযোগ্য নয়। ডেটা অ্যাক্সেস প্রতিরোধে গুরুতর আইনী, ব্যবসায় এবং নৈতিক বাধা রয়েছে এবং প্রযুক্তি বাধা হিসাবে এই বাধাগুলি চলে যাবে না কারণ তারা প্রযুক্তিগত বাধাগুলি নয়। কিছু ন্যাশনাল সরকার কিছু তথ্যসমুহের জন্য ডাটা অ্যাক্সেস সক্ষম করার জন্য পদ্ধতিগুলি প্রবর্তন করেছে, তবে প্রক্রিয়াটি বিশেষভাবে রাষ্ট্র ও স্থানীয় পর্যায়ে অ্যাড হক। এছাড়াও, কিছু ক্ষেত্রে, গবেষকরা তথ্য অ্যাক্সেস প্রাপ্ত করার জন্য কোম্পানিগুলির সাথে অংশীদার করতে পারেন, তবে এটি গবেষকদের এবং কোম্পানীর জন্য বিভিন্ন ধরণের সমস্যা তৈরি করতে পারে।