ব্যবসা ও সরকার দ্বারা অনুষ্ঠিত তথ্য গবেষকরা অ্যাক্সেস করার জন্য কঠিন হয়.
মে 2014 সালে, মার্কিন যুক্তরাষ্ট্রের জাতীয় নিরাপত্তা এজেন্ডা একটি বিশ্রী নাম আছে, ইন্টেলিজেন্স কমিউনিটি কম্প্রিহেনসিভ জাতীয় সাইবার নিরাপত্তা ইনিশিয়েটিভ ডাটা সেন্টার গ্রামীণ উটাহ একটি তথ্য কেন্দ্র খোলা. যাইহোক, এই ডাটা সেন্টার, যা উটাহ ডাটা সেন্টার হিসেবে পরিচিত হতে এসেছে, স্তম্ভিত ক্ষমতা আছে বলে জানা যায়. এক প্রতিবেদনে অভিযোগ করে উটাহ ডাটা সেন্টার সংরক্ষণ এবং "ব্যক্তিগত ইমেইলের সম্পূর্ণ বিষয়বস্তু, সেল ফোন কল, এবং Google অনুসন্ধান সহ যোগাযোগের সব ফর্ম, সেইসাথে ব্যক্তিগত তথ্য গ্রামাঞ্চলে ভ্রমণ-পার্কিং রসিদ, ভ্রমণের ভ্রমণপথগুলি সব বিশৃঙ্খলভাবে প্রক্রিয়া করতে সক্ষম হয় , বইয়ের দোকান ক্রয় এবং অন্যান্য ডিজিটাল `পকেট শিবিকা" (Bamford 2012) . তথ্য, আরো নীচে বর্ণিত হেবন বড় তথ্য বন্দী অনেক সংবেদনশীল প্রকৃতি সম্পর্কে বৃদ্ধিকারী উদ্বেগ ছাড়াও, উটাহ ডাটা সেন্টারের একটি সমৃদ্ধ ডাটাবেস যে গবেষকরা অপ্রাপ্য হয় একটি চরম দৃষ্টান্ত. আরো সাধারণভাবে, বড় তথ্য অনেক উৎস যে উপযোগী হতে হবে গবেষক নিয়ন্ত্রিত ও সরকার (যেমন, ট্যাক্স তথ্য ও শিক্ষামূলক তথ্য) এবং কোম্পানি দ্বারা সীমাবদ্ধ করা হয় (যেমন, প্রশ্নের অনুসন্ধান ইঞ্জিন এবং ফোন কল মেটা-ডেটা). অতএব, এই তথ্য অবিলম্বে বিশ্ববিদ্যালয়ে গবেষকরা উপলব্ধ হবে না, এবং সবচেয়ে এমনকি সরকার বা কোম্পানির গবেষকরা উপলব্ধ হবে না.
আমার অভিজ্ঞতায় অনেক বিশ্ববিদ্যালয়ে ভিত্তিক গবেষকরা এই দুর্লভতা উৎস ভুল বোঝে. এই ডেটা অপ্রাপ্য কারণ কোম্পানি এবং সরকার এ মানুষ, বোকা অলস, বা uncaring হয় না. বরং সেখানে গুরুতর আইনি, কারিগরি, ব্যবসা, এবং নৈতিক বাধা যে তথ্য প্রবেশাধিকার রোধ হয়. উদাহরণস্বরূপ, ওয়েবসাইটের জন্য কিছু পদ অফ সার্ভিস চুক্তি শুধুমাত্র ডেটা কর্মীদের দ্বারা ব্যবহার করা বা পরিষেবা উন্নত করার জন্য অনুমতি দেয়. তাই তথ্য শেয়ারিং এর নির্দিষ্ট ফরম গ্রাহকদের কাছ থেকে বৈধ মামলা কোম্পানিগুলোর প্রভাবাধীন পারে. এছাড়া শেয়ারিং তথ্য জড়িত কোম্পানিগুলোর সারগর্ভ ব্যবসার ঝুঁকি আছে. কল্পনা করা যদি ব্যক্তিগত অনুসন্ধান ডেটা ঘটনাক্রমে একটি বিশ্ববিদ্যালয় গবেষণা প্রকল্পের অংশ হিসেবে Google থেকে আউট অবাঞ্ছিতভাবে কিভাবে পাবলিক প্রতিক্রিয়া হবে চেষ্টা. এই ধরনের একটি তথ্য ভঙ্গ, চরম, এমনকি কোম্পানির জন্য একটি অস্তিত্ববাদের ঝুঁকি হতে পারে. তাই গুগল এবং সবচেয়ে বড় খুব ঝুঁকি পরাঙ্মুখ গবেষকদের সঙ্গে তথ্য ভাগ করে নেওয়ার বিষয়ে কোম্পানি-হয়.
আসলে, প্রায় সবাই কে একটি শক্তিশালী অবস্থানে রয়েছে প্রচুর পরিমাণে এক্সেস প্রদান ডাটা আবদুর চৌধুরীর গল্প জানে. 2006 সালে, যখন তিনি এওএল গবেষণা প্রধান ছিলেন, তিনি ইচ্ছাকৃতভাবে মুক্তি কি সে চিন্তা গবেষণা সম্প্রদায় 650,000 এওএল ব্যবহারকারীদের কাছ থেকে সার্চ কোয়েরি অনামী হয়. যতদুর আমি বলতে পারেন, চৌধুরী এবং AOL গবেষকরা ভাল উদ্দেশ্য ছিল এবং তারা মনে করল যে, তারা তথ্য অনামী ছিল. কিন্তু, তারা ভুল ছিল. এটা দ্রুত আবিষ্কৃত হয় যে তথ্য হিসাবে বেনামী হিসেবে গবেষকরা চিন্তা ছিল না, এবং নিউ ইয়র্ক টাইমস থেকে সাংবাদিকদের স্বচ্ছন্দে সঙ্গে ডেটাসেটে লোকেদের শনাক্ত করতে পেরেছি (Barbaro and Zeller Jr 2006) . একবার এই সমস্যার আবিষ্কৃত হয়েছিল, চৌধুরী এওএল এর ওয়েবসাইট থেকে তথ্য মুছে ফেলা, কিন্তু এটা খুব দেরি হয়ে গেছে. তথ্য অন্যান্য ওয়েবসাইটগুলির রিপোস্ট করা হয়েছে, এবং এটি সম্ভবত এখনও উপলব্ধ যখন আপনি এই বই পড়া হয় হবে. গবেষণা সম্প্রদায়ের সাথে তথ্য ভাগ করার জন্য তার প্রচেষ্টার কারণে চৌধুরী বহিস্কার করা হয়, এবং AOL এর প্রধান প্রযুক্তি কর্মকর্তা পদত্যাগ (Hafner 2006) . এই উদাহরণ দেখায় যেমন, কোম্পানি তথ্য অ্যাক্সেস সহজতর ভেতরে নির্দিষ্ট ব্যক্তিদের জন্য সুবিধা বেশ ছোট হয় এবং খারাপ-কেস দৃশ্যকল্প ভয়ানক.
গবেষণা, তবে যে সাধারণ জনসাধারণের জন্য অ্যাক্সেসযোগ্য নয় ডেটাতে অ্যাক্সেস লাভ করতে পারেন. সরকারগুলো পদ্ধতি যে গবেষকরা অ্যাক্সেসের জন্য আপনি আবেদন অনুসরণ করতে পারেন আছে, এবং উদাহরণ এই অধ্যায়ের পরবর্তী প্রদর্শনী হিসেবে গবেষকরা মাঝেমধ্যে কর্পোরেট তথ্য অ্যাক্সেস লাভ করতে পারেন. উদাহরণস্বরূপ, Einav et al. (2015) ইবে একজন গবেষক অনলাইন নিলাম থেকে ডিজিটাল ট্রেস অধ্যয়ন সঙ্গে যৌথভাবে কাজ. আমি গবেষণা করে পরবর্তী অধ্যায়ে (ধারা 2.4.3.2) মধ্যে এই সহযোগিতা থেকে এসেছেন সম্পর্কে আরো আলোচনা করব, কিন্তু কারণ এটা যে উপাদানগুলো আমি সফল জুটি দেখতে চারটি ছিল আমি এখন এটা উল্লেখ: গবেষক আগ্রহ, গবেষক সামর্থ্য, কোম্পানির স্বার্থ এবং কোম্পানির সামর্থ্য. অন্য কথায়, Einav এবং সহকর্মীদের আগ্রহী এবং অনলাইন নিলাম অধ্যয়নরত সক্ষম ছিল. আর, ইবে এছাড়াও ছিল. যাইহোক, আমি দেখা করেছি অনেক সম্ভাব্য সহযোগিতার কারণ হয় গবেষক বা কোম্পানী এই উপাদানগুলো এক ইঙ্গিতও ব্যর্থ.
এমনকি যদি আপনি একটি ব্যবসার সঙ্গে একটি অংশীদারিত্ব গড়ে তুলতে অবশ্য সক্ষম হয়, সেখানে আপনার জন্য কিছু মূল্যবান হয়. প্রথমত, যে প্রশ্ন আপনি সঙ্গে সম্ভবত সীমাবদ্ধ করা তথ্য দিয়ে অনুরোধ করতে পারেন; কোম্পানি গবেষণা যে তাদের খারাপ বানাতে পারে করার সম্ভাবনা কম. দ্বিতীয়ত, আপনি সম্ভবত না অন্যান্য গবেষকরা, যার মানে অন্য গবেষকদের যাচাই করতে এবং আপনার ফলাফল প্রসারিত করতে সক্ষম হবে না সঙ্গে আপনার তথ্য ভাগ করে নিতে সক্ষম হবে. উপরন্তু, এই অংশীদারিত্ব সুদ, যেখানে মানুষ মনে হতে পারে যে আপনার ফলাফল আপনার অংশীদারিত্ব দ্বারা প্রভাবিত হয়েছিল একটি বিরোধের অন্তত চেহারা তৈরি করতে পারেন. এই মূল্যবান সকল সুরাহা করা যেতে পারে, কিন্তু এটা পরিষ্কার হবে যে তথ্য সবার কাছে অ্যাক্সেসযোগ্য হয় না সঙ্গে কাজ উভয় upsides এবং মূল্যবান ছিল গুরুত্বপূর্ণ.
সংক্ষেপে বলা যায়, বড় তথ্য প্রচুর গবেষকরা অ্যাক্সেসযোগ্য নয়. গুরুতর আইনগত, কারিগরি, ব্যবসা, এবং নৈতিক বাধা যে ডেটা অ্যাক্সেস প্রতিরোধ, এবং এই বাধা দূরে যেতে হবে. জাতীয় সরকার সাধারণভাবে ডেটা অ্যাক্সেস সক্ষম পদ্ধতি প্রতিষ্ঠা করেছে, কিন্তু প্রক্রিয়া আরো তদর্থক রাষ্ট্র এবং স্থানীয় স্তরে হতে পারে. এছাড়াও, কিছু ক্ষেত্রে, গবেষক কোম্পানীর সঙ্গে অংশীদার ডেটা অ্যাক্সেস প্রাপ্ত করতে পারেন, কিন্তু এই গবেষকদের জন্য সমস্যার বিভিন্ন তৈরি করতে পারেন.