کاروباری اداروں اور حکومتوں کی طرف سے منعقد کی ڈیٹا تک رسائی حاصل کرنے کے محققین کے لئے مشکل ہیں.
مئی 2014 میں، امریکہ کے قومی سلامتی ایجنڈا ایک عجیب نام ہے کہ، انٹیلی جنس کمیونٹی جامع قومی Cybersecurity انیشی ڈیٹا سینٹر دیہی یوٹاہ میں ایک ڈیٹا سینٹر کھول دیا. تاہم، یہ ڈیٹا سینٹر، یوٹاہ ڈیٹا سینٹر کے نام سے جانا آیا ہے جس میں، حیران کن صلاحیتوں ہے کی رپورٹ ہے. ایک رپورٹ یوٹاہ ڈیٹا سینٹر کی دکان اور "نجی ای میلز کے مکمل مندرجات، سیل فون کالز، اور گوگل کی تلاش سمیت مواصلات کی تمام شکلوں، کے طور پر بھی ذاتی ڈیٹا ٹریلس-پارکنگ رسیدیں، سفر itineraries کے کے تمام قسم کے پر عملدرآمد کرنے کے قابل ہے کہ الزام ، کتابوں کی دکان کی خریداری، اور دیگر ڈیجیٹل `جیب گندگی '" (Bamford 2012) . بڑے اعداد و شمار میں قبضہ کر لیا میں معلومات، زیادہ ذیل میں بیان کیا جائے گا جس کی زیادہ سے زیادہ کے حساس نوعیت کے بارے میں کی ترتیب کے خدشات کے علاوہ میں، یوٹاہ ڈیٹا سینٹر کے محققین کے لئے ناقابل رسائی ہے کہ ایک امیر ڈیٹا کا ذریعہ کا ایک انتہائی مثال ہے. مزید عام طور پر، بڑے اعداد و شمار کے بہت سے ذرائع محققین کنٹرول اور حکومتوں (مثلا، ٹیکس ڈیٹا اور تعلیمی اعداد و شمار) اور کمپنیوں کی طرف سے محدود ہیں کے لئے مفید ہو گا کہ (مثلا، تلاش کرنے کے استفسارات انجن اور فون کال میٹا ڈیٹا). لہذا، ان اعداد و شمار فوری طور پر یونیورسٹیوں میں محققین کے لئے دستیاب نہیں ہو گا، اور سب سے زیادہ بھی حکومتوں یا کمپنیوں میں محققین کے لئے دستیاب نہیں ہو گا.
میرے تجربے میں، یونیورسٹیوں میں مقیم بہت سے محققین نے اس ناقابل رسائی کا ذریعہ غلط سمجھتے. یہ اعداد و شمار پر ناقابل رسائی اداروں اور حکومتوں پر لوگوں، بیوکوف سست، یا لاپرواہ ہیں کیونکہ نہیں ہیں. بلکہ سنگین قانونی، تکنیکی، کاروبار، اور ڈیٹا تک رسائی روکنے کے کہ اخلاقی رکاوٹیں موجود ہیں. مثال کے طور پر، ویب سائٹ کے لئے کچھ شرائط کی خدمت کے معاہدوں صرف اعداد و شمار کے ملازمین کی طرف سے استعمال کیا جا کرنے کے لئے یا سروس کو بہتر بنانے کے لئے اجازت دے. لہذا ڈیٹا کا اشتراک کی بعض اقسام صارفین کی طرف سے جائز قانونی مقدموں کے لئے کمپنیوں کو بے نقاب کر سکتے تھے. اشتراک کے اعداد و شمار میں ملوث کمپنیوں کو کافی کاروبار کے خطرات بھی ہیں. ذاتی تلاش کو ڈیٹا کے اتفاقی طور پر ایک یونیورسٹی کی تحقیق کے منصوبے کا حصہ کے طور پر گوگل سے باہر لیک تو عوام کس طرح جواب دے گی تصور کرنے کی کوشش. اس طرح ایک ڈیٹا کی خلاف ورزی، انتہائی، تو بھی کمپنی کے لئے ایک وجود خطرہ ہو سکتا ہے. لہذا گوگل اور سب سے بڑے بہت خطرے خلاف محققین کے ساتھ ڈیٹا کا اشتراک کرنے کے بارے میں کمپنیوں-ہیں.
اعداد و شمار کے عبد چودھری کی کہانی جانتا ہے کے حقیقت میں، تقریبا ہر کسی کو ایک کی پوزیشن میں ہے جو بڑی مقدار تک رسائی فراہم کرنے کے لئے. 2006 میں وہ AOL تحقیق کے سربراہ تھے تو اس نے جان بوجھ کر جاری کی گئی اس نے سوچا کہ کیا تحقیق کمیونٹی کو 650،000 AOL صارفین کی طرف سے تلاش کے سوالات گمنام ہو گئے تھے. جہاں تک مجھے بتا سکتے ہیں، چوہدری اور AOL میں محققین نیک نیتی تھی اور وہ یہ کہ وہ اعداد و شمار گمنام تھا سوچا. لیکن، وہ غلط تھے. یہ فوری طور پر دریافت کیا گیا تھا کہ اعداد و شمار کے محققین نے سوچا کہ جتنا گمنام نہیں تھے، اور نیو یارک ٹائمز سے نامہ نگاروں کو آسانی کے ساتھ ڈیٹا سیٹ میں لوگوں کی شناخت کرنے کے قابل تھے (Barbaro and Zeller Jr 2006) . ان مسائل کو دریافت کیا گیا ہے ایک بار، چوہدری AOL کی ویب سائٹ سے ڈیٹا کو ہٹا دیا، لیکن یہ بہت دیر ہو چکی تھی. اعداد و شمار کی دیگر ویب سائٹس پر دوبارہ شائع کر دیا گیا تھا، اور آپ کو اس کتاب پڑھ رہے ہیں جب یہ شاید اب بھی دستیاب ہو جائے گا. تحقیق کمیونٹی کے ساتھ ڈیٹا کا اشتراک کرنے کی کوشش کی وجہ سے، چودھری نکالا گیا، اور AOL کے چیف ٹیکنالوجی افسر نے استعفی دے دیا (Hafner 2006) . اس مثال سے پتہ چلتا ہے کے طور پر، ڈیٹا تک رسائی کی سہولت کے لئے کمپنیوں کے اندر مخصوص افراد کے لئے فوائد بہت چھوٹے ہیں اور بدترین حالات کی صورت خوفناک ہے.
تحقیق، تاہم، عام لوگوں کے لئے ناقابل رسائی ہے کہ اعداد و شمار تک رسائی حاصل کر سکتے ہیں. حکومتوں محققین رسائی کے لئے درخواست دینے کی پیروی کر سکتے ہیں کہ طریقہ کار ہے، اور مثال کے بعد میں اس باب شو میں کے طور پر، محققین کبھار کارپوریٹ ڈیٹا تک رسائی حاصل کر سکتے ہیں. مثال کے طور پر، Einav et al. (2015) آن لائن نیلامی کی طرف سے ڈیجیٹل نشانات کا مطالعہ کرنا بے میں ایک محقق کے ساتھ شراکت داری. میں بعد میں باب (دفعہ 2.4.3.2) میں اس تعاون سے آیا ہے کہ تحقیق کے بارے میں مزید بات کریں گے، لیکن یہ اجزاء میں کامیاب شراکت داری میں دیکھتے ہیں کہ چاروں تھا کیونکہ میں اب اس کا ذکر: محقق سود، محقق کی صلاحیت، کمپنی کے مفاد، اور کمپنی کی صلاحیت. دوسرے الفاظ میں، Einav اور ساتھیوں میں دلچسپی رکھتے ہیں اور آن لائن نیلامیوں تعلیم حاصل کرنے کی صلاحیت رکھتے تھے. اور، ای بے بھی تھا. تاہم، میں نے دیکھا ہے بہت سے ممکن تعاون محقق یا کمپنی یا تو ان اجزاء میں سے ایک کا فقدان ناکام رہتے ہیں کیونکہ.
آپ تاہم، ایک کاروبار کے ساتھ شراکت داری کو تیار کرنے کے قابل ہیں، یہاں تک کہ اگر، آپ کے لئے کچھ downsides ہیں. سب سے پہلے، سوالات آپ کے امکان محدود کیا جائے کے ڈیٹا کے ساتھ پوچھ سکتے ہیں کہ؛ کمپنیوں نے ان بری نظر بنا سکتے ہیں کہ تحقیق کی اجازت دینے کا امکان نہیں ہیں. دوئم، آپ شاید دوسرے محققین، جس میں دیگر محققین کی تصدیق اور آپ کے نتائج فراہم کرنے کے قابل نہیں ہو گا کہ اس کا مطلب کے ساتھ آپ کے ڈیٹا کو اشتراک کرنے کے لئے نہیں کر سکیں گے. اس کے علاوہ، ان شراکت کم از کم سود، لوگوں کا خیال ہو سکتا ہے جہاں کہ آپ کے نتائج آپ شراکتوں کی طرف سے متاثر کیا گیا تھا کے ایک تصادم کا تاثر پیدا کر سکتے ہیں. ان downsides میں تمام خطاب کیا جا سکتا، لیکن یہ اعداد و شمار ہے کہ سب کے لئے قابل رسائی نہیں ہے کے ساتھ کام کرنے کے upsides اور downsides دونوں تھا کہ واضح ہونا ضروری ہے.
سمری میں، بڑی ڈیٹا کے بہت سے محققین کے ناقابل رسائی ہے. سنگین قانونی، تکنیکی، کاروبار موجود ہیں، اور ڈیٹا تک رسائی روکنے کے کہ اخلاقی رکاوٹیں، اور ان رکاوٹوں کو دور نہیں جائیں گے. قومی حکومتوں کو عام طور پر ڈیٹا تک رسائی کو چالو کرنے کے لئے طریقہ کار قائم کیا ہے، لیکن اس عمل کو زیادہ ایڈہاک ریاستی اور مقامی سطحوں پر ہو سکتا ہے. اس کے علاوہ، بعض صورتوں میں، محققین کمپنیوں کے ساتھ شراکت داری کے ڈیٹا تک رسائی حاصل کرنے کے لئے کر سکتے ہیں، لیکن اس کے محققین کے لئے مسائل کی ایک قسم کی تشکیل دے سکتے.