کمپنیوں اور حکومتوں کی جانب سے منعقد کردہ اعداد و شمار محققین تک رسائی حاصل کرنا مشکل ہے.
مئی 2014 میں، امریکی نیشنل سیکیورٹی ایجنسی نے دیہی یوٹا میں ایک غیر معمولی نام، انٹیلیجنس کمیونٹی جامع قومی سائبریکچر ایونیٹیٹ ڈیٹا سینٹر کے ساتھ ایک ڈیٹا سینٹر کھول دیا. تاہم، یہ ڈیٹا سینٹر، جو یوٹاہ ڈیٹا سینٹر کے طور پر جانا جاتا ہے، اس کو حیرت انگیز صلاحیتوں کی اطلاع دی گئی ہے. ایک رپورٹ کا دعوی کرتا ہے کہ یہ تمام مواصلات کو ذخیرہ کرنے اور عمل کرنے میں کامیاب ہے جس میں "نجی ای میلز، سیل فون کالز، اور Google کی تلاشوں، اور ساتھ ساتھ ذاتی ڈیٹا ٹریلز، پارکنگ کی رسیدیں، سفر کا سفر، کتاب اسٹور خریداری ، اور دیگر ڈیجیٹل 'جیبی لیٹر' ' (Bamford 2012) . بڑے ڈیٹا میں قبضہ کر لیا گیا بہت زیادہ معلومات کے حساس نوعیت کے بارے میں خدشات کو بڑھانے کے علاوہ، یوٹہ ڈیٹا سینٹر ایک امیر ڈیٹا ذریعہ کی ایک انتہائی مثال ہے جو محققین کے قابل نہیں ہے. عام طور پر، بڑے ڈیٹا کے بہت سے ذرائع جو مفید ہوسکتے ہیں اور حکومتوں (مثال کے طور پر، ٹیکس کے اعداد و شمار اور تعلیمی اعداد و شمار) یا کمپنیوں (مثال کے طور پر، تلاش کے انجن اور فون کال میٹا ڈیٹا کے سوالات) کی طرف سے محدود ہیں. لہذا، اگرچہ ان اعداد و شمار کے ذرائع موجود ہیں، وہ سماجی تحقیق کے مقاصد کے لئے بیکار ہیں کیونکہ وہ قابل رسائی نہیں ہیں.
میرے تجربے میں، یونیورسٹیوں کی بنیاد پر بہت سے محققین نے اس قابل رسائی کا ذریعہ غلط سمجھا. یہ اعداد و شمار ناقابل قبول نہیں ہیں کیونکہ کمپنیوں اور حکومتوں میں لوگ بیوقوف، سست یا غیر معمولی ہیں. بلکہ، سنگین قانونی، کاروبار، اور اخلاقی رکاوٹوں ہیں جو ڈیٹا تک رسائی کو روکنے کے لۓ ہیں. مثال کے طور پر، ویب سائٹس کے لئے بعض شرائط کے معاہدوں کو صرف ملازمین کی طرف سے استعمال کیا جا سکتا ہے یا خدمت کو بہتر بنانے کی اجازت دیتا ہے. تو ڈیٹا بیس کے بعض قسم کے کمپنیوں کو گاہکوں سے جائز قانونی قوانین کو بے نقاب کر سکتا ہے. اعداد و شمار کا اشتراک کرنے میں شامل کمپنیوں کو کافی کاروباری خطرات بھی ہیں. تصور کرنے کی کوشش کریں کہ کس طرح یونیورسٹی کے تحقیقی منصوبے کے حصے کے طور پر گوگل سے ذاتی تلاش کے اعداد و شمار کو حادثے سے گوگل سے نکال لیا جائے گا. اس طرح کے اعداد و شمار کی خلاف ورزی، اگر انتہائی ہو تو، کمپنی کے لئے بھی حتمی خطرہ ہوسکتا ہے. لہذا Google اور سب سے بڑی کمپنیوں - محققین کے ساتھ اشتراک کرنے کے اعداد و شمار کے بارے میں بہت خطرناک ہیں.
دراصل، ہر کسی کو جو بڑی مقدار میں ڈیٹا تک رسائی فراہم کرنے کی حیثیت رکھتا ہے وہ اب عبد چودھری کی کہانی جانتا ہے. 2006 میں، جب انہوں نے AOL پر تحقیق کا سربراہ تھا تو انہوں نے جان بوجھ کر تحقیقاتی برادری کو جاری کیا جسے انہوں نے سوچا کہ 650،000 اے او او ایل کے صارفین سے تلاش کے سوالات نامزد کیے گئے تھے. جہاں تک میں بتا سکتا ہوں، چودھری اور اے او او میں محققین نے اچھے ارادے کا اظہار کیا، اور انہوں نے سوچا کہ انھوں نے ڈیٹا نام نہاد کیا. لیکن وہ غلط تھے. تیزی سے پتہ چلا گیا کہ اعداد و شمار گمنام نہیں تھے جیسے محققین نے سوچا، اور نیویارک ٹائمز سے صحافیوں کو آسانی سے ڈیٹا بیس میں (Barbaro and Zeller 2006) کی شناخت کرنے میں کامیاب تھا. ایک بار جب یہ مسائل دریافت ہوئی تھیں، چودھری نے اے او ایل کی ویب سائٹ سے ڈیٹا کو ہٹا دیا، لیکن یہ بہت دیر ہو چکی تھی. اعداد و شمار دیگر ویب سائٹس پر دوبارہ شائع کردیئے گئے ہیں، اور جب آپ اس کتاب کو پڑھ رہے ہیں تو شاید یہ بھی دستیاب رہیں گے. چودھری کو نکال دیا گیا تھا، اور AOL کے چیف ٹیکنیکل آفیسر نے استعفی دیا (Hafner 2006) . جیسا کہ اس مثال سے پتہ چلتا ہے، ڈیٹا تک رسائی کی سہولت کے لئے کمپنیوں کے اندر مخصوص افراد کے فوائد بہت چھوٹے ہیں اور بدترین کیس کے منظر خراب ہیں.
تاہم محققین، عام طور پر کبھی بھی ڈیٹا تک رسائی حاصل کرسکتے ہیں جو عام طور پر قابل رسائی نہیں ہے. کچھ حکومتیں ایسی طریقہ کار ہیں جو محققین تک رسائی کے لۓ درخواست دے سکتے ہیں، اور اس باب میں بعد میں مثال کے طور پر، محققین کو کبھی کبھار کارپوریٹ ڈیٹا تک رسائی حاصل ہوسکتی ہے. مثال کے طور پر، Einav et al. (2015) نے آن لائن نیلامیوں کا مطالعہ کرنے کے لئے ای بی پر ایک محقق کے ساتھ شراکت کی. میں تحقیق کے بارے میں مزید بات کروں گا جو بعد میں باب میں اس تعاون سے آیا تھا، لیکن میں اب اس کا ذکر کرتا ہوں کیونکہ اس میں کامیاب ہونے والی شراکت داروں میں سے چار اجزاء موجود ہیں: محققین کے مفاد، محققین کی صلاحیت، کمپنی کی دلچسپی، اور کمپنی کی صلاحیت . میں نے بہت سے ممکنہ تعاون کو ناکام بنایا ہے کیونکہ یا تو محقق یا شراکت دار یہ کمپنی یا حکومت ہے- ان اجزاء میں سے ایک کی کمی ہے.
یہاں تک کہ اگر آپ کاروبار کے ساتھ شراکت داری کو فروغ دینے یا محدود حکومتی اعداد و شمار تک رسائی حاصل کرنے میں کامیاب ہوسکتے ہیں، تاہم، آپ کے لئے کچھ بھی کمی نہیں ہے. سب سے پہلے، آپ شاید اپنے ڈیٹا کو دیگر محققین کے ساتھ اشتراک کرنے میں کامیاب نہیں ہوسکیں گے، جس کا مطلب یہ ہے کہ دیگر محققین آپ کے نتائج کی توثیق اور توسیع نہیں کرسکیں گے. دوسرا، سوالات جو آپ پوچھ سکتے ہیں وہ محدود ہوسکتے ہیں؛ کمپنیاں تحقیق کی اجازت دینے کے قابل نہیں ہیں جو انہیں خراب نظر آسکتی ہیں. آخر میں، یہ شراکت دار کم از کم دلچسپی کے تنازعے کی ظہور پیدا کرسکتی ہے، جہاں لوگ سوچتے ہیں کہ آپ کے نتائج آپ کی شراکت داری سے متاثر ہوئیں. ان سبھی اداسوں کو خطاب کیا جاسکتا ہے، لیکن یہ واضح ہونا ضروری ہے کہ ان اعداد و شمار کے ساتھ کام کرنا جو سب کے لئے قابل رسائی نہیں ہے دونوں کے اوپر اور downsides دونوں ہے.
خلاصہ میں، محققین کے لئے بہت سے بڑے اعداد و شمار تک رسائی نہیں ہے. سنگین قانونی، کاروباری اور اخلاقی رکاوٹ موجود ہیں جو ڈیٹا تک رسائی کو روکنے کی روک تھام کرتے ہیں، اور یہ خامیاں دور نہیں جائیں گی کیونکہ ٹیکنالوجی بہتر ہوتی ہے کیونکہ وہ تکنیکی خنډ نہیں ہیں. کچھ قومی حکومتوں نے ڈیٹا بیس تک رسائی حاصل کرنے کے لئے کچھ ڈیٹا بیس کو چالو کرنے کے طریقہ کار قائم کیے ہیں، لیکن یہ عمل ریاست اور مقامی سطح پر خاص طور پر اس کی نشاندہی کرتا ہے. اس کے علاوہ، بعض معاملات میں، محققین کو کمپنی تک رسائی حاصل کرنے کے لئے شراکت داری مل سکتی ہے، لیکن یہ محققین اور کمپنیوں کے لئے مختلف مسائل پیدا کرسکتے ہیں.