بڑی اعداد و شمار کے وسائل میں پیمائش رویے کو تبدیل کرنے کا امکان بہت کم ہے.
سماجی تحقیق کا ایک چیلنج یہ ہے کہ جب لوگ جانتے ہیں کہ وہ محققین کی طرف سے مشاہدہ کیا جا رہا ہے جب لوگ اپنے رویے کو تبدیل کرسکتے ہیں. سماجی سائنسدانوں کو عام طور پر اس رشتہ دار کو بلایا جاتا ہے (Webb et al. 1966) . مثال کے طور پر، علاقائی مطالعات کے مقابلے میں لوگ لیبارٹری مطالعہ میں بہت سخاوت مند ہوسکتے ہیں کیونکہ سابقہ وہ بہت ہی باخبر ہیں کہ ان کا مشاہدہ کیا جا رہا ہے (Levitt and List 2007a) . بڑے اعداد و شمار کا ایک پہلو ہے جو بہت سے محققین کو وعدہ ملتا ہے یہ ہے کہ شرکاء عام طور پر نہیں جانتا ہے کہ ان کے اعداد و شمار کو قبضہ کیا جا رہا ہے یا وہ ان اعداد و شمار کے مجموعے کے عادی بن گئے ہیں کہ اب ان کے رویے میں تبدیلی نہیں آئی ہے. کیونکہ شرکاء غیر غیر فعال ہیں ، لہذا، بڑی ڈیٹا کے بہت سے ذرائع کو رویے کا مطالعہ کرنے کے لئے استعمال کیا جا سکتا ہے جو پہلے درست پیمائش پر قابل قبول نہیں ہے. مثال کے طور پر، Stephens-Davidowitz (2014) نے امریکہ کے مختلف علاقوں میں نسلی حرکت پذیر کرنے کے لئے تلاش کے انجن کے سوالات میں نسل پرستی کی شرائط کی اشاعت کا استعمال کیا. غیر جانبدار اور بڑا (سیکشن 2.3.1 دیکھیں) تلاش کے اعداد و شمار کے قابل پیمائش کی فطرت جو دیگر طریقوں کا استعمال کرتے ہوئے مشکل ہوسکتے ہیں، جیسے سروے.
تاہم، غیر جانبدارتا، یہ یقینی بناتا ہے کہ یہ اعداد و شمار کسی طرح سے لوگوں کے رویے یا رویے کی براہ راست عکاسی کرتی ہیں. مثال کے طور پر، انٹرویو کی بنیاد پر ایک مطالعہ میں ایک جواب دہندہ کے طور پر کہا گیا، "یہ نہیں ہے کہ مجھے کوئی مسئلہ نہیں ہے، میں نے انہیں فیس بک پر نہیں ڈال دیا" (Newman et al. 2011) . دوسرے الفاظ میں، اگرچہ کچھ بڑے اعداد و شمار غیر معقول ہیں، وہ ہمیشہ سماجی امتیازی تعصب سے آزاد نہیں ہیں، لوگوں کے لئے رجحان خود کو بہتر طریقے سے پیش کرنا چاہتے ہیں. اس کے علاوہ، جیسا کہ میں بعد میں باب میں بیان کروں گا، بڑے اعداد و شمار کے وسائل میں قبضہ کر لیا گیا ہے، کبھی کبھی پلیٹ فارم کے مالکان کے مقاصد سے متاثر ہوتا ہے، ایک مسئلہ میں الگورتھممک اعتراف کروں گا. آخر میں، اگرچہ غیر جانبدار تحقیق کے لئے فائدہ مند ہے، لوگوں کے رویے کو ان کی رضامندی اور بیداری کے بغیر بھی اخلاقی خدشات پیدا ہوتی ہے کہ میں باب 6 میں تفصیل سے بیان کروں گا.
تین خصوصیات جن میں نے ابھی بیان کیا ہے وہ بڑے، ہمیشہ، اور غیر فعال ہیں - عام طور پر، لیکن سماجی تحقیق کے لئے فائدہ مند نہیں. اگلا، میں بڑے اعداد و شمار کے وسائل، نامکمل، غیر نمائندگی، بہاؤ، الگورتھم کی طرف سے الجھن، گندی اور سنجیدگی سے، کے طور پر عام طور پر، لیکن ہمیشہ نہیں، تحقیق کے لئے مسائل کو پیدا کرنے کے سات خصوصیات کو تبدیل کر دیں گے.