پیمائش بڑی ڈیٹا کے ذرائع میں رویہ تبدیل کرنے کے لئے زیادہ امکان کم ہے.
سماجی تحقیق کے ایک چیلنج ہے جب کہ وہ جانتے ہیں کہ وہ محققین کی طرف سے مشاہدہ کیا جا رہا ہے لوگوں کو ان کے رویے کو تبدیل کر سکتے ہیں ہے. سماجی سائنسدانوں عام طور پر محقق پیمائش رد کے جواب میں اس رویے کو بدلیں فون کریں (Webb et al. 1966) . بڑے اعداد و شمار کا ایک پہلو بہت محقق کا وعدہ تلاش ہے کہ شرکاء کو عام طور پر اس بات سے آگاہ ان کے ڈیٹا کو گرفتار کر لیا ہے یا وہ یہ اب کوئی ان کے رویے کو تبدیل کر کہ اس ڈیٹا کو جمع کرنے کے لئے اتنا عادی ہو گئے ہیں کیا جا رہا ہے کہ نہیں ہیں. وہ غیر رد عمل ہیں، اس وجہ سے، بڑی ڈیٹا کے بہت سے ذرائع رویے ماضی میں درست پیمائش کرنے amendable نہیں کیا گیا ہے کہ مطالعہ کرنے کے لئے استعمال کیا جا سکتا. مثال کے طور پر، Stephens-Davidowitz (2014) ریاست ہائے متحدہ امریکہ کے مختلف علاقوں میں نسلی animus پیمائش کرنے کی تلاش کے انجن کے سوالات میں نسلی امتیاز پر مبنی شرائط کی کوریج کا استعمال کیا. تلاش کے اعداد و شمار کی غیر رد عمل اور بڑی (پچھلے سیکشن دیکھیں) فطرت کا فعال کی پیمائش جیسے سروے دوسرے طریقوں، کا استعمال کرتے ہوئے مشکل ہو جائے گا کہ.
غیر رد، تاہم، ان اعداد و شمار کسی نہ کسی طرح ایک براہ راست لوگوں کے طرز عمل یا رویوں کی عکاسی کرتے ہیں کہ اس بات کا یقین نہیں کرتا. مثال کے طور پر، ایک مدعا کے طور پر بتایا Newman et al. (2011) ، دوسرے الفاظ میں، کچھ بڑے اعداد و شمار ذرائع، غیر رد عمل ہیں، اگرچہ وہ ہمیشہ سماجی وانچھنییتا تعصب کی آزاد نہیں ہیں "یہ میں مسائل، میں تو صرف فیس بک پر ڈال نہیں کر رہا ہوں. نہیں ہے کہ نہیں ہے" ، لوگوں کے لئے رجحان کو ممکن بہترین طریقہ میں خود کو پیش کرنے کے لئے چاہتے ہیں کے لئے. اس کے علاوہ، میں نے ذیل میں زیادہ بیان کریں گے کے طور پر، ان اعداد و شمار کے ذرائع سے کبھی کبھی پلیٹ فارم کے مالکان کے اہداف کی طرف سے متاثر کر رہے ہیں، پر algorithmic confounding نامی ایک مسئلہ (ذیل میں مزید بیان کیا).
غیر رد اگرچہ اخلاقی خدشات باب 6. اضافہ ڈیجیٹل کی نگرانی کے خلاف عوامی ردعمل وقت کے ساتھ زیادہ رد عمل بننے کے لئے بڑی ڈیٹا سسٹمز قیادت کر سکتے ہیں، اور مضبوط میں ذیل میں اور تفصیل سے بحث اٹھاتا ان کی رضامندی اور بیداری کے بغیر لوگوں کے طرز عمل سے باخبر رہنے کے، تحقیق کے لیے فائدہ مند ہے ڈیجیٹل کی نگرانی کے بارے میں تشویش بھی غیر representativity (زیادہ ذیل میں بیان کیا) کے بارے میں خدشات میں اضافہ، کو مکمل طور پر بڑی ڈیٹا سسٹمز سے آپٹ آؤٹ کرنے کی کوشش کرنے کے لئے کچھ لوگوں کی قیادت کر سکتے.
سوشل ریسرچ بگ، ہمیشہ پر، اور غیر فعالی-عام طور پر پیدا ہوتی ہیں کیونکہ ان اعداد و شمار کے ذرائع کی تحقیق کے لئے محققین کی طرف سے پیدا نہیں کیا گیا کے لئے بڑے اعداد و شمار کے یہ تینوں اچھی خصوصیات. اب، میں بڑے اعداد و شمار کے ذرائع کی تحقیق کے لئے خراب ہیں کہ سات خواص کی طرف رجوع کر لیں گے. یہ خصوصیات کی وجہ سے بھی اس ڈیٹا تحقیق کے لیے محققین کی طرف سے پیدا نہیں کیا گیا تھا پیدا کرنے کے لئے کوشش کرتے ہیں.