هو أقل بكثير من المرجح أن تغيير السلوك في مصادر البيانات الكبيرة القياس.
وأحد التحديات البحث الاجتماعي هو أن الناس يمكن أن يتغير سلوكهم عندما يعلمون أن يجري لوحظ من قبل الباحثين. علماء الاجتماع يدعون عموما هذا التغيير سلوك ردا على التفاعل قياس الباحث (Webb et al. 1966) . جانب واحد من البيانات الكبيرة التي يجد العديد من الباحثين واعدة غير أن المشاركين عموما ليست على علم بأن بياناتهم يتم القبض أو أنهم أصبحوا معتادين على جمع هذه البيانات أنه لم يعد تغيير سلوكهم. لأنها غير رد الفعل، لذلك، العديد من مصادر بيانات كبيرة يمكن استخدامها لدراسة السلوك الذي لم يكن قابلة للتعديل لقياس دقيق من قبل. على سبيل المثال، Stephens-Davidowitz (2014) المستخدمة انتشار تعابير عنصرية في الاستعلامات محرك البحث لقياس العداء العنصري في مناطق مختلفة من الولايات المتحدة. الطابع غير المتفاعلة والكبيرة (انظر القسم السابق) من بيانات البحث مكنت القياسات التي سيكون من الصعب استخدام وسائل أخرى، مثل عمليات المسح.
غير تفاعلية، ومع ذلك، لا يضمن أن هذه البيانات هي بطريقة أو بأخرى مباشرة تعكس سلوك الناس أو المواقف. على سبيل المثال، والمدعى عليه واحد وقال Newman et al. (2011) ، "انها ليست أنني لم يكن لديك مشاكل، أنا فقط لا يضعهم في الفيسبوك." وبعبارة أخرى، على الرغم من بعض مصادر البيانات الكبيرة غير رد الفعل، فهي ليست خالية من التحيز الرغبة الاجتماعي دائما ، والميل للناس تريد أن تقدم نفسها في أفضل طريقة ممكنة. وعلاوة على ذلك، وأنا أصف أكثر أدناه، هذه مصادر البيانات تتأثر أحيانا أهداف أصحاب منصة، مشكلة اسمها الخلط حسابي (وصفت أكثر أدناه).
وعلى الرغم من عدم التفاعل، هو مفيد للبحث وتتبع سلوك الناس دون موافقتهم والوعي يثير مخاوف أخلاقية ناقش أدناه وبالتفصيل في الفصل 6. وتسبب الغضب الجماهيري ضد زيادة المراقبة الرقمية يمكن أن تؤدي نظم البيانات الكبيرة لتصبح أكثر تفاعلية مع مرور الوقت، وقوية قلق حول المراقبة الرقمية يمكن أن يقود بعض الناس في محاولة لاستبعاد نظم البيانات الكبيرة تماما، وزيادة المخاوف بشأن عدم التمثيل (وصف أكثر أدناه).
هذه الخصائص الجيدة ثلاثة من البيانات الكبيرة لأبحاث كبيرة الاجتماعية، ودائما على، وغير رد الفعل، عموما تنشأ بسبب هذه مصادر البيانات لم يتم إنشاؤها من قبل الباحثين للبحث. الآن، وأنا سوف تتحول إلى خصائص سبعة من مصادر البيانات الكبيرة التي هي سيئة للأبحاث. تميل هذه الميزات أيضا أن تنشأ أنه لم يتم إنشاء هذه البيانات من قبل الباحثين للبحث.