Pengukuran adalah lebih kurang berkemungkinan untuk mengubah tingkah laku dalam sumber data yang besar.
Satu cabaran penyelidikan sosial adalah orang yang boleh mengubah tingkah laku mereka apabila mereka tahu bahawa mereka sedang diperhatikan oleh penyelidik. Ahli sains sosial biasanya memanggil perubahan tingkah laku ini sebagai tindak balas kepada pengukuran penyelidik kereaktifan (Webb et al. 1966) . Salah satu aspek data yang besar yang banyak penyelidik mencari menjanjikan bahawa peserta secara amnya tidak sedar bahawa data mereka ditangkap atau mereka telah menjadi begitu biasa dengan pengumpulan data ini bahawa ia tidak lagi perubahan tingkah laku mereka. Kerana mereka bukan reaktif, oleh itu, banyak sumber data yang besar boleh digunakan untuk mengkaji tingkah laku yang belum dipinda untuk ukuran yang tepat sebelum ini. Sebagai contoh, Stephens-Davidowitz (2014) digunakan kelaziman segi perkauman dalam pertanyaan enjin carian untuk mengukur kebencian kaum di kawasan-kawasan yang berlainan di Amerika Syarikat. Bukan reaktif dan besar (lihat bahagian sebelumnya) sifat data carian membolehkan ukuran yang akan menjadi sukar menggunakan kaedah lain, seperti tinjauan.
Bukan kereaktifan, bagaimanapun, tidak memastikan bahawa data ini entah bagaimana langsung mencerminkan tingkah laku atau sikap rakyat. Sebagai contoh, sebagai salah satu responden memberitahu Newman et al. (2011) , "Ia tidak bahawa saya tidak mempunyai masalah, saya hanya tidak meletakkan mereka di Facebook." Dalam erti kata lain, walaupun beberapa sumber data yang besar adalah bukan reaktif, mereka tidak sentiasa bebas daripada kebaikan bias sosial , kecenderungan untuk orang ramai mahu membentangkan diri mereka dengan cara yang terbaik mungkin. Di samping itu, seperti yang saya akan menerangkan lebih lanjut di bawah, sumber data ini kadang-kadang kesan daripada matlamat pemilik platform, masalah yang dipanggil membaurkan algoritma (diterangkan lebih lanjut di bawah).
Walaupun bukan kereaktifan adalah berfaedah untuk penyelidikan, mengesan tingkah laku manusia tanpa kebenaran dan kesedaran mereka menimbulkan kebimbangan etika dibincangkan di bawah dan secara terperinci dalam Bab 6. tindak balas awam terhadap pengawasan digital meningkat boleh membawa sistem data yang besar untuk menjadi lebih reaktif dari masa ke masa, dan kuat kebimbangan mengenai pengawasan digital juga boleh menyebabkan sesetengah orang cuba untuk memilih untuk keluar daripada sistem data yang besar sepenuhnya, meningkatkan kebimbangan mengenai bukan representativity (diterangkan lebih lanjut di bawah).
Ketiga-tiga ciri-ciri yang baik data yang besar untuk penyelidikan besar sosial, sentiasa hidup, dan bukan reaktif-biasanya timbul kerana sumber data ini tidak dicipta oleh penyelidik untuk penyelidikan. Sekarang, saya akan beralih kepada tujuh sifat sumber data yang besar yang tidak baik untuk penyelidikan. Ciri-ciri ini juga cenderung untuk timbul kerana data ini tidak dicipta oleh penyelidik untuk penyelidikan.