2.3.1.3 Non-reaktif

Pengukuran jauh lebih kecil kemungkinannya untuk mengubah perilaku dalam sumber-sumber data besar.

Salah satu tantangan dari penelitian sosial adalah bahwa orang dapat mengubah perilaku mereka ketika mereka tahu bahwa mereka sedang diamati oleh para peneliti. Ilmuwan sosial umumnya menyebut perubahan perilaku ini dalam menanggapi pengukuran peneliti reaktivitas (Webb et al. 1966) . Salah satu aspek data besar yang banyak peneliti menemukan menjanjikan adalah bahwa peserta umumnya tidak menyadari bahwa data mereka ditangkap atau mereka telah menjadi begitu terbiasa dengan pengumpulan data ini yang tidak lagi perubahan perilaku mereka. Karena mereka adalah non-reaktif, karena itu, banyak sumber data yang besar dapat digunakan untuk mempelajari perilaku yang belum bisa dikembangkan untuk pengukuran yang akurat sebelumnya. Misalnya, Stephens-Davidowitz (2014) digunakan prevalensi istilah rasis dalam permintaan mesin pencari untuk mengukur animus rasial di berbagai wilayah Amerika Serikat. The non-reaktif dan besar (lihat bagian sebelumnya) sifat data pencarian diaktifkan pengukuran yang akan sulit menggunakan metode lain, seperti survei.

Non-reaktivitas, bagaimanapun, tidak menjamin bahwa data ini entah bagaimana langsung mencerminkan perilaku atau sikap orang-orang. Misalnya, sebagai salah satu responden mengatakan Newman et al. (2011) , "Ini bukan berarti saya tidak memiliki masalah, aku hanya tidak menempatkan mereka di Facebook." Dengan kata lain, meskipun beberapa sumber data besar adalah non-reaktif, mereka tidak selalu bebas dari bias keinginan sosial , kecenderungan orang untuk ingin menampilkan diri dalam cara yang terbaik. Selanjutnya, seperti yang saya akan menjelaskan lebih lanjut di bawah, ini sumber data kadang-kadang dipengaruhi oleh tujuan dari pemilik platform yang, masalah yang disebut algoritmik pembaur (dijelaskan lebih lanjut di bawah).

Meskipun non-reaktivitas menguntungkan untuk penelitian, melacak perilaku orang tanpa persetujuan dan kesadaran mereka menimbulkan keprihatinan etis dibahas di bawah ini dan secara rinci dalam Bab 6. Sebuah reaksi publik terhadap peningkatan surveilans digital dapat menyebabkan sistem data besar untuk menjadi lebih reaktif dari waktu ke waktu, dan kuat kekhawatiran tentang surveilans digital bahkan dapat menyebabkan beberapa orang untuk mencoba untuk opt-out dari sistem data besar sekali, meningkatkan kekhawatiran tentang non-representasi (dijelaskan lebih lanjut di bawah).

Ketiga sifat yang baik dari data besar untuk sosial penelitian-besar, selalu-on, dan non-reaktif-umumnya timbul karena sumber-sumber data yang tidak diciptakan oleh para peneliti untuk penelitian. Sekarang, saya akan beralih ke tujuh sifat sumber data besar yang buruk untuk penelitian. Fitur-fitur ini juga cenderung muncul karena data ini tidak diciptakan oleh para peneliti untuk penelitian.