Ukuran loba kurang kamungkinan pikeun ngarobah paripolah dina sumber data gedé.
Hiji tangtangan panalungtikan sosial nyaeta jelema bisa ngarobah paripolah maranéhanana basa aranjeunna nyaho nu sipatna keur ditalungtik ku panalungtik. Élmuwan Sosial umumna nelepon parobahan paripolah ieu dina response ka ukuran panalungtik réaktivitas (Webb et al. 1966) . Hiji aspék data gedé nu loba panalungtik manggihan ngajangjikeun nyaeta pamilon umumna teu sadar yen data maranéhanana anu keur kawengku atawa maranéhanana geus jadi jadi biasa kumpulan data ieu nu henteu deui robah paripolah maranéhanana. Sabab non-réaktif, sahingga, loba sumber data gedé bisa dipaké pikeun diajar paripolah nu geus teu acan amendable ka ukuran akurat saméméhna. Contona, Stephens-Davidowitz (2014) dipaké Prévalénsi istilah rasialis dina queries search engine pikeun ngukur animus ras di wewengkon nu beda-beda Amérika Sarikat. Nu non-réaktif jeung gedé (tempo bagian saméméhna) alam data search diaktipkeun ukuran nu bakal hésé ngagunakeun métode séjénna, saperti survey.
Non-réaktivitas kitu, teu mastikeun yén data ieu kumaha bae a langsung ngagambarkeun paripolah atawa sikap masarakat. Contona, minangka salah réspondén ka Newman et al. (2011) , "Ieu teu mah teu boga masalah, Kaula ngan teu putting eta dina Facebook." Dina basa sejen, sanajan sababaraha sumber data gedé nu non-réaktif, maranehna teu salawasna bébas bias desirability sosial , nu kacenderungan pikeun jalma hayang nampilkeun sorangan dina cara anu pangalusna nu mungkin. Salajengna, sakumaha Abdi gé ngajelaskeun leuwih handap, ieu sumber data kadang impacted ku tujuan boga platform, hiji masalah disebut algorithmic confounding (digambarkeun leuwih handap).
Sanajan non-réaktivitas anu nguntungkeun pikeun panalungtikan, nyukcruk laku masarakat tanpa idin jeung kasadaran maranéhanana raises masalah etika dibahas di handap jeung di jéntré dina Bab 6. A backlash umum ngalawan ngaronjat panjagaan digital bisa ngakibatkeun sistem data gedé pikeun jadi leuwih réaktif kana waktu, sarta kuat patalina jeung masalah ngeunaan panjagaan digital komo bisa ngakibatkeun sababaraha urang nyobian milih-kaluar sistem data gedé lengkep, ngaronjatkeun kasalempang non-representativity (digambarkeun leuwih handap).
Ieu tilu sipat alus data gedé pikeun sosial panalungtikan-gedé, sok-on, jeung non-réaktif-umumna mecenghul alatan ieu sumber data anu teu dijieun ku panalungtik pikeun panalungtikan. Ayeuna, Abdi gé ngahurungkeun ka tujuh sipat sumber data gedé anu goréng pikeun panalungtikan. fitur ieu ogé condong timbul lantaran data ieu teu dijieun ku panalungtik pikeun panalungtikan.