Büyük veri kaynaklarındaki ölçümlerin davranış değişikliği daha az olasıdır.
Sosyal araştırmanın bir zorluğu, insanların araştırmacılar tarafından gözlemlendiklerini bildiklerinde davranışlarını değiştirebilmeleridir. Sosyal bilimciler genellikle bu reaktivite olarak adlandırırlar (Webb et al. 1966) . Örneğin, insanlar laboratuar çalışmalarında saha çalışmalarından daha cömert olabilirler, çünkü eskiden, gözlemlendiklerinin farkındalar (Levitt and List 2007a) . Pek çok araştırmacının umut verici bulduğu büyük verilerin bir yönü, katılımcıların genellikle verilerin yakalanmasının ya da bu veri koleksiyonuna alışkın olmadıklarının farkında olmadıklarıdır. Katılımcılar reaktif olmadıklarından, daha önce çok sayıda büyük veri kaynağı, daha önce doğru ölçüme uymayan davranışları incelemek için kullanılabilir. Örneğin, Stephens-Davidowitz (2014) , Amerika Birleşik Devletleri'nin farklı bölgelerindeki ırksal animusu ölçmek için arama motoru sorgularında ırkçı terimlerin yaygınlığını kullanmıştır. Araştırma verilerinin reaktif olmayan ve büyük olması (bkz. Bölüm 2.3.1), anketler gibi diğer yöntemleri kullanmakta zorlanacak ölçümleri mümkün kılmıştır.
Bununla birlikte, reaktivite, bu verilerin bir şekilde insanların davranışlarının veya tutumlarının doğrudan bir yansıması olmasını sağlamaz. Örneğin, röportaja dayalı bir çalışmada yanıt verenlerden biri olarak “Sorun yaşamamış değil, onları Facebook'a (Newman et al. 2011) ” dedi (Newman et al. 2011) . Diğer bir deyişle, bazı büyük veri kaynakları reaktif olmadıkça, her zaman sosyal arzulanabilirlik önyargısından arınmış değildir, insanların kendilerini mümkün olan en iyi şekilde sunmak istemeleri eğilimi. Dahası, bölümde daha sonra açıklayacağım gibi, büyük veri kaynaklarında yakalanan davranışlar bazen platform sahiplerinin hedeflerinden etkilenir, bir sorun algoritmik karıştırıcı olarak adlandırırım . Son olarak, araştırma için non-reaktivite avantajlı olsa da, insanların davranışlarını rızası olmadan izlemek ve farkındalık, 6. bölümde ayrıntılı olarak tarif edeceğim etik kaygıları ortaya çıkarmaktadır.
Az önce tarif ettiğim üç özellik - büyük, her zaman açık ve reaktif olmayan - genellikle her zaman değil, sosyal araştırmalar için avantajlıdır. Daha sonra, büyük veri kaynaklarının - tamamlanmamış, erişilemeyen, temsili olmayan, sürüklenmeyen, algoritmik olarak karışık, kirli ve hassas olan - genellikle her zaman olmasa da, araştırma için sorun yaratan yedi özelliğine döneceğim.