Việc đo lường trong các nguồn dữ liệu lớn ít có khả năng thay đổi hành vi.
Một thách thức của nghiên cứu xã hội là mọi người có thể thay đổi hành vi của họ khi họ biết rằng họ đang được các nhà nghiên cứu quan sát. Các nhà khoa học xã hội thường gọi phản ứng này (Webb et al. 1966) . Ví dụ, mọi người có thể hào phóng hơn trong các nghiên cứu trong phòng thí nghiệm hơn là nghiên cứu thực địa bởi vì trước đây họ rất ý thức rằng họ đang được quan sát (Levitt and List 2007a) . Một khía cạnh của dữ liệu lớn mà nhiều nhà nghiên cứu thấy có triển vọng là người tham gia thường không nhận thức được rằng dữ liệu của họ đang bị bắt hoặc họ đã quen với việc thu thập dữ liệu này mà nó không còn thay đổi hành vi của họ nữa. Vì những người tham gia không phản ứng , do đó, nhiều nguồn dữ liệu lớn có thể được sử dụng để nghiên cứu hành vi chưa được tuân thủ để đo lường chính xác trước đây. Ví dụ, Stephens-Davidowitz (2014) sử dụng sự phổ biến của các thuật ngữ phân biệt chủng tộc trong các truy vấn công cụ tìm kiếm để đo lường hình ảnh động chủng tộc ở các vùng khác nhau của Hoa Kỳ. Tính chất không phản ứng và lớn (xem phần 2.3.1) của dữ liệu tìm kiếm cho phép đo lường sẽ khó sử dụng các phương pháp khác, chẳng hạn như khảo sát.
Tuy nhiên, không phản ứng không đảm bảo rằng những dữ liệu này bằng cách nào đó phản ánh trực tiếp hành vi hoặc thái độ của người dân. Ví dụ, như một người trả lời trong một cuộc phỏng vấn dựa trên nghiên cứu cho biết, "Nó không phải là tôi không có vấn đề, tôi chỉ không đặt chúng trên Facebook" (Newman et al. 2011) . Nói cách khác, mặc dù một số nguồn dữ liệu lớn không mang tính phi lý, chúng không phải lúc nào cũng không có thiên vị xã hội mong muốn, xu hướng cho mọi người muốn thể hiện mình theo cách tốt nhất có thể. Hơn nữa, như tôi sẽ mô tả sau trong chương, hành vi bị bắt trong các nguồn dữ liệu lớn đôi khi bị ảnh hưởng bởi các mục tiêu của chủ sở hữu nền tảng, một vấn đề tôi sẽ gọi là thuật toán gây nhầm lẫn . Cuối cùng, mặc dù không phản ứng là thuận lợi cho nghiên cứu, theo dõi hành vi của con người mà không có sự đồng ý và nhận thức của họ làm tăng mối quan tâm đạo đức mà tôi sẽ mô tả chi tiết trong chương 6.
Ba đặc tính mà tôi vừa mô tả — lớn, luôn luôn, và không phản ứng — nói chung, nhưng không phải lúc nào cũng thuận lợi cho nghiên cứu xã hội. Tiếp theo, tôi sẽ chuyển sang bảy thuộc tính của các nguồn dữ liệu lớn - không đầy đủ, không thể tiếp cận, không đại diện, trôi dạt, khó hiểu về mặt thuật toán, bẩn thỉu và nhạy cảm - nói chung, nhưng không phải lúc nào cũng tạo ra các vấn đề cho nghiên cứu.