2.3.1.3非反應

測量是不太可能改變在大的數據源的行為。

社會研究的一個挑戰是,人們可以改變他們的行為,當他們知道他們正在被研究人員觀察到。社會科學家們普遍呼籲響應研究員測量反應這一行為改變(Webb et al. 1966)大數據的一個方面,許多研究者發現有前途的是,參與者通常不知道他們的數據被捕獲或者他們已經變得如此習慣了這種數據收集器,不再改變自己的行為。因為它們是不反應的 ,因此,大的數據的許多來源可用於研究行為尚未易於進行精確測量先前。例如, Stephens-Davidowitz (2014)用於在搜索引擎查詢種族方面的患病率以測量在美國的不同區域種族敵意。搜索數據的非反應性和大的(見前面的部分)的性質使能測量,將使用其他方法,諸如調查是困難的。

非反應性,但並不保證這些數據在某種程度上直接的人的行為或態度反映。例如,一位受訪者告訴Newman et al. (2011) ,“這並不是說我沒有問題,我只是沒有把他們在Facebook上。”換句話說,即使一些大的數據源是無反應,他們並不總是免費的社會期望偏見,對於人的傾向要展示自己的最佳可能的方式。此外,下面我將介紹更多的,這些數據源有時是由平台擁有者的目標的影響,(說明詳見下文),一個叫算法混雜的問題。

雖然非反應性研究有利,跟踪人們的行為未經其同意和意識引發的倫理問題在第6章公眾的強烈反應反對增加數字監控可能會導致大數據系統,隨著時間的推移更多的反應,以及強烈的下面和詳細的討論有關數字監控的關注甚至可能會導致一些人試圖完全退出大數據系統,提高對非代表性 (更多如下所述)的擔憂。

社會研究型大,永遠在線,和非反應,通常出現,因為這些數據源沒有被研究人員研究創建大數據這三個性能良好。現在,我要談談的是壞的研究大數據源的七個屬性。這些特性也趨向於出現因為這個數據沒有被研究人員研究創建。