2.4.1計數的東西

如果你把好的數據一個很好的問題簡單的計數會很有意思。

雖然在複雜的冠冕堂皇的語言表達,大量的社會研究其實只是計數的東西。在大數據時代,研究人員可以指望比以往任何時候都多,但這並不自動意味著研究應集中在計數越來越多的東西。相反,如果我們要做好研究與大數據,我們需要問:哪些東西是值得計數?這似乎是一個完全主觀的問題,但也有一些普遍的模式。

我要去算,沒有人以​​前計算的東西:常生說激勵自己的計算研究。例如,一個學生可能會說,很多人都研究移民,許多人研究過雙胞胎,但沒有人研究農民雙胞胎。通過激勵缺乏通常不會導致良好的研究。當然,也有可能是很好的理由來研究農民雙胞胎,但事實上,他們沒有被之前的研究並不意味著他們現在應該研究。從來沒有人指望在我的辦公室地毯線程數,但是這並不自動意味著,這將是一個很好的研究項目。通過激勵缺失是一種像說:看,有一個洞那邊,我要去工作非常努力,以填補它。但是,並不是每個洞需要填補。

相反,由沒有激勵,我認為,指望導致良好的研究在兩種情況下,當研究很有趣 重要的(或兩者理想情況下)。例如,衡量失業率是非常重要的,因為它是驅動決策的經濟指標。一般來說,人們有一個不錯的是什麼重要的意義。因此,在本節的剩餘部分,我將提供三個例子,其中計數很有趣。在每種情況下,研究人員還不算隨意的,而他們是在揭示重要的見解更普遍的想法有關系統是如何工作的社會非常特別的設置計數。換句話說,很多是什麼讓這些特殊的計數練習有趣的是不是數據本身,它來自這些更普遍的想法。

下面我將介紹的三個例子:在紐約的出租車司機(第2.4.1.1),2)友誼學生(第2.4.1.2節形成)和中國政府3)社交媒體審查行為1)工作行為(第2.4.1.3)。這些例子分享一下的是,他們都表明,指望大數據可用於測試的理論預言。在某些情況下,大數據源,使您能夠直接比較做計數(在紐約出租車的情況下)。在其他情況下,研究人員將需要通過合併數據一起和實施理論結構(如在友誼形成的情況下)來處理不完備性;在某些情況下,研究人員需要收集自己的觀測數據(如社交媒體審查的情況下)。正如我希望這些例子表明,研究者誰能夠提出有趣的問題,大數據帶來了巨大希望。