2.5結論

大數據無處不在,但用它和其他形式的社會研究的觀測數據是困難的。根據我的經驗有像一個沒有免費的午餐屬性的研究:如果你沒有投入大量的工作收集數據做,那麼你很可能將不得不投入大量工作,分析數據,或者在思考什麼是一個有趣的問題要問的數據。根據本章的想法,我認為有那麼大的數據來源將是社會研究最有價值的三種主要方式:

  • 競爭的理論預測之間的憑經驗審理。這種工作的例子包括: Farber (2015) (紐約出租車司機)和King, Pan, and Roberts (2013)在中國的審查制度)
  • 改善社會測量通過臨近預報策略。這類工作的一個例子是Ginsberg et al. (2009) (谷歌流感趨勢)。
  • 估計與自然實驗和匹配的因果效應。這樣的工作。的例子Mas and Moretti (2009)對生產率的影響)和Einav et al. (2015) (在eBay的拍賣上起拍價的影響)。

在社會研究許多重要的問題可以表示為這三個之一。然而,這些方法通常需要研究者帶來了很多的數據。是什麼讓Farber (2015)有趣的是測量的理論動力。這一理論的動機來自於數據之外。因此,對於那些誰是善於提出某些類型的研究問題,大數據源可以是非常富有成果。

最後,而不是理論驅動的實證研究(這一直是焦點這一章),我們可以翻轉的腳本,並創造經驗,推動理論化 。也就是說,通過經驗事實,模式和謎題的悉心積累,我們可以構建新的理論。

理論這種替代,數據優先方法是不是新的,並且它最有力地闡述Glaser and Strauss (1967)與他們的呼籲紮根理論 。該數據優先的方法,但是,不作為已被周圍很多在數字時代研究新聞聲稱意味著“理論的終結” (Anderson 2008) 。相反,如數據環境的變化,我們必須預期的理論和數據之間的關係的重新平衡。在當今世界,數據收集是昂貴的,是有意義的只收集理論認為將是最有用的數據。但是,在這個世界上,大量的數據已經是免費的,它是有道理也嘗試一個數據第一種方法(Goldberg 2015)

正如我在本章中所顯示的,研究人員可以通過觀察人們學到很多東西。在接下來的三個章節,我將描述我們如何能學到更多不同的東西,如果我們更直接問他們問題(第3章),運行實驗(第4章),甚至涉及到他們定制我們的數據收集和交互與人在調研過程中,直接(第5章)。