如果你把好的数据一个很好的问题简单的计数会很有意思。
虽然在复杂的冠冕堂皇的语言表达,大量的社会研究其实只是计数的东西。在大数据时代,研究人员可以指望比以往任何时候都多,但这并不自动意味着研究应集中在计数越来越多的东西。相反,如果我们要做好研究与大数据,我们需要问:哪些东西是值得计数?这似乎是一个完全主观的问题,但也有一些普遍的模式。
我要去算,没有人以前计算的东西:常生说激励自己的计算研究。例如,一个学生可能会说,很多人都研究移民,许多人研究过双胞胎,但没有人研究农民双胞胎。通过激励缺乏通常不会导致良好的研究。当然,也有可能是很好的理由来研究农民双胞胎,但事实上,他们没有被之前的研究并不意味着他们现在应该研究。从来没有人指望在我的办公室地毯线程数,但是这并不自动意味着,这将是一个很好的研究项目。通过激励缺失是一种像说:看,有一个洞那边,我要去工作非常努力,以填补它。但是,并不是每个洞需要填补。
相反,由没有激励,我认为,指望导致良好的研究在两种情况下,当研究很有趣 的或重要的(或两者理想情况下)。例如,衡量失业率是非常重要的,因为它是驱动决策的经济指标。一般来说,人们有一个不错的是什么重要的意义。因此,在本节的剩余部分,我将提供三个例子,其中计数很有趣。在每种情况下,研究人员还不算随意的,而他们是在揭示重要的见解更普遍的想法有关系统是如何工作的社会非常特别的设置计数。换句话说,很多是什么让这些特殊的计数练习有趣的是不是数据本身,它来自这些更普遍的想法。
下面我将介绍的三个例子:在纽约的出租车司机(第2.4.1.1),2)友谊学生(第2.4.1.2节形成)和中国政府3)社交媒体审查行为1)工作行为(第2.4.1.3)。这些例子分享一下的是,他们都表明,指望大数据可用于测试的理论预言。在某些情况下,大数据源,使您能够直接比较做计数(在纽约出租车的情况下)。在其他情况下,研究人员将需要通过合并数据一起和实施理论结构(如在友谊形成的情况下)来处理不完备性;在某些情况下,研究人员需要收集自己的观测数据(如社交媒体审查的情况下)。正如我希望这些例子表明,研究者谁能够提出有趣的问题,大数据带来了巨大希望。