我们总是会需要问人的问题。
鉴于越来越多的我们的行为是在政府和企业的管理数据采集,有些人可能会认为提出问题是过去的事情了。但是,它不是那么简单。这是千真万确的,研究人员会问少在未来的行为,但是,正如我在第2章所讨论的,也有与准确性,完整性,以及许多大型数据源的可访问性的实际问题。因此,我期待与这些数据源的问题,意味着研究人员将继续询问他们对可预见的未来行为的受访者。
除了这些实际的原因,还有一个更重要的原因要问:行为数据,甚至完美的行为数据是有限的。一些最重要的社会结果和预测的是内部状态 ,如感情,知识,期望和意见。内部状态只有人的头脑中存在,有时还了解内部状态的最好方法就是问。
大数据源的实际和基本的限制,以及它们如何能与调查被克服,由莫伊拉·伯克和罗伯特·克劳特的说明(2014)就如何友谊的强度在Facebook上通过影响相互作用的研究。当时,伯克在Facebook的工作,所以她不得不有史以来创造了人类行为的最庞大而详细的记录之一的完全访问权限。但是,即使还在,伯克和克劳特不得不使用调查,以回答他们研究的问题。他们的利益如何结局关闭答辩认为特定的朋友,是只有被诉人的脑子里存在的内部状态。此外,除了使用调查,收集自己感兴趣的结局,伯克和克劳特也不得不使用调查,以了解其他潜在混杂因素。特别是,他们想分开的通信通过其他渠道在Facebook上交流的影响(例如,电子邮件,电话,脸对脸)。尽管通过电子邮件和电话的交互自动记录,这些痕迹是不提供给伯克和克劳特。结合友谊强度和Facebook的日志数据的非Facebook的交互他们的调查数据,伯克和克劳特得出的结论是通过Facebook通信实际上导致没有增加亲近的感觉。
由于伯克和克劳特的工作说明,大数据源无法消除需要问人的问题。其实,我想提请本研究相反的教训:大数据实际上是增加的问这问那的价值,我将展示在本章中。因此,要考虑请求和观察之间的关系的最好办法是,它们是互补而非替代;他们就像花生酱和果冻。当有更多的花生酱,人们希望有更多的果冻;当有更多的大数据,人们希望更多的调查。