3.2询问与观察

我们总是会需要问人的问题。

鉴于越来越多的行为被大数据源捕获,例如政府和商业管理数据,有些人可能会认为提问已成为过去。但是,事情并非那么简单。我认为研究人员会继续向人们提问,这有两个主要原因。首先,正如我在第2章中讨论的那样,许多大数据源的准确性,完整性和可访问性存在实际问题。其次,除了这些实际原因外,还有更为根本的原因:有些事情很难从行为数据中学习 - 甚至是完美的行为数据。例如,一些最重要的社会结果和预测因素是内部状态 ,例如情绪,知识,期望和观点。内部状态存在于人们的头脑中,有时学习内部状态的最佳方式是提问。

Moira Burke和Robert Kraut (2014)关于如何通过Facebook上的互动影响友谊的力量的研究说明了大数据源的实际和基本限制,以及如何通过调查克服这些限制。当时,伯克正在Facebook工作,因此她可以完全访问有史以来最庞大,最详细的人类行为记录。但即便如此,Burke和Kraut也不得不使用调查来回答他们的研究问题。他们感兴趣的结果 - 受访者和她的朋友之间的主观亲密感 - 是一种内部状态,只存在于受访者的头脑中。此外,除了使用调查来收集他们感兴趣的结果之外,Burke和Kraut还必须使用调查来了解潜在的混淆因素。特别是,他们希望通过其他渠道(例如,电子邮件,电话和面对面)将Facebook上的通信影响与通信分开。尽管通过电子邮件和电话进行的交互是自动记录的,但Burke和Kraut无法获得这些痕迹,因此他们必须通过调查收集这些痕迹。 Burke和Kraut将他们关于友谊力量和非Facebook互动的调查数据与Facebook日志数据相结合,得出的结论是,通过Facebook进行的沟通确实会增加亲密感。

正如Burke和Kraut的工作所说明的那样,大数据来源并不能消除向人们提问的必要性。事实上,我会从这项研究中得出相反的教训:大数据源实际上可以增加提问的价值,正如我将在本章中所展示的那样。因此,思考询问与观察之间关系的最佳方式是它们是补充而非替代;它们就像花生酱和果冻。当有更多的花生酱时,人们需要更多的果冻;当有更多的大数据时,我认为人们会想要更多的调查。