纯粹的现成策略和纯粹的定制策略都没有充分利用数字时代的能力。在未来,我们将创建混合动力车。
在介绍中,我将现成的Marcel Duchamp风格与米开朗基罗的定制风格进行了对比。这种对比也捕捉到了倾向于与现成品一起工作的数据科学家和倾向于使用自定义工作的社会科学家之间的差异。然而,在未来,我希望我们会看到更多的混合动力车,因为这些纯粹的方法都是有限的。想要只使用现成品的研究人员将会挣扎,因为世界上没有很多美丽的现成品。另一方面,想要仅使用自定义选项的研究人员将牺牲规模。然而,混合方法可以将现成品带来的规模与来自自定义的问题和数据之间的紧密配合相结合。
我们在四个经验章节的每一章中都看到了这些混合动力的例子。在第2章中,我们了解了Google流感趋势如何将始终在线的大数据系统(搜索查询)与基于概率的传统测量系统(CDC流感监测系统)相结合,以产生更快的估算(Ginsberg et al. 2009) 。在第3章中,我们看到了Stephen Ansolabehere和Eitan Hersh (2012)将定制的调查数据与现成的政府行政数据相结合,以便更多地了解实际投票的人的特征。在第4章中,我们看到了Opower实验如何将现成的电力测量基础设施与定制治疗相结合,以研究社会规范对数百万人行为的影响(Allcott 2015) 。最后,在第5章中,我们看到Kenneth Benoit及其同事(2016)如何将定制的人群编码过程应用于由政党创建的现成宣言集,以创建研究人员可用于研究政策辩论动态的数据。
这四个例子都表明,未来强有力的战略将是丰富大数据源,这些数据源不是为研究创造的,而是提供更多信息,使其更适合研究(Groves 2011) 。无论是从定制产品还是现成品开始,这种混合风格对许多研究问题都有很大希望。