3.6与大数据源相关的调查

将调查链接到大数据源使您可以生成单独使用任一数据源无法进行的估算。

大多数调查都是独立的,自足的。它们不是相互依赖的,并且它们不利用世界上存在的所有其他数据。这会改变。通过将调查数据与第2章中讨论的大数据源相关联,实在是太多了。通过组合这两种类型的数据,通常可以单独使用其中任何一种来完成某些操作。

调查数据可以通过几种不同的方式与大数据源相结合。在本节中,我将描述两种有用且不同的方法,我将其称为丰富的询问放大的询问 (图3.12)。虽然我将通过详细示例来说明每种方法,但您应该认识到这些是可以与不同类型的调查数据和不同类型的大数据一起使用的一般配方。此外,您应该注意到,可以通过两种不同的方式查看这些示例中的每一个。回顾第1章中的想法,有些人会将这些研究视为“定制”调查数据增强“现成”大数据的例子,而其他人则将其视为“现成”大数据增强“定制”调查数据的例子。您应该能够看到两个视图。最后,您应该注意到这些示例如何澄清调查和大数据源是补充而非替代。

图3.12:两种组合大数据源和调查数据的方法。在丰富的要求(第3.6.1节)中,大数据源具有感兴趣的核心度量,并且调查数据围绕它构建必要的上下文。在放大的询问(第3.6.2节)中,大数据源没有感兴趣的核心指标,但它用于放大调查数据。

图3.12:两种结合大数据源和调查数据的方法。在丰富的要求(第3.6.1节)中,大数据源具有感兴趣的核心度量,并且调查数据围绕它构建必要的上下文。在放大的询问(第3.6.2节)中,大数据源没有感兴趣的核心指标,但它用于放大调查数据。