维基百科很棒。志愿者的大规模合作创造了一个可供所有人使用的精彩百科全书。维基百科成功的关键不是新知识;相反,它是一种新的合作形式。幸运的是,数字时代可以实现许多新的合作形式。因此,我们现在应该问:哪些大规模的科学问题 - 我们无法单独解决的问题 - 我们现在能够共同解决这些问题吗?
研究协作是什么新鲜事,当然。什么是新的,但是,是数字时代能够与一个更大,更多样化的合作人:人在世界各地数十亿互联网接入。我希望这些新的合作质量会产生惊人的结果不只是因为涉及的人数,因为其多样的技能和观点,但也。我们如何将大家与互联网连接到我们的研究过程?您能够利用100个研究助理吗?什么约10万熟练的合作者?
有许多形式的大规模协作,计算机科学家通常根据其技术特征将它们组织成大量类别(Quinn and Bederson 2011) 。然而,在本章中,我将基于如何将它们用于社会研究来对大规模协作项目进行分类。特别是,我认为粗略区分三种类型的项目是有帮助的: 人工计算 , 公开调用和分布式数据收集 (图5.1)。
我将在本章后面更详细地描述这些类型,但现在让我简要介绍一下。 人工计算项目非常适合轻松任务大规模的问题,例如标记一百万张图像。这些项目过去可能由本科研究助理执行。贡献不需要与任务相关的技能,最终输出通常是所有贡献的平均值。人类计算项目的一个典型例子是银河动物园,十万名志愿者帮助天文学家对一百万个星系进行了分类。另一方面, 公开呼叫项目非常适合于您正在寻找明确制定的问题的新颖和意想不到的答案的问题。这些项目过去可能涉及询问同事。贡献来自具有特殊任务相关技能的人,最终产出通常是所有贡献中最好的。一个开放式电话的典型例子是Netflix奖,成千上万的科学家和黑客致力于开发新算法来预测客户对电影的评分。最后, 分布式数据收集项目非常适合大规模数据收集。这些项目过去可能由本科研究助理或调查研究公司执行。贡献通常来自可以访问研究人员不能访问的位置的人,最终产品是贡献的简单集合。分布式数据收集的一个典型例子是eBird,其中成千上万的志愿者提供有关他们看到的鸟类的报告。
大规模合作在诸如天文学(Marshall, Lintott, and Fletcher 2015)和生态学(Dickinson, Zuckerberg, and Bonter 2010)等领域有着悠久而丰富的历史,但在社会研究中尚未普及。但是,通过描述其他领域的成功项目并提供一些关键的组织原则,我希望能说服你两件事。首先, 可以利用群众协作进行社会研究。其次,使用大规模协作的研究人员将能够解决以前似乎不可能的问题。尽管大规模协作通常被视为节省资金的一种方式,但远不止于此。正如我将要展示的那样,大规模协作不仅让我们更便宜地进行研究,它还可以让我们更好地进行研究。
在前面的章节中,您已经看到了通过以三种不同的方式与人交往可以学到什么:观察他们的行为(第2章),向他们提问(第3章),并将他们注册到实验中(第4章)。在本章中,我将向您展示通过让人们成为研究合作者可以学到什么。对于大规模协作的三种主要形式中的每一种,我将描述一个典型的例子,用进一步的例子说明重要的附加点,最后描述这种形式的大规模协作如何用于社会研究。本章将总结五个原则,可以帮助您设计自己的大规模协作项目。