5.3.4结论

打开电话让很多专家和非专家提出解决方案,到解决方案比产生容易检查的问题。

在所有三个公开征集项目,Netflix的奖,Foldit,点对点的专利,研究人员提出了具体形式的问题,征求解决方案,然后选择了最好的解决方案。研究人员甚至不需要知道要问最好的专家,有时好点子来自意想不到的地方来了。

现在,我还可以突出显示公开征集项目和人力计算项目之间有两个重要的区别。首先,在公开征集项目的研究人员指定,而在人脑运算研究指定一个微任务目标(例如,预测电影评级)(例如,分类的星系)。其次,在打开调用的研究人员希望最好的贡献,最好的算法预测电影的收视率,蛋白质的能量最低的配置,或者最相关的一件现有技术,不是某种所有的贡献简单组合的。

鉴于公开电话和这三个例子的通用模板,什么样的社会问题的研究可能适用于这种做法?在这一点上,我应该承认,再也没有出现过很多成功的例子,但(对于我将在稍后解释原因)。在直接类似物而言,我们可以想像,正由历史研究者寻找最早的文档的对专利的风格的项目提一个特定的人或思想。如果在一个存档没有收集相关的文件,但分布广泛公开征集的方式,以这种问题可能是特别有价值。

更一般地,许多国家的政府有问题,可能是适合,因为他们是如何创建可用于指导行动的预测打开电话(Kleinberg et al. 2015) 。例如,就像Netflix公司想在预测收视率的电影,政府可能要预测结果,如该餐厅最有可能的健康违规行为,以更有效地分配视察资源。通过这样的问题,上进Glaeser et al. (2016)使用的公开征集,帮助波士顿市预测基于来自Yelp的评论和历史的检验数据数据餐厅个人卫生和环境卫生的行为。格莱泽和同事们估计,赢得了公开征集的预测模型将约50%提高餐厅检查员的工作效率。商家也有类似的结构问题,如预测客户流失(Provost and Fawcett 2013)

最后,除开涉及那些已经发生在一个特定的数据集的结果调用(例如,预测使用以往的医疗违规行为数据卫生代码违规),人们可以想像预测,并没有在数据没有发生过任何人的成果。例如,脆弱的家庭和儿童福利研究跟踪了自出生约5000儿童在20个不同的美国城市(Reichman et al. 2001)研究人员收集的数据对这些孩子,他们的家庭,出生时其更广泛的环境,并在9岁1,3,5,和15。鉴于对这些孩子的所有信息,如何能研究人员预测的结果,比如谁即将毕业从大学?或者说,在某种程度上,这将是更有趣的许多研究人员,其中的数据和理论是最有效预测这些成果表示?由于没有这些儿童目前都已经长大,考上大学,这将是一个真正的前瞻性的预测,有研究人员可能会采用多种不同的策略。一位研究员谁认为,社区是在塑造生活结果可能采取的一种方法,而谁侧重于家庭的研究人员可能会做一些完全不同的关键。其中这些方法会更好地工作?我们不知道,并找出我们可以学到一些关于家庭,邻里,教育和社会不平等的重要过程。此外,这些预测可以被用来引导未来数据收集。试想一下,有迹象表明,不预测任何型号的毕业高校毕业生数量少;这些人将成为后续的定性访谈和人种学观测的理想人选。因此,在这种公开的呼叫中,预测是不是结束;相反,他们提供了新的方式来比较,充实,并结合不同的理论传统。这种公开征集的是不特定使用来自脆弱家庭的数据来预测谁去上大学;它可以用来预测,最终将在任何纵向社交数据集收集的任何结果。

正如我在本节前面写了,再也没有出现过使用开放调用社会研究者的例子很多。我认为,这是因为开放的呼叫不很适合于社会科学家通常框架他们的问题的方式。返回到Netflix的奖,社会科学家通常不会问预测的口味,他们会问关于文化如何以及为什么味道来自不同社会阶层的人不同(Bourdieu 1987) 。这样的“如何”和“为什么”的问题不会导致容易验证的解决方案,因此认为适合不佳打开电话。因此,似乎打开呼叫更易于预测解释问题的问题;更多的预测与解释之间的区别看Breiman (2001) 。最近的理论家,但是,已经呼吁社会科学家重新解释和预测之间的二分法(Watts 2014) 。由于预测和解释模糊的界限,我希望公开比赛将在社会科学中变得越来越普遍。