5.2人计算

人工计算项目会遇到一个大问题,将其分解为简单的部分,将它们发送给许多工作人员,然后汇总结果。

人工计算项目结合了许多从事简单微任务工作的人的努力,以解决对一个人来说不可能的大问题。如果你曾经想过,你可能有一个适合人类计算的研究问题:“如果我有一千名研究助理,我可以解决这个问题。”

人类计算项目的典型例子是Galaxy Zoo。在这个项目中,超过十万名志愿者对大约一百万个星系的图像进行了分类,其准确性与专业天文学家早期和小幅度的努力相似。大规模合作提供的这种增加的规模导致了关于星系如何形成的新发现,并且它形成了一种全新的星系类别,称为“绿豆”。

尽管银河动物园似乎远非社会研究,但实际上社会研究人员希望对图像或文本进行编码,分类或标记。在某些情况下,这种分析可以通过计算机完成,但仍然存在某些形式的分析,这些分析对计算机来说很难,但对人们来说却很容易。正是这些易于人,但难以为计算机的微任务,我们可以转向人类计算项目。

不仅银河动物园的微任务非常普遍,而且项目的结构也是一般的。 Galaxy Zoo和其他人类计算项目通常使用拆分 - 应用 - 组合策略(Wickham 2011) ,一旦您理解了这种策略,您就可以使用它来解决许多问题。首先,一个大问题被分成许多小问题块。然后,人类工作被应用于每个小问题块,独立于其他块。最后,将这项工作的结果结合起来,以产生一致的解决方案。鉴于背景,让我们看看如何在Galaxy Zoo中使用split-apply-combine策略。