人计算,可以有一千个研究助理。
人工计算项目结合了许多非专家的工作来解决计算机无法轻易解决的易于任务的大规模问题。他们使用split-apply-combine策略将一个大问题分解成许多简单的微任务,这些微任务可以由没有专业技能的人解决。计算机辅助的人类计算系统也使用机器学习来放大人的努力。
在社会研究中,人类计算项目最有可能用于研究人员想要对图像,视频或文本进行分类,编码或标记的情况。这些分类通常不是研究的最终产物;相反,它们是分析的原材料。例如,政治宣言的人群编码可以用作对政治辩论动态的分析的一部分。当这些分类微任务不需要专门培训并且对正确答案有广泛的一致意见时,它们可能最有效。如果分类任务更主观 - 例如,“这个新闻故事是否有偏见?” - 那么了解谁参与以及他们可能带来什么偏见变得越来越重要。最后,人类计算项目的输出质量取决于人类参与者提供的输入质量:垃圾输入,垃圾输出。
为了进一步建立你的直觉,表5.1提供了人类计算如何在社会研究中使用的其他例子。该表显示,与Galaxy Zoo不同,许多其他人类计算项目使用微任务劳动力市场(例如,亚马逊机械土耳其人)并依赖付费工人而非志愿者。当我提供关于创建自己的大规模协作项目的建议时,我将回到这个参与者动机问题。
概要 | 数据 | 参与者 | 参考 |
---|---|---|---|
代码政党宣言 | 文本 | 微型劳动力市场 | Benoit et al. (2016) |
从美国200个城市的占领抗议活动的新闻文章中提取活动信息 | 文本 | 微型劳动力市场 | Adams (2016) |
对报纸文章进行分类 | 文本 | 微型劳动力市场 | Budak, Goel, and Rao (2016) |
从第一次世界大战中的士兵日记中提取事件信息 | 文本 | 志愿者 | Grayson (2016) |
检测地图中的更改 | 图片 | 微型劳动力市场 | Soeller et al. (2016) |
检查算法编码 | 文本 | 微型劳动力市场 | Porter, Verdery, and Gaddis (2016) |
最后,在本节中的例子,人类的计算可以对科学民主化的影响。回想一下,那Schawinski和林托特是研究生当他们开始星系动物园。在此之前的数字时代,一个项目分类一百万星系的分类将需要这么多的时间和金钱,这将仅获实用,适合资金雄厚和耐心教授。这不再是真实的。人类计算项目把许多非专家的工作,解决简单的任务,大尺度问题。接下来,我将你显示,大规模协作也可以应用到需要的专业知识,即使研究者本人可能没有问题,专业知识。