5.2.3結論

人計算,可以有一千個研究助理。

人工計算項目結合了許多非專家的工作來解決計算機無法輕易解決的易於任務的大規模問題。他們使用split-apply-combine策略將一個大問題分解成許多簡單的微任務,這些微任務可以由沒有專業技能的人解決。計算機輔助的人類計算系統也使用機器學習來放大人的努力。

在社會研究中,人類計算項目最有可能用於研究人員想要對圖像,視頻或文本進行分類,編碼或標記的情況。這些分類通常不是研究的最終產物;相反,它們是分析的原材料。例如,政治宣言的人群編碼可以用作對政治辯論動態的分析的一部分。當這些分類微任務不需要專門培訓並且對正確答案有廣泛的一致意見時,它們可能最有效。如果分類任務更主觀 - 例如,“這個新聞故事是否有偏見?” - 那麼了解誰參與以及他們可能帶來什麼偏見變得越來越重要。最後,人類計算項目的輸出質量取決於人類參與者提供的輸入質量:垃圾輸入,垃圾輸出。

為了進一步建立你的直覺,表5.1提供了人類計算如何在社會研究中使用的其他例子。該表顯示,與Galaxy Zoo不同,許多其他人類計算項目使用微任務勞動力市場(例如,亞馬遜機械土耳其人)並依賴付費工人而非志願者。當我提供關於創建自己的大規模協作項目的建議時,我將回到這個參與者動機問題。

表5.1:社會研究中人類計算項目的例子
概要 數據 參與者 參考
代碼政黨宣言 文本 微型勞動力市場 Benoit et al. (2016)
從美國200個城市的佔領抗議活動的新聞文章中提取活動信息 文本 微型勞動力市場 Adams (2016)
對報紙文章進行分類 文本 微型勞動力市場 Budak, Goel, and Rao (2016)
從第一次世界大戰中的士兵日記中提取事件信息 文本 志願者 Grayson (2016)
檢測地圖中的更改 圖片 微型勞動力市場 Soeller et al. (2016)
檢查算法編碼 文本 微型勞動力市場 Porter, Verdery, and Gaddis (2016)

最後,在本節中的例子,人類的計算可以對科學民主化的影響。回想一下,那Schawinski和林托特是研究生當他們開始星系動物園。在此之前的數字時代,一個項目分類一百萬星系的分類將需要這麼多的時間和金錢,這將僅獲實用,適合資金雄厚和耐心教授。這不再是真實的。人類計算項目把許多非專家的工作,解決簡單的任務,大尺度問題。接下來,我將告訴你,大規模的合作,也可以應用於要求expertise,即使是自己的研究員可能沒有問題,專業知識。