5.3.4結論

打開電話讓很多專家和非專家提出解決方案,到解決方案比產生容易檢查的問題。

在所有三個公開徵集項目,Netflix的獎,Foldit,點對點的專利,研究人員提出了具體形式的問題,徵求解決方案,然後選擇了最好的解決方案。研究人員甚至不需要知道要問最好的專家,有時好點子來自意想不到的地方來了。

現在,我還可以突出顯示公開徵集項目和人力計算項目之間有兩個重要的區別。首先,在公開徵集項目的研究人員指定,而在人腦運算研究指定一個微任務目標(例如,預測電影評級)(例如,分類的星系)。其次,在打開調用的研究人員希望最好的貢獻,最好的算法預測電影的收視率,蛋白質的能量最低的配置,或者最相關的一件現有技術,不是某種所有的貢獻簡單組合的。

鑑於公開電話和這三個例子的通用模板,什麼樣的社會問題的研究可能適用於這種做法?在這一點上,我應該承認,再也沒有出現過很多成功的例子,但(對於我將在稍後解釋原因)。在直接類似物而言,我們可以想像,正由歷史研究者尋找最早的文檔的對專利的風格的項目提一個特定的人或思想。如果在一個存檔沒有收集相關的文件,但分佈廣泛公開徵集的方式,以這種問題可能是特別有價值。

更一般地,許多國家的政府有問題,可能是適合,因為他們是如何創建可用於指導行動的預測打開電話(Kleinberg et al. 2015)例如,就像Netflix公司想在預測收視率的電影,政府可能要預測結果,如該餐廳最有可能的健康違規行為,以更有效地分配視察資源。通過這樣的問題,上進Glaeser et al. (2016)使用的公開徵集,幫助波士頓市預測基於來自Yelp的評論和歷史的檢驗數據數據餐廳個人衛生和環境衛生的行為。格萊澤和同事們估計,贏得了公開徵集的預測模型將約50%提高餐廳檢查員的工作效率。商家也有類似的結構問題,如預測客戶流失(Provost and Fawcett 2013)

最後,除開涉及那些已經發生在一個特定的數據集的結果調用(例如,預測使用以往的醫療違規行為數據衛生代碼違規),人們可以想像預測,並沒有在數據沒有發生過任何人的成果。例如,脆弱的家庭和兒童福利研究跟踪了自出生約5000兒童在20個不同的美國城市(Reichman et al. 2001)研究人員收集的數據對這些孩子,他們的家庭,出生時其更廣泛的環境,並在9歲1,3,5,和15。鑑於對這些孩子的所有信息,如何能研究人員預測的結果,比如誰即將畢業從大學?或者說,在某種程度上,這將是更有趣的許多研究人員,其中的數據和理論是最有效預測這些成果表示?由於沒有這些兒童目前都已經長大,考上大學,這將是一個真正的前瞻性的預測,有研究人員可能會採用多種不同的策略。一位研究員誰認為,社區是在塑造生活結果可能採取的一種方法,而誰側重於家庭的研究人員可能會做一些完全不同的關鍵。其中這些方法會更好地工作?我們不知道,並找出我們可以學到一些關於家庭,鄰里,教育和社會不平等的重要過程。此外,這些預測可以被用來引導未來數據收集。試想一下,有跡象表明,不預測任何型號的畢業高校畢業生數量少;這些人將成為後續的定性訪談和人種學觀測的理想人選。因此,在這種公開的呼叫中,預測是不是結束;相反,他們提供了新的方式來比較,充實,並結合不同的理論傳統。這種公開徵集的是不特定使用來自脆弱家庭的數據來預測誰去上大學;它可以用來預測,最終將在任何縱向社交數據集收集的任何結果。

正如我在本節前面寫了,再也沒有出現過使用開放調用社會研究者的例子很多。我認為,這是因為開放的呼叫不很適合於社會科學家通常框架他們的問題的方式。返回到Netflix的獎,社會科學家通常不會問預測的口味,他們會問關於文化如何以及為什麼味道來自不同社會階層的人不同(Bourdieu 1987) 。這樣的“如何”和“為什麼”的問題不會導致容易驗證的解決方案,因此認為適合不佳打開電話。因此,似乎打開呼叫更易於預測解釋問題的問題;更多的預測與解釋之間的區別看Breiman (2001) 。最近的理論家,但是,已經呼籲社會科學家重新解釋和預測之間的二分法(Watts 2014) 。由於預測和解釋模糊的界限,我希望公開比賽將在社會科學中變得越來越普遍。