commentary salajengna

Bagian ieu dirarancang pikeun dipaké minangka rujukan, tinimbang jadi maca salaku naratif a.

  • Bubuka (Bagéan 5.1)

Kolaborasi Massa blends gagasan ti élmu warga, crowdsourcing, sarta kecerdasan koléktif. Élmu warga biasana hartina ngalibetkeun "warga" (ie, non-élmuwan) dina prosés ilmiah (Crain, Cooper, and Dickinson 2014) . Crowdsourcing biasana hartina nyokot masalah biasana direngsekeun dina hiji organisasi jeung gantina outsourcing ka hiji riungan (Howe 2009) . Kecerdasan koléktif biasana hartina kelompok individu akting koléktif cara nu sigana calakan (Malone and Bernstein 2015) . Nielsen (2012) mangrupa bubuka buku-panjang éndah kana kakawasaan kolaborasi massa pikeun panalungtikan ilmiah.

Aya loba jenis kolaborasi massa nu teu cocog rapih kana tilu kategori nu diusulkeun, sarta Jigana tilu pantas perhatian husus sabab bisa jadi mangpaat dina panalungtikan sosial di sawatara titik. Salah sahiji conto nyaeta pasar prediksi, di mana peserta meuli jeung kontrak dagang nu redeemable dumasar kana hasil anu lumangsung di dunya (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Pasar ngaramal mindeng dipaké ku firms jeung pamaréntah pikeun forecasting, jeung pasar ngaramal geus ogé geus digunakeun ku panalungtik sosial keur prediksi replicability studi diterbitkeun dina psikologi (Dreber et al. 2015) .

A conto kadua nu teu cocog oge kana skéma categorization mah proyék PolyMath, di mana panalungtik gawé bareng ngagunakeun blog jeung wikis ngabuktikeun theorems math anyar (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Proyék PolyMath aya dina sababaraha cara sarupa Hadiah Netflix, tapi dina pamilon proyék PolyMath leuwih aktip diwangun dina leyuran parsial batur.

A conto katilu nu teu cocog oge kana skéma categorization mah mobilizations time-gumantung saperti Badan Pertahanan Advanced Research Projects (DARPA) Network tangtangan (ie, Beureum balon tangtangan). Pikeun leuwih dina waktu ieu mobilizations sensitip tempo Pickard et al. (2011) , Tang et al. (2011) , jeung Rutherford et al. (2013) .

  • Ngitung manusa (Bagéan 5.2)

Istilah "ngitung manusa" asalna kaluar ti pagawean dilakukeun ku élmuwan komputer, jeung ngarti kana konteks balik ieu panalungtikan bakal ngaronjatkeun pangabisa anjeun nyokot kaluar masalah anu bisa jadi amenable ka eta. Keur tugas nu tangtu, komputer nu incredibly kuat jeung kamampuhan jauh exceeding manusa malah ahli. Contona, dina catur, komputer bisa ngéléhkeun komo pangalusna grand Masters. Tapi-jeung ieu kurang well ngaapresiasi ku sosial élmuwan-keur tugas séjén, komputer sabenerna loba leuwih goreng ti urang. Dina basa sejen, ayeuna anjeun leuwih hade tinimbang komo komputer paling canggih di tugas nu tangtu mimilukeun processing gambar, video, audio, jeung téks. Ku kituna-saperti ieu gambar ku XKCD éndah kartun-aya tugas anu gampang pikeun komputer jeung teuas pikeun jalma, tapi aya ogé tugas anu teuas pikeun komputer jeung gampang pikeun jalma (Gambar 5.13). élmuwan komputer dipake dina ieu keras pikeun-komputer-gampang-pikeun-manusa tugas, saba kitu, sadar yén maranéhanana bisa ngawengku manusa dina prosés komputer maranéhanana. Di dieu nu kumaha Luis von Ahn (2005) ditétélakeun ngitung manusa sabot mimiti diciptakeun istilah dina disertasi-Na: ". Paradigma pikeun ngamangpaatkeun kakawasaan processing manusa pikeun ngajawab masalah anu komputer teu bisa can ngajawab"

Angka 5,13: Kanggo sababaraha tugas komputer anu endah pisan, exceeding kamampuh ahli manusa. Tapi, keur tugas séjén, manusa biasa bisa outperform sistem komputer komo canggih. masalah skala badag anu ngalibetkeun tugas anu teuas pikeun komputer jeung gampang pikeun manusa well-cocog keur ngitung manusa. Dipaké nurutkeun istilah digambarkeun di dieu: http://xkcd.com/license.html

Angka 5,13: Kanggo sababaraha tugas komputer anu endah pisan, exceeding kamampuh ahli manusa. Tapi, keur tugas séjén, manusa biasa bisa outperform sistem komputer komo canggih. masalah skala badag anu ngalibetkeun tugas anu teuas pikeun komputer jeung gampang pikeun manusa well-cocog keur ngitung manusa. Dipaké nurutkeun istilah digambarkeun di dieu: http://xkcd.com/license.html

Ku definisi ieu FoldIt-nu kuring dijelaskeun dina bagian dina kabuka télépon-bisa dianggap proyék ngitung manusa. Tapi, kuring milih ngararangkay FoldIt salaku telepon kabuka sabab merlukeun kaahlian husus sarta nyokot leyuran pangalusna nyumbang tinimbang make pamisah-panawaran-ngagabung strategi.

Pikeun perlakuan panjang buku alus teuing tina ngitung manusa, dina rasa paling umum istilah, tempo Law and Ahn (2011) . Bab 3 Law and Ahn (2011) boga sawala metot of ngagabung léngkah nu leuwih kompleks tinimbang nu leuwih dina bab ieu.

Istilah "pamisah panawaran--ngagabung" ieu dipaké ku Wickham (2011) pikeun ngagambarkeun hiji strategi keur komputasi statistical, tapi sampurna ngarebut prosés loba proyék ngitung manusa. Nu pamisah-panawaran-ngagabung strategi sarua jeung kerangka MapReduce dimekarkeun di Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Dua proyék ngitung manusa palinter mah teu boga rohangan pikeun ngabahas nu Game ESP (Ahn and Dabbish 2004) jeung reCAPTCHA (Ahn et al. 2008) . Boh proyék ieu kapanggih cara kreatif pikeun memotivasi peserta pikeun nyadiakeun labél dina gambar. Tapi, boh proyék ieu ogé diangkat patarosan etika sabab, kawas Smithsonian Galaxy, pamilon dina Game ESP jeung reCAPTCHA teu nyaho kumaha data maranéhanana ieu dipake (Lung 2012; Zittrain 2008) .

Diideuan ku Game ESP, loba panalungtik ngusahakeun pikeun ngembangkeun batur "kaulinan jeung tujuan a" (Ahn and Dabbish 2008) (ie, "ngitung dumasar manusa-kaulinan" (Pe-Than, Goh, and Lee 2015) ) nu bisa dipaké pikeun ngajawab rupa-rupa masalah séjén. Naon ieu "kaulinan jeung tujuan" geus di umum nyaeta aranjeunna nyoba nyieun tugas aub dina ngitung manusa nikmat. Ku kituna, sedengkeun Game ESP babagi sarua pamisah-panawaran-ngagabung struktur jeung Smithsonian Galaxy, eta beda di kumaha pamilon anu ngamotivasi-fun vs. kahayang pikeun mantuan élmu.

Katerangan mah Smithsonian Galaxy draws dina Nielsen (2012) , Adams (2012) , Clery (2011) , jeung Hand (2010) , jeung presentasi mah tujuan panalungtikan Smithsonian Galaxy ieu disederhanakeun. Pikeun leuwih dina sajarah klasifikasi galaksi di astronomi jeung kumaha Smithsonian Galaxy terus tradisi ieu, tempo Masters (2012) jeung Marshall, Lintott, and Fletcher (2015) . Gedong dina Smithsonian Galaxy, panalungtik réngsé Galaxy Smithsonian 2 nu dikumpulkeun leuwih ti 60 juta leuwih klasifikasi morfologis kompléks ti sukarelawan (Masters et al. 2011) . Salajengna, maranehna cabang kaluar kana masalah luar morfologi galaksi kaasup Ngalanglang beungeut bulan, neangan planét, sarta transcribing dokumén heubeul. Ayeuna, sadaya proyék-proyék maranéhanana dikumpulkeun di www.zooniverse.org (Cox et al. 2015) . Salah sahiji proyék-Snapshot Serengeti-nyadiakeun bukti yén Galaxy Smithsonian tipe proyék klasifikasi image ogé bisa dipigawé pikeun panalungtikan lingkungan (Swanson et al. 2016) .

Pikeun panalungtik perencanaan ngagunakeun pasar tanaga gawé mikro-tugas (misalna Amazon Mechanical Turk) pikeun proyék ngitung manusa, Chandler, Paolacci, and Mueller (2013) jeung Wang, Ipeirotis, and Provost (2015) nawarkeun nasihat alus dina desain tugas jeung isu nu patali lianna.

Panalungtik kabetot dina nyieun naon geus mah disebut generasi kadua sistem ngitung manusa (misalna sistem anu ngagunakeun labél manusa ngalatih hiji model pembelajaran mesin) bisa jadi kabetot dina Shamir et al. (2014) (pikeun conto ngagunakeun média audio) jeung Cheng and Bernstein (2015) . Oge, proyék ieu bisa dipigawé jeung telepon kabuka, whereby panalungtik bersaing pikeun nyieun model mesin learning jeung kinerja predictive greatest. Contona, tim Smithsonian Galaxy lumpat telepon kabuka sarta kapanggih pendekatan anyar nu outperformed hiji dimekarkeun di Banerji et al. (2010) ; tempo Dieleman, Willett, and Dambre (2015) pikeun wincikanana.

  • Open télépon (Bagéan 5,3)

telepon Open teu anyar. Dina kanyataan, salah sahiji sauran kabuka pang alusna-dipikawanoh balik deui ka 1714 basa DPR Britania sacara dijieun The Bujur Hadiah keur saha anu bisa ngamekarkeun cara pikeun nangtukeun bujur kapal di laut. Masalah stumped loba élmuwan greatest tina poé, kaasup Isaac Newton, jeung leyuran unggul ieu pamustunganana nyerah ku clockmaker ti padesaan anu ditilik masalah béda ti élmuwan anu fokus kana leyuran nu kumaha bae bakal kaasup astronomi (Sobel 1996) . Salaku conto ieu illustrates, hiji alesan nu asup kabuka nu mikir pikeun digawe jadi oge nyaeta aranjeunna nyadiakeun aksés ka jalma nu perspéktif jeung kaahlian beda (Boudreau and Lakhani 2013) . Tempo Hong and Page (2004) jeung Page (2008) leuwih dina nilai diversity di ngarengsekeun masalah.

Unggal kasus telepon kabuka dina bab butuh bit kieu salajengna keur naha milik di ieu kategori. Kahiji, salah sahiji cara anu ngabedakeun antara ngitung manusa jeung proyék telepon kabuka naha output téh rata-rata kabéh leyuran (ngitung manusa) atawa leyuran pangalusna (open telepon). Nu Netflix Hadiah mangrupa rada tricky di hal ieu alatan leyuran pangalusna tétéla jadi rata canggih tina leyuran individual, hiji ditilik disebut leyuran ensemble (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Ti perspektif Netflix kitu, kabeh geus maranehna ngalakukeun ieu nyokot leyuran pangalusna.

Kadua, ku sababaraha pedaran ngeunaan ngitung manusa (misalna Von Ahn (2005) ), FoldIt kudu dianggap proyék ngitung manusa. Tapi, kuring milih ngararangkay FoldIt salaku telepon kabuka sabab merlukeun kaahlian husus sarta nyokot leyuran pangalusna nyumbang, tinimbang make pamisah-panawaran-ngagabung strategi.

Ahirna, hiji bisa ngajawab yén peer-to-Patén mangrupakeun conto kumpulan data sebaran. Kuring milih di antarana salaku telepon kabuka sabab mibanda struktur kontes kawas jeung ngan kontribusi pangalusna dipaké (sedengkeun jeung kumpulan data sebaran, pamanggih kontribusi alus jeung goréng kurang jelas).

Pikeun leuwih dina Hadiah Netflix, tempo Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , jeung Feuerverger, He, and Khatri (2012) . Pikeun nu langkung lengkep ihwal FoldIt tingali, Cooper et al. (2010) , Andersen et al. (2012) , jeung Khatib et al. (2011) ; katerangan mah FoldIt draws dina déskripsi dina Nielsen (2012) , Bohannon (2009) , jeung Hand (2010) . Pikeun leuwih dina peer-to-Patén, tempo Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , jeung Noveck (2009) .

Sarua jeung hasil Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , Bab 10 laporan gains gede dina produktivitas inspectors perumahan di New York City lamun Citatah anu dipandu ku model prediksi. Dina New York City, ieu model prediksi anu diwangun ku pagawé kota, tapi dina kasus séjén, hiji bisa dibayangkeun yén maranéhanana bisa dijieun atawa ningkat jeung telepon kabuka (misalna Glaeser et al. (2016) ). Tapi, hiji perhatian utama jeung model prediksi dipake ka allocate sumber nu model boga potensi pikeun nguatkeun biases aya. Loba panalungtik geus nyaho "runtah di, runtah kaluar", jeung jeung model prediksi bisa jadi "bias di, bias kaluar." Tempo Barocas and Selbst (2016) jeung O'Neil (2016) leuwih dina bahaya model prediksi diwangun jeung data latihan bias.

Hiji masalah anu bisa nyegah pamaréntah ti ngagunakeun contests kabuka nu merlukeun release data, anu bisa ngakibatkeun pelanggaran privasi. Pikeun leuwih jéntré ngeunaan privasi jeung release data dina telepon kabuka tempo Narayanan, Huey, and Felten (2016) jeung sawala dina Bab 6.

  • Kumpulan data sebaran (Bagéan 5,4)

Katerangan mah eBird draws dina déskripsi dina Bhattacharjee (2005) jeung Robbins (2013) . Pikeun langkung lengkep ihwal kumaha panalungtik ngagunakeun model statistik ka nganalisis data eBird tempo Hurlbert and Liang (2012) jeung Fink et al. (2010) . Pikeun leuwih dina sajarah élmu warga di ornothology, tempo Greenwood (2007) .

Pikeun leuwih dina jurnal Project Malawi, tempo Watkins and Swidler (2009) jeung Kaler, Watkins, and Angotti (2015) . Jeung pikeun leuwih dina proyék patali di Afrika Kidul, tempo Angotti and Sennott (2015) . Pikeun conto leuwih panalungtikan ngagunakeun data ti Project Malawi jurnal tempo Kaler (2004) jeung Angotti et al. (2014) .

  • Ngarancang Anjeun sorangan (Bagéan 5,5)

pendekatan mah ngalamar nasihat desain ieu induktif, dumasar kana conto suksés jeung gagal proyék kolaborasi massa nu geus Nu Uninga Ngeunaan. Aya ogé stream panalungtikan nyoba panawaran leuwih umum téori psikologi sosial ka ngarancang masarakat online nu sasuai pikeun desain proyék kolaborasi massa, tempo, contona, Kraut et al. (2012) .

Ngeunaan motivating pamilon, eta sabenerna cukup tricky ka angka kaluar persis naha urang ilubiung dina proyék kolaborasi massa (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Lamun rencana pikeun memotivasi peserta jeung pamayaran dina pasar tanaga gawé mikro-tugas (misalna Amazon Mechanical Turk) Kittur et al. (2013) nawarkeun sababaraha saran.

Ngeunaan sangkan reuwas, pikeun conto leuwih pamanggihan teu kaduga datang kaluar proyék Zoouniverse, tempo Marshall, Lintott, and Fletcher (2015) .

Ngeunaan keur etika, sababaraha perkenalan umum alus pikeun isu aub nu Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , jeung Zittrain (2008) . Pikeun isu husus nu patali jeung isu hukum jeung pagawé riungan, tempo Felstiner (2011) . O'Connor (2013) alamat patarosan ngeunaan pangawasan etika panalungtikan lamun kalungguhan peneliti jeung pamilon blur. Pikeun isu nu patali jeung babagi data bari mayungan participats dina proyék élmu warga, tempo Bowser et al. (2014) . Boh Purdam (2014) jeung Windt and Humphreys (2016) geus sababaraha sawala ngeunaan isu etika dina kumpulan data sebaran. Ahirna, paling proyék ngaku kontribusi tapi teu méré kiridit Pangarang ka pamilon. Dina Foldit, pamaén Foldit mindeng didaptarkeun salaku panulis (Cooper et al. 2010; Khatib et al. 2011) . Dina proyék telepon kabuka sejen, pangdeudeul unggul mindeng bisa nulis tulisan ngajéntrékeun leyuran maranéhanana (misalna Bell, Koren, and Volinsky (2010) jeung Dieleman, Willett, and Dambre (2015) ). Dina kulawarga Smithsonian Galaxy proyék, kontributor pisan aktif jeung penting kadang diondang jadi ko-pangarang dina tulak. Contona, Ivan Terentev jeung Tim Matorny, dua pamilon Radio Galaxy Smithsonian ti Rusia, éta ko-pangarang dina salah sahiji tulak nu jengkar ti proyék nu (Banfield et al. 2016; Galaxy Zoo 2016) .