Dodatne komentar

Ta del je namenjen za uporabo kot referenca, namesto da se glasi pripoved.

  • Uvod (oddelek 5.1)

Mass sodelovanje združuje zamisli državljanov znanosti, crowdsourcing in kolektivne inteligence. Citizen znanost ponavadi pomeni vključevanje "državljanov" (tj ne-znanstveniki) v znanstveni proces (Crain, Cooper, and Dickinson 2014) . Crowdsourcing ponavadi pomeni ob problem ponavadi rešiti znotraj organizacije, in namesto tega outsourcing v množici (Howe 2009) . Kolektivna inteligenca ponavadi pomeni, skupine posameznikov, ki delujejo skupaj na način, ki se zdi, inteligentne (Malone and Bernstein 2015) . Nielsen (2012) je čudovit uvod knjige dolžine v moč množično sodelovanje za znanstvene raziskave.

Obstaja veliko vrst množično sodelovanje, ki ne sodijo lepo v tri kategorije, ki sem jo predlagal, in mislim, da trije zaslužijo posebno pozornost, saj bi lahko bilo koristno v socialnih raziskav na neki točki. En primer je napoved trge, kjer kupujejo udeleženci in trgovinske pogodbe, ki so unovčljive na podlagi rezultatov, ki se pojavljajo v svetu (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Napovedujejo trgi so jih podjetja in vlade pogosto uporabljajo za napovedovanje in napovedovanje trgi so socialni raziskovalci uporabljajo tudi za napovedovanje ponovljivost objavljenih študij psihologije (Dreber et al. 2015) .

Drugi primer, ki ne sodi tudi v svoj ​​sistem razvrščanja je projekt polihistor, kjer raziskovalci sodelovali uporabo blogi in wikiji dokazati novih matematičnih izrekov (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Projekt polihistor je v nekaterih pogledih podobne nagrade Netflix, vendar udeleženci polihistor projekta bolj aktivno zgrajena na delne rešitve drugih.

Tretji primer, ki ne sodi tudi v svoj sistem razvrščanja je odvisen od časa mobilizacije, kot so Advanced Research Agency obrambnih projektov (DARPA) omrežja Challenge (tj Red Balloon Challenge). Za več informacij o teh časa občutljive mobilizacija glej Pickard et al. (2011) , Tang et al. (2011) , in Rutherford et al. (2013) .

  • Human računanje (oddelek 5.2)

Izraz "človeški računanje" prihaja iz dela, ki ga računalniški znanstveniki opravili, in razumeti kontekst v ozadju te raziskave bo izboljšala svojo sposobnost, da poberem iz težav, ki so lahko predmet njim. Za nekatere naloge, računalniki so neverjetno močna s sposobnostmi daleč presega celo strokovne ljudi. Na primer, v šahu, lahko računalniki premagati tudi najboljše velikih mojstrov. Ampak, kar je manj cenijo družboslovci, za druge naloge, računalniki so dejansko veliko slabše kot ljudje. Z drugimi besedami, zdaj ste boljši od še tako prefinjen računalnik na nekatere naloge, ki vključujejo obdelavo slik, video, avdio in besedilo. Tako, kot je bilo prikazano s čudovitim Xkcd risanke, da so naloge, ki so preproste za računalnike in težko za ljudi, vendar obstajajo tudi naloge, ki jih je težko za računalnike in enostaven za ljudi (Slika 5.13). Računalniški znanstveniki, ki delajo na teh hard-za-računalnikov-enostaven za človeka nalog, zato je spoznal, da bi lahko vključijo ljudi v svoji računski postopek. Takole Luis von Ahn (2005) opisal človeško računanje, ko je prvič skoval izraz v svoji disertaciji: ". Paradigmo za uporabo človeškega procesorske moči za reševanje problemov, ki jih računalniki še ne more rešiti"

Slika 5.13: Za nekatere naloge so računalniki neverjetno, presega zmožnosti človeških strokovnjakov. Ampak, za druge naloge, lahko navadni ljudje prekašajo celo prefinjene računalniki sistemov. Težave velikem obsegu, ki vključujejo naloge, ki jih je težko za računalnike in enostavno za ljudi, so zelo primerna za prehrano računanja. Uporabljajo v skladu s pogoji, opisanimi tukaj: http://xkcd.com/license.html

Slika 5.13: Za nekatere naloge so računalniki neverjetno, presega zmožnosti človeških strokovnjakov. Ampak, za druge naloge, lahko navadni ljudje prekašajo celo prefinjene računalniki sistemov. Težave velikem obsegu, ki vključujejo naloge, ki jih je težko za računalnike in enostavno za ljudi, so zelo primerna za prehrano računanja. Uporabljajo v skladu s pogoji, opisanimi tukaj: http://xkcd.com/license.html

Po tej definiciji FoldIt-, ki sem opisal v poglavju o javnih razpisih, se lahko šteje za izračun projekt človek. Vendar pa sem se odločil za kategorizacijo FoldIt kot javnega razpisa, saj zahteva posebna znanja in traja najboljša rešitev prispeval namesto z split-uporablja-združujejo strategijo.

Za odlično zdravljenje dolžino knjige ljudi računanja, v najbolj splošnem pomenu besede, glej Law and Ahn (2011) . Poglavje 3 Law and Ahn (2011) ima zanimivo razpravo o bolj kompleksnih združujejo korakov od tistih, ki v tem poglavju.

Izraz "split-velja-združujejo", ga je uporabljen Wickham (2011) , ki opisuje strategijo za statistične računalništvo, vendar je popolnoma zajame proces številnih projektov s področja človekovih računanja. The-velja-združujejo split strategija je podobna okviru MapReduce pripravljena na Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Dve pameten človekovih računanja projekti, ki mi niso imeli prostora za razpravo so ESP igre (Ahn and Dabbish 2004) in reCAPTCHA (Ahn et al. 2008) . Oba projekta ugotovljeno, kreativne načine za motiviranje udeležencev za zagotavljanje oznak na slikah. Vendar pa oba projekta postavljeno tudi etična vprašanja, saj za razliko od Galaxy Zoo, ki sodelujejo v ESP divjadi in reCAPTCHA ni vedel, kako so njihovi podatki, ki se uporabljajo (Lung 2012; Zittrain 2008) .

Ki jih je ESP igre Navdih so mnogi raziskovalci poskušali razviti druge "igre z namenom" (Ahn and Dabbish 2008) (tj "računanja na osnovi človek-igre" (Pe-Than, Goh, and Lee 2015) ), ki je lahko uporabljena za reševanje številnih drugih težav. Kaj te "igre z namenom," je skupno to, da so poskušali narediti naloge, ki sodelujejo v človeški izračun prijetno. Tako, medtem ko je ESP Igra ima enako split-velja-kombiniranja strukturo z Galaxy Zoo, se razlikuje v tem, kako so udeleženci motivirani-zabavo v primerjavi z željo, da bi pomagal znanosti.

Moj opis Galaxy Zoo črpa Nielsen (2012) , Adams (2012) , Clery (2011) , in Hand (2010) , in moja predstavitev raziskovalnih ciljev Galaxy Zoo je bila poenostavljena. Za več informacij o zgodovini klasifikaciji galaksij v astronomiji in kako Galaxy Zoo nadaljuje to tradicijo, glej Masters (2012) in Marshall, Lintott, and Fletcher (2015) . Na podlagi Galaxy Zoo, so raziskovalci zaključili Galaxy Zoo 2, ki zberejo več kot 60 milijonov več kompleksnih morfološke klasifikacije iz prostovoljcev (Masters et al. 2011) . Poleg tega so razvejana v težave izven galaksije morfologije vključno raziskuje površino lune, iskanje planetov, in prepisovanje starih dokumentov. Trenutno so vsi njihovi projekti zbirajo na www.zooniverse.org (Cox et al. 2015) . Eden od projektov, Snapshot Serengeti-dokaže, da lahko Galaxy Zoo tipa projektov Klasifikacija slika treba storiti tudi za okoljske raziskave (Swanson et al. 2016) .

Raziskovalci nameravate uporabljati mikro opravil trg dela (npr Amazon Mechanical Turk) za projekt človeškega računanja, Chandler, Paolacci, and Mueller (2013) in Wang, Ipeirotis, and Provost (2015) ponujajo dobre nasvete o oblikovanju nalog in drugih sorodnih vprašanj.

Raziskovalci, ki jih zanima ustvarjanje, kar sem poklical druge generacije sistemov človeškega računanja (na primer sistemi, ki uporabljajo človeške nalepke usposobiti učni model računalnika) morda zanima Shamir et al. (2014) (na primer z uporabo avdio) in Cheng and Bernstein (2015) . Prav tako lahko ti projekti storiti z odprtimi klice, pri čemer raziskovalci tekmujejo za ustvarjanje strojnega učenja modelov z največjo napovedno uspešnost. Na primer, Galaxy Zoo ekipa tekel javni razpis in našel nov pristop, ki uspešnejša tista, razvit v Banerji et al. (2010) ; glej Dieleman, Willett, and Dambre (2015) za podrobnosti.

  • Razpisi (oddelek 5.3)

Razpisi niso nove. Pravzaprav je eden izmed najbolj znanih javnih razpisih, sega v leto 1714, ko je britanski parlament ustvaril zemljepisne dolžine nagrado za vsakogar, ki bi lahko razvili način za določitev dolžine ladje na morju. Problem težavno mnogih največjih znanstvenikov dni, vključno z Isaac Newton, in zmagovalna rešitev je z urar s podeželja, ki približal problem drugače znanstvenikov, ki so osredotočeni na rešitev, ki bi na nek način vključuje astronomijo nazadnje predložene (Sobel 1996) . Ker ta primer kaže, eden od razlogov, da so javni razpisi, da deluje tako dobro, da zagotavljajo dostop do ljudi, ki imajo različne poglede in spretnosti (Boudreau and Lakhani 2013) . Glej Hong and Page (2004) in Page (2008) za več informacij o vrednosti raznolikosti v reševanju problemov.

Vsak od odprtih primerov klicev v poglavju zahteva nekaj nadaljnjo razlago, zakaj spada v to kategorijo. Najprej en način, da razlikuje med človeško računanja in javnega razpisa projektov, ali je proizvodnja v povprečju vseh rešitev (človeški računanja) ali najboljša rešitev (odprta klic). Netflix Nagrada je nekoliko zapleteno, v zvezi s tem, ker je najboljša rešitev se je izkazala za prefinjeno povprečje posamezne rešitve, pristopov, ki se imenuje zasedba rešitev (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Z vidika Netflix, pa je vse, kar so morali storiti je izbrati najboljšo rešitev.

Drugič, po nekaterih definicijah človeškega računanja (na primer, Von Ahn (2005) ), FoldIt je treba šteti za računanje projekt človek. Vendar pa sem se odločil za kategorizacijo FoldIt kot javnega razpisa, saj zahteva posebna znanja in traja prispevala najboljša rešitev, in ne z uporabo split-uporablja-združujejo strategijo.

Končno, bi lahko rekli, da je Peer-to-patentu primer porazdeljene zbiranja podatkov. Sem se odločil, da ga vključite kot javnega razpisa, ker je tekmovanje podobno strukturo in se uporabljajo samo najboljše prispevke (ker s porazdeljeno zbirko podatkov, je zamisel o dobrih in slabih prispevkov je manj jasna).

Za več informacij o nagradi Netflix, glej Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , in Feuerverger, He, and Khatri (2012) . Za več informacij o FoldIt glej Cooper et al. (2010) , Andersen et al. (2012) , ter Khatib et al. (2011) ; moj opis FoldIt opira na opise v Nielsen (2012) , Bohannon (2009) , in Hand (2010) . Za več informacij o Peer-to-patentu, glej Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , in Noveck (2009) .

Podobne rezultate Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , poglavje 10 poročila velikih dobičkov v produktivnosti stanovanjskih inšpektorjev v New Yorku, ko se pregledi ravnajo po napovednih modelov. V New Yorku so se te napovedne modele zgradil mestnih delavcev, ampak tudi v drugih primerih je mogoče zamisliti, da bi jih bilo mogoče ustvariti ali izboljšati z odprtimi klice (npr Glaeser et al. (2016) ). Vendar pa je eden velik problem z napovedne modele, ki se uporablja za dodelitev sredstev, je, da imajo modeli potencial za okrepitev obstoječe predsodke. Mnogi raziskovalci že vem "smeti v, smeti ven", in s napovednih modelov je lahko "prosti tek, v pristranskost ven." Glej Barocas and Selbst (2016) in O'Neil (2016) za več informacij o nevarnostih napovednih modelov zgrajenih z pristranske vadbenih podatkov.

Eden od problemov, ki bi lahko preprečili vladam, da z odprtimi tekmovanja je, da zahteva izpustitev podatkov, kar bi lahko privedlo do kršitve zasebnosti. Za več informacij o zasebnosti in objavi podatkov v javnih razpisih glej Narayanan, Huey, and Felten (2016) in razprava v poglavju 6.

  • Distributed zbiranje podatkov (oddelek 5.4)

Moj opis eBird opira na opise v Bhattacharjee (2005) in Robbins (2013) . Več o tem, kako raziskovalci uporabljajo statistične modele za analizo podatkov eBird glej Hurlbert and Liang (2012) in Fink et al. (2010) . Za več informacij o zgodovini državljanov znanosti ornothology glej Greenwood (2007) .

Za več informacij o Malawi Journals projekt, glej Watkins and Swidler (2009) in Kaler, Watkins, and Angotti (2015) . In več o podobnem projektu v Južni Afriki, glej Angotti and Sennott (2015) . Za več primerov raziskav s pomočjo podatkov iz Malavi Journals projekta glej Kaler (2004) in Angotti et al. (2014) .

  • Oblikovanje lastne (oddelek 5.5)

Moj pristop k nudenju oblikovanje nasvet je induktivna, ki temeljijo na primerih uspešna in ni množično sodelovalnih projektov, ki sem jih slišal. Na voljo je tudi tok raziskav poskuša uporabiti bolj splošne družbene psihološke teorije za oblikovanje spletne skupnosti, ki je pomembna za oblikovanje projektov množično sodelovanje, glej, na primer, Kraut et al. (2012) .

V zvezi z motivacijo udeležencev, je pravzaprav precej zapleteno, da ugotovimo, točno, zakaj ljudje sodelujejo v masi sodelovalnih projektov (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Če nameravate motivirajo udeležence s plačilom na trgu dela mikro nalog (npr Amazon Mechanical Turk) Kittur et al. (2013) ponuja nekaj nasvetov.

Glede omogoča presenečenje, za več primerov nepričakovanih odkritij, ki prihajajo iz projektov Zoouniverse glej Marshall, Lintott, and Fletcher (2015) .

Glede da je etično, nekaj dobrih splošnih vnosi teh vprašanjih so Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , in Zittrain (2008) . Za vprašanja, zlasti v zvezi s pravnimi vprašanji z zaposlenimi množice, glej Felstiner (2011) . O'Connor (2013) obravnava vprašanja o etični nadzor nad raziskavami, ko vloge raziskovalcev in udeležencev zameglitev. Za vprašanja v zvezi z izmenjavo podatkov, hkrati pa ščiti participats v projekte državljanov znanosti, glej Bowser et al. (2014) . Oba Purdam (2014) in Windt and Humphreys (2016) še nekaj razprave o etičnih vprašanjih v porazdeljenih zbiranja podatkov. Končno, večina projektov priznati prispevke, vendar ne dajejo avtorja kredit za udeležence. V Foldit so Foldit igralci pogosto naveden kot avtor (Cooper et al. 2010; Khatib et al. 2011) . V other projektih lahko klicev lahko zmago prispeva pogosto napisati knjigo, ki povzema njihove rešitve (npr Bell, Koren, and Volinsky (2010) in Dieleman, Willett, and Dambre (2015) ). V družini Galaxy Zoo projektov, so zelo aktivni in pomembno prispevajo včasih pozvana, da se soavtorji na papir. Na primer, so bili Ivan Terentev in Tim Matorny, dva udeleženca Radio Galaxy Zoo iz Rusije, soavtorji na enem od dokumentov, ki so nastale iz tega projekta (Banfield et al. 2016; Galaxy Zoo 2016) .