Масовната соработка ги спојува идеите од науката на граѓаните , толкувачи и колективна интелигенција . Граѓанската наука обично значи вклучување на "граѓани" (т.е. ненаучни) во научниот процес; за повеќе, видете Crain, Cooper, and Dickinson (2014) и Bonney et al. (2014) . Crowdsourcing обично значи преземање на проблем што вообичаено се решава во рамките на една организација и наместо да го пренасочи кон толпата; за повеќе, видете Howe (2009) . Колективната интелигенција обично подразбира групи на поединци кои дејствуваат колективно на начини кои изгледаат интелигентни; за повеќе, видете Malone and Bernstein (2015) . Nielsen (2012) е вовед во должина на книга за моќта на масовна соработка за научни истражувања.
Постојат многу видови на масовна соработка кои не се вклопуваат добро во трите категории што ги предложив и мислам дека три од нив заслужуваат посебно внимание, бидејќи тие би можеле да бидат корисни во општествените истражувања. Еден пример е пазарите за предвидување, каде што учесниците купуваат и тргуваат со договори кои се откупливи врз основа на резултатите што се случуваат во светот. Предвидувањата на пазарите често се користат од страна на фирмите и владите за предвидување и тие исто така се користат од страна на социјалните истражувачи за да се предвиди повторливоста на објавените студии во психологијата (Dreber et al. 2015) . За преглед на пазарите за предвидување, види Wolfers and Zitzewitz (2004) и Arrow et al. (2008) .
Вториот пример кој не се вклопува добро во мојата шема за категоризација е PolyMath проектот, каде истражувачите соработуваа користејќи блогови и викија за да докажат нови математички теореми. Проектот PolyMath е на некој начин сличен на наградата Netflix, но во овој проект учесниците поактивно се изградени на парцијалните решенија на другите. За повеќе за PolyMath проектот, видете Gowers and Nielsen (2009) , Cranshaw and Kittur (2011) , Nielsen (2012) , и Kloumann et al. (2016) .
Трет пример кој не се вклопува добро во мојата шема за категоризација е онаа на мобилизирањата зависни од времето, како што е Мрежата предизвик на Агенцијата за напредни истражувачки проекти (DARPA) (т.е. Црвениот балон предизвик). За повеќе информации за овие мобилизирани мобилни Pickard et al. (2011) погледнете го Pickard et al. (2011) , Tang et al. (2011) и Rutherford et al. (2013) .
Терминот "човечки пресметки" произлегува од работата на компјутерските научници, а разбирањето на контекстот зад ова истражување ќе ја подобри вашата способност да одберат проблеми кои би можеле да бидат соодветни за него. За одредени задачи, компјутерите се неверојатно моќни, со способности кои далеку ги надминуваат оние на дури и стручни луѓе. На пример, во шахот, компјутерите можат да ги победат дури и најдобрите велемајстори. Но, и ова е помалку ценето од страна на социјалните научници - за други задачи, компјутерите се всушност многу полоши од луѓето. Со други зборови, сега сте подобри од дури и најсофистицираниот компјутер при одредени задачи кои вклучуваат обработка на слики, видео, аудио и текст. Компјутерски научници кои работат на овие тешко-за-компјутери-лесни за човечки задачи затоа сфати дека тие би можеле да ги вклучат луѓето во нивниот компјутерски процес. Еве како Луис фон анн (2005) опиша човечката пресметка кога прв го измисли терминот во својата дисертација: "парадигма за искористување на моќта за обработка на човекот за решавање на проблемите што компјутерите сеуште не можат да ги решат." За третман на човечки пресметки, најопштата смисла на терминот, видете Law and Ahn (2011) .
Според дефиницијата предложена во Ahn (2005) Foldit - која ја опишав во делот за отворени повици - може да се смета за проект за човечки пресметки. Сепак, избрав да го категоризирам Foldit како отворен повик бидејќи бара специјализирани вештини (иако не е задолжително формална обука) и го зема најдоброто решение, наместо да користи стратегија за сплит-примена-комбинација.
Терминот "split-apply-combine" беше употребен од Wickham (2011) да опише стратегија за статистички компјутери, но совршено го доловува процесот на многу проекти за човечки пресметки. Стратегијата за сплит-примена-комбинација е слична на рамката MapReduce развиена во Google; за повеќе на MapReduce, видете Dean and Ghemawat (2004) и Dean and Ghemawat (2008) . За повеќе информации за други дистрибуирани компјутерски архитектури, видете Vo and Silvia (2016) . Поглавје 3 од Law and Ahn (2011) има дискусија за проекти со покомплексни чекори на комбинирање од оние во ова поглавје.
Во проектите за човечки пресметки што ги разгледав во поглавјето, учесниците беа свесни за тоа што се случуваше. Некои други проекти, сепак, бараат да се фати "работа" која веќе се случува (слично на eBird) и без свест на учесниците. Видете, на пример, играта ESP (Ahn and Dabbish 2004) и reCAPTCHA (Ahn et al. 2008) . Сепак, и двата проекти, исто така, покренуваат етички прашања, бидејќи учесниците не знаат како се користат нивните податоци (Zittrain 2008; Lung 2012) .
Инспириран од играта ESP, многу истражувачи се обиделе да развијат други "игри со цел" (Ahn and Dabbish 2008) (т.е. "човечки пресметани игри" (Pe-Than, Goh, and Lee 2015) ) кои можат да бидат користи за решавање на други проблеми. Што имаат овие "игри со цел" заеднички е тоа што тие се обидуваат да ги направат задачите вклучени во човечките пресметки пријатно. Така, додека ESP Game ја дели истата структура на сплит-примена-комбинација со Galaxy Zoo, таа се разликува во тоа како учесниците се мотивирани-забава наспроти желбата да им помогне на науката. За повеќе игри за игри со цел, видете Ahn and Dabbish (2008) .
Мојот опис на Галакси зоолошката градина се базира на Nielsen (2012) , Adams (2012) , Clery (2011) и Hand (2010) , а мојата презентација на истражувачките цели на Галакси зоолошката беше поедноставена. За повеќе информации за историјата на класификацијата на галаксиите во астрономијата и зошто Галакси зоолошката градина ја продолжува оваа традиција, види Masters (2012) и Marshall, Lintott, and Fletcher (2015) . Надградба на Галакси зоолошката градина, истражувачите го завршиле Галакси зоолошката зона 2, која собрала повеќе од 60 милиони посложени морфолошки класификации од волонтерите (Masters et al. 2011) . Понатаму, тие се проширија во проблеми надвор од морфологијата на галаксијата, вклучително и истражување на површината на Месечината, потрага по планети и транскрипција на стари документи. Во моментов, сите нивни проекти се собираат на веб-страницата Zooniverse (Cox et al. 2015) . Еден од проектите - Snapshot Serengeti - обезбедува докази дека проектите за класификација на сликите од типот Галакси зоолошка градина, исто така, може да се направат за истражување на животната средина (Swanson et al. 2016) .
За истражувачите кои планираат да го искористат пазарот за труд на микротрусија (на пример, Амазонски механички Турчин) за проект за човечки пресметки, Chandler, Paolacci, and Mueller (2013) и J. Wang, Ipeirotis, and Provost (2015) нудат добри совети за дизајнирање на задачи и други поврзани прашања. Porter, Verdery, and Gaddis (2016) нудат примери и совети фокусирани конкретно на користењето на пазарите на труд на микро-таск за она што го нарекуваат "зголемување на податоци". Линијата помеѓу зголемување на податоци и собирање на податоци е малку матно. За повеќе информации за собирање и користење на етикети за надгледувано учење за текст, видете Grimmer and Stewart (2013) .
Истражувачите заинтересирани за создавање на она што сум го нарекувал компјутерски потпомогнати човечки пресметковни системи (на пример, системи кои користат човечки етикети за обука на машина за учење модел) може да бидат заинтересирани во Shamir et al. (2014) (за пример со користење аудио) и Cheng and Bernstein (2015) . Исто така, моделите за учење на машините во овие проекти може да бидат поттикнати со отворени повици, при што истражувачите се натпреваруваат да создадат модели за машинско учење со најголеми предвидливи перформанси. На пример, тимот на Галакси Banerji et al. (2010) ; видете Dieleman, Willett, and Dambre (2015) за детали.
Отворени повици не се нови. Всушност, еден од најпознатите отворени повици датира од 1714 година кога британскиот парламент ја создаде наградата за долгови за секој што би можел да развие начин за одредување на должината на бродот на море. Проблемот ги зафати многумина од најголемите научници од деновите, вклучувајќи го и Исак Њутн, а победничкото решение на крајот беше поднесено од Џон Харисон, часовник од село, кој различно му пристапи на проблемот од научниците кои беа фокусирани на решение кое на некој начин би вклучило астрономија ; за повеќе информации, видете Sobel (1996) . Како што илустрира овој пример, една причина зошто се чини дека отворените повици работат толку добро е дека тие обезбедуваат пристап до луѓе со различни перспективи и вештини (Boudreau and Lakhani 2013) . Види Hong and Page (2004) и Page (2008) за повеќе за вредноста на разновидноста во решавањето на проблемите.
Секој од случаите на отворен повик во поглавјето бара малку понатамошно објаснување зошто тој припаѓа во оваа категорија. Прво, еден начин на кој се прави разлика меѓу човечките пресметки и проектите за отворен повик е дали излезот е просек од сите решенија (човечки пресметки) или најдобро решение (отворен повик). Наградата Netflix е малку незгодна во врска со ова, бидејќи најдоброто решение се покажа како софистициран просек на индивидуални решенија, пристап наречен ансамблино решение (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Од гледна точка на Netflix, сепак, сè што требаше да направат е да го избереме најдоброто решение. За повеќе информации за наградата Netflix, видете Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , и Feuerverger, He, and Khatri (2012) .
Второ, според некои дефиниции за човечки пресметки (на пример, Ahn (2005) ), Фолдит треба да се смета за проект за човечки пресметки. Сепак, јас одлучувам да го категоризирам како отворен повик затоа што бара специјализирани вештини (иако не е задолжително специјализирана обука) и е потребно најдобро решение, наместо да се користи стратегија за сплит-примена-комбинација. За повеќе информации за Foldit, Cooper et al. (2010) , Khatib et al. (2011) , и Andersen et al. (2012) ; мојот опис на Foldit се опишува во описите во Bohannon (2009) , Hand (2010) и Nielsen (2012) .
Конечно, може да се тврди дека Peer-to-Patent е пример за дистрибуирано собирање на податоци. Избрав да го вклучам како отворен повик затоа што има структура слична на натпреварот и се користат само најдобрите придонеси, додека со дистрибуираното собирање податоци идејата за добри и лоши придонеси е помалку јасна. За повеќе информации за Peer-to-Patent, видете Noveck (2006) , Ledford (2007) , Noveck (2009) , и Bestor and Hamp (2010) .
Во смисла на користење на отворени повици во социјални истражувања, резултатите слични на оние на Glaeser et al. (2016) се пријавени во поглавјето 10 на Mayer-Schönberger and Cukier (2013) при што Њујорк беше во можност да користи прогнозиско моделирање за да произведе големи придобивки во продуктивноста на инспекторите за домување. Во Њујорк, овие предвидувачки модели биле изградени од страна на вработените во градот, но во други случаи, може да се замисли дека тие би можеле да бидат создадени или подобрени со отворени повици (на пример, Glaeser et al. (2016) ). Сепак, една голема загриженост со предвидливите модели кои се користат за распределба на ресурсите е дека овие модели имаат потенцијал да ги засилат постоечките предрасуди. Многу истражувачи веќе знаат "ѓубре, ѓубре", а со предвидувачки модели тоа може да биде "пристрасност, пристрасност". Види Barocas and Selbst (2016) и O'Neil (2016) за повеќе за опасностите од предвидените модели изградени со пристрасни податоци за обука.
Еден проблем што може да ги спречи владите да користат отворени натпревари е тоа што ова бара ослободување на податоци, што може да доведе до кршење на приватноста. За повеќе информации за приватност и објавување на податоци во отворени повици, видете Narayanan, Huey, and Felten (2016) и дискусијата во поглавјето 6.
За повеќе за разликите и сличностите помеѓу предвидување и објаснување, види Breiman (2001) , Shmueli (2010) , Watts (2014) и Kleinberg et al. (2015) . За повеќе информации за улогата на предвидување во општествените истражувања, видете Athey (2017) , Cederman and Weidmann (2017) , Hofman, Sharma, and Watts (2017) , ( ??? ) , И Yarkoni and Westfall (2017) .
За преглед на проекти за отворени повици во биологијата, вклучувајќи совети за дизајн, видете Saez-Rodriguez et al. (2016) .
Мојот опис за eBird се базира на описи во Bhattacharjee (2005) , Robbins (2013) , и Sullivan et al. (2014) . За повеќе информации за тоа како истражувачите користат статистички модели за анализирање на податоците од eBird, видете Fink et al. (2010) и Hurlbert and Liang (2012) . За повеќе информации за проценката на вештините на учесниците на eBird, видете Kelling, Johnston, et al. (2015) . За повеќе информации за историјата на граѓанската наука во орнитологијата, видете Greenwood (2007) .
За повеќе информации за проектот Малави списание, види Watkins and Swidler (2009) и Kaler, Watkins, and Angotti (2015) . За повеќе информации поврзани со проектот во Јужна Африка, видете Angotti and Sennott (2015) . За повеќе примери на истражување користејќи податоци од проектот Малави списанија види Kaler (2004) и Angotti et al. (2014) .
Мојот пристап кон дизајнирање совети беше индуктивен, врз основа на примери на успешни и неуспешни проекти за масовна соработка за кои сум слушнал. Исто така, постоеше поток истражувачки обиди да се применат поопшти социјални психолошки теории за дизајнирање на онлајн заедници кои се релевантни за дизајнирањето на проекти за масовна соработка, види, на пример, Kraut et al. (2012) .
Во однос на мотивирачките учесници, всушност е доста незгодно да се дознае точно зошто луѓето учествуваат во проекти за масовна соработка (Cooper et al. 2010; Nov, Arazy, and Anderson 2011; Tuite et al. 2011; Raddick et al. 2013; Preist, Massung, and Coyle 2014) . Ако планирате да ги мотивирате учесниците со исплата на пазарот на труд за микротруктура (на пр. Амазонски механички Турчин), Kittur et al. (2013) нуди некои совети.
Во врска со овозможувањето изненадување, за повеќе примери на неочекувани откритија кои произлегуваат од Zooiverse проектите, видете Marshall, Lintott, and Fletcher (2015) .
Во врска со тоа што е етички, некои добри општи вовед за прашањата кои се вклучени се Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) и Zittrain (2008) . За прашања кои се конкретно поврзани со правни прашања со вработените во толпата, видете Felstiner (2011) . O'Connor (2013) осврнува на прашања во врска со етичкиот надзор на истражувањата кога улогите на истражувачите и учесниците се замаглуваат. За прашања поврзани со размена на податоци, додека ги штити учесниците во научните проекти на граѓанското општество, види Bowser et al. (2014) . Двете Purdam (2014) и Windt and Humphreys (2016) дискутираат за етичките прашања во дистрибуираното собирање податоци. Конечно, повеќето проекти признаваат придонеси, но не даваат авторски права на учесниците. Во Foldit, играчите често се наведени како автор (Cooper et al. 2010; Khatib et al. 2011) . Во други проекти за отворен повик, победничкиот соработник често може да напише хартија во која ги опишува нивните решенија (на пример, Bell, Koren, and Volinsky (2010) и Dieleman, Willett, and Dambre (2015) ).