მასობრივი თანამშრომლობის blends იდეების მოქალაქე მეცნიერების, crowdsourcing და კოლექტიური დაზვერვის. მოქალაქეობრივი მეცნიერება, როგორც წესი, გულისხმობს "მოქალაქეებს" (ანუ მეცნიერებმა) სამეცნიერო პროცესში; მეტი, იხილეთ Crain, Cooper, and Dickinson (2014) და Bonney et al. (2014) . Crowdsourcing ჩვეულებრივ ნიშნავს ორგანიზაციის ფარგლებში პრობლემის გადასაჭრელად და ამის ნაცვლად აუთსორსინგის აყვანა; უფრო მეტი, იხილეთ Howe (2009) . კოლექტიური დაზვერვა, როგორც წესი, ნიშნავს იმ პირთა ჯგუფებს, რომლებიც მოქმედებენ კოლექტიურად, როგორც ჩანს, ინტელექტუალური; უფრო მეტიც, იხილეთ Malone and Bernstein (2015) . Nielsen (2012) არის წიგნის სიგრძე შესავალი სამეცნიერო კვლევის მასობრივი თანამშრომლობისათვის.
არსებობს მრავალი სახის მასობრივი თანამშრომლობა, რომელიც არ შეესაბამება სამ კატეგორიად იმას, რასაც მე ვთავაზობდი და მე ვფიქრობ, რომ სამი მათგანი განსაკუთრებულ ყურადღებას იმსახურებს, რადგან ისინი შეიძლება სასარგებლო იყოს სოციალურ კვლევაში. ერთი მაგალითია პროგნოზირების ბაზრები, სადაც მონაწილეები ყიდულობენ და ვაჭრობენ კონტრაქტებს, რომლებიც გამოსყიდვას ეფუძნება მსოფლიოში მომხდარ შედეგებზე. პროგნოზირების ბაზრები ხშირად იყენებენ ფირმებსა და მთავრობებს პროგნოზირებისთვის და ისინი ასევე იყენებენ სოციალურ მკვლევარებს, რომ გამოაქვეყნონ გამოქვეყნებული კვლევების ფსიქოლოგიაში (Dreber et al. 2015) . პროგნოზირების ბაზრების მიმოხილვისთვის იხ. Wolfers and Zitzewitz (2004) და Arrow et al. (2008) .
მეორე მაგალითი, რომელიც კარგად არ შეესაბამება ჩემი კატეგორიზაციის სქემას, არის PolyMath პროექტი, სადაც მკვლევარებმა თანამშრომლობდნენ ბლოგისა და ვიკის გამოყენებით ახალი მათემატიკის თეორემები. პოლიმათის პროექტი გარკვეულწილად არის ისეთივე, როგორიც არის Netflix Prize, მაგრამ ამ პროექტში მონაწილეები უფრო აქტიურად აშენებენ სხვების ნაწილობრივ გადაწყვეტილებებს. პოლიმათის პროექტზე უფრო მეტია, იხილეთ Gowers and Nielsen (2009) , Cranshaw and Kittur (2011) , Nielsen (2012) და Kloumann et al. (2016) .
მესამე მაგალითი, რომელიც კარგად არ შეესაბამება ჩემს კატეგორიზაციის სქემას, არის დროზე ორიენტირებული მობილიზაციები, როგორიცაა თავდაცვის Advanced Research Projects Agency (DARPA) ქსელის გამოწვევა (ანუ წითელი ბუშტის გამოწვევა). ამ დროისთვის უფრო მგრძნობიარე მობილიზაციები იხილეთ Pickard et al. (2011) , Tang et al. (2011) , და Rutherford et al. (2013) .
ტერმინი "ადამიანის გამოთვლითი" გამოდის კომპიუტერის მეცნიერთა მიერ განხორციელებული სამუშაოსა და ამ კვლევის მიღმა კონტექსტის გაგება ხელს შეუწყობს თქვენი პრობლემების გამოსწორებას, რაც შეიძლება შესაფერისი იყოს. გარკვეული ამოცანების გამო, კომპიუტერები წარმოუდგენლად ძლიერია, რომელთაც აქვთ შესაძლებლობებიც, რომელთაგან განსხვავებითაც კი გამოცდილი ადამიანები. მაგალითად, ჭადრაკში, კომპიუტერთან შეიძლება საუკეთესო გრანდიოზული სცემეს. მაგრამ ეს ნაკლებად კარგად არის დასაფასებელი სოციალური მეცნიერები - სხვა ამოცანებისათვის, კომპიუტერები მართლაც ბევრად უფრო უარესია ხალხზე. სხვა სიტყვებით რომ ვთქვათ, ახლა უფრო უკეთესია, ვიდრე ყველაზე უფრო დახვეწილი კომპიუტერი გარკვეულ ამოცანებზე, რომლებიც მოიცავს სურათების, ვიდეოების, აუდიო და ტექსტების დამუშავებას. ამ რთულ კომპიუტერებზე მომუშავე კომპიუტერის მეცნიერებმა მარტივმა ადამიანურ ამოცანებზე გააცნობიერეს, რომ მათ შეეძლოთ ადამიანები შეადგენდნენ მათ კომპიუტერულ პროცესებში. აი, როგორ იცნობდა ლუის ფონ აჰნი (2005) ადამიანის გამოთვლით, როდესაც იგი პირველად მოხსენიებული იყო მისი სადისერტაციო ნაშრომში: "პარადიგმა ადამიანის დამუშავების ძალაუფლების გამოყენებისათვის პრობლემების გადასაწყვეტად კომპიუტერები ჯერ ვერ გადაჭრის". ტერმინი ყველაზე ზოგადი გაგებით, იხილეთ Law and Ahn (2011) .
Ahn (2005) Foldit- ში შემოთავაზებული განმარტების მიხედვით, რომელიც მე ნაწილობრივ აღნიშნავდა ღია ზარების განყოფილებას, შეიძლება ჩაითვალოს ადამიანის გამოთვლითი პროექტი. თუმცა, მე შეარჩიე ფოლიტის კლასიფიკაცია, როგორც ღია ზარი, რადგან ის მოითხოვს სპეციალურ უნარებს (თუმცა არ არის აუცილებელი ფორმალური ტრენინგი) და ის საუკეთესო გამოსავალს უჭერს მხარს, ვიდრე გაყოფილი-აპლიკაციის შერწყმის სტრატეგია.
ტერმინი "გაყოფილი-მიერთება-კომბინირება" გამოიყენებოდა Wickham (2011) სტატისტიკური გამოთვლითი სტრატეგიის აღწერისთვის, მაგრამ ეს საკმაოდ კეთდება ადამიანის გამოთვლითი პროექტების განხორციელების პროცესში. გაყოფილი-აპლიკაციის შერწყმის სტრატეგია მსგავსია MapReduce- ის ფარგლებში, რომელიც Google- ში შეიქმნა; უფრო მეტი MapReduce, იხილეთ Dean and Ghemawat (2004) და Dean and Ghemawat (2008) . სხვა განაწილებული გამოთვლითი არქიტექტორების შესახებ იხილეთ Vo and Silvia (2016) . Law and Ahn (2011) მე -3 თავი Law and Ahn (2011) პროექტებს განიხილავს უფრო რთული კომპლექსური ნაბიჯებით, ვიდრე ამ თავში.
ადამიანის გამოთვლით პროექტებში, რომლებიც მე განვიხილეთ თავი, თავი შეიტყვეს რა ხდება. თუმცა, ზოგიერთი სხვა პროექტი ცდილობს "მუშაობა", რომელიც უკვე ხდება (eBird- ის მსგავსი) და მონაწილეების ინფორმირებულობის გარეშე. მაგალითად, ESP თამაშის (Ahn and Dabbish 2004) და reCAPTCHA (Ahn et al. 2008) . თუმცა, ორივე ეს პროექტი ასევე ეთიკურ კითხვებს აქცევს, რადგან მონაწილეებს არ იცოდნენ, როგორ იყენებდა მათი მონაცემები (Zittrain 2008; Lung 2012) .
ESP თამაშის შთაგონებით, ბევრი მკვლევარი ცდილობდა შეექმნათ სხვა "თამაშები მიზნებით" (Ahn and Dabbish 2008) (ანუ "ადამიანის გამოთვლითი თამაშები" (Pe-Than, Goh, and Lee 2015) ), რომელიც შეიძლება იყოს გამოიყენება სხვა პრობლემების გადაჭრის მიზნით. რა არის ეს "თამაშები მიზნად" საერთო აქვთ ის, რომ ისინი ცდილობენ, განახორციელონ ამოცანები ადამიანის გამოთვლით სასიამოვნო. ამდენად, ხოლო ESP Game- ი იზიარებს იგივე გაყოფილი-მიერთების შემადგენელ სტრუქტურას Galaxy Zoo- სთან, განსხვავდება ის, თუ როგორ მოქმედებენ მონაწილეები მოტივირებული- fun და მეცნიერების დასახმარებლად. უფრო მეტი თამაშების მიზნით, იხ. Ahn and Dabbish (2008) .
Galaxy Zoo- ს ჩემი აღწერა აღწერს Nielsen (2012) , Adams (2012) , Clery (2011) და Hand (2010) და გამარტივდა Galaxy Zoo- ის კვლევის მიზნების პრეზენტაცია. უფრო მეტი გალაქტიკური კლასიფიკაციის ისტორიაში ასტრონომიაში და როგორ განაგრძობს Galaxy Zoo ამ ტრადიციას, იხ. Masters (2012) და Marshall, Lintott, and Fletcher (2015) . Galaxy Zoo- ზე შენობა, მკვლევარებმა დაასრულეს Galaxy Zoo 2, რომელიც შეგროვდა 60 მილიონზე მეტ კომპლექსურ მორფოლოგიურ კლასიფიკაციას მოხალისეებიდან (Masters et al. 2011) . გარდა ამისა, მათ გალაქტიკაში მორფოლოგიის გარეთ არსებული პრობლემების შესწავლა დაიწყეს, მათ შორის მთვარის ზედაპირის შესწავლა, პლანეტების ძიება და ძველი დოკუმენტების ტრანსკრიპციით. ამჟამად, ყველა მათი პროექტი იკრიბება Zooniverse ნახვა (Cox et al. 2015) . ერთ-ერთი პროექტი-სენაფსორო სეროგეტი-იძლევა მტკიცებულებას, რომ Galaxy Zoo- ის ტიპის გამოსახულების კლასიფიკაციის პროექტები შეიძლება გაკეთდეს გარემოსდაცვითი კვლევისთვის (Swanson et al. 2016) .
მკვლევართათვის განკუთვნილია მიკროტოტასის შრომის ბაზრის გამოყენება (მაგალითად, Amazon Mechanical Turk) ადამიანის გამოთვლითი პროექტისთვის, Chandler, Paolacci, and Mueller (2013) და J. Wang, Ipeirotis, and Provost (2015) გთავაზობთ რჩევებს სხვა დაკავშირებული საკითხები. Porter, Verdery, and Gaddis (2016) გთავაზობთ მაგალითები და რჩევა განსაკუთრებით კონკრეტულად გამოყენების microtask შრომის ბაზრებზე რა ისინი მოვუწოდებთ "მონაცემების augmentation." ხაზის მონაცემების augmentation და მონაცემთა შეგროვების გარკვეულწილად blurry. ტექსტისთვის ზედამხედველობითი სწავლებისთვის ეტიკეტების შეგროვებისა და გამოყენების შესახებ უფრო მეტი ინფორმაციისთვის იხილეთ Grimmer and Stewart (2013) .
მკვლევარებმა დაინტერესდნენ, თუ რას ვუწოდი კომპიუტერის დახმარებით გამოთვლილ კომპიუტერულ სისტემებს (მაგალითად, სისტემებს, რომლებიც იყენებენ ადამიანის ეტიკეტების მომზადებას მანქანათმცოდნეობის მოდელს) შეიძლება დაინტერესდნენ Shamir et al. (2014) ) და Cheng and Bernstein (2015) . გარდა ამისა, ამ პროექტებში მანქანათმცოდნეობის მოდელები შეიძლება ითხოვდეს ღია ზარებით, რის შედეგადაც მკვლევარები კონკურენციას წარმოადგენენ მანქანათმცოდნეობის მოდელების შექმნასთან ერთად. მაგალითად, Galaxy Zoo გუნდი გაიქცა ღია ზარი და აღმოაჩინა ახალი მიდგომა, რომ გაეცნო Banerji et al. (2010) ; იხ. Dieleman, Willett, and Dambre (2015) .
ღია ზარები არ არის ახალი. სინამდვილეში, ერთ-ერთი ყველაზე ცნობილი ღია ზარი 1714 წლამდე თარიღდება, როდესაც ბრიტანეთის პარლამენტმა შექმნა გრძედი საუცხოო პრიზი, რომელსაც შეუძლია საზღვაო ხომალდის განსაზღვრის გზა. ამ პრობლემის მოგვარების დროს, მათ შორის ისააკ ნიუტონმა და გამარჯვების გამოსავლენმა საბოლოოდ წარადგინეს ჯონ ჰარისონი, ქალაქებისგან, რომლებიც მეცნიერებს განსხვავებულად ესაუბრნენ იმ პრობლემებს, რომლებიც ყურადღებას ამახვილებდნენ იმ გამოსავალზე, რომელიც გარკვეულწილად მოიცავდა ასტრონომიას ; დამატებითი ინფორმაციისთვის იხილეთ Sobel (1996) . როგორც ეს მაგალითი გვიჩვენებს, ერთი მიზეზი, რომ ღია ზარები ფიქრობენ იმდენად კარგად მუშაობენ, რომ ისინი სხვადასხვა პერსპექტივებსა და უნარებს (Boudreau and Lakhani 2013) . იხილეთ Hong and Page (2004) და Page (2008) მეტი მრავალფეროვნების ღირებულების პრობლემის მოგვარებაში.
თავიანთი ღია ზარის შემთხვევები თავიანთ ნაწილში მოითხოვს გარკვეულ დამატებით განმარტებას, თუ რატომ ეკუთვნის ეს კატეგორია. პირველი, ერთი გზა, რომელიც მე გამოვყოფდი ადამიანური გამოთვლებისა და ღია ზარის პროექტებს შორის არის თუ არა გამოსავალი საშუალოდ ყველა გადაწყვეტილებას (ადამიანის გამოთვლა) ან საუკეთესო გამოსავალს (ღია ზარი). ამ თვალსაზრისით, Netflix Prize გარკვეულწილად სახიფათოა, რადგან საუკეთესო გამოსავალი აღმოჩნდა ინდივიდუალური გადაწყვეტილებების დახვეწილი საშუალო, მიდგომა მოუწოდა ანსამბლის გამოსავალს (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . თუმცა, Netflix- ის პერსპექტივიდან, ყველა მათგანმა უნდა გააკეთოს საუკეთესო გამოსავალი. ნეტფლის პრიზზე მეტი იხილეთ Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) და Feuerverger, He, and Khatri (2012) და Feuerverger, He, and Khatri (2012) .
მეორე, ადამიანთა გამოთვლილების ზოგიერთი განსაზღვრება (მაგ., Ahn (2005) ), ფოლიტი უნდა ჩაითვალოს ადამიანის გამოთვლითი პროექტი. თუმცა, მე შეარჩიე იგი, როგორც ღია ზარი, რადგან ის მოითხოვს სპეციალიზებულ უნარებს (თუმცა არა აუცილებლად სპეციალიზებული ტრენინგი) და ის საუკეთესო გამოსავალს იღებს, ვიდრე გაყოფილი აპლიკაციის შერწყმის სტრატეგია. უფრო მეტის შესახებ Foldit ვხედავ, Cooper et al. (2010) , Khatib et al. (2011) , Andersen et al. (2012) ; ჩემი აღწერა Foldit ამახვილებს აღწერილობებიდან Bohannon (2009) , Hand (2010) , და Nielsen (2012) .
საბოლოოდ, შეიძლება ითქვას, რომ თანხმობა პატენტის არის განაწილებული მონაცემთა შეგროვების მაგალითი. მე შეარჩიე იგი, როგორც ღია ზარი, რადგან მას აქვს კონკურსის მსგავსი სტრუქტურა და მხოლოდ საუკეთესო წვლილი გამოიყენება, ხოლო დისტრიბუციის მონაცემების შეგროვება, კარგი და ცუდი წვლილის იდეა ნაკლებად ნათელია. უფრო მეტია პიტერ-პატენტის შესახებ, იხილეთ Noveck (2006) , Ledford (2007) , Noveck (2009) , და Bestor and Hamp (2010) .
სოციალურ კვლევაში ღია ზარის გამოყენების თვალსაზრისით, Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) მე -10 თავშია Mayer-Schönberger and Cukier (2013) სადაც ნიუ-იორკს შეეძლო გამოეყენებინა პროგნოზირებადი მოდელირება, რათა უზრუნველყოს მსხვილი მიღწევები საბინაო ინსპექტორების პროდუქტიულობაში. ნიუ-იორკში, ამ პროგნოზირების მოდელები ქალაქის თანამშრომლების მიერ აშენდა, მაგრამ სხვა შემთხვევებში შეიძლება წარმოიდგინოთ, რომ მათ შეუძლიათ შექმნან ან გააუმჯობესონ ღია ზარები (მაგალითად, Glaeser et al. (2016) ). თუმცა, რესურსების გამოყოფისთვის გამოყენებული პროგნოზირებადი მოდელების ერთ-ერთი მთავარი საზრუნავი ისაა, რომ ამ მოდელებს გააჩნიათ არსებული მიკერძოების განმტკიცება. ბევრმა მკვლევარმა უკვე იცის, რომ "ნაგავი, ნაგავია" და პროგნოზირებადი მოდელები შეიძლება იყოს "მიკერძოება, მიკერძოებული". იხილეთ Barocas and Selbst (2016) და O'Neil (2016) უფრო მეტი, ვიდრე პროგნოზირების მოდელების საფრთხე მიკერძოებული ტრენინგის მონაცემებით.
ერთი პრობლემა, რომელიც ხელს უშლის მთავრობებს ღია კონკურენციის გამოყენებით, ის მოითხოვს მონაცემების გათავისუფლებას, რამაც შეიძლება გამოიწვიოს კონფიდენციალურობის დარღვევა. ღია ზარების კონფიდენციალურობისა და მონაცემების შესახებ უფრო მეტი ინფორმაციისთვის იხ. Narayanan, Huey, and Felten (2016) და დისკუსია მე -6 თავში.
უფრო მეტი განსხვავებისა და მსგავსების შესახებ პროგნოზირებისა და ახსნა-განმარტების მიხედვით, იხ. Breiman (2001) , Shmueli (2010) , Watts (2014) და Kleinberg et al. (2015) . სოციალური კვლევის პროგნოზის როლზე იხილეთ Athey (2017) , Cederman and Weidmann (2017) , Hofman, Sharma, and Watts (2017) , ( ??? ) და Yarkoni and Westfall (2017) .
ბიოლოგიაში ღია ზარის პროექტების განხილვა, მათ შორის დიზაინის რჩევა, იხ. Saez-Rodriguez et al. (2016) .
ჩემი აღწერილობა eBird ამახვილებს აღწერებზე Bhattacharjee (2005) , Robbins (2013) და Sullivan et al. (2014) . დამატებითი ინფორმაციის მისაღებად, მკვლევარებმა გამოიყენონ სტატისტიკური მოდელები eBird მონაცემების ანალიზი Fink et al. (2010) და Hurlbert and Liang (2012) . EBird- ის მონაწილეთა უნარების შეფასების მიზნით, იხილეთ Kelling, Johnston, et al. (2015) . უფრო მეტი მოქალაქის მეცნიერების ისტორია ორნიტოლოგში, იხილეთ Greenwood (2007) .
დამატებითი ინფორმაციისთვის იხილეთ Malawi Journals Project, იხილეთ Watkins and Swidler (2009) და Kaler, Watkins, and Angotti (2015) . დამატებითი ინფორმაციისთვის სამხრეთ აფრიკაში, იხილეთ Angotti and Sennott (2015) . კვლევის უფრო მეტი მაგალითისთვის, მალავის ჟურნალების პროექტში გამოყენებული მონაცემების ნახვა იხილეთ Kaler (2004) და Angotti et al. (2014) .
ჩემი მიდგომა შემოთავაზებული კონსტრუქციების შემოთავაზება იყო ინდუქციური, ეფუძნებოდა წარმატებული და წარუმატებელი მასობრივი თანამშრომლობის პროექტების მაგალითებს, რომლებიც მე გავიგე. ასევე არსებობს კვლევის მცდელობები უფრო ზოგადი სოციალური ფსიქოლოგიური თეორიების გამოყენებას, რათა შეიქმნას ონლაინ თემების შექმნა, რაც შესაბამისობაშია მასობრივი თანამშრომლობის პროექტების შესაქმნელად, მაგალითად, Kraut et al. (2012) .
რაც შეეხება მონაწილეებს, ეს ფაქტიურად საკმაოდ მწვავეა, რათა გაერკვნენ, თუ რატომ მონაწილეობენ მასობრივი თანამშრომლობის პროექტებში მონაწილეები (Cooper et al. 2010; Nov, Arazy, and Anderson 2011; Tuite et al. 2011; Raddick et al. 2013; Preist, Massung, and Coyle 2014) . თუ აპირებთ მონაწილეებს მოტივაციაზე მიკროტოტასის შრომის ბაზარზე გადახდის (მაგ., Amazon Mechanical Turk), Kittur et al. (2013) გთავაზობთ რჩევებს.
რაც შეეხება სიურპრიზს, Zooiverse პროექტებისგან გამოვლენილი მოულოდნელი აღმოჩენების უფრო მეტი მაგალითია Marshall, Lintott, and Fletcher (2015) .
რაც შეეხება ეთიკურ, ზოგადი შესავალი ზოგადი შესავალი საკითხები ჩართულია Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) და Zittrain (2008) . კონკრეტულად დაკავშირებული საკითხები საკითხებზე გულშემატკივარი თანამშრომლები, ვხედავ Felstiner (2011) . O'Connor (2013) მიმართავს კითხვებს კვლევის ეთიკური მეთვალყურეობის შესახებ, როდესაც მკვლევარებისა და მონაწილეების როლების დაბინდვა. მოქალაქეთა სამეცნიერო პროექტებში მონაწილეების დაცვისას მონაცემთა გაზიარების საკითხებთან დაკავშირებით იხილეთ Bowser et al. (2014) . ორივე Purdam (2014) და Windt and Humphreys (2016) აქვს გარკვეული დისკუსია ეთიკური საკითხები გავრცელებული მონაცემების შეგროვება. საბოლოო ჯამში, პროექტების უმეტესობა აღიარებს მონაწილეებს, მაგრამ მონაწილეებს არ მისცემენ ავტორობის კრედიტს. Foldit- ში, მოთამაშეები ხშირად ავლენენ ავტორს (Cooper et al. 2010; Khatib et al. 2011) . სხვა ღია ზარის პროექტებში გამარჯვებულმა შეიძლება Bell, Koren, and Volinsky (2010) ქაღალდი, რომელიც აღწერს მათ გადაწყვეტილებებს (მაგალითად, Bell, Koren, and Volinsky (2010) და Dieleman, Willett, and Dambre (2015) ).