همکاری توده ای ایده هایی را از علم شهروندان ، جمع آوری اطلاعات و هوش جمعی ترکیب می کند . علم شهروندی معمولا به معنای "شهروندان" (به عنوان مثال، غیر متخصصان) در فرآیند علمی است؛ برای بیشتر، Crain, Cooper, and Dickinson (2014) و Bonney et al. (2014) . فراخوانی معمولا به معنی مشکلی است که معمولا در یک سازمان حل می شود و به جای آن، آن را به یک جمعیت هدایت می کند؛ برای اطلاعات بیشتر، Howe (2009) . اطلاعات جمعی معمولا به معنی گروهی از افراد است که به طور جمعی به شیوه ای عمل می کنند که به نظر هوشمندانه باشد. برای دیدن بیشتر به Malone and Bernstein (2015) . Nielsen (2012) یک مقدمه کتاب در رابطه با قدرت همکاری جمعی برای تحقیقات علمی است.
انواع مختلفی از همکاری جمعی وجود دارد که به طور سهبعدی به سه دسته که من پیشنهاد کرده اند متناسب نیست و من فکر می کنم که سه نفر از آنها مورد توجه خاص هستند زیرا ممکن است در تحقیقات اجتماعی مفید باشد. یک مثال این است که بازار پیش بینی، که در آن شرکت کنندگان قراردادهایی را خریداری و فروش می کنند که براساس نتایجی که در جهان اتفاق می افتد قابل جبران است. پیش بینی بازارها اغلب توسط شرکت ها و دولت ها برای پیش بینی استفاده می شود و همچنین توسط محققان اجتماعی برای پیش بینی تکرارپذیری مطالعات منتشر شده در روانشناسی (Dreber et al. 2015) . برای یک مرور کلی از بازارهای پیش بینی، Wolfers and Zitzewitz (2004) و Arrow et al. (2008) .
نمونه دوم که به طرح بندی طبقه بندی من مناسب نیست، پروژه PolyMath است، که در آن محققان با استفاده از وبلاگ ها و ویکی ها برای اثبات قضیه های ریاضی جدید همکاری کردند. پروژه PolyMath به نوعی شبیه به جایزه Netflix است، اما در این پروژه شرکت کنندگان فعالانه تر از تصمیمات جزئی دیگران ساخته شده اند. برای کسب اطلاعات بیشتر در مورد پروژه PolyMath به Gowers and Nielsen (2009) ، Cranshaw and Kittur (2011) ، Nielsen (2012) و Kloumann et al. (2016) .
یک مثال سوم که به طرح طبقه بندی من مناسب نمی باشد این است که از بسیج های وابسته به زمان مانند آژانس پروژه های تحقیقاتی پیشرفته دفاع (DARPA) شبکه چالش (یعنی چالش بالون قرمز). برای کسب اطلاعات بیشتر در مورد این بسیجهای حساس به زمان، Pickard et al. (2011) ، Tang et al. (2011) ، و Rutherford et al. (2013) .
اصطلاح "محاسبه انسان" از کارهایی است که توسط دانشمندان کامپیوتر انجام می شود، و درک زمینه پشت این تحقیق، توانایی شما را در انتخاب مشکلات که ممکن است برای آن مفید باشد، بهبود خواهد بخشید. برای انجام وظایف خاص، رایانه ها فوق العاده قدرتمند هستند، با قابلیت هایی که به مراتب بیش از افراد متخصص است. به عنوان مثال، در شطرنج، رایانه می تواند حتی بهترین استاد بزرگ را ضرب و شتم کند. اما علیرغم این که دانشمندان علوم اجتماعی کمتر از دیگران به آن اهمیت میدهند، کامپیوترها در واقع خیلی بدتر از افراد هستند. به عبارت دیگر، در حال حاضر بهتر از حتی رایانه های پیچیده تر در وظایف خاصی که شامل پردازش تصاویر، ویدئو، صدا و متن هستند بهتر است. دانشمندان کامپیوتر در این کارهای سخت برای کامپیوترها و کارهای آسان برای انسان متوجه شدند که آنها میتوانند در فرآیند محاسبات خود شامل انسان شوند. در اینجا این است که چگونه لوئیس فون آون (2005) هنگامی که او اولین بار در اصطلاح در مقاله خود فرموله شده است، توضیح داده است: "یک پارادایم برای استفاده از قدرت پردازش انسانی برای حل مشکلات که کامپیوتر هنوز نمی تواند حل کند." برای یک کتاب طولانی محاسبات انسانی، در به طور کلی معنی اصطلاح را ببینید، Law and Ahn (2011) .
با توجه به تعریف پیشنهاد شده در Ahn (2005) Foldit که من در بخش تماسهای باز توضیح دادم، می توان یک پروژه محاسبه انسانی در نظر گرفت. با این حال، من تصمیم می گیرم که Foldit را به عنوان یک تماس باز کنم، زیرا به مهارت های تخصصی نیاز دارد (البته نه الزاما آموزش رسمی) و بهترین راه حل را به جای استفاده از یک استراتژی ترکیبی تقسیم تقسیم می کند.
اصطلاح "split-apply-combine" توسط Wickham (2011) برای توصیف یک استراتژی برای محاسبات آماری استفاده شده است، اما کاملا فرایند بسیاری از پروژه های محاسبات انسانی را در بر می گیرد. استراتژی split-apply-combine مشابه چارچوب MapReduce در Google است؛ برای اطلاعات بیشتر در MapReduce، Dean and Ghemawat (2004) و Dean and Ghemawat (2008) . برای بیشتر در سایر معماریهای توزیع شده محاسبات، به Vo and Silvia (2016) . فصل 3 Law and Ahn (2011) بحث در مورد پروژه های با مراحل ترکیب پیچیده تر از آنچه در این فصل است.
در پروژه های محاسبه انسانی که من در این فصل بحث کرده ام، شرکت کنندگان از آنچه اتفاق می افتد آگاه بودند. با این حال، برخی پروژه های دیگر در تلاشند تا "کار" را که پیش از این اتفاق می افتد (مانند eBird) و بدون آگاهی شرکت کننده بگیرد. برای مثال، بازی ESP (Ahn and Dabbish 2004) و reCAPTCHA (Ahn et al. 2008) . با این حال، هر دو این پروژه ها همچنین سوالات اخلاقی را مطرح می کنند، زیرا شرکت کنندگان نمی دانند که چگونه داده ها مورد استفاده قرار می گیرند (Zittrain 2008; Lung 2012) .
با الهام از بازی ESP، بسیاری از محققان تلاش کرده اند تا بازی های دیگری با هدف را توسعه دهند (Ahn and Dabbish 2008) (یعنی "بازی های محاسباتی مبتنی بر انسان" (Pe-Than, Goh, and Lee 2015) ) که می توانند برای حل انواع مشکلات دیگر استفاده می شود. آنچه این "بازی ها با هدف" مشترک است این است که آنها تلاش می کنند تا وظایف مربوط به محاسبه ی انسانی را لذت بخش تر کنند. بنابراین، در حالی که بازی ESP همان ساختار تقسیم بندی-اعمال-ترکیب با Galaxy Zoo را در اختیار دارد، در شرکت کنندگان انگیزه، سرگرم کننده و میل به کمک به علوم متفاوت است. برای اطلاعات بیشتر در مورد بازی با هدف، Ahn and Dabbish (2008) .
شرح من از Galaxy Zoo به Nielsen (2012) ، Adams (2012) ، Clery (2011) و Hand (2010) و ارائه من از اهداف تحقیق Galaxy Zoo ساده شده است. برای کسب اطلاعات بیشتر در مورد تاریخچه طبقه بندی کهکشان در نجوم و نحوه ادامه دادن این سنت به Galaxy Zoo، مراجعه به Masters (2012) و Marshall, Lintott, and Fletcher (2015) . محققان بر روی Galaxy Zoo بر روی Galaxy Zoo 2 که بیش از 60 میلیون طبقه بندی مورفولوژیک پیچیده تر از داوطلبان را جمع آوری کرده بودند، به گلکسی Zoo 2 مجهز شدند (Masters et al. 2011) . علاوه بر این، آنها را به مشکلات خارج از مورفولوژی کهکشانی، از جمله کاوش در سطح ماه، جستجو برای سیاره ها و ضبط کردن اسناد قدیم، منجر شده است. در حال حاضر تمام پروژه های آنها در وب سایت Zooniverse (Cox et al. 2015) جمع آوری می شوند. یکی از پروژه های Snapshot Serengeti - شواهدی را ارائه می دهد که پروژه های طبقه بندی تصوير Galaxy Zoo را می توان برای تحقیقات محیطی نیز انجام داد (Swanson et al. 2016) .
برای محققان برنامه ریزی برای استفاده از یک بازار کار میکرو کار (به عنوان مثال، آمازون مکانیک ترک) برای یک پروژه محاسبه انسانی، Chandler, Paolacci, and Mueller (2013) و J. Wang, Ipeirotis, and Provost (2015) ارائه مشاوره خوب در طراحی وظیفه و سایر مسائل مرتبط Porter, Verdery, and Gaddis (2016) نمونه هایی را ارائه می دهند که به طور خاص در مورد استفاده از بازار کار میکرو استک برای آنچه که آنها "افزایش اطلاعات" می نامند، ارائه می شود. خط بین افزایش داده ها و جمع آوری داده ها تا حدودی تار است. برای کسب اطلاعات بیشتر در مورد جمع آوری و استفاده از برچسب ها برای یادگیری تحت نظارت برای متن، Grimmer and Stewart (2013) .
محققان علاقه مند به ایجاد آنچه من به نام سیستم های کامپیوتری محاسبه شده اند (به عنوان مثال سیستم هایی که از برچسب های انسانی برای آموزش یک مدل یادگیری ماشین استفاده می کنند) ممکن است به Shamir et al. (2014) علاقمند باشند Shamir et al. (2014) (برای مثال با استفاده از صدا) و Cheng and Bernstein (2015) . همچنین مدل های یادگیری ماشین در این پروژه ها با فراخوانی های باز تماس گرفته می شود، که به موجب آن محققان برای ایجاد مدل های یادگیری ماشین با بیشترین پیش بینی کننده رقابت رقابت می کنند. به عنوان مثال، تیم باغ وحش Galaxy یک فراخوان باز را اجرا کرد و یک رویکرد جدید را پیدا کرد که از نظر طراحی شده در Banerji et al. (2010) برتر بود Banerji et al. (2010) ؛ برای جزئیات جزئیات Dieleman, Willett, and Dambre (2015) ببینید.
تماس های باز جدید نیستند. در حقیقت، یکی از شناخته شده ترین فراخوانهای باز به سال 1714 باز می گردد، زمانی که مجلس بریتانیا جایزه طولانی را برای هر کسی که می تواند راهی برای تعیین طول جغرافیایی یک کشتی در دریا ایجاد کند، ایجاد کرد. مشکل بسیاری از بزرگترین دانشمندان روزها، از جمله اسحاق نیوتون، و همچنین راه حل برنده شدن، در نهایت توسط جان هریسون (John Harrison)، ساعت ساز از روستاییان مطرح شد که به طور متفاوتی از دانشمندان مورد بررسی قرار گرفتند که بر روی یک راه حل متمرکز بودند که به نوعی شامل نجوم بود ؛ برای اطلاعات بیشتر، Sobel (1996) . همانطور که در این مثال نشان داده شده است، یکی از دلایلی که فراخوانی های باز به نظر می رسد به خوبی کار می کنند این است که آنها دسترسی به افراد با دیدگاه ها و مهارت های مختلف را فراهم می کند (Boudreau and Lakhani 2013) . برای اطلاعات بیشتر در مورد ارزش تنوع در حل مسائل، به صفحات Hong and Page (2004) و Page (2008) مراجعه کنید.
هر یک از موارد تماس باز در فصل، نیازمند کمی توضیح بیشتر برای اینکه چرا در این رده متعلق به آن است. اول، یکی از راه هایی که من بین محاسبه های انسانی و پروژه های فراخوانی باز تشخیص می دهم این است که آیا خروجی به طور متوسط تمام راه حل ها (محاسبه انسان) یا بهترین راه حل (call open) است. جایزه Netflix در این زمینه تا حدودی پیچیده است؛ زیرا بهترین راه حل، یک میانگین پیچیده از راه حل های فردی است؛ یک رویکرد به نام راه حل گروهی (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . با این حال، از نظر Netflix، همه ی آنها مجبور بودند بهترین گزینه را انتخاب کنند. برای کسب اطلاعات بیشتر در جایزه Netflix، Bennett and Lanning (2007) ، Thompson (2008) ، Bell, Koren, and Volinsky (2010) ، و Feuerverger, He, and Khatri (2012) و Feuerverger, He, and Khatri (2012) .
دوم، با استفاده از تعاریف محاسبات انسانی (به عنوان مثال، Ahn (2005) )، Foldit باید یک پروژه محاسبه انسانی باشد. با این حال، من تصمیم می گیرم که آن را به عنوان یک فراخوانی مجدد طبقه بندی کنم، زیرا به مهارت های تخصصی نیاز دارد (البته نه لزوما آموزش تخصصی) و بهترین راه حل را به جای استفاده از یک استراتژی ترکیبی تقسیم می کند. برای دیدن بیشتر در Foldit ببینید، Cooper et al. (2010) ، Khatib et al. (2011) و Andersen et al. (2012) ؛ شرح من از Foldit در توصیف ها در Bohannon (2009) ، Hand (2010) و Nielsen (2012) ترسیم می کند.
در نهایت، می توان استدلال کرد که Peer-to-Patent نمونه ای از جمع آوری اطلاعات توزیع شده است. من انتخاب می کنم که آن را به عنوان یک تماس باز کنم چون آن ساختار مشابه مسابقه دارد و تنها بهترین کمک ها استفاده می شود، در حالی که با جمع آوری داده های توزیع شده، ایده مشارکت خوب و بد، کمتر مشخص است. برای اطلاعات بیشتر در مورد Peer-to-Patent به Noveck (2006) ، Ledford (2007) ، Noveck (2009) و Bestor and Hamp (2010) .
از لحاظ استفاده از فراخوانهای باز در تحقیقات اجتماعی، نتایج مشابه با نتایج Glaeser et al. (2016) در فصل 10 Mayer-Schönberger and Cukier (2013) که شهر نیویورک قادر به استفاده از مدل پیش بینی شده برای تولید بازده بزرگ در Mayer-Schönberger and Cukier (2013) مسکن است. در شهر نیویورک، این مدل پیش بینی شده توسط کارکنان شهر ساخته شده است، اما در موارد دیگر، می توان تصور کرد که آنها می توانند با تماس های باز ایجاد یا بهبود یافته (مثلا Glaeser et al. (2016) ). با این حال، یکی از نگرانی های عمده در مورد مدل های پیش بینی شده ای که برای تخصیص منابع استفاده می شود، این است که این مدل ها توانایی تقویت تعصبات موجود را دارند. بسیاری از محققان در حال حاضر "زباله در زباله" را می دانند و با مدل های پیش بینی می توانند "تعصب، بی عدالتی" باشند. برای دیدن بیشتر خطرات مدل های پیش بینی شده، به Barocas and Selbst (2016) و O'Neil (2016) مراجعه کنید. با داده های آموزش بی نظیر.
یک مشکل که ممکن است دولتها از استفاده از رقابت های آزاد جلوگیری کنند، این است که به انتشار داده ها نیاز دارد، که می تواند منجر به نقض حریم خصوصی شود. برای اطلاعات بیشتر درباره حریم خصوصی و انتشار اطلاعات در تماسهای باز، Narayanan, Huey, and Felten (2016) و بحث در فصل 6 را ببینید.
برای اطلاعات بیشتر در مورد تفاوت ها و شباهت های پیش بینی و توضیح، به Breiman (2001) ، Shmueli (2010) ، Watts (2014) و Kleinberg et al. (2015) Shmueli (2010) Kleinberg et al. (2015) . برای اطلاعات بیشتر در مورد پیش بینی در تحقیقات اجتماعی، نگاه کنید به Athey (2017) ، Cederman and Weidmann (2017) ، Hofman, Sharma, and Watts (2017) ، ( ??? ) و Yarkoni and Westfall (2017) .
برای بررسی طرح های تماس باز در زیست شناسی، از جمله مشاوره طراحی، به Saez-Rodriguez et al. (2016) .
توضیحات من از eBird در توضیحات در Bhattacharjee (2005) ، Robbins (2013) ، و Sullivan et al. (2014) ترسیم می کند Sullivan et al. (2014) . برای اطلاعات بیشتر در مورد چگونگی استفاده از مدل های آماری برای تحلیل داده های eBird، به Fink et al. (2010) و Hurlbert and Liang (2012) . برای کسب اطلاعات بیشتر در مورد برآورد مهارت شرکت کنندگان eBird، به Kelling, Johnston, et al. (2015) . برای اطلاعات بیشتر در مورد تاریخ علوم شهروندی در حوزه عرفان، Greenwood (2007) .
برای اطلاعات بیشتر در مورد پروژه مجلات مالاوی، Watkins and Swidler (2009) و Kaler, Watkins, and Angotti (2015) . برای کسب اطلاعات بیشتر در مورد یک پروژه مرتبط در آفریقای جنوبی، Angotti and Sennott (2015) . برای نمونه های بیشتری از تحقیق با استفاده از داده های پروژه های مجلات مالاوی، Kaler (2004) و Angotti et al. (2014) .
رویکرد من به ارائه مشاوره طراحی، مبتنی بر نمونه هایی از پروژه های همکاری موفق و شکست خورده توام بود که من آن را شنیده ام. همچنان یک جریان تحقیقاتی برای اعمال کلیه نظریه های روان شناختی اجتماعی برای طراحی جوامع آنلاین که مربوط به طراحی پروژه های همکاری مشترک است، وجود دارد. برای مثال، Kraut et al. (2012) .
با توجه به انگیزه شرکت کنندگان، در واقع واقعا دشوار است که دقیقا مشخص شود که چرا مردم در پروژه های همکاری مشترک شرکت می کنند (Cooper et al. 2010; Nov, Arazy, and Anderson 2011; Tuite et al. 2011; Raddick et al. 2013; Preist, Massung, and Coyle 2014) . اگر قصد دارید انگیزه شرکت کنندگان را در پرداخت یک بازار کار میکرو تاک (مانند Amazon Mechanical Turk)، Kittur et al. (2013) توصیه می کند.
در مورد شگفت انگیز بودن، برای مثال های بیشتری از اکتشافات غیر منتظره که از پروژه های Zooisteres خارج می شوند، Marshall, Lintott, and Fletcher (2015) .
با توجه به اخلاق، برخی از مقالات خوب در مورد مسائل مربوط به Gilbert (2015) ، Salehi et al. (2015) ، Schmidt (2013) ، Williamson (2016) ، Resnik, Elliott, and Miller (2015) و Zittrain (2008) . برای مسائل مربوط به مسائل حقوقی با کارکنان جمعیت، به Felstiner (2011) . O'Connor (2013) در مورد نظارت اخلاقی تحقیقاتی که نقش محققان و شرکت کنندگان را مختل می کند، به سوالات می پردازد. برای مسائل مربوط به به اشتراک گذاری اطلاعات در حالی که محافظت از شرکت کنندگان در پروژه های علوم شهری، Bowser et al. (2014) . هر دو Purdam (2014) و Windt and Humphreys (2016) بحث های زیادی در مورد مسائل اخلاقی در جمع آوری داده های توزیع شده دارند. در نهایت، اکثر پروژه ها مشارکت ها را تأیید می کنند اما مشارکتکنندگان را مجاز نمی دانند. در Foldit، بازیکنان اغلب به عنوان نویسنده معرفی می شوند (Cooper et al. 2010; Khatib et al. 2011) . در دیگر پروژه های Dieleman, Willett, and Dambre (2015) کنندگان برنده اغلب می توانند مقاله ای را که راه حل های آنها را توضیح می دهند بنویسند ( Bell, Koren, and Volinsky (2010) Dieleman, Willett, and Dambre (2015) Bell, Koren, and Volinsky (2010) و Dieleman, Willett, and Dambre (2015) ).