कल खुला धेरै विशेषज्ञहरु र गैर-विशेषज्ञहरु जहाँ समाधान उत्पन्न भन्दा जाँच गर्न सजिलो हो समस्याहरूको समाधान प्रस्तावित गरौं।
सबै तीन खुला कल परियोजनाहरू-Netflix पुरस्कार, Foldit, साथीहरूको-को एकाधिकार-अनुसन्धानकर्ताहरूले एक विशिष्ट फारम को प्रश्न खडा, समाधान solicited, र त्यसपछि सबै भन्दा राम्रो समाधान छानिएको। शोधकर्ताओं पनि सोध्न सर्वश्रेष्ठ विशेषज्ञ जान्नु आवश्यक थिएन, र कहिलेकाहीं राम्रो विचार अनपेक्षित ठाउँमा आए।
अब म पनि खुला कल परियोजनाहरू र मानव गणना परियोजनाहरू बीच दुई महत्त्वपूर्ण मतभेद हाइलाइट गर्न सक्नुहुन्छ। पहिलो, खुला कल परियोजनाहरू मा शोधकर्ता लक्ष्य (जस्तै, चलचित्र मूल्यांकन भविष्यवाणी) मानव गणना मा अनुसन्धान एक माइक्रो-कार्य निर्दिष्ट जबकि (जस्तै, एक ग्यालेक्सी वर्गीकृत) निर्दिष्ट गर्दछ। दोस्रो, खुला कल मा शोधकर्ताओं चलचित्र मूल्यांकन, प्रोटिनको सबै भन्दा कम-ऊर्जा विन्यास, वा पूर्व कला-केही योगदानको सबै को सरल संयोजन को प्रकारको सबैभन्दा सान्दर्भिक टुक्रा भविष्यवाणी लागि सबै भन्दा राम्रो योगदान-सबै भन्दा राम्रो तर्कको चाहन्थे।
सामान्य सामाजिक अनुसन्धान समस्याहरू को प्रकार यो दृष्टिकोण गर्न उपयुक्त हुन सक्छ के, खुला कल र यी तीन उदाहरण को लागि टेम्पलेट दिइएको? यो बिन्दुमा, म त्यहाँ (म एक क्षणमा व्याख्या छौँ भनेर कारण) अझै धेरै सफल उदाहरण भएको छैन भनी स्वीकार गर्नुपर्छ। प्रत्यक्ष analogues मामलामा, एक सहकर्मी-एकाधिकार शैली परियोजना विशिष्ट व्यक्ति वा विचार उल्लेख खोजी गर्ने पुराना कागजात लागि एक ऐतिहासिक शोधकर्ता द्वारा प्रयोग भइरहेको कल्पना गर्न सक्छ। सम्बन्धित कागजातहरू एक संग्रहमा संकलित छैनन् जब तर छन् व्यापक वितरण समस्या यस प्रकारको एक खुला कल दृष्टिकोण विशेष गरी मूल्यवान हुन सक्छ।
थप सामान्यतया, धेरै सरकारहरूले तिनीहरूले कार्य मार्गदर्शन गर्न प्रयोग गर्न सकिन्छ भनेर भविष्यवाणी सिर्जना गर्दै हुनुहुन्छ किनभने कल खोल्न उत्तरदायी हुन सक्छ समस्या (Kleinberg et al. 2015) । उदाहरणका लागि, Netflix चलचित्र मा मूल्यांकन भविष्यवाणी गर्न चाहन्थे जस्तै सरकारको परिणाम रेस्टुरेन्ट थप कुशलतापूर्वक निरीक्षण स्रोतहरू आवंटित गर्न स्वास्थ्य कोड उल्लंघन गर्न सबैभन्दा सम्भावना यस्तो जो रूपमा भविष्यवाणी गर्न सक्नुहुन्छ। समस्या, यस प्रकारको उत्प्रेरित Glaeser et al. (2016) खुला कल बोस्टन शहरमा भुकनु समीक्षा र निरीक्षण डाटा ऐतिहासिक डेटा मा आधारित रेस्टुरेन्ट स्वच्छता र सरसफाई उल्लंघन भविष्यवाणी मदत गर्न प्रयोग। Glaeser र सहयोगिहरु खुला कल जित्यो कि भविष्यवाणी मोडेल लगभग 50% द्वारा रेस्टुरेन्ट निरीक्षक को उत्पादकत्व सुधार भनेर अनुमान। कारोबार पनि यस्तो भविष्यवाणी रूपमा ग्राहक churn यस्तै संरचना संग समस्या (Provost and Fawcett 2013) ।
अन्तमा, परिणाम एक विशेष डाटा सेट पहिले नै भयो छ कि संलग्न कल खोल्न बाहेक (जस्तै, पहिलेका स्वास्थ्य कोड उल्लंघन मा डाटा प्रयोग स्वास्थ्य कोड उल्लंघन भविष्यवाणी), एक डेटासेटमा कसैले लागि अझै भयो छैन भनेर परिणाम भविष्यवाणी कल्पना सक्छ । उदाहरणका लागि, नाजुक परिवार र बाल भलाई अध्ययन 20 विभिन्न अमेरिकी शहर मा जन्म देखि बारेमा 5,000 छोराछोरीलाई ट्र्याक छ (Reichman et al. 2001) । अनुसन्धानकर्ताहरूले यी छोराछोरी, आफ्नो परिवार, र आफ्नो फराकिलो वातावरण जन्म बारेमा र उमेर 1, 3, 5, 9 मा डाटा संकलन गरेका छन्, र 15 सबै जानकारी दिइएको यी छोराछोरी बारेमा कसरी राम्रो अनुसन्धानकर्ताहरूले यस्तो गर्ने स्नातक रूपमा परिणाम भविष्यवाणी सक्छ कलेज बाट? वा, डाटा र सिद्धान्त भन्दा यी परिणाम भविष्यवाणी प्रभावकारी हुनेछ जो धेरै अनुसन्धानकर्ताहरूले, थप रोचक हुनेछ तरिकामा व्यक्त? यी बच्चाहरु को कुनै पनि हाल कलेज जान पर्याप्त पुरानो भएकोले यो साँचो अगाडि-देख भविष्यवाणी हुनेछ र त्यहाँ अनुसन्धानकर्ताहरूले रोजगार सक्छ विभिन्न रणनीति हो। छिमेक जीवन परिणाम आकार गर्दा परिवार मा केंद्रित गर्ने एक शोधकर्ता पूर्ण फरक केहि सक्छ एक दृष्टिकोण लिन सक्छ मा महत्वपूर्ण छन् भनेर विश्वास गर्ने एक शोधकर्ता। यी दृष्टिकोण कुन राम्रो काम? हामीलाई थाहा छैन, र हामी परिवार, छिमेक, शिक्षा, र सामाजिक असमानता बारेमा महत्त्वपूर्ण कुरा सिक्न सक्छौं बाहिर फेला को प्रक्रिया मा गर्छन्। यसबाहेक, यी अनुमानहरू भविष्यमा डाटा संग्रह मार्गदर्शन गर्न सकिन्छ। त्यहाँ मोडेल को कुनै पनि द्वारा स्नातक गर्न भविष्यवाणी थिएनन् कि कलेज स्नातकहरूको एउटा सानो नम्बर थिए होलान्, कल्पना गर्नुहोस्; यी मानिसहरू पालन-अप, गुणस्तरीय अन्तरवार्ता र एथ्नोग्राफिक अवलोकन लागि आदर्श उम्मेदवार हुनेछ। त्यसैले, खुला कल यस प्रकारको मा, अनुमानहरू छैन अन्त हो; बरु, तिनीहरू, तुलना गर्न समृद्ध छ, र विभिन्न सैद्धान्तिक परम्परा संयोजन नयाँ तरिका प्रदान। खुला कल यस प्रकारको जो कलेज जानेछन् भविष्यवाणी गर्न नाजुक परिवार देखि डाटा प्रयोग गर्न विशेष छैन; यसलाई अन्ततः कुनै पनि अनुदैर्ध्य सामाजिक डाटा सेटमा संकलित गरिने कुनै पनि नतिजा भविष्यवाणी गर्न प्रयोग गर्न सकिएन।
म यस खण्डमा पहिले यस्तो लेखे, त्यहाँ खुला कल प्रयोग सामाजिक अनुसन्धानकर्ताहरूले उदाहरण धेरै भएको छैन। म किनभने खुला कल राम्रो सामाजिक वैज्ञानिकहरूले सामान्यतया आफ्ना प्रश्नहरूको फ्रेम कि बाटो गर्न अनुकूल छैन यो छ कि लाग्छ। को Netflix पुरस्कार फर्केपछि सामाजिक वैज्ञानिकहरूले सामान्यतया स्वाद भविष्यवाणी बारेमा सोध्न छैन, तिनीहरूले विभिन्न सामाजिक वर्गहरू देखि मान्छे को लागि भिन्न सांस्कृतिक कसरी र किन स्वाद बारेमा सोध्न थियो (Bourdieu 1987) । यस्तो "कसरी" र "किन" प्रश्न सजिलो समाधान प्रमाणित गर्न नेतृत्व छैन, र यसैले कल खोल्न खराब फिट जस्तो देखिन्छ। तसर्थ, यसलाई खुला कल विवरण को प्रश्न भन्दा भविष्यवाणी को प्रश्न गर्न थप उत्तरदायी हुनुहुन्छ जस्तो देखिन्छ; भविष्यवाणी र व्याख्या बीच भेदभाव थप देख्न Breiman (2001) । हाल सिद्धान्तकारहरु तथापि, व्याख्या र भविष्यवाणी बीच dichotomy पुनर्विचार गर्न सामाजिक वैज्ञानिकहरूले मा भनिन्छ छन् (Watts 2014) । भविष्यवाणी र व्याख्या blurs बीच लाइन, म खुला प्रतियोगिताहरूमा सामाजिक विज्ञान मा झन् साधारण हुनेछ भनी आशा।