क्रियाएँ

कुंजी:

  • कठिनाई के डिग्री: आसान आसान , मध्यम मध्यम , कठिन कठिन , बहुत मुश्किल बहुत मुश्किल
  • गणित की आवश्यकता है ( गणित की आवश्यकता है )
  • आवश्यकता है कोडिंग ( कोडिंग )
  • डेटा संग्रहण ( डेटा संग्रहण )
  1. [ बहुत मुश्किल , कोडिंग , डेटा संग्रहण से सबसे रोमांचक दावों के एक] Benoit et al. (2015) राजनीतिक घोषणापत्र की भीड़-कोडिंग पर है कि परिणाम प्रतिलिपि प्रस्तुत करने योग्य हो जाता है। Merz, Regel, and Lewandowski (2016) घोषणापत्र कोर्पस होते हैं। से 2 छवि को पुन: पेश करने की कोशिश करें Benoit et al. (2015) अमेज़न मैकेनिकल तुर्क से श्रमिकों का उपयोग कर। कैसे समान अपने परिणामों थे?

  2. [ मध्यम ] InfluenzaNet परियोजना में लोगों के एक स्वयंसेवक पैनल घटना, प्रसार, और स्वास्थ्य की मांग इन्फ्लूएंजा-तरह-बीमारी (ILI) से संबंधित व्यवहार की रिपोर्ट (Tilston et al. 2010; Noort et al. 2015)

    1. तुलना करें और डिजाइन, लागत, और InfluenzaNet, Google फ़्लू रुझान में होने की संभावना त्रुटियों, और पारंपरिक इन्फ्लूएंजा ट्रैकिंग सिस्टम विपरीत।
    2. ऐसे में स्वाइन फ्लू के प्रकोप के रूप में एक अस्थिर समय पर विचार। प्रत्येक प्रणाली में संभव त्रुटियों का वर्णन करें।
  3. [ कठिन , कोडिंग , डेटा संग्रहण ] अर्थशास्त्री एक साप्ताहिक समाचार पत्रिका है। एक मानव गणना परियोजना देखने के लिए अगर कवर पर पुरुषों को महिलाओं के अनुपात में समय के साथ बढ़ गया है बनाएँ।

    1. पत्रिका आठ विभिन्न क्षेत्रों (अफ्रीका, एशिया प्रशांत, यूरोप, यूरोपीय संघ, लैटिन अमेरिका, मध्य पूर्व, उत्तरी अमेरिका और यूनाइटेड किंगडम) में अलग कवर कर सकते हैं और वे सभी की वेबसाइट से डाउनलोड किया जा सकता अर्थशास्त्री । इन क्षेत्रों में से एक उठाओ और विश्लेषण करते हैं। पर्याप्त विस्तार है कि वे किसी और के द्वारा दोहराया जा सकता है के साथ अपनी प्रक्रियाओं का वर्णन करने के लिए सुनिश्चित करें।

    यह सवाल जस्टिन Tenuto, crowdsourcing कंपनी में एक डेटा वैज्ञानिक द्वारा एक ऐसी ही परियोजना से प्रेरित था CrowdFlower , वहाँ "टाइम पत्रिका वास्तव में पसंद है दोस्तों"

  4. [ बहुत मुश्किल , कोडिंग , डेटा संग्रहण ] ऊपर सवाल पर बिल्डिंग, अब सभी आठ क्षेत्रों के लिए विश्लेषण करते हैं।

    1. आप क्षेत्रों में क्या अंतर पाते हैं?
    2. अतिरिक्त कितना समय और पैसे के लिए यह बड़े पैमाने अप करने के लिए क्षेत्रों के सभी आठ के लिए अपने विश्लेषण ले गए थे?
    3. कल्पना कीजिए कि अर्थशास्त्री 100 अलग कवर प्रत्येक सप्ताह है। अनुमान अतिरिक्त समय कैसे और पैसे ज्यादा यह बड़े पैमाने अप करने के लिए प्रति सप्ताह 100 कवर करने के लिए अपने विश्लेषण ले जाएगा।
  5. [ कठिन , कोडिंग ] [Kaggle] (https://www.kaggle.com/) एक वेबसाइट है कि ओपन कॉल परियोजनाओं मेजबान है। उन परियोजनाओं में से एक में भाग लेते हैं।

  6. [ मध्यम ] अपने क्षेत्र में एक पत्रिका के हाल के एक अंक के माध्यम से देखो। क्या कोई कागजात है कि खुले कॉल परियोजनाओं के रूप में पुनर्निर्मित किया जा सकता था क्या? क्यों या क्यों नहीं?

  7. [ आसान ] Purdam (2014) लंदन में भीख मांगने के बारे में एक वितरित डेटा संग्रह का वर्णन किया। शक्तियों और इस अनुसंधान डिजाइन की कमजोरियों संक्षेप।

  8. [ मध्यम ] अतिरेक वितरित डेटा संग्रह की गुणवत्ता का आकलन करने के लिए एक महत्वपूर्ण तरीका है। Windt and Humphreys (2016) को विकसित करने और पूर्वी कांगो में लोगों से संघर्ष की घटनाओं की खबरों को इकट्ठा करने के लिए एक प्रणाली का परीक्षण करें। अख़बार पढ़ना।

    1. कैसे उनके डिजाइन अतिरेक सुनिश्चित करता है?
    2. वे डेटा उनकी परियोजना से एकत्र मान्य करने के लिए कई दृष्टिकोण प्रदान करते हैं। उन्हें संक्षेप। जो आपके लिए सबसे अधिक कायल था?
    3. एक नया तरीका है कि डेटा मान्य किया जा सकता है प्रस्ताव। सुझाव विश्वास है कि आप एक तरीका है कि लागत प्रभावी और नैतिक में डेटा में होगा बढ़ाने के लिए प्रयास करना चाहिए।
  9. [ मध्यम ] करीम लखानी और उनके सहयोगियों (2013) कम्प्यूटेशनल जीव विज्ञान में एक समस्या को हल करने के लिए नए एल्गोरिदम मांगना एक खुला कॉल बनाया। उन्होंने 89 उपन्यास कम्प्यूटेशनल दृष्टिकोण से युक्त 600 से अधिक प्रस्तुतियाँ प्राप्त किया। प्रस्तुतियाँ की, वे 30 कि स्वास्थ्य के MegaBLAST के अमेरिकी राष्ट्रीय संस्थानों के प्रदर्शन को पार कर प्राप्त किया, और सबसे अच्छा प्रस्तुत दोनों अधिक से अधिक सटीकता और गति (1,000 गुना तेजी से) हासिल की।

    1. उनके अखबार पढ़ें, और फिर एक सामाजिक अनुसंधान समस्या यह है कि खुले प्रतियोगिता की ही तरह इस्तेमाल कर सकते हैं प्रस्ताव। विशेष रूप से, खुली प्रतियोगिता के इस तरह के तेजी से ऊपर और एक मौजूदा एल्गोरिथ्म के प्रदर्शन में सुधार लाने पर ध्यान केंद्रित किया है। आप अपने क्षेत्र में इस तरह की समस्या के बारे में सोच नहीं सकता है, तो क्यों नहीं समझाने की कोशिश।
  10. [ मध्यम ] कई मानव गणना परियोजनाओं अमेज़न मैकेनिकल तुर्क से प्रतिभागियों पर भरोसा करते हैं। साइन-अप पर अमेज़न मैकेनिकल तुर्क एक कार्यकर्ता बनने के लिए। वहां काम कर रहे एक घंटे खर्च करते हैं। कैसे इस प्रभाव डिजाइन, गुणवत्ता के बारे में अपने विचारों, और मानव compuation परियोजनाओं की नैतिकता है?