क्रियाएँ

  • कठिनाई की डिग्री: आसान आसान मध्यम मध्यम , कठिन कठिन , बहुत मुश्किल बहुत मुश्किल
  • गणित की आवश्यकता है गणित की आवश्यकता है )
  • कोडिंग की आवश्यकता है कोडिंग की आवश्यकता है )
  • डेटा संग्रहण ( डेटा संग्रहण )
  • मेरे पसंदीदा ( मेरा मनपसंद )
  1. [ बहुत मुश्किल , कोडिंग की आवश्यकता है , डेटा संग्रहण , मेरा मनपसंद ] राजनीतिक घोषणापत्रों के भीड़-कोडिंग पर बेनोइट और सहयोगियों (2016) शोध के सबसे रोमांचक दावों में से एक यह है कि परिणाम पुन: उत्पन्न होते हैं। Merz, Regel, and Lewandowski (2016) मेनिफेस्टो कॉर्पस तक पहुंच प्रदान करता है। Benoit et al. (2016) से आकृति 2 को पुन: पेश करने का प्रयास करें Benoit et al. (2016) अमेज़ॅन मैकेनिकल तुर्क से श्रमिकों का उपयोग करना। आपके परिणाम कितने समान थे?

  2. [ मध्यम ] इन्फ्लुएंजानेट परियोजना में लोगों का स्वयंसेवक पैनल इन्फ्लूएंजा जैसी बीमारी से संबंधित घटनाओं, प्रसार, और स्वास्थ्य-मांग व्यवहार की रिपोर्ट करता है (Tilston et al. 2010; Noort et al. 2015)

    1. InfluenzaNet, Google Flu Trends, और पारंपरिक इन्फ्लूएंजा ट्रैकिंग सिस्टम में डिज़ाइन, लागत और संभावित त्रुटियों की तुलना और तुलना करें।
    2. एक परेशान समय पर विचार करें, जैसे इन्फ्लूएंजा के उपन्यास रूप का प्रकोप। प्रत्येक प्रणाली में संभावित त्रुटियों का वर्णन करें।
  3. [ कठिन , कोडिंग की आवश्यकता है , डेटा संग्रहण ] अर्थशास्त्री एक साप्ताहिक समाचार पत्रिका है। यह देखने के लिए मानव गणना गणना परियोजना बनाएं कि समय के साथ कवर पर पुरुषों का अनुपात बदल गया है या नहीं।

    1. पत्रिका में आठ अलग-अलग क्षेत्रों (अफ्रीका, एशिया प्रशांत, यूरोप, यूरोपीय संघ, लैटिन अमेरिका, मध्य पूर्व, उत्तरी अमेरिका और यूनाइटेड किंगडम) में अलग-अलग कवर हो सकते हैं और वे सभी पत्रिका की वेबसाइट से डाउनलोड किए जा सकते हैं। इन क्षेत्रों में से एक को चुनें और विश्लेषण करें। पर्याप्त प्रक्रियाओं के साथ अपनी प्रक्रियाओं का वर्णन करना सुनिश्चित करें कि उन्हें किसी और द्वारा दोहराया जा सकता है।

    यह प्रश्न भीड़सोर्सिंग कंपनी क्रॉडफ्लॉवर में एक डेटा वैज्ञानिक जस्टिन टेनूटो द्वारा इसी तरह की परियोजना से प्रेरित था: "टाइम मैगज़ीन वास्तव में पसंद करता है" देखें (http://www.crowdflower.com/blog/time-magazine-cover-data) ।

  4. [ बहुत मुश्किल , कोडिंग की आवश्यकता है , डेटा संग्रहण ] पिछले प्रश्न पर निर्माण, अब सभी आठ क्षेत्रों के लिए विश्लेषण प्रदर्शन करते हैं।

    1. आप क्षेत्रों में क्या मतभेद पाए?
    2. सभी आठ क्षेत्रों में आपके विश्लेषण को बढ़ाने के लिए कितना अतिरिक्त समय और पैसा लिया गया?
    3. कल्पना करें कि अर्थशास्त्री के पास हर हफ्ते 100 अलग-अलग कवर होते हैं। अनुमान लगाएं कि प्रति सप्ताह 100 कवर में आपके विश्लेषण को बढ़ाने के लिए कितना अतिरिक्त समय और पैसा लगेगा।
  5. [ कठिन , कोडिंग की आवश्यकता है ] ऐसी कई वेबसाइटें हैं जो खुली कॉल परियोजनाओं को होस्ट करती हैं, जैसे कि कागल। उन परियोजनाओं में से एक में भाग लें, और वर्णन करें कि आप उस विशेष परियोजना के बारे में क्या सीखते हैं और सामान्य रूप से खुली कॉल के बारे में जानें।

  6. [ मध्यम ] अपने क्षेत्र में एक पत्रिका के हालिया अंक को देखें। क्या ऐसे कोई कागजात हैं जिन्हें ओपन कॉल परियोजनाओं के रूप में सुधारित किया जा सकता था? क्यों या क्यों नहीं?

  7. [ आसान ] Purdam (2014) लंदन में भीख मांगने के बारे में एक वितरित डेटा संग्रह का वर्णन करता है। इस शोध डिजाइन की ताकत और कमजोरियों को सारांशित करें।

  8. [ मध्यम ] वितरित डेटा संग्रह की गुणवत्ता का आकलन करने के लिए रिडंडेंसी एक महत्वपूर्ण तरीका है। Windt and Humphreys (2016) ने पूर्वी कांगो में लोगों से संघर्ष घटनाओं की रिपोर्ट एकत्र करने के लिए एक प्रणाली विकसित और परीक्षण की। अखबार को पढ़ो।

    1. उनके डिजाइन कैसे अनावश्यकता सुनिश्चित करते हैं?
    2. उन्होंने अपनी परियोजना से एकत्रित डेटा को प्रमाणित करने के लिए कई दृष्टिकोण प्रदान किए। उन्हें सारांशित करें। जो आपको सबसे ज्यादा विश्वास दिलाता था?
    3. एक नया तरीका प्रस्तावित करें कि डेटा को सत्यापित किया जा सके। सुझावों को उस विश्वास में वृद्धि करने का प्रयास करना चाहिए जो आपके पास डेटा में लागत प्रभावी और नैतिक है।
  9. [ मध्यम ] करीम लखानी और सहयोगियों (2013) ने कम्प्यूटेशनल जीवविज्ञान में एक समस्या को हल करने के लिए नए एल्गोरिदम मांगने के लिए एक खुली कॉल बनाई। उन्हें 89 उपन्यास कम्प्यूटेशनल दृष्टिकोण वाले 600 से अधिक सबमिशन प्राप्त हुए। सबमिशन में, 30 ने यूएस नेशनल इंस्टीट्यूट ऑफ हेल्थ मेगाब्लैस्ट के प्रदर्शन को पार किया, और सर्वोत्तम सटीकता और गति (1,000 गुना तेज) दोनों प्राप्त सर्वोत्तम सबमिशन।

    1. अपने पेपर को पढ़ें, और फिर एक सामाजिक शोध समस्या का प्रस्ताव दें जो एक ही तरह की खुली प्रतियोगिता का उपयोग कर सके। विशेष रूप से, इस तरह की खुली प्रतियोगिता एक मौजूदा एल्गोरिदम के प्रदर्शन को तेज करने और सुधारने पर केंद्रित है। यदि आप अपने क्षेत्र में इस तरह की कोई समस्या नहीं सोच सकते हैं, तो समझाने की कोशिश क्यों नहीं करें।
  10. [ मध्यम , मेरा मनपसंद ] कई मानव गणना परियोजनाएं अमेज़ॅन मैकेनिकल तुर्क से प्रतिभागियों पर भरोसा करती हैं। अमेज़ॅन मैकेनिकल तुर्क पर एक कार्यकर्ता बनने के लिए साइन अप करें। वहां काम करने में एक घंटे बिताएं। यह मानवीय गणना परियोजनाओं के डिजाइन, गुणवत्ता और नैतिकता के बारे में आपके विचारों को कैसे प्रभावित करता है?