उपक्रम

की:

  • अडचण पदवी: सोपे सोपे , मध्यम मध्यम हार्ड कठीण , खुप कठिण खुप कठिण
  • गणित आवश्यक आहे ( गणित आवश्यक आहे )
  • आवश्यक कोडींग ( कोडींग आवश्यक )
  • माहिती मिळवणे ( माहिती मिळवणे )
  1. [ खुप कठिण , कोडींग आवश्यक , माहिती मिळवणे ] सर्वात रोमांचक दावे एक Benoit et al. (2015) राजकीय जाहीरनाम्यात गर्दीतून-कोडींग वर परिणाम उत्पन्न करता येण्याजोगा आहे. Merz, Regel, and Lewandowski (2016) जाहीरनामा कॉर्पस प्रवेश पुरवते. अंजीर 2 पुनरुत्पादन प्रयत्न Benoit et al. (2015) ऍमेझॉन यांत्रिकी तुर्क कामगार वापरून. आपले परिणाम कसे समान होते?

  2. [ मध्यम ] InfluenzaNet प्रकल्पात लोक स्वयंसेवक पॅनल प्रादुर्भाव, प्रभाव, आणि आरोग्य शोधत शीतज्वर सारखी-रोग (ILI) संबंधित वागण्याची तक्रार (Tilston et al. 2010; Noort et al. 2015) .

    1. तुलना करा आणि रचना, खर्च, आणि InfluenzaNet, म्हणून Google Flu Trends शक्यता चुका, आणि पारंपारिक शीतज्वर ट्रॅकिंग प्रणाली फरक.
    2. अशा स्वाइन फ्लू उद्रेक म्हणून स्थिर वेळ घ्या. प्रत्येक प्रणाली मध्ये शक्य त्रुटी वर्णन करा.
  3. [ कठीण , कोडींग आवश्यक , माहिती मिळवणे ] अर्थतज्ज्ञ एक साप्ताहिक बातम्या मॅगझिन आहे. कव्हर वर पुरुष महिला प्रमाण वेळ वाढ झाली आहे हे पाहण्यासाठी एक मानवी मोजणी प्रोजेक्ट तयार करा.

    1. मासिक आठ विविध क्षेत्रांमध्ये (आफ्रिका, आशिया पॅसिफिक, युरोप, युरोपियन युनियन, लॅटिन अमेरिका, मध्य पूर्व, उत्तर अमेरिका, युनायटेड किंगडम) विविध चेंडू असू शकतात आणि ती सर्व वेबसाईटवरुन डाउनलोड केला जाऊ शकतो अर्थतज्ज्ञ . या प्रदेशाच्या निवडा आणि विश्लेषण करते. ते कोणीतरी करून असेच होऊ शकते, असे पुरेसे तपशील आपल्या प्रक्रीया वर्णन करणे सुनिश्चित करा.

    हा प्रश्न जस्टीन Tenuto, संख्या वाढवण्यासाठी कंपनी येथे डेटा वैज्ञानिक एक समान प्रकल्प प्रेरणा होती CrowdFlower पाहू, "वेळ नियतकालिक खरोखर dudes पसंती" .

  4. [ खुप कठिण , कोडींग आवश्यक , माहिती मिळवणे ] वरील प्रश्नाचे तयार करणे, आता सर्व आठ क्षेत्रांमध्ये विश्लेषण करते.

    1. आपण भागात काय फरक आढळले?
    2. जास्त वेळ किती आणि पैसा मोजमाप-अप करण्यासाठी क्षेत्रांमध्ये सर्व आठ आपल्या विश्लेषण केले होते?
    3. अर्थतज्ज्ञ 100 प्रत्येक आठवड्यात विविध चेंडू आहे अशी कल्पना करा. तो आपल्या विश्लेषण मोजमाप-अप करण्यासाठी 100 दर आठवड्यात चेंडू किती अतिरिक्त वेळ आणि पैसा लागू होईल असा अंदाज आहे.
  5. [ कठीण , कोडींग आवश्यक ] [Kaggle] (https://www.kaggle.com/) खुल्या कॉल प्रकल्प होस्ट की एक वेबसाइट आहे. त्या प्रकल्पांपैकी एक मध्ये सहभागी व्हा.

  6. [ मध्यम ] आपल्या शेतात एक जर्नल अलीकडील समस्येचे घ्या. खुल्या कॉल प्रकल्प reformulated गेले आहेत असे काही पेपर्स आहेत? का किंवा का नाही?

  7. [ सोपे ] Purdam (2014) लंडन मध्ये भीक मागत एक वितरित डेटा संकलन वर्णन. या संशोधन रचना ताकद व कमकुवतपणा सारांश.

  8. [ मध्यम ] रिडंडंसि वितरित डेटा संकलन गुणवत्ता मुल्यांकन करण्याची एक महत्वाचा मार्ग आहे. Windt and Humphreys (2016) विकसित आणि पूर्व कॉंगो लोक संघर्ष घटना अहवाल संकलित करण्यासाठी प्रणाली चाचणी. कागद वाचू.

    1. त्यांच्या रचना रिडंडंसि कसे याची खात्री आहे?
    2. ते त्यांच्या प्रकल्प गोळा केलेला डेटा प्रमाणित करण्यासाठी अनेक पध्दती देतात. त्यांना सारांश. जे सर्वात ठोस होता?
    3. डेटा सत्यापित करणे शक्य की एक नवीन मार्ग प्रस्तावित. सूचना आपण खर्च-प्रभावी आणि नैतिक आहे की एक प्रकारे डेटा लागेल आत्मविश्वास वाढविणे प्रयत्न करावा.
  9. [ मध्यम ] करीम Lakhani आणि सहकारी (2013) संगणकीय जीवशास्त्र मध्ये एक समस्या सोडविण्यास नवीन अल्गोरिदम मागण्यासाठी खुले कॉल निर्माण केली. ते 89 कादंबरी संगणकीय पध्दती असलेली 600 पेक्षा अधिक सबमिशन प्राप्त केले. सबमिशन, ते प्राप्त आरोग्य च्या MegaBLAST अमेरिकेच्या राष्ट्रीय संस्था कामगिरी ओलांडली 30, आणि सर्वोत्तम सादर जास्त अचूकता आणि वेग दोन्ही (1,000 पट वेगाने) गाठले.

    1. त्यांच्या कागद वाचू, आणि नंतर उघडा स्पर्धा समान प्रकारचे वापरू शकतो की एक सामाजिक संशोधन समस्या मांडणे. विशेषतः, खुल्या स्पर्धा या प्रकारची भरधाव आणि अस्तित्वात अल्गोरिदम कामगिरी सुधारण्यावर लक्ष केंद्रित आहे. आपण आपल्या शेतात या समस्या विचार करू शकत नाही तर, का नाही, हे स्पष्ट करण्यासाठी प्रयत्न करा.
  10. [ मध्यम ] अनेक मानवी मोजणी प्रकल्प ऍमेझॉन यांत्रिकी तुर्क सहभागी अवलंबून. ऍमेझॉन यांत्रिकी तुर्क एक कार्यकर्ता होण्यासाठी साइन-अप. काम एक तास खर्च. हे कसे परिणाम आपल्या मानवी compuation प्रकल्प रचना, गुणवत्ता विचार आणि आचारसंहिता नाही?