उपक्रम

  • अडचण पदवी: सोपे सोपे , मध्यम मध्यम , हार्ड कठीण , खुप कठिण खुप कठिण
  • गणित आवश्यक आहे ( गणित आवश्यक आहे )
  • कोडींग आवश्यक आहे ( कोडींग आवश्यक )
  • माहिती मिळवणे ( माहिती मिळवणे )
  • माझे आवडते ( माझे आवडते )
  1. [ खुप कठिण , कोडींग आवश्यक , माहिती मिळवणे , माझे आवडते ] राजकीय manifesto च्या जमावटोळी-कोडिंग वर Benoit आणि सहकार्यांना ' (2016) संशोधन पासून सर्वात रोमांचक दावे एक निकाल परिणाम पुन्हा उत्पन्न करता येण्याजोगा आहे. Merz, Regel, and Lewandowski (2016) मॅनिफेस्टो कॉर्पसमध्ये प्रवेश प्रदान करतात Benoit et al. (2016) पासून आकृती 2 ची पुनर्रचना करण्याचा प्रयत्न करा Benoit et al. (2016) ऍमेझॉन यांत्रिकी तुर्क आपले परिणाम कसे सारखे होते?

  2. [ मध्यम ] इन्फ्लुएन्झानेट प्रोजेक्टमध्ये लोक स्वयंसेवक पॅनेल इन्फ्लूएन्झा सारखी आजार (Tilston et al. 2010; Noort et al. 2015) शी संबंधित घटना, व्याप्ती आणि आरोग्य-शोधण्याच्या वागण्याचा अहवाल देतात.

    1. InfluenzaNet, Google Flu Trends, आणि पारंपारिक इन्फ्लूएझा ट्रॅकिंग सिस्टीममध्ये डिझाइन, खर्च आणि संभाव्य चुकांची तुलना करा आणि त्यामध्ये तुलना करा.
    2. एक अस्थिर वेळेचा विचार करा, जसे की इन्फ्लुएंझाचा एक कादंबरीचा फॉर्म. प्रत्येक प्रणालीतील संभाव्य चुका सांगा
  3. [ कठीण , कोडींग आवश्यक , माहिती मिळवणेइकॉनॉमिस्ट हे एक साप्ताहिक वृत्त मासिक आहे कव्हरवरील स्त्रियांपेक्षा पुरुषांच्या गुणोत्तर बदलला आहे काय हे पाहण्यासाठी मानवी मोजणीचे प्रोजेक्ट तयार करा.

    1. मॅगझिनच्या आठ वेगवेगळ्या क्षेत्रांमध्ये (आफ्रिका, आशिया पॅसिफिक, युरोप, युरोपियन युनियन, लॅटिन अमेरिका, मध्य पूर्व, उत्तर अमेरिका आणि युनायटेड किंगडम) वेगवेगळ्या कव्हर असू शकतात आणि ते सर्व मासिकांच्या वेबसाइटवरून डाउनलोड केले जाऊ शकतात. यापैकी एक विभाग निवडा आणि विश्लेषण करा. आपल्या कार्यपद्धतीचा पुरेसा तपशिलासह वर्णन करणे सुनिश्चित करा की ते इतर कुणीही वापरू शकतात.

    हा प्रश्न प्रेरक प्रेक्षक कंपनी क्राडाफ्लॉवर येथे डेटा वैज्ञानिक जस्टीन तेनुतो यांच्यासारख्या प्रकल्पातून प्रेरित झाला होता: "वेळ नियतकालिक खरोखर आवडते दिवे" पहा (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ खुप कठिण , कोडींग आवश्यक , माहिती मिळवणे ] मागील प्रश्नावर इमारत, आता सर्व आठ क्षेत्रांमध्ये विश्लेषण करा.

    1. सर्व प्रदेशांमध्ये आपल्याला काय फरक सापडला?
    2. सर्व आठ विभागांना आपले विश्लेषण वाढविण्यासाठी किती अतिरिक्त वेळ आणि पैसे घेतले?
    3. कल्पना करा की अर्थशास्त्रामध्ये प्रत्येक आठवड्यात 100 वेगवेगळ्या कव्हर्स आहेत. दर आठवड्यास 100 कव्हरपर्यंत आपल्या विश्लेषणाचे प्रमाण वाढविण्यासाठी किती अतिरिक्त वेळ आणि पैसे लागतील याचा अंदाज लावा.
  5. [ कठीण , कोडींग आवश्यक ] अशा अनेक वेबसाइट्स आहेत ज्या उघड्या कॉल प्रोजेक्टचे होस्ट करते, जसे की कॅगल. त्यापैकी एका प्रकल्पात सहभागी व्हा आणि त्या विशिष्ट प्रकल्पाबद्दल आणि सामान्यतः खुल्या कॉलबद्दल आपण जे काही शिकता त्याचे वर्णन करा.

  6. [ मध्यम ] आपल्या क्षेत्रात एक जर्नल ऑफ अलिकडील अंक पहा. खुले कॉल प्रोजेक्ट्स म्हणून पुनरावृत्त होऊ शकणारे काही कागदपत्रे आहेत काय? का किंवा का नाही?

  7. [ सोपे ] Purdam (2014) लंडनमध्ये भीक Purdam (2014) वितरित डेटा संकलनाचे वर्णन केले आहे. या संशोधन डिझाइनची ताकद आणि कमतरता सारांशित करा.

  8. [ मध्यम ] रिडंडंसि वितरक डेटा संकलनाची गुणवत्ता मोजण्याचा एक महत्वाचा मार्ग आहे. Windt and Humphreys (2016) पूर्व काँगोमधील लोकांकडून होणाऱ्या संघर्ष घटनांच्या अहवाला गोळा करण्यासाठी एक यंत्रणा विकसित आणि परीक्षित केली. कागद वाचा.

    1. त्यांची रचना रिडंडन्सीची खात्री कशी करते?
    2. त्यांनी त्यांच्या प्रकल्पामधून गोळा केलेल्या डेटाचे प्रमाणीकरण करण्यासाठी अनेक पध्दती देतात. त्यांना सारांश. जे तुम्हाला सर्वात खात्रीने होते?
    3. डेटा प्रमाणित केला जाऊ शकणारा एक नवीन मार्ग प्रस्तावित करा. सूचनांमुळे आपल्यास असे वाटेल की डेटामध्ये अशा प्रकारे जे मूल्य प्रभावी आणि नैतिक आहे ते वाढवण्याचा प्रयत्न करावा.
  9. [ मध्यम ] करीम लखानी आणि सहकाऱ्यांनी (2013) संगणकीय जीवशास्त्रातील समस्या सोडवण्यासाठी नवीन अल्गोरिदम मागण्यासाठी एक खुला कॉल तयार केला. त्यांना 89 पेक्षा अधिक सबमिशन प्राप्त झाली ज्यात 89 कादंबरीच्या संगणकीय पद्धती आहेत. सबमिशनपैकी 30, अमेरिकेच्या राष्ट्रीय आरोग्य संस्थाच्या मेगाब्ल्लास्टच्या कामगिरीपेक्षा ओलांडली आणि सर्वोत्तम सबमिशनने अधिक अचूकता आणि वेग (1000 पट अधिक जलद) गाठली.

    1. त्यांचे पेपर वाचा, आणि नंतर एक सोशल रिसर्च समस्येचा प्रस्ताव द्या जो समान प्रकारचे खुली स्पर्धा वापरू शकेल. विशेषतः, या प्रकारचा खुल्या स्पर्धेत वेगवान आणि विद्यमान अल्गोरिदमच्या कार्यक्षमतेत सुधारणा करण्यावर लक्ष केंद्रित केले आहे. आपण आपल्या क्षेत्रात अशा समस्या विचार करू शकत नसल्यास, का नाही हे स्पष्ट करण्याचा प्रयत्न करा.
  10. [ मध्यम , माझे आवडते ] अनेक मानवी मोजणी प्रकल्प ऍमेझॉन यांत्रिक तुर्कांमधून सहभागी होतात. ऍमेझॉन यांत्रिकी तुर्कवर कार्यकर्ता होण्यासाठी साइन अप करा तिथे काम करण्यासाठी एक तास खर्च करा हे मानवी गणनेच्या प्रोजेक्टच्या डिझाइन, गुणवत्ता आणि नैतिक मूल्यांबद्दल आपले विचार कसे प्रभावित करते?