פעילויות

מַפְתֵחַ:

  • דרגת הקושי: קל קַל , בינוני בינוני , קשה קָשֶׁה , קשה מאוד קשה מאוד
  • דורש מתמטיקה ( דורש מתמטיקה )
  • דורש קידוד ( דורש קידוד )
  • איסוף נתונים ( איסוף נתונים )
  1. [ קשה מאוד , דורש קידוד , איסוף נתונים ] אחת הטענות הכי מרגש מ Benoit et al. (2015) על-קידוד הקהל של מניפסטים פוליטיים היא כי התוצאות הן לשחזור. Merz, Regel, and Lewandowski (2016) מספק גישה המניפסט קורפוס. נסה לשחזר איור 2 מ Benoit et al. (2015) באמצעות עובדי אמזון מכונות טורק. איך דומה היו התוצאות?

  2. [ בינוני ] בפרויקט InfluenzaNet פאנל מתנדב של אנשים לדווח על שכיחות, שכיחות, והתנהגות בריאות המבקשים הקשורים שפעת דמוי-מחלה (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. השווה לעומת העיצוב, העלויות, ושגיאות סבירות InfluenzaNet, של Google Flu Trends, ומערכות מעקב שפעת מסורתיות.
    2. קח זמן מעורער, כגון התפרצות שפעת החזירים. תאר את השגיאות האפשריות בכל מערכת.
  3. [ קָשֶׁה , דורש קידוד , איסוף נתונים ] האקונומיסט הוא מגזין חדש שבועי. יצירת פרויקט חישוב אדם כדי לבדוק אם היחס בין נשים לגברים על העטיפה גדל לאורך זמן.

    1. המגזין יכול להיות כיסויים שונים בשמונה אזורים שונים (אפריקה, אסיה פסיפיק, אירופה, האיחוד האירופי, אמריקה הלטינית, המזרח התיכון, צפון אמריקה, בריטניה) והם כולם יכולים להיות להוריד מאתר האינטרנט של האקונומיסט . פיק אחד של אזורים אלה לבצע את הניתוח. הקפד לתאר הליכים שלך עם פירוט מספיק שיוכלו להיות משוכפל על ידי מישהו אחר.

    שאלה זו הייתה בהשראת פרויקט דומה על ידי ג'סטין Tenuto, מדען נתונים בחברת crowdsourcing CrowdFlower , ראה "מגזין טיים באמת אוהב Dudes" .

  4. [ קשה מאוד , דורש קידוד , איסוף נתונים ] בניין על השאלה לעיל, חברה לבצע את הניתוח עבור כל שמונת האזורים.

    1. מה ההבדלים מצאת פני אזורים?
    2. כמה תוספת זמן וכסף לקח לגמלן הניתוח שלך לכל השמונה האזורים?
    3. תארו לעצמכם כי האקונומיסט יש 100 כיסויים שונים בכל שבוע. להעריך כמה תוספת זמן וכסף זה ייקח לגמלן הניתוח שלך ל -100 מכסה בשבוע.
  5. [ קָשֶׁה , דורש קידוד ] [Kaggle] (https://www.kaggle.com/) הוא אתר אינטרנט אשר מאחסן פרויקטים קריאים פתוחים. להשתתף באחד מאותם פרויקטים.

  6. [ בינוני ] להסתכל דרך בגיליון האחרון של כתב עת בתחום שלך. האם יש ניירות שיכול שעברו תהליך עיבוד כפרויקטים קריאה פתוחה? למה או למה לא?

  7. [ קַל ] Purdam (2014) תיאר אוסף נתונים מבוזרים על מתחנן בלונדון. סכם את נקודות החוזק והחולשה של עיצוב מחקר זה.

  8. [ בינוני יתירות] היא דרך חשובה כדי להעריך את איכות איסוף נתונים מבוזרים. Windt and Humphreys (2016) לפתח ולבדוק מערכת לאסוף דיווחים על תופעות סכסוך מאנשים במזרח קונגו. קראו את העיתון.

    1. איך העיצוב שלהם להבטיח יתירות?
    2. הם מציעים מספר גישות כדי לאמת את הנתונים שנאספו בפרויקט שלהם. סכם אותם. איזה היה משכנע ביותר אליך?
    3. הצע דרך חדשה כי הנתונים ניתן היה לאמת. הצעות צריכות לנסות להגדיל את הביטחון כי היית צריכים בנתונים בצורה חסכונית ואתית.
  9. [ בינוני ] כרי Lakhani ועמיתיו (2013) יצרו שיחה פתוחה לשדל אלגוריתמים חדשים כדי לפתור בעיה בביולוגיה חישובית. הם קבלו יותר מ -600 הגשות המכילות 89 גישות חישוביות רומן. של הגשות, שקיבלו 30 שחרגו הביצועים של המוסד האמריקני הלאומי של MegaBLAST הבריאות, ואת ההגשה הטובה ביותר מושגת הן דיוק רב יותר ומהירות (1,000 פעמים מהר).

    1. קראו במאמרם, ולאחר מכן להציע בעית המחקר חברתית שיכול להשתמש באותו סוג של תחרות פתוחה. בפרט, זה סוג של תחרות פתוחה מתמקד זירוז ושיפור הביצועים של אלגוריתם קיים. אם אתה לא יכול לחשוב על בעיה כזאת בתחום שלך, מנסה להסביר למה לא.
  10. [ בינוני ] פרויקטי חישוב אדם רבים מסתמכים על משתתפים של אמזון מכונה טורק. הירשם כדי להיות עובד באמזון המכאני טורק. הקדישו שעה לעבוד שם. איך זה השפעת מחשבותיך על העיצוב, האיכות, ואתיקה של פרויקטי compuation אדם?