дейности

Key:

  • степен на трудност: лесно лесно , среден среда , твърд твърд , много трудно много трудно
  • изисква математика ( изисква по математика )
  • изисква кодиране ( изисква кодиране )
  • събиране на данни ( събиране на данни )
  1. [ много трудно , изисква кодиране , събиране на данни ] Едно от най-интересните претенции от Benoit et al. (2015) на тълпата-кодиране на политически манифести е, че резултатите са възпроизводими. Merz, Regel, and Lewandowski (2016) осигурява достъп до Манифест корпус. Опитайте се да възпроизвежда фигура 2 от Benoit et al. (2015) с помощта на работници от Amazon Mechanical Turk. Как подобна бяха резултатите?

  2. [ среда ] В проекта на InfluenzaNet доброволец панел на хората да докладват на заболеваемост, болестност и здраве търси поведението, свързани с грипоподобно-заболяване (ГЗ) (Tilston et al. 2010; Noort et al. 2015) .

    1. Сравняват и съпоставят дизайна, разходи и евентуални грешки в InfluenzaNet, Google Flu Trends, и традиционните системи за проследяване на птиците.
    2. Помислете нерешен време, като например избухването на свинския грип. Описват се възможните грешки във всяка система.
  3. [ твърд , изисква кодиране , събиране на данни ] The Economist е седмично списание новини. Създаване на проект човешки изчисления, за да видите, ако съотношението на жените към мъжете на корицата е увеличил с течение на времето.

    1. Списанието може да има различни корици в осем различни региони (Африка, Азия, Европа, Европейския съюз, Латинска Америка, Близкия изток, Северна Америка и Великобритания) и всички те могат да бъдат изтеглени от интернет страницата на The Economist . Изберете един от тези региони и извършване на анализа. Бъдете сигурни, за да опишете процедури с достатъчно подробности, които те биха могли да бъдат възпроизведени от някой друг.

    Този въпрос е бил вдъхновен от подобен проект от Джъстин тенуто, учен с данни в краудсорсинг компанията CrowdFlower , вижте "Списание Time наистина се интересува от Dudes" .

  4. [ много трудно , изисква кодиране , събиране на данни ] Изграждане на въпроса по-горе, сега извършване на анализа за всички осем региона.

    1. Какви разлики открихте в отделните региони?
    2. Колко допълнително време и пари бяха необходими, за да мащабирате-нагоре си анализ на всички осем на регионите?
    3. Представете си, че Economist има 100 различни корици всяка седмица. Пресметнете колко допълнително време и пари ще го взема, за да мащабирате-нагоре си анализ на 100 корици на седмица.
  5. [ твърд , изисква кодиране ] [Kaggle] (https://www.kaggle.com/) е уебсайт, който е домакин на проекти открита покана. Участвайте в един от тези проекти.

  6. [ среда ] Погледни през последния брой на списание във вашата област. Има ли някакви документи, които биха могли да бъдат преформулирани като проекти открита покана? Защо или защо не?

  7. [ лесно ] Purdam (2014) , описан разпределена събиране на данни за просия в Лондон. Обобщете на силните и слабите страни на този изследователски проект.

  8. [ среда ] Излишъкът е важен начин да се оцени качеството на разпределени за събиране на данни. Windt and Humphreys (2016) разработва и тества система за събиране на докладите на конфликтни събития от хората в Източно Конго. Прочети листа.

    1. Как проектирането им осигури съкращения?
    2. Те предлагат няколко подхода за валидиране на данните, събрани от техния проект данните. резюмета от тях. Коя е най-убедителен за вас?
    3. Предложи нов начин, че данните могат да бъдат валидирани. Предложения трябва да се опита да увеличи доверието, че ще имат в данните по начин, който е икономически ефективен и етично.
  9. [ среда ] Карим Лахани и колеги (2013) , създадени открита покана да бъдат привличани нови алгоритми за решаване на проблем в изчислителната биология. Те са получили повече от 600 заявления, съдържащи 89 нови изчислителни подходи. От представените, те са получили 30, че превишаване на изпълнението на САЩ националните институти на MegaBLAST здравеопазването, и най-доброто представяне постигат както по-голяма точност и скорост (1000 пъти по-бързо).

    1. Прочетете статията си, а след това предложи изследвания проблем социална, че биха могли да използват един и същи вид на открит конкурс. В частност, този вид на открит конкурс се фокусира върху ускоряване и подобряване на ефективността на съществуващ алгоритъм. Ако не можете да мислите за проблем като този във вашата област, се опита да обясни защо не.
  10. [ среда ] Много от проектите на човешките изчислителни разчитат на участници от Amazon Mechanical Turk. Абонирайте се, за да стане един работник на Amazon Mechanical Turk. Прекарайте един часа работа там. Как става това въздействието си мисли за дизайн, качество и етика на проекти човешките compuation?