aktivnosti

  • степен тешкоће: једноставно лако , средња средња , тешко тешко , Веома тешко Веома тешко
  • захтева математику ( захтева математику )
  • захтева кодирање ( захтева кодирање )
  • прикупљање података ( прикупљање података )
  • моји фаворити ( моје омиљено )
  1. [ Веома тешко , захтева кодирање , прикупљање података , моје омиљено ] Једно од најузбудљивијих тврдњи истраживања Беноита и колега (2016) о масовном кодирању политичких манифестова јесте то што су резултати поновљиви. Merz, Regel, and Lewandowski (2016) омогућавају приступ Манифесто Цорпусу. Покушајте репродуковати слику 2 из Benoit et al. (2016) користећи раднике Амазон Мецханицал Турк. Колико су били слични ваши резултати?

  2. [ средња ] У пројекту ИнфлуензаНет волонтерски панел људи пријављује инциденцију, преваленцију и здравствено понашање везано за грипу сличну болест (Tilston et al. 2010; Noort et al. 2015) .

    1. Упоређивање и контраст дизајна, трошкова и вероватних грешака у ИнфлуензаНет, Гоогле трендовима грипа и традиционалним системима праћења грипа.
    2. Размислите о неуређеном времену, као што је избијање новог облика грипа. Опишите могуће грешке у сваком систему.
  3. [ тешко , захтева кодирање , прикупљање података ] Економист је недељник часописа. Направите пројекат људског рачунања да бисте видели да ли се однос жена и мушкараца на насловници променио током времена.

    1. Часопис може имати различите покриваче у осам различитих региона (Африка, Азија Пацифик, Европа, Европска унија, Латинска Америка, Блиски исток, Сјеверна Америка и Велика Британија) и сви се могу преузети са веб странице часописа. Изаберите један од ових регија и извршите анализу. Обавезно опишите своје поступке са довољно детаљима да би их неко могао репликовати.

    Ово питање је инспирисано сличним пројектом Јустина Тенутаа, научника за податке у компанији ЦровдФловер, која се бави публиком: погледајте "Тиме Магазине заиста воли момке" (хттп://ввв.цровдфловер.цом/блог/тиме-магазине-цовер-дата) .

  4. [ Веома тешко , захтева кодирање , прикупљање података ] На основу претходног питања, сада извршите анализу за свих осам региона.

    1. Које разлике сте пронашли у регионима?
    2. Колико додатног времена и новца је потребно за повећање ваше анализе у свих осам региона?
    3. Замислите да Економиста има сваке недеље 100 различитих наслова. Процените колико ће вам времена и новца трајати да бисте повећали своју анализу на 100 покривања недељно.
  5. [ тешко , захтева кодирање ] Постоји неколико веб локација које хостују пројекте отвореног позива, као што је Каггле. Учествујте у једном од тих пројеката и опишите шта сте научили о том конкретном пројекту ио отвореним позивима уопште.

  6. [ средња ] Погледајте недавно издање часописа у вашој области. Да ли постоје неки документи који су могли бити преформулисани као пројекти отвореног позива? Зашто или зашто не?

  7. [ лако ] Purdam (2014) описује дистрибуирану колекцију података о просјачењу у Лондону. Резимирајте снаге и слабости овог истраживања.

  8. [ средња ] Редунданција је важан начин за процјену квалитета прикупљања дистрибуираних података. Windt and Humphreys (2016) развили и тестирали систем за прикупљање извештаја о конфликтним догађајима од људи у Источном Конгу. Прочитај папир.

    1. Како њихов дизајн осигурава редундантност?
    2. Они су понудили неколико приступа за валидацију података прикупљених из свог пројекта. Сумирајте их. Што вам је највише уверљиво?
    3. Предложите нови начин да се подаци могу валидирати. Предлози треба да покушају да повећају поверење које бисте имали у податке на начин који је исплатив и етички.
  9. [ средња ] Карим Лакхани и колеге (2013) су отворили позив за тражење нових алгоритама за решавање проблема у рачунској биологији. Добили су више од 600 поднесака који садрже 89 нових рачунских приступа. Од поднесака, 30 су превазилазиле перформансе америчког МегаБЛАСТ-а Националних института за здравље, а најбоља поднеска постигла је и већу тачност и брзину (1.000 пута брже).

    1. Прочитајте њихов рад, а затим предложите проблем социјалног истраживања који би могао користити исту врсту отвореног такмичења. Конкретно, овакав отворени конкурс је фокусиран на убрзавање и побољшање перформанси постојећег алгоритма. Ако не можете да замислите овакав проблем у вашем пољу, покушајте да објасните зашто не.
  10. [ средња , моје омиљено ] Многи пројекти из области људских рачунара се ослањају на учеснике из Амазон Мецханицал Турк. Пријавите се да постанете радник на Амазонском механичком Турку. Проведите један сат тамо. Како то утиче на ваше мисли о дизајну, квалитету и етици људских пројеката рачунања?