активности

клуч:

  • степен на тежина: лесни лесно , средни среден , тешко тешко , многу тешко многу тешко
  • бара математика ( бара математика )
  • бара кодирање ( бара кодирање )
  • собирање на податоци ( собирање на податоци )
  1. [ многу тешко , бара кодирање , собирање на податоци ] Еден од највозбудливите побарувања од Benoit et al. (2015) на публиката кодирање на политички манифести, е дека резултатите се умножуваат. Merz, Regel, and Lewandowski (2016) обезбедува пристап до Манифестот Корпус. Обидете се да се репродуцира Слика 2 од Benoit et al. (2015) со користење на работници од Амазон Машински Турк. Колку е слична беа вашите резултати?

  2. [ среден ] Во проектот InfluenzaNet волонтер панел од луѓе известуваат за појавата, ширењето и здравје бараат однесување во врска со грип-како-болест (ИЛИ) (Tilston et al. 2010; Noort et al. 2015) .

    1. Споредете и контрастот на дизајнот, трошоци, и, најверојатно, грешки во InfluenzaNet, Google грип тренд, и традиционалните системи за следење на грип.
    2. Се сметаат за неплатени време, како што појава на свински грип. Опишете ја можни грешки во секој систем.
  3. [ тешко , бара кодирање , собирање на податоци ] Економист е неделен магазин. Се создаде проект човечки пресметка да се види дали односот на жените со мажите на насловната страница се зголеми со текот на времето.

    1. Списанието може да има различни корици во осум различни области (Африка, Азија, Европа, Европската унија, Латинска Америка, Блискиот Исток, Северна Америка и Велика Британија) и сите тие може да се симне од веб-сајтот на Економист . Изберете еден од овие региони и вршење на анализа. Бидете сигурни дека за да се опише вашите постапки со доволно детали што тие може да се повтори од страна на некој друг.

    Ова прашање е инспирирана од сличен проект на Џастин Tenuto, научник податоци на crowdsourcing компанија CrowdFlower , видете "Време списание навистина сака Еј" .

  4. [ многу тешко , бара кодирање , собирање на податоци ] Градење на прашањето погоре, сега вршат анализа за сите осум региони.

    1. Што разлики не ќе се најде во регионите?
    2. Колку повеќе време и пари не е потребно да скала-up на вашите анализа за сите осум региони?
    3. Замислете дека економист од 100 различни покрива секоја недела. Процени колку дополнителни пари и време е потребно за да скала-up на вашата анализа на 100 корици неделно.
  5. [ тешко , бара кодирање ] [Kaggle] (https://www.kaggle.com/) е веб-сајт кој е домаќин на проекти со отворен повик. Учествуваат во една од овие проекти.

  6. [ среден ] Поглед низ неодамнешното издание на списанието во својата област. Дали има некои документи кои би можеле да се преформулира како проекти со отворен повик? Зошто да или зошто не?

  7. [ лесно ] Purdam (2014) го опишува дистрибуирани собирање на податоци за просење во Лондон. Утврди ги предностите и слабостите на овој истражувачки проект.

  8. [ среден ] Инфраструктура е важен начин да се оцени квалитетот на дистрибуирани собирање на податоци. Windt and Humphreys (2016) развивање и тестирање на системот за собирање на извештаите на конфликтот настани од луѓето во источниот дел на Конго. Читање на хартија.

    1. Како го прави нивниот дизајн обезбеди вишок?
    2. Тие нудат неколку пристапи за да се провери собрани од нивниот проект податоци. ги резимираме. Кој беше најубедлив за вас?
    3. Предложи нов начин на кој податоците може да биде потврдена. Предлозите треба да се обидат да се зголеми довербата, кои ќе треба во податоците на начин кој е ефективен и етички.
  9. [ среден ] Карим Lakhani и колеги (2013) создаде отворен повик да ги дели нови алгоритми за да реши еден проблем во компјутерската биологија. Тие добија повеќе од 600 поднесоци содржи 89 нови пресметковни методи. На поднесоци, тие добија 30, кој ги надмина перформансите на американскиот Национален институт за MegaBLAST здравство, а најдобар поднесување постигнува и поголема прецизност и брзина (1.000 пати побрзо).

    1. Прочитајте нивните хартија, а потоа да предложат истражувачки проблем социјална работа дека може да се користи на ист вид на отворен конкурс. Особено, овој вид на конкурс е фокусирана на забрзување и подобрување на ефикасноста на постоечкиот алгоритам. Ако не можете да мислам на проблем како овој во својата област, се обиде да објасни зошто не.
  10. [ среден ] Многу проекти за човекови пресметка потпираат на учесници од Амазон Машински Турк. Си-до стане работник на Амазон Машински Турк. Поминат еден час работат таму. Како се менува вашите размислувања во врска со дизајнот, квалитетот и етиката на проекти за човекови compuation?