aktiviteter

Nyckel:

  • Svårighetsgrad: lätt lätt , medium medium , hård hård , väldigt hårt väldigt hårt
  • kräver math ( kräver math )
  • kräver kodning ( kräver kodning )
  • datainsamling ( datainsamling )
  1. [ väldigt hårt , kräver kodning , datainsamling ] En av de mest spännande krav från Benoit et al. (2015) på publik kodning av politiska manifest är att resultaten är reproducerbara. Merz, Regel, and Lewandowski (2016) ger tillgång till Manifestet Corpus. Försök att reproducera Fig 2 från Benoit et al. (2015) med hjälp av arbetare från Amazon Mechanical Turk. Hur liknande var dina resultat?

  2. [ medium ] I InfluenzaNet projektet en volontär panel människor rapportera incidens, prevalens och hälsa söker beteende i samband med influensaliknande sjukdom (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Jämföra och kontrastera utformning, kostnader och sannolika fel i InfluenzaNet Google Flu Trends, och traditionella spårning influensa system.
    2. Överväga en orolig tid, såsom svininfluensautbrott. Beskriv eventuella fel i varje system.
  3. [ hård , kräver kodning , datainsamling ] The Economist är en vecko nyhetsmagasin. Skapa en mänsklig beräkning projekt för att se om förhållandet mellan kvinnor och män på omslaget har ökat över tiden.

    1. Magasinet kan ha olika omslag i åtta olika regioner (Afrika, Asien och Stillahavsområdet, Europa, EU, ​​Latinamerika, Mellanöstern, Nordamerika och Storbritannien) och de kan alla laddas ner från webbplatsen för The Economist . Välj en av dessa regioner och utföra analysen. Var noga med att beskriva era rutiner med tillräckligt detaljerat att de kan replikeras av någon annan.

    Denna fråga har inspirerats av ett liknande projekt av Justin Tenuto, en dataforskare vid crowdsourcing företaget CrowdFlower , se "Time Magazine gillar verkligen Dudes" .

  4. [ väldigt hårt , kräver kodning , datainsamling ] Bygga på frågan ovan, nu utföra analysen för alla åtta regioner.

    1. Vilka skillnader hittade du olika regioner?
    2. Hur mycket extra tid och pengar tog det att skala upp din analys till alla åtta av regionerna?
    3. Föreställ dig att Economist har 100 olika omslag varje vecka. Uppskatta hur mycket extra tid och pengar skulle det ta att skala upp din analys till 100 täcker per vecka.
  5. [ hård , kräver kodning ] [Kaggle] (https://www.kaggle.com/) är en webbplats som är värd öppna samtals projekt. Delta i en av dessa projekt.

  6. [ medium ] Titta igenom ett färskt nummer av en tidskrift inom ditt område. Finns det några papper som skulle ha kunnat omformulerats som öppna samtal projekt? Varför eller varför inte?

  7. [ lätt ] Purdam (2014) beskrev en distribuerad datainsamling om tiggeri i London. Samman styrkor och svagheter i denna forskningsdesign.

  8. [ medium ] Redundans är ett viktigt sätt att bedöma kvaliteten på insamling distribuerade data. Windt and Humphreys (2016) utveckla och testa ett system för att samla in rapporter om konflikt händelser från människor i östra Kongo. Läsa tidningen.

    1. Hur deras konstruktion säkerställa redundans?
    2. De erbjuder flera metoder för att validera de data som samlats in från sina projekt. Sammanfatta dem. Som var mest övertygande för dig?
    3. Föreslå ett nytt sätt att uppgifterna kan valideras. Förslag bör försöka öka säker på att du skulle ha i data på ett sätt som är kostnadseffektivt och etiskt.
  9. [ medium ] Karim Lakhani och kollegor (2013) skapade en öppen inbjudan att värva nya algoritmer för att lösa ett problem i beräkningsbiologi. De fick mer än 600 bidrag som innehåller 89 nya beräkningsmetoder. Av de inlagor, fick de 30 som överskred utförandet av amerikanska National Institutes of Health Megablast och bästa underkastelse uppnås både större noggrannhet och hastighet (1000 gånger snabbare).

    1. Läs deras papper, och sedan föreslå en samhällsforskning problem som kan använda samma typ av öppen tävling. I synnerhet är denna typ av öppen tävling fokuserar på att påskynda och förbättra prestanda för en befintlig algoritm. Om du inte kan tänka på problem som detta i ditt område, försök att förklara varför inte.
  10. [ medium ] Många mänskliga beräkningsprojekt förlitar sig på deltagare från Amazon Mechanical Turk. Registrera dig för att bli en arbetare på Amazon Mechanical Turk. Tillbringa en timme arbetar där. Hur gör detta påverka din tankar om design, kvalitet och etik mänskliga compuation projekt?