Aktiviteter

Nøgle:

  • sværhedsgrad: let let , medium medium , hårdt hårdt , meget hård meget hård
  • kræver matematik ( kræver matematik )
  • kræver kodning ( kræver kodning )
  • dataindsamling ( dataindsamling )
  1. [ meget hård , kræver kodning , dataindsamling ] En af de mest spændende krav fra Benoit et al. (2015) på crowd-kodning af politiske manifester er, at resultaterne er reproducerbare. Merz, Regel, and Lewandowski (2016) giver adgang til manifestet Corpus. Prøve at genskabe figur 2 fra Benoit et al. (2015) ved hjælp af arbejdstagere fra Amazon Mechanical Turk. Hvor lignende var dine resultater?

  2. [ medium ] I InfluenzaNet projektet en frivillig panel af folk rapporterer incidens, prævalens og sundhed søger adfærd relateret til influenza-lignende-sygdom (ILS) (Tilston et al. 2010; Noort et al. 2015) .

    1. Sammenligne og kontrast design, omkostninger, og sandsynlige fejl i InfluenzaNet, Google Flu Trends, og traditionelle influenza sporingssystemer.
    2. Overvej en urolig tid, såsom svineinfluenza udbrud. Beskriv de mulige fejl i hvert system.
  3. [ hårdt , kræver kodning , dataindsamling ] The Economist er en ugentlig nyhedsmagasin. Opret en menneskelig beregning projekt at se, om forholdet mellem kvinder til mænd på omslaget er steget over tid.

    1. Magasinet kan have forskellige covers i otte forskellige regioner (Afrika, Asien og Stillehavsområdet, Europa, EU, ​​Latinamerika, Mellemøsten, Nordamerika, og Det Forenede Kongerige), og de ​​kan alle downloades fra hjemmesiden af The Economist . Vælg en af ​​disse regioner og udføre analysen. Vær sikker på at beskrive dine procedurer med detaljer nok, at de kunne gentages af andre.

    Dette spørgsmål var inspireret af et lignende projekt af Justin Tenuto, et data forsker ved crowdsourcing selskab CrowdFlower , se "Time Magazine virkelig kan lide Dudes" .

  4. [ meget hård , kræver kodning , dataindsamling ] Med udgangspunkt i ovenstående spørgsmål, nu udføre analysen for alle otte regioner.

    1. Hvilke forskelle fandt du på tværs af regioner?
    2. Hvor meget ekstra tid og penge tog det at skalere op din analyse til alle otte af regionerne?
    3. Forestil dig, at Economist har 100 forskellige covers hver uge. Anslå, hvor meget ekstra tid og penge ville det tage at skalere op din analyse til 100 covers ugen.
  5. [ hårdt , kræver kodning ] [Kaggle] (https://www.kaggle.com/) er en hjemmeside, der er vært Åben indkaldelse projekter. Deltag i et af disse projekter.

  6. [ medium ] Kig gennem et nyligt nummer af et tidsskrift på dit område. Er der nogen papirer, der kunne have været omformuleret som åbne opkald projekter? Hvorfor eller hvorfor ikke?

  7. [ let ] Purdam (2014) beskrev en distribueret dataopsamling om tiggeri i London. Sammenfatte styrker og svagheder i denne forskning design.

  8. [ medium ] Redundans er en vigtig måde at vurdere kvaliteten af distribuerede dataindsamling. Windt and Humphreys (2016) udvikle og afprøve et system til indsamling rapporter om konflikt begivenheder fra folk i det østlige Congo. Læse avisen.

    1. Hvordan deres design sikrer redundans?
    2. De tilbyder flere metoder til at validere de indsamlede data fra deres projekt. Opsummer dem. Hvilket var mest overbevisende for dig?
    3. Foreslå en ny måde, at data kan valideres. Forslag skal forsøge at øge den tillid, du ville have i data på en måde, der er omkostningseffektiv og etisk.
  9. [ medium ] Karim Lakhani og kolleger (2013) skabte en åben opfordring til at hverve nye algoritmer til at løse et problem i datamatisk biologi. De modtog mere end 600 indlæg, der indeholder 89 nye beregningsmæssige tilgange. Af de indlæg, de har modtaget 30, som oversteg udførelsen af ​​det amerikanske National Institutes of Healths MegaBLAST, og den bedste indsendelse opnået både større nøjagtighed og hastighed (1.000 gange hurtigere).

    1. Læs deres papir, og derefter foreslå en social forskning problem, der kunne bruge den samme slags åben konkurrence. Især er denne form for åben konkurrence fokuseret om fremskyndelse og forbedring af en eksisterende algoritme. Hvis du ikke kan tænke på problemet som denne i dit område, så prøv at forklare, hvorfor ikke.
  10. [ medium ] Mange menneskelige beregnings-projekter er afhængige af deltagere fra Amazon Mechanical Turk. Tilmeld dig til at blive en arbejdstager på Amazon Mechanical Turk. Tilbringe en timers arbejdsuge der. Hvordan denne effekt dine tanker om design, kvalitet og etik af humane compuation projekter?