aktiviteter

Nøkkel:

  • Vanskelighetsgrad: lett lett , medium medium , hard hard , veldig vanskelig veldig vanskelig
  • krever matematikk ( krever matte )
  • krever koding ( krever koding )
  • datainnsamling ( datainnsamling )
  1. [ veldig vanskelig , krever koding , datainnsamling ] En av de mest spennende krav fra Benoit et al. (2015) på mengden-koding av politiske manifester er at resultatene er reproduserbare. Merz, Regel, and Lewandowski (2016) gir tilgang til manifestet Corpus. Prøv å reprodusere figur 2 fra Benoit et al. (2015) ved bruk av arbeidskraft fra Amazon Mechanical Turk. Hvor like var resultatene dine?

  2. [ medium ] I InfluenzaNet prosjektet frivillig panel av mennesker rapporterer forekomst, utbredelse og helse søkende atferd knyttet til influensa-lignende-sykdom (ILS) (Tilston et al. 2010; Noort et al. 2015) .

    1. Sammenligne og kontrast design, kostnader, og sannsynligvis feil i InfluenzaNet, Google Flu Trends, og tradisjonelle influensa sporingssystemer.
    2. Vurder en urolig tid, for eksempel svineinfluensautbrudd. Beskriv mulige feil i hvert system.
  3. [ hard , krever koding , datainnsamling ] The Economist er et ukentlig nyhetsmagasin. Lag en menneskelig beregning prosjekt for å se om forholdet mellom kvinner og menn på forsiden har økt over tid.

    1. Magasinet kan ha ulike deksler i åtte ulike regioner (Afrika, Asia Pacific, Europa, EU, ​​Latin-Amerika, Midtøsten, Nord-Amerika, og Storbritannia), og de ​​kan alle lastes ned fra hjemmesiden til The Economist . Velg ett av disse regionene og utføre analysen. Sørg for å beskrive prosedyrer med nok detaljer at de kunne bli kopiert av noen andre.

    Dette spørsmålet ble inspirert av et lignende prosjekt med Justin Tenuto, en data forsker ved crowdsourcing selskapet CrowdFlower , se "Time Magazine virkelig liker Dudes" .

  4. [ veldig vanskelig , krever koding , datainnsamling ] Bygge på spørsmålet ovenfor, nå utføre analysen for alle åtte regioner.

    1. Hvilke forskjeller fant du på tvers av regioner?
    2. Hvor mye ekstra tid og penger tok det å skalere opp analysen til alle åtte av regionene?
    3. Tenk deg at Economist har 100 forskjellige deksler hver uke. Anslå hvor mye ekstra tid og penger vil det ta å skalere opp analysen til 100 deksler per uke.
  5. [ hard , krever koding ] [Kaggle] (https://www.kaggle.com/) er et nettsted som er vert for åpen samtale prosjekter. Delta i en av disse prosjektene.

  6. [ medium ] Se gjennom en fersk utgave av et tidsskrift på ditt felt. Er det noen papirer som kunne ha blitt reformulert som åpne samtale prosjekter? Hvorfor eller hvorfor ikke?

  7. [ lett ] Purdam (2014) beskrev en distribuert datainnsamling om tigging i London. Oppsummer styrker og svakheter ved denne forskningsdesign.

  8. [ medium ] Redundans er en viktig måte å vurdere kvaliteten på distribuerte datainnsamlingen. Windt and Humphreys (2016) utvikle og teste et system for å samle inn rapporter om konflikt hendelser fra folk i Øst-Kongo. Les avisen.

    1. Hvordan deres design sikre redundans?
    2. De tilbyr flere metoder for å validere dataene som samles inn fra deres prosjekt. Oppsummer dem. Som var mest overbevisende for deg?
    3. Foreslå en ny måte at dataene kan valideres. Forslag bør prøve å øke tilliten til at du ville ha i dataene på en måte som er kostnadseffektiv og etisk.
  9. [ medium ] Karim Lakhani og kolleger (2013) skapte en åpen samtale å oppfordre nye algoritmer for å løse et problem i beregningsorientert biologi. De fikk mer enn 600 påmeldinger inneholder 89 nye beregnings tilnærminger. Av de innleveringer, fikk de 30 som overgikk resultatene av det amerikanske National Institutes of Health MegaBLAST, og den beste innsending oppnådd både større nøyaktighet og hastighet (1000 ganger raskere).

    1. Les deres papir, og deretter foreslå et samfunnsforskning problem som kunne bruke den samme typen åpen konkurranse. Spesielt er denne typen åpen konkurranse fokusert på å påskynde og å forbedre ytelsen av en eksisterende algoritme. Hvis du ikke kan tenke på problem som dette i feltet ditt, kan du prøve å forklare hvorfor ikke.
  10. [ medium ] Mange menneskelige beregnings prosjekter er avhengige av deltakere fra Amazon Mechanical Turk. Registrer deg for å bli en arbeidstaker på Amazon Mechanical Turk. Tilbring en time arbeider der. Hvordan påvirker dette dine tanker om design, kvalitet og etikk på menneske compuation prosjekter?