aktiviteter

  • vanskelighetsgrad: lett lett , medium medium , hardt hard , veldig vanskelig veldig vanskelig
  • krever matte ( krever matte )
  • krever koding ( krever koding )
  • datainnsamling ( datainnsamling )
  • mine favoritter ( favoritten min )
  1. [ veldig vanskelig , krever koding , datainnsamling , favoritten min ] En av de mest spennende påstandene fra Benoit og kollegers (2016) forskning om mengdekoding av politiske manifester er at resultatene er reproduserbare. Merz, Regel, and Lewandowski (2016) gir tilgang til Manifesto Corpus. Prøv å reprodusere figur 2 fra Benoit et al. (2016) ved hjelp av arbeidstakere fra Amazon Mechanical Turk. Hvordan likte dine resultater?

  2. [ medium ] I InfluenzaNet-prosjektet rapporterer et frivillig panel av personer til forekomsten, utbredelsen og helsevesenet atferd relatert til influensalignende sykdom (Tilston et al. 2010; Noort et al. 2015) .

    1. Sammenlign og kontrast design, kostnader og sannsynlige feil i InfluenzaNet, Google Flu Trends, og tradisjonelle influensasporing systemer.
    2. Tenk på en ubestemt tid, for eksempel et utbrudd av en ny form for influensa. Beskriv mulige feil i hvert system.
  3. [ hard , krever koding , datainnsamling ] The Economist er et ukentlig nyhetsmagasin. Lag et menneskelig beregningsprosjekt for å se om forholdet mellom kvinner og menn på forsiden har endret seg over tid.

    1. Magasinet kan ha forskjellige deksler i åtte forskjellige regioner (Afrika, Asia Pacific, Europa, EU, Latin-Amerika, Midtøsten, Nord-Amerika og Storbritannia) og de kan alle lastes ned fra magasinets nettsted. Velg en av disse regionene og utfør analysen. Sørg for å beskrive prosedyrene dine med nok detalj at de kunne kopieres av noen andre.

    Dette spørsmålet ble inspirert av et lignende prosjekt av Justin Tenuto, dataforsker ved crowdsourcing-firmaet CrowdFlower: se "Time Magazine Really Like Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ veldig vanskelig , krever koding , datainnsamling ] Bygg på det forrige spørsmålet, utfør nå analysen for alle åtte regioner.

    1. Hvilke forskjeller fant du på tvers av regioner?
    2. Hvor mye ekstra tid og penger tok det for å øke analysen til alle åtte av regionene?
    3. Tenk deg at Economist har 100 forskjellige deksler hver uke. Anslå hvor mye ekstra tid og penger det ville ta for å øke analysen til 100 dekker per uke.
  5. [ hard , krever koding ] Det er flere nettsteder som er vert for åpne anropsprosjekter, for eksempel Kaggle. Delta i et av prosjektene, og beskriv hva du lærer om det aktuelle prosjektet og om åpne samtaler generelt.

  6. [ medium ] Se gjennom et nylig utgave av en journal i ditt felt. Er det noen papirer som kunne blitt omformulert som åpne samtaleprosjekter? Hvorfor eller hvorfor ikke?

  7. [ lett ] Purdam (2014) beskriver en distribuert datainnsamling om tigging i London. Oppsummer styrken og svakhetene i denne forskningsdesignen.

  8. [ medium ] Redundans er en viktig måte å vurdere kvaliteten på distribuert datainnsamling. Windt and Humphreys (2016) utviklet og testet et system for å samle rapporter om konflikthendelser fra mennesker i Øst-Kongo. Les avisen.

    1. Hvordan sikrer designen deres overflod?
    2. De tilbød flere tilnærminger til å validere dataene som ble samlet inn fra prosjektet. Oppsummer dem. Hvilken var overbevisende for deg?
    3. Foreslå en ny måte at dataene kunne bli validert. Forslag bør forsøke å øke tilliten som du vil ha i dataene på en måte som er kostnadseffektiv og etisk.
  9. [ medium ] Karim Lakhani og kolleger (2013) opprettet et åpent anrop for å søke nye algoritmer for å løse et problem i beregningsbiologi. De mottok mer enn 600 innleveringer som inneholder 89 nye beregningsmetoder. Av innsendingene overgikk 30 ytelsen til US National Institutes of Health's MegaBLAST, og den beste innsatsen oppnådde både større nøyaktighet og hastighet (1000 ganger raskere).

    1. Les deres papir, og så foreslå et sosialt forskningsproblem som kan bruke samme type åpen konkurranse. Spesielt er denne typen åpen konkurranse fokusert på å øke og forbedre ytelsen til en eksisterende algoritme. Hvis du ikke kan tenke på et slikt problem i ditt felt, kan du prøve å forklare hvorfor ikke.
  10. [ medium , favoritten min ] Mange menneskelige beregningsprosjekter er avhengige av deltakere fra Amazon Mechanical Turk. Registrer deg for å bli en arbeider på Amazon Mechanical Turk. Tilbring en time på jobb der. Hvordan påvirker dette dine tanker om design, kvalitet og etikk i menneskelige beregningsprosjekter?