darbības

  • grūtības pakāpe: viegli viegli , vidēja vidēja , grūti grūti , ļoti grūti ļoti grūti
  • prasa math ( prasa matemātiku )
  • nepieciešama kodēšana ( nepieciešama kodēšana )
  • datu vākšana ( datu vākšana )
  • mani mīļākie ( Mans mīļākais )
  1. [ ļoti grūti , nepieciešama kodēšana , datu vākšana , Mans mīļākais ] Viena no aizraujošākajām Benoita un kolēģu (2016) pētījumiem par politisko manifestu pūļa kodēšanu ir tas, ka rezultāti ir reproducējami. Merz, Regel, and Lewandowski (2016) nodrošina piekļuvi Manifesta korpusam. Mēģiniet reproducēt 2. attēlu no Benoit et al. (2016) izmantojot darbiniekus no Amazon Mechanical Turk. Cik līdzīgi bija jūsu rezultāti?

  2. [ vidēja ] InfluenzaNet projektā brīvprātīgo cilvēku grupa ziņo par saslimstību, izplatību un ar veselību saistītu uzvedību, kas saistīta ar gripai līdzīgu slimību (Tilston et al. 2010; Noort et al. 2015) .

    1. Salīdziniet un salīdziniet InfluenzaNet, Google Flu Trends un tradicionālās gripas izsekošanas sistēmas dizainu, izmaksas un iespējamās kļūdas.
    2. Apsveriet nenoteiktu laiku, piemēram, jauna veida gripas uzliesmojumu. Aprakstiet iespējamās kļūdas katrā sistēmā.
  3. [ grūti , nepieciešama kodēšana , datu vākšana ] The Economist ir iknedēļas ziņu žurnāls. Izveidojiet cilvēku aprēķinu projektu, lai noskaidrotu, vai laika gaitā sieviešu un vīriešu attiecība uz vāka ir mainījusies.

    1. Žurnālam var būt dažādi vāki astoņos dažādos reģionos (Āfrikā, Āzijas un Klusā okeāna reģionā, Eiropā, Eiropas Savienībā, Latīņamerikā, Tuvajos Austrumos, Ziemeļamerikā un Apvienotajā Karalistē), un tos var lejupielādēt no žurnāla tīmekļa vietnes. Izvēlieties vienu no šiem reģioniem un veiciet analīzi. Noteikti aprakstiet savas procedūras ar pietiekami detalizētu informāciju, lai tās varētu atkārtot kāds cits.

    Šo jautājumu iedvesmojis līdzīgs projekts, ko veica kratīšanas uzņēmuma CrowdFlower datu zinējs Justin Tenuto, skatīt: "Time Magazine patiešām patīk mazuļi" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ ļoti grūti , nepieciešama kodēšana , datu vākšana ] Pamatojoties uz iepriekšējo jautājumu, tagad veic visu astoņu reģionu analīzi.

    1. Kādas atšķirības Jūs atradāt dažādos reģionos?
    2. Cik daudz laika un naudas jums vajadzēja, lai palielinātu savu analīzi visiem astoņiem reģioniem?
    3. Iedomājieties, ka Economist katru nedēļu ir 100 dažādi. Novērtējiet, cik daudz laika un naudas jums vajadzētu, lai jūsu analīzi palielinātu līdz 100 segumiem nedēļā.
  5. [ grūti , nepieciešama kodēšana ] Ir vairākas vietnes, kurās tiek rīkoti atklāto zvanu projekti, piemēram, Kaggle. Piedalieties vienā no šiem projektiem un aprakstiet, ko jūs uzzināt par konkrēto projektu un par atklātajiem konkursiem kopumā.

  6. [ vidēja ] Izpētiet neseno žurnāla numuru savā jomā. Vai ir kādi dokumenti, kurus varētu pārveidot par atklātu konkursu projektiem? Kāpēc vai kāpēc ne?

  7. [ viegli ] Purdam (2014) apraksta izplatītu datu vākšanu par ubagošanu Londonā. Apkopojiet šī pētījuma dizaina stiprās un vājās puses.

  8. [ vidēja ] Redundancy ir svarīgs veids, kā novērtēt izplatīto datu vākšanas kvalitāti. Windt and Humphreys (2016) izstrādāja un pārbaudīja sistēmu, lai savāktu ziņojumus par konflikta notikumiem no Kongo Austrumu iedzīvotājiem. Lasīt papīru.

    1. Kā to dizains nodrošina atlaišanu?
    2. Viņi piedāvāja vairākas pieejas, lai apstiprinātu datus, kas savākti no viņu projekta. Apkopot tos. Kas tev bija visvairāk pārliecinošs?
    3. Ierosināt jaunu veidu, kā datus varētu validēt. Ieteikumos jums jācenšas palielināt uzticību datiem, kas jums būtu rentabli un ētiski.
  9. [ vidēja ] Karim Lakhani un kolēģi (2013) izveidoja atklātu konkursu, lai meklētu jaunus algoritmus problēmas risināšanai skaitļošanas bioloģijā. Viņi saņēma vairāk nekā 600 iesniegumu, kuros bija 89 jauni skaitļošanas risinājumi. No iesniegumiem 30 pārsniedza ASV Nacionālo Veselības Institūtu MegaBLAST sniegumu, un vislabākais iesniegums bija gan lielāka precizitāte, gan ātrums (1000 reizes ātrāk).

    1. Lasiet viņu dokumentu un pēc tam ierosiniet sociālās pētniecības problēmu, kas varētu izmantot tādu pašu atklātu konkursu. Jo īpaši šāda veida atklāta konkursa mērķis ir paātrināt un uzlabot esošā algoritma veiktspēju. Ja jūs nevarat domāt par problēmu, kāda ir šajā jomā, mēģiniet paskaidrot, kāpēc nedarīt.
  10. [ vidēja , Mans mīļākais ] Daudzi cilvēku aprēķinu projekti balstās uz dalībniekiem no Amazon Mechanical Turk. Pierakstieties, lai kļūtu par strādnieku Amazon Mechanical Turk. Turpiniet stundu. Kā tas ietekmē jūsu domas par cilvēka aprēķinu projektu dizainu, kvalitāti un ētiku?