kagiatan

Key:

  • darajat kasulitan: gampang gampil , sedeng sedeng , teuas teuas Pisan teuas pisan teuas
  • merlukeun math ( merlukeun math )
  • merlukeun coding ( merlukeun coding )
  • kumpulan data ( kumpulan data )
  1. [ pisan teuas , merlukeun coding , kumpulan data ] Salah sahiji klaim paling seru ti Benoit et al. (2015) dina riungan-coding of manifestos pulitik nu hasilna bisa diulang. Merz, Regel, and Lewandowski (2016) nyadiakeun aksés ka Manifesto Corpus. Coba baranahan Gbr 2 ti Benoit et al. (2015) maké pagawe ti Amazon Mechanical Turk. Kumaha sarupa éta hasil anjeun?

  2. [ sedeng ] Dina proyék InfluenzaNet a panel volunteer jalma ngalaporkeun incidence, Prévalénsi, jeung kaséhatan néangan paripolah patali influenza kawas-gering (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Bandingkeun jeung kontras desain, waragad, sarta kasalahan dipikaresep di InfluenzaNet, Google Flu Tren, sarta sistim tracking influenza tradisional.
    2. Pertimbangkeun hiji waktu unsettled, saperti wabah flu babi. Ngagambarkeun kasalahan mungkin dina unggal sistim.
  3. [ teuas , merlukeun coding , kumpulan data ] Nu ékonom nyaeta majalah warta mingguan. Nyieun proyék ngitung manusa lamun ningali babandingan awewe ka lalaki dina panutup geus ngaronjat kana waktu.

    1. Majalah bisa boga nyertakeun beda dina dalapan wewengkon beda (Afrika, Asia Pasifik, Eropa, Uni Éropa, Amérika Latin, Wétan Tengah, Amérika Kalér, jeung Britania Raya) jeung maranéhanana bisa sadaya diundeur ti website tina ékonom The . Nyokot salah sahiji wewengkon ieu jeung ngalakukeun analisis. Pastikeun pikeun ngagambarkeun prosedur Anjeun sareng cukup jéntré yén maranéhanana bisa replicated ku batur nu sejenna.

    Patarosan ieu diideuan ku proyék sarupa ku Justin Tenuto, hiji élmuwan data di pausahaan crowdsourcing CrowdFlower , tempo "Magazine Time Emang diaku Dudes" .

  4. [ pisan teuas , merlukeun coding , kumpulan data ] Wangunan di Patarosan di luhur, ayeuna ngalakukeun analisis pikeun sakabéh dalapan wewengkon.

    1. Bedana naon anjeun manggih sakuliah wewengkon?
    2. Sabaraha tambahan waktu jeung duit teu eta nyokot ka analisis Anjeun ka sadaya dalapan wewengkon skala-up?
    3. Bayangkeun nu ékonom ngabogaan 100 nyertakeun beda minggu unggal. Estimasi sabaraha tambahan waktu jeung duit eta bakal nyokot ka skala-up analisis Anjeun ka 100 nyertakeun per minggu.
  5. [ teuas , merlukeun coding ] [Kaggle] (https://www.kaggle.com/) nyaéta hiji website nu sarwa proyék telepon kabuka. Ilubiung dina salah sahiji proyék maranéhanana.

  6. [ sedeng ] Tingali ngaliwatan isu anyar tina jurnal dina widang Anjeun. Dupi aya tulak anu bisa geus reformulated salaku proyék telepon kabuka? Naha atawa naha teu?

  7. [ gampil ] Purdam (2014) ditétélakeun kumpulan data sebaran ngeunaan begging di London. Nyimpulkeun kaunggulan jeung kelemahan desain ieu panalungtikan.

  8. [ sedeng ] Redundancy teh mangrupakeun cara nu penting pikeun assess kualitas kumpulan data sebaran. Windt and Humphreys (2016) ngamekarkeun jeung nguji sistim pikeun ngumpulkeun laporan kajadian konflik ti jalma di Wétan Kongo. Baca kertas.

    1. Kumaha carana sangkan desain maranéhanana mastikeun redundancy?
    2. Maranéhanana nawarkeun sababaraha deukeut ka sangkan méré konfirmasi data dikumpulkeun ti proyék maranéhanana. Nyimpulkeun eta. Nu ieu paling ngayakinkeun ka anjeun?
    3. Ngajukeun jalan anyar nu data bisa disahkeun. Bongbolongan kudu nyoba ngaronjatkeun kapercayaan nu bakal anjeun kudu di data ku cara nu biaya-éféktif jeung etika.
  9. [ sedeng ] Karim Lakhani sareng kolega (2013) dijieun telepon kabuka ka solicit algoritma anyar pikeun ngajawab masalah dina biologi komputer. Maranéhanana nampa leuwih ti 600 kiriman ngandung 89 deukeut komputer novel. Tina kiriman, maranéhanana narima 30 nu ngaleuwihan kinerja Nasional Institutes US Kaséhatan sacara MegaBLAST, sarta kaluman pangalusna kahontal boh akurasi leuwih gede jeung laju (1.000 kali leuwih gancang).

    1. Baca kertas maranéhanana, terus ngajukeun masalah panalungtikan sosial anu bisa maké nanaon sarua kontes muka. Dina sababaraha hal, jenis ieu kontes kabuka ieu fokus kana ngebut luhur jeung ningkatkeun kinerja hiji algoritma nu geus aya. Lamun anjeun teu bisa mikir masalah saperti ieu di widang Anjeun, coba terangkeun naha teu.
  10. [ sedeng ] Loba proyék ngitung manusa ngandelkeun pamilon ti Amazon Mechanical Turk. Asup-up ka jadi worker dina Amazon Mechanical Turk. Méakkeun hiji jam gawe aya. Kumaha teu dampak ieu pikiran anjeun ngeunaan desain, kualitas, sarta étika proyék compuation manusa?