faaliyetler

  • zorluk derecesi: kolay kolay orta orta , zor zor , çok zor çok zor
  • matematik gerektirir matematik gerektirir )
  • kodlama gerektirir kodlama gerektirir )
  • veri koleksiyonu ( veri koleksiyonu )
  • Favorilerim ( benim favorim )
  1. [ çok zor , kodlama gerektirir , veri koleksiyonu , benim favorim Benoit ve meslektaşlarının (2016) siyasi manifestoların kalabalık kodlaması üzerine yaptığı araştırmalardan en heyecanlı iddialardan biri sonuçların tekrarlanabilir olmasıdır. Merz, Regel, and Lewandowski (2016) Manifesto Corpus'a erişim sağlar. Benoit et al. (2016) Amazon Mechanical Turk'den çalışanlar kullanıyor. Sonuçlarınız ne kadardı?

  2. [ orta ] InfluenzaNet projesinde gönüllü bir insan paneli, grip benzeri hastalıkla ilgili insidans, prevalans ve sağlık arama davranışlarını bildirmektedir (Tilston et al. 2010; Noort et al. 2015) .

    1. InfluenzaNet, Google Grip Trendleri ve geleneksel grip izleme sistemlerinde tasarımı, maliyetleri ve olası hataları karşılaştırın ve karşılaştırın.
    2. Yeni bir grip formunun salgını gibi rahatsız edilmeyen bir zaman düşünün. Her sistemdeki olası hataları tanımlayın.
  3. [ zor , kodlama gerektirir , veri koleksiyonu ] Economist haftalık bir haber dergisi. Kadınların kaptaki kadınlara oranının zamanla değişip değişmediğini görmek için bir insan hesaplama projesi oluşturun.

    1. Derginin sekiz farklı bölgede (Afrika, Asya Pasifik, Avrupa, Avrupa Birliği, Latin Amerika, Orta Doğu, Kuzey Amerika ve Birleşik Krallık) farklı kapakları olabilir ve bunların hepsi derginin web sitesinden indirilebilir. Bu bölgelerden birini seçin ve analizi yapın. Prosedürlerinizi, bir başkası tarafından çoğaltılabilecekleri kadar ayrıntılı olarak açıkladığınızdan emin olun.

    Bu soru, crowdsourcing şirketi CrowdFlower'da bir veri bilimcisi olan Justin Tenuto tarafından yapılan benzer bir projeden esinlenilmiştir: “Time Magazine, Dudes'i Gerçekten Beğeniyor” (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ çok zor , kodlama gerektirir , veri koleksiyonu ] Önceki soru üzerine bina, şimdi tüm sekiz bölge için analiz gerçekleştirin.

    1. Bölgeler arasında hangi farklılıkları buldunuz?
    2. Analizinizi bölgelerin sekizine çıkarmak için ne kadar zaman ve para harcadı?
    3. Economist'in her hafta 100 farklı kapak olduğunu hayal edin. Analizinizi haftada 100 kapak olacak şekilde büyütmek için ne kadar zaman ve para harcayacağınızı tahmin edin.
  5. [ zor , kodlama gerektirir ] Kaggle gibi açık çağrı projelerini barındıran çeşitli web siteleri var. Bu projelerden birine katılın ve o projeyle ilgili ne öğrendiğinizi ve genel olarak açık çağrılar hakkında bilgi verin.

  6. [ orta ] Alanınızda bir derginin son sayısında inceleyin. Açık çağrı projeleri olarak yeniden formüle edilmiş olabilecek herhangi bir makale var mı? Neden ya da neden olmasın?

  7. [ kolay ] Purdam (2014) Londra'da dilencilikle ilgili dağıtılmış veri koleksiyonunu açıklamaktadır. Bu araştırma tasarımının güçlü ve zayıf yönlerini özetler.

  8. [ orta ] Fazlalık dağıtılmış veri toplamanın kalitesini değerlendirmek için önemli bir yoldur. Windt and Humphreys (2016) , Doğu Kongo'daki insanlardan çatışma olayları raporlarını toplamak için bir sistem geliştirdi ve test etti. Kağıdı oku.

    1. Tasarımları artıklığı nasıl sağlıyor?
    2. Projelerinden topladıkları verileri doğrulamak için çeşitli yaklaşımlar sundular. Onları özetler. Hangisi size en çok inandırıcı oldu?
    3. Verilerin doğrulanabileceği yeni bir yol önerin. Öneriler, verilerde sahip olabileceğiniz güveni, uygun maliyetli ve etik bir şekilde artırmaya çalışmalıdır.
  9. [ orta ] Karim Lakhani ve meslektaşları (2013) , hesaplamalı biyolojide bir problemi çözmek için yeni algoritmalar istemek için açık bir çağrı başlattılar. 89 yeni hesaplama yaklaşımı içeren 600'den fazla başvuru aldı. Gönderimlerin 30'u ABD Ulusal Sağlık Enstitüleri'nin MegaBLAST'in performansını aştı ve en iyi teslimiyet hem daha yüksek doğruluk ve hız kazandı (1000 kat daha hızlı).

    1. Makalelerini okuyun ve daha sonra aynı tür açık yarışı kullanabilecek bir sosyal araştırma problemi önerin. Özellikle, bu tür bir açık yarışma, mevcut bir algoritmanın performansını hızlandırmak ve geliştirmek üzerine odaklanmıştır. Eğer sizin alanınızda böyle bir problem düşünemiyorsanız neden olmasın diye açıklamaya çalışın.
  10. [ orta , benim favorim ] Birçok insan hesaplama projesi, Amazon Mechanical Turk'den katılımcılara güveniyor. Amazon Mechanical Turk'te çalışan olmak için kayıt olun. Orada bir saat çalış. Bu, insan hesaplama projelerinin tasarımı, kalitesi ve etiği hakkındaki düşüncelerinizi nasıl etkiler?