faaliyetler

anahtar:

  • Zorluk derecesi: kolay kolay orta orta , zor zor , çok zor çok zor
  • (Matematik gerektirir matematik gerektirir )
  • (Kodlama gerektirir kodlama gerektirir )
  • veri koleksiyonu ( veri koleksiyonu )
  • Favorilerim ( benim favorim )
  1. [ zor , matematik gerektirir ] Bölümde, post-tabakalaşma hakkında çok olumlu oldu. Ancak, her zaman tahminlerin kalitesini artırmak değildir. -Sonrası tabakalaşma olabilir tahminlerin kalitesini düşürebilir bir durum oluşturun. (Bir ipucu için bkz Thomsen (1973) ).

  2. [ zor , veri koleksiyonu , kodlama gerektirir ] Tasarım ve silah mülkiyeti hakkında sormak Amazon MTurk olmayan bir olasılık tetkikini ( "mı? Bir silah, tüfek sahibi, Do you, ya da evde kimse yok ya tabanca olduğunu sizin ya da evdeki başka birisi?") Ve silah kontrolü karşı tutum ( "sizce ne silah sahibi olmak ya da silah sahibi kontrol etmek için Amerikalıların hakkını korumak daha önemli-nedir?").

    1. Anket ne kadar sürer? Fiyatı ne kadar? Nasıl örnek demografik ABD nüfusunun demografik arasındaki farklar nelerdir?
    2. numunenin kullanarak silah sahipliği ham tahmini nedir?
    3. post-tabakalaşma veya başka bir tekniği kullanarak örnek olmayan temsilde Doğru. Şimdi silah mülkiyet tahmini nedir?
    4. Nasıl tahminler Pew Araştırma Merkezi son tahmin arasındaki farklar nelerdir? eğer varsa size, tutarsızlıkları açıklamak ne düşünüyorsunuz?
    5. silah kontrolü yönelik tutumlar için egzersiz 2-5 tekrarlayın. bulgularınızın Nasıl farklı?
  3. [ çok zor , veri koleksiyonu , kodlama gerektirir ] Goel ve arkadaşları (2016) Amazon MTurk Pew Araştırma Merkezi tarafından Genel Sosyal Anketi (GSS) seçin ve anketlerden alınan 49 çoktan seçmeli sorudan oluşan tutum olmayan bir olasılık tabanlı anket uygulanmıştır. Daha sonra model tabanlı sonrası tabakalaşma (Bay P) kullanarak veri olmayan temsiliyet için ayarlamak ve olasılık tabanlı GSS / Pew anketleri kullanılarak tahmin olanlar ile düzeltilmiş tahminleri karşılaştırın. MTurk aynı araştırma yapmak ve GSS / Pew en son turlarından tahminleri ile düzeltilmiş tahminleri karşılaştırarak Şekil 2a ve Şekil 2b çoğaltmak için deneyin (49 soru listesi için Ek Tablo A2 bakınız).

    1. Karşılaştırın ve Pew ve GSS sonuçlarına sonuçlarınızı kontrast.
    2. Karşılaştırın ve MTurk araştırmasının sonuçlarına sonuçlarınızı kontrast Goel, Obeng, and Rothschild (2016) .
  4. [ orta , veri koleksiyonu , kodlama gerektirir ] Birçok çalışma cep telefonu faaliyet verilerinin ilgili anketler kullanın. Bu araştırmacılar oturum açan davranışları ile kendini bildirilen davranışı karşılaştırabilirsiniz ilginç bir ayardır (örn bkz Boase and Ling (2013) ). arama ve manifatura ve iki ortak zaman dilimlerinde vardır hakkında sormak iki ortak davranışlar "geçen hafta." "dün" ve

    1. Eğer daha doğru olduğunu düşünüyorum öz-rapor tedbirler herhangi bir veriyi toplama, önce mi? Niye ya?
    2. senin ankete olmak arkadaşlarınızın 5 askere. kısaca bu 5 arkadaş örneklenmiş nasıl özetleyin. Bu örnekleme prosedürü tahminleriniz belirli önyargıları neden olabilir?
    3. Onları takip mikro anket isteyiniz:
    • "Kaç kez dün başkalarını aramak için cep telefonunuzu kullanabilirsiniz mı?"
    • "Kaç metin mesajları dün yolladın?"
    • "Kaç kez son yedi gün içinde diğerlerini aramak için cep telefonu kullanmak mı?"
    • kendi telefon veya servis sağlayıcınız tarafından kaydedilen olarak anket tamamlandıktan sonra "birçok kez göndermek veya son yedi gün içinde metin mesajları / SMS? için cep telefonu kullanmak yaptım nasıl" kendi kullanım verileri kontrol etmek istiyoruz.
    1. Nasıl öz bildirim kullanım verilerini günlüğe farkı nedir? Hangi en doğru olan, en doğru nedir?
    2. Şimdi (Bir sınıf için bu etkinliği yapıyoruz) Eğer sınıftaki diğer insanlardan verilerle toplanan verileri birleştirir. Bu büyük veri kümesi ile, bir kısmını (d) tekrarlayın.
  5. [ orta , veri koleksiyonu ] Schuman ve Baskı (1996) bu soruyu emir sorular arasındaki ilişkilerin iki tip için önemli olacağını savunuyorlar: iki soru özgüllük aynı seviyede olan yarı parça sorularınızı (örneğin iki başkan adayları derecelendirme); ve genel bir soru daha spesifik bir soru izler parça-bütün soruları (örneğin "İşinizi size ne kadar memnun?" sorarak, ardından "Hayatınızdan Nasılsın memnun?").

    Onlar başka soru sırası etkisinin iki tür karakterize: tutarlılık etkileri daha sonraki bir soruya verilen cevaplar (onlar başka türlü olurdu daha) yakın bir önceki soruya verilen olanlar getirilir ortaya; iki soruya yanıtlar arasında büyük farklılıklar vardır ortaya etkileri kontrast.

    1. Büyük bir soru sırası etkisi, büyük bir sipariş etkisi olacağını düşünüyorum parça-bütün soruların bir çift ve sırasını önemli değildir düşünüyorum soruların bir çift var olacağını düşünüyorum yarı parça soruların bir çift oluşturmak. Sorularınızı test etmek için MTurk bir anket deneme çalıştırın.
    2. yarı parça efekti oluşturmak başardık kadar büyük oldu? Bir tutarlılık ya da kontrast etkisi oldu mu?
    3. parça-bütün efekti oluşturmak başardık kadar büyük oldu? Bir tutarlılık ya da kontrast etkisi oldu mu?
    4. Eğer sırası önemli olacağını düşünmüyordu senin çifti bir soru sırası etkisi var mıydı?
  6. [ orta , veri koleksiyonu ] Schuman ve Baskı ayağı, çalışmaları üzerine inşa Moore (2002) katkı ve subtractive: Soru sırası etkisinin ayrı bir boyutu açıklar. kontrast ve tutarlılık etkileri birbirine katkı ilişkin iki kalemin davalıların değerlendirmeler sonucunda üretilen ve katılımcıların soruları poz hangi içinde büyük çerçeveye daha duyarlı yapıldığında Subtractive sonuçlar ortaya çıkar iken. Oku Moore (2002) , daha sonra tasarım ve katkı maddesi ya da eksiltici etkilerini göstermek için MTurk bir anket deney çalıştırın.

  7. [ zor , veri koleksiyonu ] Christopher Antoun ve arkadaşları (2015) MTurk, Craigslist, Google AdWords ve Facebook: dört farklı online işe kaynaklardan elde edilen kolaylık örnekleri karşılaştıran bir çalışma yürüttük. Basit bir anket Tasarım ve en az iki farklı çevrimiçi işe kaynaklar aracılığıyla katılacakları belirlemek (onlar kullanılan dört kaynaktan farklı kaynaklardan olabilir Antoun et al. (2015) ).

    1. Farklı kaynaklar arasında, para ve zaman açısından acemi başına maliyet, karşılaştırın.
    2. Farklı kaynaklardan elde edilen örneklerin kompozisyonu karşılaştırın.
    3. örnekler arasındaki verilerin kalitesini karşılaştırın. Katılımcıların veri kalitesini ölçmek için nasıl hakkında fikir edinmek için, bkz Schober et al. (2015) .
    4. Tercih kaynağı nedir? Niye ya?
  8. [ orta ] YouGov, bir internet tabanlı pazar araştırma şirketi, İngiltere'de yaklaşık 800.000 katılımcıların bir panelin çevrimiçi anketler yapılmış ve İngiltere seçmenlerin oy ya kalmasını AB Referandumu (yani, Brexit) sonucunu tahmin etmek Bay P. kullanılan veya Avrupa Birliği bırakın.

    YOUGOV istatistiksel model ayrıntılı bir açıklama burada (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Kabaca söylemek gerekirse, YouGov 2015 genel seçim oy seçimi, yaş, nitelikleri, cinsiyet, mülakat tarihi, yanı sıra olanlar arasında tahmin etmek onlar Birincisi, YouGov panelist toplanan verileri kullanılmıştır. Yaşayan seçim bölgesi dayalı tipe seçmenleri bölmeler oy kim Ayrıl'a oy niyetinde her seçmen Çeşidi insanların oranı. Onlar 2015 İngiliz Seçim Çalışması (BES) seçim rulolar katılım doğrulanmış seçim sonrası yüz yüze anket kullanarak her seçmen Çeşidi katılımını tahmin ediyoruz. Son olarak, onlar, genel seçim ve bilgi yerinden YouGov araştırma verileri birçok kişi için oy nasıl BES bazı ilave bilgileri ile yapılan son nüfus sayımına ve Yıllık Nüfus Anketi (dayalı seçmenlerin her seçmen Çeşidi var kaç kişi tahmin her seçim bölgesinde her parti).

    Üç gün oylamadan önce, YouGov bırak için bir iki puan önde gösterdi. oylama arifesinde, anket (49-51 Kalacak) aramak çok yakın gösterdi. Nihai on-the-gün çalışma (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/) Kalan lehine 48/52 öngördü. Aslında, bu tahmin, dört puanlık nihai sonucu (52-48 bırak) kaçırdı.

    1. yanlış gitmiş ne olabilir değerlendirmek için bu bölümde ele alınan toplam anket hata çerçevesini kullanın.
    2. seçimde (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) sonra YOUGOV yanıtı açıkladı: "Bunun nedeni katılımın büyük bir bölümünde görünüyor - bir şey olduğunu böyle bir ince dengeli yarışın sonucuna açısından son derece önemli olacağını baştan beri söyledik. Katılımcıların olsun son genel seçimde oy ve genel seçimlerin yukarıda bir katılımın düzeyi, özellikle Kuzey modeli, altüst etmişti Bizim katılım modeli, kısmen, dayanıyordu. "Bu bölümde (a) cevabınızı değiştiriyor mu?
  9. [ orta , kodlama gerektirir ] Şekil 3.1'de temsil hataların her göstermek için bir simülasyon yazın.

    1. Bu hatalar aslında iptal bir durum oluşturun.
    2. hatalar birbirini bileşik bir durum oluşturun.
  10. [ çok zor , kodlama gerektirir ] BLUMENSTOCK ve arkadaşları araştırma (2015) anket yanıtları tahmin dijital iz verilerini kullanabileceğiniz bir makine öğrenme modeli inşa çıkıyor. Şimdi, farklı bir veri kümesi ile aynı şeyi denemek için gidiyoruz. Kosinski, Stillwell, and Graepel (2013) Facebook bireysel özellikleri ve nitelikleri tahmin edebilirsiniz seviyor bulundu. Şaşırtıcı bir şekilde, bu öngörüler daha doğru arkadaş ve meslektaşlarının daha olabilir (Youyou, Kosinski, and Stillwell 2015) .

    1. Oku Kosinski, Stillwell, and Graepel (2013) http://mypersonality.org/: Onların veriler burada mevcuttur ve Şekil 2. çoğaltmak
    2. Şimdi, Şekil 3 çoğaltmak.
    3. http://applymagicsauce.com/: Son olarak, kendi Facebook verilerini kendi modelini deneyin. Ne kadar iyi sizin için çalışır?
  11. [ orta ] Toole et al. (2015) cep telefonlarından kullanım çağrı ayrıntı kayıtları (CDR) toplam işsizlik eğilimleri tahmin etmek.

    1. Karşılaştırın ve tasarımı kontrast Toole et al. (2015) ile Blumenstock, Cadamuro, and On (2015) .
    2. Eğer CDR geleneksel anketler yerine, onları tamamlayıcı veya işsizliği izlemek için devlet politika için hiç kullanılmaması gerektiğini düşünüyor musunuz? Niye ya?
    3. Ne kanıtı CDR'leri tamamen işsizlik oranı geleneksel önlemler yerine sizi ikna olur?