faaliyetler

  • zorluk derecesi: kolay kolay orta orta , zor zor , çok zor çok zor
  • matematik gerektirir matematik gerektirir )
  • kodlama gerektirir kodlama gerektirir )
  • veri koleksiyonu ( veri koleksiyonu )
  • Favorilerim ( benim favorim )
  1. [ zor , matematik gerektirir ] Bu bölümde, tabakalaşma hakkında çok olumlu davrandım. Ancak, bu her zaman tahminlerin kalitesini yükseltmez. Son tabakalaşmanın tahminlerin kalitesini azaltabileceği bir durum yaratın. (Bir ipucu için bkz. Thomsen (1973) .)

  2. [ zor , veri koleksiyonu , kodlama gerektirir ] Silah bulundurma ve silah kontrolüne yönelik tutumları sormak için Amazon Mechanical Turk üzerinde bir olasılık dışı anket tasarlayın ve yapın. Tahminlerinizi bir olasılık örneğinden elde edilen sonuçlarla karşılaştırabilmeniz için lütfen soru metnini ve yanıt seçeneklerini doğrudan Pew Research Center tarafından yönetilenler gibi yüksek kaliteli bir anketten kopyalayın.

    1. Anketin ne kadar sürüyor? Fiyatı ne kadar? Örneğinizin demografisi, ABD nüfusunun demografisiyle nasıl karşılaştırılır?
    2. Numunenizi kullanarak silah mülkiyetinin ham tahmini nedir?
    3. Numunenizin post-tabakalaşma veya başka bir teknik kullanılarak temsil edilmezliğini düzeltin. Şimdi silah mülkiyeti tahmini nedir?
    4. Tahminleriniz olasılık temelli bir örneklemden en son tahminle nasıl karşılaştırılır? Varsa, tutarsızlıkları nasıl açıklarsınız?
    5. Silah kontrolüne yönelik tutumlar için soruları tekrar edin (b) - (d). Bulgularınız farklı mı?
  3. [ çok zor , veri koleksiyonu , kodlama gerektirir ] Goel ve meslektaşları (2016) , Genel Sosyal Araştırmadan (GSS) alınan 49 çoktan seçmeli tutum sorusunu yönettiler ve Pew Research Center tarafından Amazon Mechanical Turk'den alınan yanıtsız örneklemlere yönelik anketler seçtiler. Daha sonra, model tabanlı post-tabakalaşma kullanarak verilerin temsili olmadığını ayarladılar ve düzeltilmiş tahminlerini olasılık temelli GSS ve Pew anketlerinden elde edilenlerle karşılaştırdılar. Aynı araştırmayı Amazon Mechanical Turk'te gerçekleştirin ve düzeltilmiş tahminlerinizi GSS ve Pew anketlerinin son turlarından elde edilen tahminlerle karşılaştırarak şekil 2a ve şekil 2b'yi çoğaltmaya çalışın. (49 soru listesi için ek tablo A2'ye bakınız.)

    1. Sonuçlarınızı Pew ve GSS'den gelenlerle karşılaştırın ve karşılaştırın.
    2. Sonuçlarınızı Goel, Obeng, and Rothschild (2016) Mechanical Turk anketinden elde edilen sonuçlarla karşılaştırın ve karşılaştırın.
  4. [ orta , veri koleksiyonu , kodlama gerektirir ] Birçok çalışma, cep telefonu kullanımının kendinden bildirilen ölçümlerini kullanmaktadır. Bu, araştırmacıların kendini rapor edilmiş davranışlarını günlük davranışlarıyla karşılaştırabilecekleri ilginç bir ortamdır (bkz. Örneğin Boase and Ling (2013) ). Sorulması gereken iki yaygın davranış, çağrı ve mesajlaşmadır ve iki ortak zaman dilimi “dün” ve “geçen hafta” dır.

    1. Herhangi bir veri toplamaya başlamadan önce, hangi öz değerlendirme raporlarından hangisinin daha doğru olduğunu düşünüyorsunuz? Niye ya?
    2. Anketinizde olmak için beş arkadaşınızı toplayın. Lütfen bu beş arkadaşın nasıl örneklendiğini kısaca özetleyin. Bu örnekleme prosedürü tahminlerinizde belirli önyargılara neden olabilir mi?
    3. Onlara aşağıdaki mikro soruları sorun:
    • “Dün cep telefonunu dün başkalarını aramak için kaç kez kullandın?”
    • “Dün kaç metin mesajı yolladın?”
    • “Son yedi günde cep telefonunuzu başkalarını aramak için kaç kez kullandınız?”
    • “Son yedi günde cep telefonunuzu kısa mesaj göndermek / almak için kaç kez kullandınız?”
    1. Bu mikro işlem tamamlandıktan sonra, telefon veya servis sağlayıcısı tarafından oturum açıldıklarında kullanım verilerini kontrol etmelerini isteyin. Öz rapor kullanımı, günlük verilerine göre nasıl karşılaştırılır? Hangisi en doğru, hangisi daha doğru?
    2. Şimdi, topladığınız verileri, sınıfınızdaki diğer kişilerden gelen verilerle birleştirin (bu etkinliği bir sınıf için yapıyorsanız). Bu daha büyük veri kümesiyle, parçayı tekrarlayın (d).
  5. [ orta , veri koleksiyonu Schuman ve Presser (1996) soruların iki tür soru için önemli olacağını ileri sürmektedir: iki sorununun aynı düzeyde özgü olduğu kısmi kısım soruları (örneğin, iki başkanlık adayının derecelendirmeleri); ve genel bir sorunun daha spesifik bir soruyu takip ettiği (örneğin, “İşinizden ne kadar memnunsunuz?” diye sorduğumuz kısmi bütün sorular ve ardından “Hayatınızdan ne kadar memnunsunuz?”).

    Bunlar ayrıca iki tür soru düzeni etkisini karakterize eder: tutarlılık etkileri, daha sonraki bir soruya verilen cevaplar, daha önceki bir soruya verilenlere (aksi takdirde) daha yaklaştırıldığında ortaya çıkar; Kontrast etkileri, iki soruya verilen cevaplar arasında daha büyük farklılıklar olduğunda ortaya çıkar.

    1. Büyük bir soru düzeni etkisine sahip olacağını düşündüğünüz bir parça kısmi soru oluşturun; Büyük bir sipariş etkisine sahip olacağını düşündüğünüz kısmi bütün sorular; ve siparişini düşündüğünüz bir çift soru. Sorularınızı test etmek için Amazon Mechanical Turk üzerinde bir anket denemesi yapın.
    2. Bir parça parça etkisi ne kadar büyüktür? Bir tutarlılık veya kontrast etkisi miydi?
    3. Kısmi bir etki yaratmak için ne kadar büyüktü? Bir tutarlılık veya kontrast etkisi miydi?
    4. Parselinizde siparişin önemli olduğunu düşünmediğiniz bir soru siparişi etkisi var mıydı?
  6. [ orta , veri koleksiyonu Schuman ve Presser'in çalışmalarına dayanan Moore (2002) , soru sırası etkisinin ayrı bir boyutunu tanımlamaktadır: katkı ve eksiltici etkiler. Katılımcıların birbirleriyle ilişkili olarak iki maddeye ilişkin değerlendirmelerinin bir sonucu olarak karşıtlık ve tutarlılık etkileri üretilirken, katılımcılar soruların ortaya konulduğu daha geniş çerçeveye daha duyarlı hale geldiklerinde katkı ve eksiltici etkiler üretilir. Moore (2002) okuyun, daha sonra katkı ve eksiltici etkileri göstermek için MTurk üzerinde bir deneme deneyi tasarlayın ve çalıştırın.

  7. [ zor , veri koleksiyonu Christopher Antoun ve arkadaşları (2015) , dört farklı online işe alım kaynağından elde edilen uygunluk örneklerini karşılaştıran bir çalışma yürütmüşlerdir: MTurk, Craigslist, Google AdWords ve Facebook. Basit bir anket tasarlayın ve katılımcıları en az iki farklı online işe alma kaynağıyla işe alın (bu kaynaklar, Antoun et al. (2015) kullanılan dört kaynaktan farklı olabilir).

    1. Farklı kaynaklar arasında işe alım maliyetini - para ve zaman açısından - karşılaştırın.
    2. Farklı kaynaklardan elde edilen örneklerin kompozisyonunu karşılaştırın.
    3. Örnekler arasındaki verilerin kalitesini karşılaştırın. Yanıtlayıcılardan veri kalitesini ölçmek için fikirler için bkz. Schober et al. (2015) .
    4. Tercih ettiğiniz kaynak hangisidir? Niye ya?
  8. [ orta ] 2016 AB Referandumu'nun (yani Brexit) sonuçlarını tahmin etmeye yönelik bir çabada, İnternet tabanlı bir pazar araştırması şirketi olan YouGov, Birleşik Krallık'ta yaklaşık 800.000 katılımcıdan oluşan bir anketin çevrimiçi anketlerini gerçekleştirdi.

    YouGov'un istatistiksel modelinin ayrıntılı bir açıklaması https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ adresinde bulunabilir. Kabaca ifade edersek, YouGov seçmenleri 2015 genel seçim oyu seçimi, yaş, nitelikler, cinsiyet ve görüşme tarihinin yanı sıra yaşadıkları yer seçimine dayanan türlere ayırdı. Birincisi, YouGov panelistlerinden toplanan verileri, oy verenler arasında, oy vermeyi amaçlayan her bir seçmen türünün oranını tahmin etmek için kullandılar. Her seçmen tipinin katılımını, seçim komisyonlarından gelen katılımı onaylayan seçim sonrası yüz yüze anket olan 2015 İngiliz Seçim Çalışması'nı (BES) kullanarak tahmin ettiler. Son olarak, en son Nüfus Sayımı ve Yıllık Nüfus Anketi'ne dayanarak (diğer veri kaynaklarından bazı ek bilgilerle), seçmenlerde her bir seçmen türünde kaç kişi olduğunu tahmin etmişlerdir.

    Oylamadan üç gün önce, YouGov, iki noktadan Ayrılma iznini gösterdi. Oylama arifesinde, anket sonucun çok yakın olduğunu gösterdi (49/51 Remain). Son günlerde yapılan çalışma, Remain'in lehine 48/52'yi öngördü (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Aslında, bu tahmin, nihai sonucu (52/48 Bırak) dört yüzde puanı kaçırdı.

    1. Neyin yanlış gidebileceğini değerlendirmek için bu bölümde tartışılan toplam anket hatası çerçevesini kullanın.
    2. YouGov'un seçimden sonraki yanıtı (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) şöyle açıklıyordu: “Bu, katılım nedeniyle büyük bir rol oynuyor. Bu kadar ince dengeli bir ırkın sonucu için hepimizin çok önemli olacağını söylemiştik. Bizim katılım modelimiz, kısmen, son genel seçimlerde oy verenlerin genel seçimlerde oy kullanıp kullanmadıklarına ve genel seçimlerden daha yüksek bir katılım düzeyine, özellikle de Kuzey'e yönelmiş olmalarına dayanıyordu. ”Bu, (a) bölümünün cevabını değiştiriyor mu?
  9. [ orta , kodlama gerektirir Şekil 3.2'deki temsil hatalarının her birini göstermek için bir simülasyon yazınız.

    1. Bu hataların aslında iptal edildiği bir durum oluşturun.
    2. Hataların birbirini birleştirdiği bir durum yaratın.
  10. [ çok zor , kodlama gerektirir ] Blumenstock ve meslektaşlarının (2015) araştırması, anket yanıtlarını tahmin etmek için dijital izleme verilerini kullanabilecek bir makine öğrenme modeli oluşturmayı içermektedir. Şimdi, aynı şeyi farklı bir veri kümesiyle deneyeceksin. Kosinski, Stillwell, and Graepel (2013) , Facebook beğenin bireysel özellikleri ve özellikleri tahmin edebileceğini buldu. Şaşırtıcı bir şekilde, bu tahminler arkadaşların ve meslektaşlarınkinden daha doğru olabilir (Youyou, Kosinski, and Stillwell 2015) .

    1. Kosinski, Stillwell, and Graepel (2013) okuyun ve şekil 2'yi çoğaltın. Verileri http://mypersonality.org/ adresinden edinilebilir.
    2. Şimdi, şekil 3'ü kopyalayın.
    3. Son olarak, modellerini kendi Facebook verilerinizde deneyin: http://applymagicsauce.com/. Senin için ne kadar iyi çalışıyor?
  11. [ orta Toole et al. (2015) toplam işsizlik trendlerini tahmin etmek için cep telefonlarından çağrı detay kayıtlarını (CDR Toole et al. (2015) kullandı.

    1. Toole et al. (2015) ile birlikte Blumenstock, Cadamuro, and On (2015) .
    2. CDR'lerin geleneksel anketlerin yerini alması, onları tamamlaması ya da hükümet politika yapıcılarının işsizliği takip etmeleri için hiç kullanılmaması gerektiğini düşünüyor musunuz? Niye ya?
    3. CDR'lerin işsizlik oranının geleneksel önlemlerinin yerini tamamen alabileceği konusunda hangi kanıtlar sizi ikna edecektir?