aktiviti

  • darjah kesukaran: mudah mudah , sederhana sederhana , keras keras , sangat susah sangat susah
  • memerlukan matematik ( memerlukan matematik )
  • memerlukan pengekodan ( memerlukan pengekodan )
  • pengumpulan data ( pengumpulan data )
  • kegemaran saya ( kegemaran saya )
  1. [ keras , memerlukan matematik ] Dalam bab ini, saya sangat positif mengenai post-stratification. Bagaimanapun, ini tidak selalu meningkatkan kualiti anggaran. Bina situasi di mana post-stratification dapat mengurangkan kualiti anggaran. (Untuk petunjuk, lihat Thomsen (1973) .)

  2. [ keras , pengumpulan data , memerlukan pengekodan Reka bentuk dan menjalankan kajian tak probabiliti pada Amazon Mechanical Turk untuk bertanya mengenai pemilikan senjata dan sikap terhadap kawalan senjata. Oleh itu, anda boleh membandingkan anggaran anda dengan yang diperolehi dari sampel kebarangkalian, sila salin teks soalan dan pilihan jawapan secara terus daripada tinjauan berkualiti tinggi seperti yang dijalankan oleh Pusat Penyelidikan Pew.

    1. Berapa lamakah tinjauan anda? Berapakah kosnya? Bagaimanakah demografi sampel anda berbanding dengan demografi penduduk AS?
    2. Apakah ramalan mentah pemilikan senjata menggunakan sampel anda?
    3. Betul untuk tidak mewakili sampel anda menggunakan post-stratification atau teknik lain. Sekarang apa anggaran pemilikan senjata api?
    4. Bagaimanakah anggaran anda membandingkan dengan anggaran terkini dari sampel berasaskan kebarangkalian? Apa yang anda fikirkan menjelaskan perbezaannya, jika ada?
    5. Ulang soalan (b) - (d) untuk sikap terhadap kawalan senjata. Bagaimanakah perbezaan pendapat anda?
  3. [ sangat susah , pengumpulan data , memerlukan pengekodan ] Goel dan rakan sekerja (2016) mentadbir 49 soalan persoalan pelbagai pilihan yang diambil dari Kajian Sosial Umum (GSS) dan pilih tinjauan oleh Pusat Penyelidikan Pew kepada sampel kebarangkalian responden yang diambil dari Amazon Mechanical Turk. Mereka kemudiannya diselaraskan untuk tidak mewakili data menggunakan model stratifikasi berasaskan model dan membandingkan anggaran yang diselaraskan dengan mereka dari tinjauan GSS dan Pew berasaskan kebarangkalian. Lakukan tinjauan yang sama pada Amazon Mechanical Turk dan cuba untuk meniru angka 2a dan angka 2b dengan membandingkan anggaran yang diselaraskan dengan anggaran dari pusingan terbaru survei GSS dan Pew. (Lihat jadual lampiran A2 untuk senarai 49 soalan.)

    1. Bandingkan dan kontras hasil anda dengan orang-orang dari Pew dan GSS.
    2. Bandingkan dan kontras hasil anda dengan orang-orang dari tinjauan mekanikal Turk di Goel, Obeng, and Rothschild (2016) .
  4. [ sederhana , pengumpulan data , memerlukan pengekodan ] Banyak kajian menggunakan langkah-langkah yang dilaporkan sendiri mengenai penggunaan telefon bimbit. Ini adalah satu persekitaran yang menarik di mana para penyelidik boleh membandingkan tingkah laku yang dilaporkan sendiri dengan tingkah laku yang dilog (lihat misalnya, Boase and Ling (2013) ). Dua tingkah laku biasa untuk bertanya tentang panggilan dan teks, dan dua bingkai masa yang sama adalah "semalam" dan "dalam seminggu yang lalu."

    1. Sebelum mengumpul apa-apa data, yang mana langkah-langkah laporan diri yang anda fikir lebih tepat? Mengapa?
    2. Merakam lima rakan anda untuk berada dalam tinjauan anda. Sila ringkas meringkaskan bagaimana lima rakan-rakan ini telah dicontohi. Bolehkah prosedur pensampelan ini mendorong kecenderungan khusus dalam anggaran anda?
    3. Tanya kepada mereka soalan microsurvey yang berikut:
    • "Berapa kali anda menggunakan telefon bimbit anda untuk memanggil orang lain semalam?"
    • "Berapa banyak mesej teks yang anda hantar semalam?"
    • "Berapa kali anda menggunakan telefon bimbit anda untuk memanggil orang lain dalam tempoh tujuh hari yang lalu?"
    • "Berapa kali anda menggunakan telefon bimbit anda untuk menghantar atau menerima mesej teks / SMS dalam tempoh tujuh hari yang lalu?"
    1. Setelah mikrosurvey ini selesai, mintalah untuk memeriksa data penggunaan mereka seperti yang dilog oleh telefon atau penyedia perkhidmatan mereka. Bagaimana penggunaan laporan diri berbanding dengan data log? Yang paling tepat, yang kurang tepat?
    2. Kini menggabungkan data yang anda kumpulkan dengan data dari orang lain di kelas anda (jika anda melakukan aktiviti ini untuk kelas). Dengan dataset yang lebih besar ini, ulang bahagian (d).
  5. [ sederhana , pengumpulan data ] Schuman dan Presser (1996) berhujah bahawa pesanan soalan akan menjadi perkara penting untuk dua jenis soalan: soalan sebahagian bahagian di mana dua soalan berada pada tahap kekhususan yang sama (misalnya, penilaian dua calon presiden); dan sebahagian soalan keseluruhan di mana soalan umum mengikuti soalan yang lebih spesifik (contohnya, bertanya "Seberapa puaskah anda dengan kerja anda?" diikuti dengan "Seberapa puaskah anda dengan hidup anda?").

    Mereka selanjutnya mencirikan dua jenis kesan pesanan soalan: kesan konsisten berlaku apabila tindak balas kepada soalan kemudian dibawa lebih dekat (daripada yang mereka akan menjadi) kepada mereka yang diberikan kepada soalan yang lebih awal; Kesan kontras berlaku apabila terdapat perbezaan yang lebih besar antara respons kepada dua soalan.

    1. Buat sepasang soalan bahagian yang anda fikir akan mempunyai kesan pesanan soalan yang besar; sepasang soalan sebahagian besar yang anda fikir akan mempunyai kesan pesanan yang besar; dan sepasang soalan yang membuat pesanan anda tidak penting. Jalankan percubaan tinjauan di Amazon Mechanical Turk untuk menguji soalan anda.
    2. Berapa besar kesan sebahagiannya yang anda boleh buat? Adakah ia konsisten atau kesan kontras?
    3. Berapa besar kesan keseluruhannya yang dapat anda buat? Adakah ia konsisten atau kesan kontras?
    4. Adakah terdapat kesan pesanan soalan di pasangan anda di mana anda tidak fikir perintah itu penting?
  6. [ sederhana , pengumpulan data ] Membina karya Schuman dan Presser, Moore (2002) menerangkan dimensi berasingan kesan pesanan soalan: kesan tambahan dan subtractive. Walaupun kesan kontras dan konsisten dihasilkan sebagai akibat dari penilaian responden terhadap kedua-dua perkara yang berkaitan dengan satu sama lain, kesan tambahan dan subtractive dihasilkan apabila responden dibuat lebih sensitif terhadap rangka kerja yang lebih besar di mana soalan-soalan yang ditimbulkan. Baca Moore (2002) , kemudian mereka bentuk dan menjalankan percubaan kaji selidik pada MTurk untuk menunjukkan kesan tambahan atau subtractive.

  7. [ keras , pengumpulan data Christopher Antoun dan rakan-rakannya (2015) menjalankan kajian membandingkan sampel kemudahan yang diperolehi daripada empat sumber pengambilan dalam talian yang berbeza: MTurk, Craigslist, Google AdWords dan Facebook. Reka bentuk tinjauan mudah dan merekrut peserta melalui sekurang-kurangnya dua sumber perekrutan dalam talian yang berbeza (sumber-sumber ini boleh berbeza daripada empat sumber yang digunakan dalam Antoun et al. (2015) ).

    1. Bandingkan kos per merekrut dari segi wang dan masa antara sumber yang berbeza.
    2. Bandingkan komposisi sampel yang diperoleh daripada sumber yang berlainan.
    3. Bandingkan kualiti data antara sampel. Untuk idea mengenai cara mengukur kualiti data daripada responden, lihat Schober et al. (2015) .
    4. Apakah sumber pilihan anda? Mengapa?
  8. [ sederhana ] Dalam usaha untuk meramalkan keputusan Rujukan Pantau EU 2016 (iaitu, Brexit), YouGov-sebuah firma penyelidikan pasaran berasaskan Internet-mengendalikan tinjauan dalam talian mengenai panel kira-kira 800,000 responden di United Kingdom.

    Penerangan terperinci mengenai model statistik YouGov boleh didapati di https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Secara kasar, YouGov memisahkan pengundi menjadi jenis berdasarkan pilihan suara pilihan raya 2015, umur, kelayakan, jantina, dan tarikh temubual, serta kawasan di mana mereka tinggal. Pertama, mereka menggunakan data yang dikumpulkan dari ahli panel YouGov untuk menganggarkan, di antara mereka yang mengundi, perkadaran orang setiap jenis pemilih yang ingin mengundi Cuti. Mereka menganggarkan jumlah pemilih setiap jenis pemilih dengan menggunakan Kajian British Election 2015 (BES), tinjauan bersemuka pasca-pilihan raya, yang mengesahkan pemilih dari daftar pemilih. Akhirnya, mereka menganggarkan berapa ramai orang yang ada setiap jenis pemilih dalam pemilih, berdasarkan Banci Terkini dan Penyiasatan Penduduk Tahunan (dengan beberapa maklumat tambahan dari sumber data lain).

    Tiga hari sebelum undi, YouGov menunjukkan petunjuk dua mata untuk Tinggalkan. Pada malam pengundian, tinjauan menunjukkan bahawa keputusannya terlalu dekat dengan panggilan (49/51 Remain). Kajian akhir pada hari ini meramalkan 48/52 memihak kepada Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Malah, anggaran ini terlepas keputusan akhir (52/48 Cuti) sebanyak empat mata peratusan.

    1. Gunakan rangka kerja kesilapan tinjauan menyeluruh yang dibincangkan dalam bab ini untuk menilai apa yang mungkin salah.
    2. Tanggapan YouGov selepas pilihan raya (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) menjelaskan: "Ini nampaknya sebahagian besar disebabkan oleh pemilihan - sesuatu yang kami telah berkata sepanjang masa akan menjadi penting kepada hasil perlumbaan seperti ini. Model pemilih kami didasarkan pada sebahagiannya sama ada responden telah mengundi pada pilihan raya umum lalu dan tahap pemilihan di atas pemilihan umum mengganggu model, terutamanya di Utara. "Adakah ini mengubah jawapan anda kepada bahagian (a)?
  9. [ sederhana , memerlukan pengekodan ] Tulis simulasi untuk menggambarkan setiap kesilapan perwakilan dalam angka 3.2.

    1. Buat situasi di mana kesilapan ini sebenarnya membatalkan.
    2. Buat situasi di mana kesilapan menggabungkan satu sama lain.
  10. [ sangat susah , memerlukan pengekodan ] Penyelidikan Blumenstock dan rakan sekerja (2015) melibatkan membina model pembelajaran mesin yang boleh menggunakan data jejak digital untuk meramalkan tindak balas tinjauan. Sekarang, anda akan cuba perkara yang sama dengan dataset yang berbeza. Kosinski, Stillwell, and Graepel (2013) mendapati bahawa Facebook suka dapat meramalkan ciri dan sifat individu. Menghairankan, ramalan ini boleh lebih tepat daripada rakan dan rakan sekerja (Youyou, Kosinski, and Stillwell 2015) .

    1. Baca Kosinski, Stillwell, and Graepel (2013) , dan meniru angka 2. Data mereka boleh didapati di http://mypersonality.org/
    2. Sekarang, tiru angka 3.
    3. Akhirnya, cuba model mereka pada data Facebook anda sendiri: http://applymagicsauce.com/. Betulkah ia berfungsi untuk anda?
  11. [ sederhana ] Toole et al. (2015) menggunakan rekod terperinci panggilan (CDR) dari telefon bimbit untuk meramalkan trend pengangguran agregat.

    1. Bandingkan dan kontras reka bentuk kajian Toole et al. (2015) dengan Blumenstock, Cadamuro, and On (2015) .
    2. Adakah anda berfikir CDR harus menggantikan tinjauan tradisional, melengkapkannya atau tidak digunakan sama sekali untuk pembuat dasar kerajaan untuk mengesan pengangguran? Mengapa?
    3. Bukti apa yang akan meyakinkan anda bahawa CDR benar-benar boleh menggantikan langkah tradisional kadar pengangguran?