Kegiatan

Kunci:

  • tingkat kesulitan: mudah mudah , medium medium , hard keras , sangat keras sangat keras
  • membutuhkan matematika ( membutuhkan matematika )
  • membutuhkan coding ( membutuhkan coding )
  • pengumpulan data ( pengumpulan data )
  • kesukaanku ( kesukaanku )
  1. [ keras . membutuhkan matematika ] Dalam bab ini, saya sangat positif tentang pasca-stratifikasi. Namun, itu tidak selalu meningkatkan kualitas perkiraan. Buatlah sebuah situasi di mana dapat memposting-stratifikasi dapat menurunkan kualitas perkiraan. (Untuk petunjuk, lihat Thomsen (1973) ).

  2. [ keras . pengumpulan data . membutuhkan coding ] Desain dan melakukan survei non-probabilitas di Amazon MTurk untuk bertanya tentang kepemilikan senjata ( "Apakah Anda, atau apakah ada di rumah Anda, memiliki pistol, senapan atau pistol? Apakah Anda atau orang lain di rumah Anda?") Dan sikap terhadap kontrol senjata ( "Apa yang Anda pikir lebih penting-untuk melindungi hak orang Amerika untuk memiliki senjata, atau untuk mengendalikan kepemilikan senjata?").

    1. Berapa lama survei Anda ambil? Berapa biayanya? Bagaimana demografi sampel Anda dibandingkan dengan demografi penduduk AS?
    2. Apa estimasi baku kepemilikan senjata menggunakan sampel Anda?
    3. Benar untuk non-keterwakilan sampel Anda menggunakan pasca-stratifikasi atau beberapa teknik lainnya. Sekarang apa adalah estimasi kepemilikan senjata?
    4. Bagaimana perkiraan Anda dibandingkan dengan perkiraan terbaru dari Pew Research Center? Apa yang Anda pikirkan menjelaskan perbedaan, jika ada?
    5. Ulangi latihan 2-5 untuk sikap terhadap kontrol senjata. Bagaimana temuan Anda berbeda?
  3. [ sangat keras . pengumpulan data . membutuhkan coding ] Goel dan rekan (2016) diberikan survei berbasis non-probabilitas yang terdiri dari 49 pertanyaan pilihan ganda sikap yang diambil dari Survei Sosial Umum (SSU) dan pilih survei oleh Pew Research Center di Amazon MTurk. Mereka kemudian menyesuaikan untuk non-keterwakilan data menggunakan model berbasis pasca-stratifikasi (Mr P), dan membandingkan perkiraan disesuaikan dengan yang diperkirakan dengan menggunakan berbasis probabilitas survei GSS / Pew. Melakukan survei yang sama pada MTurk dan mencoba untuk meniru Gambar 2a dan 2b Gambar dengan membandingkan perkiraan disesuaikan dengan perkiraan dari putaran terbaru dari GSS / Pew (Lihat Lampiran Tabel A2 untuk daftar 49 pertanyaan).

    1. Membandingkan dan kontras hasil Anda dengan hasil dari Pew dan GSS.
    2. Membandingkan dan kontras hasil Anda dengan hasil dari survei MTurk di Goel, Obeng, and Rothschild (2016) .
  4. [ medium . pengumpulan data . membutuhkan coding ] Banyak penelitian menggunakan langkah-langkah self-laporan data aktivitas ponsel. Ini adalah pengaturan yang menarik di mana peneliti dapat membandingkan perilaku yang dilaporkan sendiri dengan perilaku bekas tebangan (lihat misalnya, Boase and Ling (2013) ). Dua perilaku umum untuk bertanya tentang yang menelepon dan SMS, dan dua kerangka waktu umum adalah "kemarin" dan "dalam seminggu terakhir."

    1. Sebelum mengumpulkan data, yang satu-laporan diri tindakan yang menurut Anda lebih akurat? Mengapa?
    2. Merekrut 5 dari teman Anda berada di survei Anda. Harap meringkas secara singkat bagaimana 5 teman tersebut sampel. Mungkin prosedur pengambilan sampel ini menginduksi bias tertentu dalam perkiraan Anda?
    3. Silakan meminta mereka berikut mikro-survei:
    • "Berapa kali Anda menggunakan ponsel untuk menelepon orang lain kemarin?"
    • "Berapa banyak pesan teks yang Anda kirim kemarin?"
    • "Berapa kali Anda menggunakan ponsel Anda untuk menelepon orang lain dalam tujuh hari terakhir?"
    • "Berapa kali Anda menggunakan ponsel Anda untuk mengirim atau menerima pesan teks / SMS di tujuh hari terakhir?" Setelah survei selesai, meminta untuk memeriksa data penggunaan mereka sebagai login melalui telepon atau penyedia layanan mereka.
    1. Bagaimana penggunaan laporan diri dibandingkan dengan data log? Yang paling akurat, yang paling akurat?
    2. Sekarang menggabungkan data yang telah Anda kumpulkan dengan data dari orang lain di kelas Anda (jika Anda melakukan kegiatan ini untuk kelas). Dengan dataset yang lebih besar ini, ulangi bagian (d).
  5. [ medium . pengumpulan data ] Schuman dan Presser (1996) berpendapat bahwa pesanan pertanyaan akan peduli untuk dua jenis hubungan antara pertanyaan: bagian-bagian pertanyaan di mana dua pertanyaan berada di tingkat yang sama dari spesifisitas (misalnya peringkat dua calon presiden); dan pertanyaan bagian-keseluruhan mana pertanyaan umum berikut pertanyaan yang lebih spesifik (misalnya bertanya "Seberapa puaskah Anda dengan pekerjaan Anda?" diikuti dengan "Seberapa puaskah Anda dengan hidup Anda?").

    Mereka lebih mencirikan dua jenis efek urutan pertanyaan: efek konsistensi terjadi ketika respon untuk pertanyaan kemudian dibawa lebih dekat (dari mereka dinyatakan akan) dengan yang diberikan ke pertanyaan awal; kontras efek terjadi ketika ada perbedaan besar antara respon untuk dua pertanyaan.

    1. Buat sepasang pertanyaan bagian-bagian yang menurut Anda akan memiliki dampak yang besar agar pertanyaan, sepasang pertanyaan paruh seluruh yang menurut Anda akan memiliki efek pesanan besar, dan sepasang pertanyaan yang agar Anda berpikir tidak masalah. Menjalankan eksperimen survei pada MTurk untuk menguji pertanyaan Anda.
    2. Seberapa besar adalah efek bagian-bagian yang Anda dapat membuat? Apakah itu konsistensi atau kontras efek?
    3. Seberapa besar adalah efek bagian-keseluruhan yang Anda dapat membuat? Apakah itu konsistensi atau kontras efek?
    4. Apakah ada pertanyaan efek urutan pada pasangan Anda di mana Anda tidak berpikir pesanan akan peduli?
  6. [ medium . pengumpulan data ] Membangun pada karya Schuman dan Presser, Moore (2002) menjelaskan dimensi yang terpisah dari efek urutan pertanyaan: aditif dan subtraktif. Sementara kontras dan konsistensi efek yang dihasilkan sebagai konsekuensi dari evaluasi responden dari dua item dalam hubungan satu sama lain, aditif dan efek subtraktif diproduksi ketika responden dibuat lebih sensitif terhadap kerangka yang lebih besar di mana pertanyaan-pertanyaan yang diajukan. Baca Moore (2002) , kemudian merancang dan menjalankan percobaan survei pada MTurk untuk menunjukkan aditif atau subtraktif efek.

  7. [ keras . pengumpulan data ] Christopher Antoun dan rekan (2015) melakukan studi membandingkan sampel kenyamanan yang diperoleh dari empat sumber merekrut online yang berbeda: MTurk, Craigslist, Google AdWords dan Facebook. Desain survei sederhana dan merekrut peserta melalui setidaknya dua sumber perekrutan online yang berbeda (mereka dapat sumber yang berbeda dari empat sumber yang digunakan dalam Antoun et al. (2015) ).

    1. Membandingkan biaya per merekrut, dalam hal uang dan waktu, antara sumber yang berbeda.
    2. Bandingkan komposisi sampel yang diperoleh dari sumber yang berbeda.
    3. Membandingkan kualitas data antara sampel. Untuk ide-ide tentang bagaimana mengukur kualitas data dari responden, melihat Schober et al. (2015) .
    4. Apa sumber yang Anda pilih? Mengapa?
  8. [ medium ] YouGov, sebuah perusahaan riset pasar berbasis internet, dilakukan jajak pendapat secara online dari panel sekitar 800.000 responden di Inggris dan digunakan Mr P. untuk memprediksi hasil dari Referendum Uni Eropa (yaitu, Brexit) di mana pemilih UK suara baik untuk tetap di atau meninggalkan Uni Eropa.

    Sebuah penjelasan rinci tentang model statistik YouGov ada di sini (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Secara kasar, YouGov partisi pemilih dalam jenis berdasarkan 2015 pilihan suara pemilihan umum, usia, kualifikasi, jenis kelamin, tanggal wawancara, serta konstituen mereka tinggal di. Pertama, mereka menggunakan data yang dikumpulkan dari para panelis YouGov untuk memperkirakan, di antara mereka yang memilih, proporsi penduduk masing-masing jenis pemilih yang berniat untuk memilih Leave. Mereka memperkirakan jumlah pemilih dari masing-masing jenis pemilih dengan menggunakan British Studi Pemilu 2015 (BES) pasca-pemilu tatap muka survei, yang divalidasi pemilih dari daftar pemilih. Akhirnya, mereka memperkirakan berapa banyak orang di sana yang masing-masing jenis pemilih di pemilih berdasarkan Sensus terbaru dan Survei Penduduk Tahunan (dengan beberapa informasi tambahan dari BES, data survei YouGov dari seluruh pemilihan umum, dan informasi pada berapa banyak orang sebagai untuk masing-masing pihak di setiap daerah pemilihan).

    Tiga hari sebelum pemungutan suara, YouGov menunjukkan keunggulan dua poin untuk Tinggalkan. Pada malam suara, jajak pendapat menunjukkan terlalu dekat untuk menelepon (49-51 Tetap). Final studi on-the-hari diprediksi 48/52 mendukung Tetap (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Bahkan, perkiraan ini tidak terjawab hasil akhir (52-48 Tinggalkan) oleh empat poin persentase.

    1. Gunakan kerangka error survei total dibahas dalam bab ini untuk menilai apa yang bisa saja salah.
    2. Tanggapan YouGov setelah pemilihan (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) menjelaskan: "Ini sepertinya di sebagian besar karena jumlah pemilih - sesuatu yang kami telah mengatakan semua bersama akan menjadi sangat penting untuk hasil seperti ras halus seimbang. Model pemilih kami didasarkan, sebagian, pada apakah responden telah memilih pada pemilihan umum lalu dan tingkat partisipasi pemilih di atas bahwa pemilihan umum marah model, terutama di Utara. "Apakah ini mengubah jawaban Anda untuk bagian (a)?
  9. [ medium . membutuhkan coding ] Tulis simulasi untuk menggambarkan setiap kesalahan representasi pada Gambar 3.1.

    1. Menciptakan situasi di mana kesalahan ini benar-benar membatalkan.
    2. Menciptakan situasi di mana kesalahan senyawa sama lain.
  10. [ sangat keras . membutuhkan coding ] Penelitian Blumenstock dan rekan (2015) yang terlibat membangun model pembelajaran mesin yang bisa menggunakan jejak data digital untuk memprediksi respons survei. Sekarang, Anda akan mencoba hal yang sama dengan dataset yang berbeda. Kosinski, Stillwell, and Graepel (2013) menemukan bahwa Facebook suka dapat memprediksi sifat-sifat individu dan atribut. Anehnya, prediksi ini bisa menjadi lebih akurat dibandingkan dengan teman-teman dan kolega (Youyou, Kosinski, and Stillwell 2015) .

    1. Baca Kosinski, Stillwell, and Graepel (2013) , dan mereplikasi Gambar 2. Data mereka tersedia di sini: http://mypersonality.org/
    2. Sekarang, meniru Gambar 3.
    3. Akhirnya, mencoba model mereka pada data Facebook Anda sendiri: http://applymagicsauce.com/. Seberapa baik bekerja untuk Anda?
  11. [ medium ] Toole et al. (2015) penggunaan detail catatan panggilan (CDRs) dari ponsel untuk memprediksi tren pengangguran agregat.

    1. Membandingkan dan kontras desain Toole et al. (2015) dengan Blumenstock, Cadamuro, and On (2015) .
    2. Apakah Anda berpikir CDR harus mengganti survei tradisional, melengkapi mereka atau tidak digunakan sama sekali bagi para pembuat kebijakan pemerintah untuk melacak pengangguran? Mengapa?
    3. Bukti apa yang akan meyakinkan Anda bahwa CDR-benar dapat menggantikan ukuran tradisional tingkat pengangguran?