Kunci:
[ . ] Dalam bab ini, saya sangat positif tentang pasca-stratifikasi. Namun, itu tidak selalu meningkatkan kualitas perkiraan. Buatlah sebuah situasi di mana dapat memposting-stratifikasi dapat menurunkan kualitas perkiraan. (Untuk petunjuk, lihat Thomsen (1973) ).
[ . . ] Desain dan melakukan survei non-probabilitas di Amazon MTurk untuk bertanya tentang kepemilikan senjata ( "Apakah Anda, atau apakah ada di rumah Anda, memiliki pistol, senapan atau pistol? Apakah Anda atau orang lain di rumah Anda?") Dan sikap terhadap kontrol senjata ( "Apa yang Anda pikir lebih penting-untuk melindungi hak orang Amerika untuk memiliki senjata, atau untuk mengendalikan kepemilikan senjata?").
[ . . ] Goel dan rekan (2016) diberikan survei berbasis non-probabilitas yang terdiri dari 49 pertanyaan pilihan ganda sikap yang diambil dari Survei Sosial Umum (SSU) dan pilih survei oleh Pew Research Center di Amazon MTurk. Mereka kemudian menyesuaikan untuk non-keterwakilan data menggunakan model berbasis pasca-stratifikasi (Mr P), dan membandingkan perkiraan disesuaikan dengan yang diperkirakan dengan menggunakan berbasis probabilitas survei GSS / Pew. Melakukan survei yang sama pada MTurk dan mencoba untuk meniru Gambar 2a dan 2b Gambar dengan membandingkan perkiraan disesuaikan dengan perkiraan dari putaran terbaru dari GSS / Pew (Lihat Lampiran Tabel A2 untuk daftar 49 pertanyaan).
[ . . ] Banyak penelitian menggunakan langkah-langkah self-laporan data aktivitas ponsel. Ini adalah pengaturan yang menarik di mana peneliti dapat membandingkan perilaku yang dilaporkan sendiri dengan perilaku bekas tebangan (lihat misalnya, Boase and Ling (2013) ). Dua perilaku umum untuk bertanya tentang yang menelepon dan SMS, dan dua kerangka waktu umum adalah "kemarin" dan "dalam seminggu terakhir."
[ . ] Schuman dan Presser (1996) berpendapat bahwa pesanan pertanyaan akan peduli untuk dua jenis hubungan antara pertanyaan: bagian-bagian pertanyaan di mana dua pertanyaan berada di tingkat yang sama dari spesifisitas (misalnya peringkat dua calon presiden); dan pertanyaan bagian-keseluruhan mana pertanyaan umum berikut pertanyaan yang lebih spesifik (misalnya bertanya "Seberapa puaskah Anda dengan pekerjaan Anda?" diikuti dengan "Seberapa puaskah Anda dengan hidup Anda?").
Mereka lebih mencirikan dua jenis efek urutan pertanyaan: efek konsistensi terjadi ketika respon untuk pertanyaan kemudian dibawa lebih dekat (dari mereka dinyatakan akan) dengan yang diberikan ke pertanyaan awal; kontras efek terjadi ketika ada perbedaan besar antara respon untuk dua pertanyaan.
[ . ] Membangun pada karya Schuman dan Presser, Moore (2002) menjelaskan dimensi yang terpisah dari efek urutan pertanyaan: aditif dan subtraktif. Sementara kontras dan konsistensi efek yang dihasilkan sebagai konsekuensi dari evaluasi responden dari dua item dalam hubungan satu sama lain, aditif dan efek subtraktif diproduksi ketika responden dibuat lebih sensitif terhadap kerangka yang lebih besar di mana pertanyaan-pertanyaan yang diajukan. Baca Moore (2002) , kemudian merancang dan menjalankan percobaan survei pada MTurk untuk menunjukkan aditif atau subtraktif efek.
[ . ] Christopher Antoun dan rekan (2015) melakukan studi membandingkan sampel kenyamanan yang diperoleh dari empat sumber merekrut online yang berbeda: MTurk, Craigslist, Google AdWords dan Facebook. Desain survei sederhana dan merekrut peserta melalui setidaknya dua sumber perekrutan online yang berbeda (mereka dapat sumber yang berbeda dari empat sumber yang digunakan dalam Antoun et al. (2015) ).
[ ] YouGov, sebuah perusahaan riset pasar berbasis internet, dilakukan jajak pendapat secara online dari panel sekitar 800.000 responden di Inggris dan digunakan Mr P. untuk memprediksi hasil dari Referendum Uni Eropa (yaitu, Brexit) di mana pemilih UK suara baik untuk tetap di atau meninggalkan Uni Eropa.
Sebuah penjelasan rinci tentang model statistik YouGov ada di sini (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Secara kasar, YouGov partisi pemilih dalam jenis berdasarkan 2015 pilihan suara pemilihan umum, usia, kualifikasi, jenis kelamin, tanggal wawancara, serta konstituen mereka tinggal di. Pertama, mereka menggunakan data yang dikumpulkan dari para panelis YouGov untuk memperkirakan, di antara mereka yang memilih, proporsi penduduk masing-masing jenis pemilih yang berniat untuk memilih Leave. Mereka memperkirakan jumlah pemilih dari masing-masing jenis pemilih dengan menggunakan British Studi Pemilu 2015 (BES) pasca-pemilu tatap muka survei, yang divalidasi pemilih dari daftar pemilih. Akhirnya, mereka memperkirakan berapa banyak orang di sana yang masing-masing jenis pemilih di pemilih berdasarkan Sensus terbaru dan Survei Penduduk Tahunan (dengan beberapa informasi tambahan dari BES, data survei YouGov dari seluruh pemilihan umum, dan informasi pada berapa banyak orang sebagai untuk masing-masing pihak di setiap daerah pemilihan).
Tiga hari sebelum pemungutan suara, YouGov menunjukkan keunggulan dua poin untuk Tinggalkan. Pada malam suara, jajak pendapat menunjukkan terlalu dekat untuk menelepon (49-51 Tetap). Final studi on-the-hari diprediksi 48/52 mendukung Tetap (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Bahkan, perkiraan ini tidak terjawab hasil akhir (52-48 Tinggalkan) oleh empat poin persentase.
[ . ] Tulis simulasi untuk menggambarkan setiap kesalahan representasi pada Gambar 3.1.
[ . ] Penelitian Blumenstock dan rekan (2015) yang terlibat membangun model pembelajaran mesin yang bisa menggunakan jejak data digital untuk memprediksi respons survei. Sekarang, Anda akan mencoba hal yang sama dengan dataset yang berbeda. Kosinski, Stillwell, and Graepel (2013) menemukan bahwa Facebook suka dapat memprediksi sifat-sifat individu dan atribut. Anehnya, prediksi ini bisa menjadi lebih akurat dibandingkan dengan teman-teman dan kolega (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) penggunaan detail catatan panggilan (CDRs) dari ponsel untuk memprediksi tren pengangguran agregat.