aktiviti

Kunci:

  • tahap kesukaran: mudah mudah , sederhana sederhana , keras keras , sangat susah sangat susah
  • memerlukan matematik ( memerlukan matematik )
  • memerlukan pengekodan ( memerlukan pengekodan )
  • pengumpulan data ( pengumpulan data )
  • kegemaran saya ( kegemaran saya )
  1. [ keras , memerlukan matematik ] Dalam bab ini, saya amat positif tentang pasca stratifikasi. Walau bagaimanapun, ia tidak sentiasa meningkatkan kualiti anggaran. Membina satu keadaan di mana boleh hantar-stratifikasi boleh mengurangkan kualiti anggaran. (Untuk petunjuk, lihat Thomsen (1973) ).

  2. [ keras , pengumpulan data , memerlukan pengekodan ] Design dan menjalankan kajian bukan kebarangkalian di Amazon MTurk untuk bertanya tentang pemilikan senjata api ( "Adakah anda, atau adakah sesiapa dalam keluarga anda, memiliki pistol, senapang atau pistol? Adakah itu anda atau orang lain di rumah anda?") Dan sikap terhadap kawalan senjata api ( "Apa yang anda fikir adalah lebih penting-untuk membela hak rakyat Amerika untuk memiliki senjata api, atau untuk mengawal pemilikan senjata api?").

    1. Berapa lama masa kajian anda ambil? Berapakah kos? Bagaimana demografi sampel anda berbanding dengan demografi penduduk Amerika Syarikat?
    2. Apakah anggaran mentah pemilikan senjata api menggunakan sampel anda?
    3. Betul untuk bukan kerepresentatifan sampel anda menggunakan post-stratifikasi atau beberapa teknik lain. Bukankah anggaran pemilikan senjata api?
    4. Bagaimana anggaran anda berbanding dengan anggaran terkini dari Pusat Penyelidikan Pew? Apa yang anda fikir menjelaskan percanggahan, jika ada apa-apa?
    5. Ulangi latihan 2-5 untuk sikap terhadap kawalan senjata api. Bagaimana penemuan anda berbeza?
  3. [ sangat susah , pengumpulan data , memerlukan pengekodan ] Goel dan rakan-rakan (2016) ditadbir kajian yang bukan berasaskan kebarangkalian yang terdiri daripada 49 soalan sikap aneka pilihan diambil daripada Tinjauan Umum Sosial (GSS) dan pilih kajian oleh Pusat Penyelidikan Pew di Amazon MTurk. Mereka kemudian laraskan untuk bukan kerepresentatifan bagi data menggunakan berdasarkan model-post-stratifikasi (Mr P), dan bandingkan anggaran diselaraskan dengan mereka dianggarkan menggunakan kaji selidik GSS / Pew berasaskan kebarangkalian. Menjalankan kajian yang sama pada MTurk dan cuba untuk meniru Rajah 2a dan Rajah 2b dengan membandingkan anggaran Anda yang disesuaikan dengan anggaran dari pusingan terbaru GSS / Pew (Lihat Lampiran Jadual A2 untuk senarai 49 soalan).

    1. Beza dan bandingkan keputusan anda kepada keputusan dari Pew dan GSS.
    2. Beza dan bandingkan keputusan anda kepada keputusan daripada kajian MTurk dalam Goel, Obeng, and Rothschild (2016) .
  4. [ sederhana , pengumpulan data , memerlukan pengekodan ] Banyak kajian menggunakan langkah-langkah diri laporan data aktiviti telefon bimbit. Ini adalah satu suasana yang menarik di mana penyelidik boleh membandingkan tingkah laku yang dilaporkan sendiri dengan tingkah laku dibalak (lihat contohnya, Boase and Ling (2013) ). Dua lumrah untuk bertanya tentang memanggil dan menghantar mesej, dan dua tempoh masa yang biasa ialah "semalam" dan "pada minggu lalu."

    1. Sebelum mengumpul sebarang data, yang mana satu laporan sendiri langkah-langkah yang anda fikir adalah lebih tepat? Mengapa?
    2. Mengambil 5 kawan-kawan anda untuk menjadi dalam kajian anda. Sila ringkaskan bagaimana 5 kawan-kawan telah disampel. Mungkin prosedur persampelan ini mendorong berat sebelah tertentu dalam anggaran anda?
    3. Sila bertanya kepada mereka berikut mikro kaji selidik:
    • "Berapa kali anda menggunakan telefon mudah alih untuk memanggil orang lain semalam?"
    • "Berapa banyak mesej teks adakah anda menghantar semalam?"
    • "Berapa kali anda menggunakan telefon mudah alih anda untuk memanggil orang lain dalam tempoh tujuh hari yang lalu?"
    • "Berapa kali adakah anda menggunakan telefon mudah alih anda untuk menghantar atau menerima mesej teks / SMS dalam tempoh tujuh hari yang lalu?" Setelah kajian selesai, tanya dengan data penggunaan mereka sebagai log melalui telefon atau pembekal perkhidmatan mereka.
    1. Bagaimanakah penggunaan laporan diri membandingkan untuk log data? Yang paling tepat, yang paling kurang tepat?
    2. Sekarang menggabungkan data yang anda telah mengumpul dengan data daripada orang lain di dalam kelas anda (jika anda sedang melakukan aktiviti ini untuk kelas a). Dengan set data yang lebih besar, ulangi bahagian (d).
  5. [ sederhana , pengumpulan data ] Schuman dan Presser (1996) berhujah bahawa perintah soalan akan perkara untuk dua jenis hubungan antara soalan: soalan bahagian-bahagian di mana dua soalan adalah pada tahap yang sama kekhususan (contohnya penilaian daripada dua calon presiden); dan soalan sambilan keseluruhan di mana soalan umum berikut soalan yang lebih khusus (contohnya bertanya "Adakah anda berpuas hati dengan kerja anda?" diikuti dengan "Adakah anda berpuas hati dengan hidup anda?").

    Dan mereka mencirikan dua jenis kesan usaha soalan: kesan konsisten berlaku apabila jawapan kepada soalan yang kemudian dibawa lebih dekat (daripada mereka akan sebaliknya) kepada orang-orang yang diberikan kepada soalan yang lebih awal; bezakan kesan berlaku apabila terdapat perbezaan yang besar antara jawapan kepada dua soalan.

    1. Mencipta sepasang soalan bahagian-bahagian yang anda fikir akan mempunyai kesan yang besar bagi soalan, sepasang soalan bahagian-keseluruhan yang anda fikir akan mempunyai kesan perintah yang besar, dan sepasang lagi soalan yang perintah yang anda fikir tidak akan perkara. Menjalankan eksperimen kajian mengenai MTurk untuk menguji soalan anda.
    2. Bagaimana besar adalah kesan bahagian-bahagian yang dapat anda buat? Adakah ia satu kesan konsisten atau sebaliknya?
    3. Bagaimana besar adalah kesan sambilan keseluruhannya yang dapat anda buat? Adakah ia satu kesan konsisten atau sebaliknya?
    4. Adakah terdapat kesan susunan soalan dalam pasangan anda di mana anda tidak fikir perintah itu akan perkara?
  6. [ sederhana , pengumpulan data ] Membina di atas kerja-kerja Schuman dan Presser, Moore (2002) menerangkan dimensi yang berasingan kesan usaha soalan: bahan tambahan dan Luak. Walaupun kontras dan konsisten kesan yang dihasilkan akibat daripada penilaian responden terhadap dua perkara berhubung dengan satu sama lain, bahan tambahan dan kesan Luak dihasilkan apabila responden adalah lebih sensitif kepada rangka kerja yang lebih besar di mana soalan-soalan yang diajukan. Baca Moore (2002) , kemudian mereka bentuk dan menjalankan eksperimen kajian mengenai MTurk untuk menunjukkan bahan tambahan atau Luak kesan.

  7. [ keras , pengumpulan data ] Christopher Antoun dan rakan-rakan (2015) telah menjalankan satu kajian membandingkan sampel mudah diperolehi daripada empat yang berbeza sumber merekrut talian: MTurk, Craigslist, Google AdWords dan Facebook. Rekabentuk kajian yang mudah dan merekrut peserta melalui sekurang-kurangnya dua sumber dalam talian merekrut berbeza (mereka boleh menjadi sumber yang berbeza dari empat sumber yang digunakan dalam Antoun et al. (2015) ).

    1. Bandingkan kos setiap rekrut, dari segi wang dan masa, antara sumber-sumber yang berbeza.
    2. Bandingkan komposisi sampel yang diperolehi daripada sumber-sumber yang berbeza.
    3. Bandingkan kualiti data antara sampel. Untuk idea tentang bagaimana untuk mengukur kualiti data daripada responden, lihat Schober et al. (2015) .
    4. Apakah sumber pilihan anda? Mengapa?
  8. [ sederhana ] YouGov, sebuah firma penyelidikan pasaran berasaskan internet, yang dijalankan undian dalam talian panel kira-kira 800,000 responden di UK dan digunakan Encik P. untuk meramalkan hasil daripada EU Referendum (iaitu, Brexit) di mana pengundi UK mengundi sama ada untuk kekal di dalam atau meninggalkan Kesatuan Eropah.

    Keterangan terperinci model statistik YouGov adalah di sini (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Kira-kira bercakap, YouGov sekatan pengundi ke dalam jenis berdasarkan 2015 pilihan raya umum undi pilihan, umur, kelayakan, jantina, tarikh temuduga, serta kawasan yang mereka tinggal. Pertama, mereka menggunakan data yang dikumpul daripada ahli panel YouGov untuk menganggarkan, di kalangan mereka yang mengundi, peratusan orang setiap jenis pengundi yang berhasrat untuk mengundi Cuti. Mereka menganggarkan jumlah kehadiran setiap jenis pengundi dengan menggunakan 2015 British Kajian Pilihan Raya (BES) selepas pilihan raya muka-ke-muka Tinjauan ini, yang disahkan keluar mengundi daripada daftar pemilih. Akhirnya, mereka menganggarkan berapa ramai orang yang terdapat bagi setiap jenis pengundi pengundi berdasarkan Banci terbaru dan Ukur Penduduk Tahunan (dengan beberapa maklumat tambahan dari BES, kajian data YouGov dari seluruh pilihan raya umum, dan maklumat mengenai berapa ramai orang mengundi setiap pihak di setiap kawasan).

    Tiga hari sebelum undi, YouGov menunjukkan kelebihan dua mata untuk Cuti. Pada malam sebelum pengundian, pengundian menunjukkan terlalu dekat dengan panggilan (49-51 Kekal). kajian on-the-hari terakhir meramalkan 48/52 memihak kepada Kekal (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Malah, anggaran ini terlepas keputusan akhir (52-48 Cuti) dengan empat mata peratusan.

    1. Menggunakan rangka kerja ralat kajian jumlah dibincangkan dalam bab ini untuk menilai apa yang boleh pergi salah.
    2. sambutan YouGov selepas pilihan raya (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) menjelaskan: "Ini seolah-olah di bahagian yang besar kerana jumlah kehadiran - sesuatu yang kita katakan selama ini akan menjadi penting kepada hasil apa-apa bangsa yang halus seimbang. model kehadiran kami adalah berdasarkan, sebahagiannya, sama ada responden telah mengundi pada pilihan raya umum lepas dan tahap keluar mengundi atas bahawa pilihan raya umum kecewa model, terutamanya di Utara. "Adakah ini menukar jawapan kepada bahagian (a)?
  9. [ sederhana , memerlukan pengekodan ] Tulis simulasi untuk menggambarkan setiap kesilapan perwakilan dalam Rajah 3.1.

    1. Mewujudkan keadaan di mana kesilapan ini sebenarnya membatalkan.
    2. Mewujudkan keadaan di mana kesilapan mengkompaun satu sama lain.
  10. [ sangat susah , memerlukan pengekodan ] The penyelidikan Blumenstock dan rakan-rakan (2015) yang terlibat membina model pembelajaran mesin yang boleh menggunakan data surih digital untuk meramal respons kajian. Sekarang, anda akan cuba perkara yang sama dengan set data yang berbeza. Kosinski, Stillwell, and Graepel (2013) mendapati bahawa Facebook suka boleh meramalkan sifat-sifat individu dan sifat-sifat. Yang menghairankan, ramalan-ramalan ini boleh menjadi lebih tepat berbanding dengan rakan-rakan dan rakan-rakan (Youyou, Kosinski, and Stillwell 2015) .

    1. Baca Kosinski, Stillwell, and Graepel (2013) , dan meniru Rajah 2. Data mereka boleh didapati di sini: http://mypersonality.org/
    2. Sekarang, meniru Rajah 3.
    3. Akhir sekali, cuba model mereka pada data Facebook anda sendiri: http://applymagicsauce.com/. Sejauh manakah ia berfungsi untuk anda?
  11. [ sederhana ] Toole et al. (2015) rekod penggunaan panggilan terperinci (CDR) dari telefon mudah alih untuk meramalkan trend pengangguran agregat.

    1. Membanding dan membezakan reka bentuk Toole et al. (2015) dengan Blumenstock, Cadamuro, and On (2015) .
    2. Adakah anda fikir CDRs perlu menggantikan kajian tradisional, melengkapkan mereka atau tidak digunakan sama sekali untuk pembuat dasar kerajaan untuk mengesan pengangguran? Mengapa?
    3. Apakah bukti yang akan meyakinkan anda bahawa CDRs benar-benar boleh menggantikan langkah-langkah tradisional kadar pengangguran?