aktiviti

  • darjah kesukaran: mudah mudah , sederhana sederhana , keras keras , sangat susah sangat susah
  • memerlukan matematik ( memerlukan matematik )
  • memerlukan pengekodan ( memerlukan pengekodan )
  • pengumpulan data ( pengumpulan data )
  • kegemaran saya ( kegemaran saya )
  1. [ sederhana , pengumpulan data ] Berinsky dan rakan-rakan (2012) menilai MTurk sebahagiannya dengan mereplikasi tiga eksperimen klasik. Ulangi eksperimen pembingkaian Penyakit Asia klasik oleh Tversky and Kahneman (1981) . Adakah keputusan anda sepadan dengan Tversky dan Kahneman? Adakah keputusan anda berpadanan dengan Berinsky dan rakan sekerja? Apa-kalau apa-apakah ini mengajar kita tentang menggunakan MTurk untuk eksperimen tinjauan?

  2. [ sederhana , kegemaran saya ] Dalam kertas yang agak lidah-dalam-pipi yang bertajuk "Kita Harus Berputus," psikologi sosial Robert Cialdini, salah seorang pengarang Schultz et al. (2007) , menulis bahawa dia bersara awal dari tugasnya sebagai seorang profesor, sebahagiannya kerana cabaran yang dia hadapi melakukan eksperimen bidang dalam disiplin (psikologi) yang terutama menjalankan percobaan lab (Cialdini 2009) . Baca kertas Cialdini, dan tulis dia e-mel yang mendesaknya untuk menimbang semula pemecahannya berdasarkan kemungkinan eksperimen digital. Gunakan contoh penyelidikan khusus yang membincangkan kebimbangannya.

  3. [ sederhana ] Untuk menentukan sama ada kejayaan awal kecil dikunci atau hilang, van de Rijt dan rakan-rakan (2014) campur tangan ke dalam empat sistem yang berbeza yang berjaya mencapai peserta secara rawak, dan kemudian mengukur kesan jangka panjang kejayaan sewenang-wenangnya. Bolehkah anda memikirkan sistem lain di mana anda boleh menjalankan eksperimen yang sama? Evaluasi sistem ini dari segi isu nilai saintifik, pengertian algoritma (lihat bab 2), dan etika.

  4. [ sederhana , pengumpulan data ] Keputusan eksperimen boleh bergantung kepada peserta. Buat percubaan dan kemudian jalankan pada MTurk menggunakan dua strategi pengambilan yang berbeza. Cuba memilih strategi eksperimen dan pengambilan supaya keputusannya berbeza . Sebagai contoh, strategi pengambilan anda mungkin untuk merekrut peserta pada waktu pagi dan petang atau untuk mengimbangi peserta dengan gaji tinggi dan rendah. Jenis-jenis perbezaan dalam strategi pengambilan boleh membawa kepada kumpulan peserta yang berlainan dan hasil eksperimen yang berlainan. Berapa perbezaan keputusan anda? Apakah yang didedahkan mengenai percubaan pada MTurk?

  5. [ sangat susah , memerlukan matematik , memerlukan pengekodan ] Bayangkan anda sedang merancang eksperimen Contagion Emosi (Kramer, Guillory, and Hancock 2014) . Gunakan hasil dari kajian pemerhatian sebelumnya oleh Kramer (2012) untuk menentukan jumlah peserta dalam setiap keadaan. Kedua-dua kajian ini tidak sepadan dengan sempurna jadi pastikan anda menyenaraikan semua anggapan yang anda buat dengan jelas:

    1. Jalankan simulasi yang akan menentukan berapa banyak peserta yang diperlukan untuk mengesan kesan yang besar seperti kesan dalam Kramer (2012) dengan \(\alpha = 0.05\) dan \(1 - \beta = 0.8\) .
    2. Lakukan pengiraan yang sama secara analitik.
    3. Memandangkan keputusan dari Kramer (2012) adalah Perampingan Emosi (Kramer, Guillory, and Hancock 2014) lebih berkuasa (iaitu, adakah ia mempunyai lebih ramai peserta daripada yang diperlukan)?
    4. Dari andaian yang anda buat, yang mempunyai kesan terbesar pada pengiraan anda?
  6. [ sangat susah , memerlukan matematik , memerlukan pengekodan ] Jawab soalan sebelumnya sekali lagi, tetapi kali ini daripada menggunakan kajian pemerhatian sebelumnya oleh Kramer (2012) , gunakan hasil dari eksperimen semula jadi oleh Lorenzo Coviello et al. (2014) .

  7. [ mudah ] Kedua-dua Margetts et al. (2011) dan van de Rijt et al. (2014) melakukan eksperimen mengkaji proses orang yang menandatangani petisyen. Bandingkan dan kontras reka bentuk dan penemuan kajian ini.

  8. [ mudah ] Dwyer, Maki, and Rothman (2015) menjalankan dua eksperimen lapangan mengenai hubungan antara norma sosial dan tingkah laku pro-alam sekitar. Inilah abstrak kertas mereka:

    "Bagaimana sains psikologi dapat digunakan untuk menggalakkan tingkah laku proenvironmental? Dalam dua kajian, intervensi yang bertujuan untuk menggalakkan tingkah laku pemuliharaan tenaga di bilik mandi awam meneliti pengaruh norma deskriptif dan tanggungjawab peribadi. Dalam Kajian 1, status cahaya (iaitu, dihidupkan atau dimatikan) dimanipulasi sebelum seseorang memasuki bilik mandi awam yang tidak didiami, menandakan norma deskriptif untuk tetapan itu. Peserta jauh lebih cenderung untuk mematikan lampu jika ia dimatikan apabila mereka memasuki. Dalam Kajian 2, satu syarat tambahan dimasukkan di mana norma mematikan cahaya ditunjukkan oleh persatuan, tetapi peserta tidak bertanggungjawab untuk menghidupkannya. Tanggungjawab peribadi menyederhanakan pengaruh norma sosial terhadap tingkah laku; apabila peserta tidak bertanggungjawab untuk menghidupkan cahaya, pengaruh norma berkurang. Keputusan ini menunjukkan bagaimana norma deskriptif dan tanggungjawab peribadi dapat mengawal keberkesanan campur tangan masyarakat. "

    Baca kertas mereka dan reka bentuk kajian ulangan 1.

  9. [ sederhana , pengumpulan data ] Membina soalan sebelumnya, kini menjalankan reka bentuk anda.

    1. Bagaimanakah perbandingannya?
    2. Apa yang boleh menjelaskan perbezaan ini?
  10. [ sederhana ] Terdapat perdebatan besar mengenai eksperimen menggunakan peserta yang diambil dari MTurk. Pada masa yang sama, terdapat juga perdebatan besar mengenai eksperimen menggunakan peserta yang diambil dari populasi pelajar sarjana muda. Tulis memo dua halaman membandingkan dan membezakan Turkers dan mahasiswa sebagai peserta penyelidikan. Perbandingan anda harus termasuk perbincangan mengenai isu saintifik dan logistik.

  11. [ mudah ] Buku Jim Manzi yang tidak terkawal (2012) adalah pengenalan yang indah kepada kuasa eksperimen dalam perniagaan. Dalam buku itu dia menyampaikan kisah berikut:

    "Saya pernah bertemu dengan seorang jenius perniagaan yang benar, seorang jutawan buatan sendiri yang mempunyai pengertian yang mendalam dan intuitif tentang kuasa eksperimen. Syarikatnya menghabiskan banyak sumber daya yang cuba membuat paparan jendela besar yang akan menarik pengguna dan meningkatkan jualan, seperti yang dikatakan oleh kebiasaan konvensional. Pakar reka bentuk yang diuji dengan berhati-hati selepas reka bentuk, dan dalam sesi kajian ujian individu dalam tempoh beberapa tahun terus menunjukkan tiada kesan sebabkan penting bagi setiap reka bentuk paparan baru mengenai penjualan. Eksekutif eksekutif pemasaran dan dagangan bertemu dengan Ketua Pegawai Eksekutif untuk mengkaji semula keputusan ujian sejarah ini di toto. Setelah menyampaikan semua data percubaan, mereka menyimpulkan bahawa kebijaksanaan konvensional adalah salah-tingkap yang memaparkan tidak memacu jualan. Tindakan yang disyorkan adalah untuk mengurangkan kos dan usaha di kawasan ini. Ini secara dramatik menunjukkan keupayaan percubaan untuk membatalkan kebijaksanaan konvensional. Tanggapan Ketua Pegawai Eksekutif adalah mudah: 'Kesimpulan saya ialah pereka anda tidak begitu baik.' Penyelesaiannya adalah untuk meningkatkan usaha dalam reka bentuk paparan kedai, dan untuk mendapatkan orang baru untuk melakukannya. " (Manzi 2012, 158–9)

    Jenis kesahihan apakah yang menjadi kebimbangan Ketua Pegawai Eksekutif?

  12. [ mudah ] Membina soalan sebelumnya, bayangkan bahawa anda berada di mesyuarat di mana hasil eksperimen dibincangkan. Apakah empat soalan yang boleh anda tanyakan-satu untuk setiap jenis kesahihan (statistik, pembinaan, dalaman, dan luaran)?

  13. [ mudah Bernedo, Ferraro, and Price (2014) mengkaji kesan tujuh tahun intervensi penjimatan air yang diterangkan dalam Ferraro, Miranda, and Price (2011) (lihat Rajah 4.11). Dalam makalah ini, Bernedo dan rakan-rakan juga berusaha untuk memahami mekanisme di sebalik kesannya dengan membandingkan tingkah laku isi rumah yang telah dan belum dipindahkan setelah rawatan disampaikan. Iaitu, secara kasar, mereka cuba melihat sama ada rawatan memberi kesan kepada rumah atau pemilik rumah.

    1. Bacalah kertas kerja, huraikan reka bentuk mereka, dan saksikan penemuan mereka.
    2. Adakah penemuan mereka memberi kesan bagaimana anda harus menilai keberkesanan kos campur tangan yang serupa? Jika ya, mengapa? Jika tidak, mengapa tidak?
  14. [ mudah ] Dalam tindak lanjut kepada Schultz et al. (2007) , Schultz dan rakan-rakan melakukan tiga eksperimen mengenai kesan norma deskriptif dan injunctif terhadap tingkah laku alam sekitar yang berbeza (penggunaan semula tuala) dalam dua konteks (sebuah hotel dan kondominium timeshare) (Schultz, Khazian, and Zaleski 2008) .

    1. Merumuskan reka bentuk dan penemuan ketiga-tiga eksperimen ini.
    2. Bagaimana, jika sekalipun, adakah mereka menukar tafsiran anda terhadap Schultz et al. (2007) ?
  15. [ mudah ] Sebagai tindak balas kepada Schultz et al. (2007) , Canfield, Bruin, and Wong-Parodi (2016) menjalankan satu siri percubaan seperti lab untuk mengkaji reka bentuk bil elektrik. Berikut adalah cara mereka menerangkannya dalam abstrak:

    "Dalam satu percubaan berasaskan tinjauan, setiap peserta menyaksikan bil elektrik hipotetikal bagi keluarga yang mempunyai penggunaan elektrik yang agak tinggi, yang meliputi maklumat mengenai (a) penggunaan sejarah, (b) perbandingan dengan jiran, dan (c) kegunaan bersejarah dengan pecahan perkakas. Peserta melihat semua jenis maklumat dalam satu daripada tiga format termasuk (a) jadual, (b) graf bar, dan (c) grafik ikon. Kami melaporkan kepada tiga penemuan utama. Pertama, pengguna memahami setiap jenis maklumat penggunaan elektrik yang paling banyak apabila dibentangkan dalam jadual, mungkin kerana jadual memudahkan bacaan titik mudah. Kedua, keutamaan dan niat untuk menjimatkan elektrik adalah yang paling kuat untuk maklumat penggunaan sejarah, bebas dari format. Ketiga, individu yang mempunyai literasi tenaga yang lebih rendah memahami semua maklumat yang kurang. "

    Tidak seperti kajian lanjutan lain, hasil utama minat dalam Canfield, Bruin, and Wong-Parodi (2016) dilaporkan tingkah laku, bukan tingkah laku sebenar. Apakah kekuatan dan kelemahan kajian jenis ini dalam program penyelidikan yang lebih luas yang mempromosikan penjimatan tenaga?

  16. [ sederhana , kegemaran saya ] Smith and Pell (2003) menyampaikan analisis meta-satirikal kajian menunjukkan keberkesanan parasut. Mereka membuat kesimpulan:

    "Seperti banyak campur tangan yang bertujuan untuk menghalang kesihatan yang tidak baik, keberkesanan parasut terjatuh tidak dinilai dengan teliti dengan menggunakan ujian terkawal rawak. Penasihat perubatan berasaskan bukti telah mengkritik penerimaan campur tangan yang dinilai hanya dengan menggunakan data pemerhatian. Kami fikir bahawa semua orang akan mendapat manfaat jika protagonis yang paling radikal dari ubat berasaskan bukti menganjurkan dan mengambil bahagian dalam percubaan dua silang, rawak, plasebo terkawal, crossover parasut itu. "

    Tulis op ed yang sesuai untuk akhbar umum-pembaca, seperti New York Times , dengan alasan terhadap fetishisasi bukti percubaan. Berikan contoh-contoh khusus dan konkrit. Petunjuk: Lihat juga Deaton (2010) dan Bothwell et al. (2016) .

  17. [ sederhana , memerlukan pengekodan , kegemaran saya ] Penganggar perbezaan dalam perbezaan kesan rawatan boleh lebih tepat daripada penganggar perbezaan dalam-min. Tulis memo kepada seorang jurutera yang bertanggungjawab terhadap ujian A / B pada syarikat media sosial yang memulakan penjelasan nilai pendekatan perbezaan-dalam-perbezaan untuk menjalankan percubaan dalam talian. Memo itu harus merangkumi penyataan masalah, beberapa gerak hati mengenai syarat-syarat di mana penaksir perbezaan-dalam-perbezaan akan melebihi penganggaran perbezaan dalam maksud, dan kajian simulasi yang mudah.

  18. [ mudah , kegemaran saya ] Gary Loveman adalah seorang profesor di Harvard Business School sebelum menjadi CEO Harrah, salah sebuah syarikat kasino terbesar di dunia. Apabila dia berpindah ke Harrah, Loveman mengubah syarikat itu dengan program kesetiaan serentak seperti yang sering mengumpul sejumlah data mengenai tingkah laku pelanggan. Di atas sistem pengukuran yang selalu ini, syarikat itu mula menjalankan eksperimen. Sebagai contoh, mereka mungkin menjalankan percubaan untuk menilai kesan kupon untuk malam hotel percuma untuk pelanggan dengan corak perjudian tertentu. Begini bagaimana Loveman menggambarkan pentingnya percubaan untuk amalan perniagaan Harrah setiap hari:

    "Ia seperti anda tidak mengganggu wanita, anda tidak mencuri, dan anda perlu mempunyai kumpulan kawalan. Ini adalah salah satu perkara yang anda boleh kehilangan pekerjaan anda di Harrah's - tidak menjalankan kumpulan kawalan. " (Manzi 2012, 146)

    Tulis e-mel kepada pekerja baru yang menjelaskan mengapa Loveman fikir ia sangat penting untuk mempunyai kumpulan kawalan. Anda perlu cuba memasukkan contoh-sama ada benar atau dibuat-untuk menggambarkan maksud anda.

  19. [ keras , memerlukan matematik ] Satu eksperimen baru bertujuan untuk menganggarkan kesan menerima peringatan mesej teks mengenai pengambilan vaksinasi. Seratus lima puluh klinik, masing-masing dengan 600 pesakit yang layak, bersedia untuk mengambil bahagian. Terdapat kos tetap $ 100 untuk setiap klinik yang anda ingin bekerjasama, dan kos $ 1 untuk setiap mesej teks yang anda ingin hantar. Tambahan lagi, mana-mana klinik yang anda bekerjasama akan mengukur hasilnya (sama ada seseorang menerima vaksinasi) secara percuma. Anggapkan bahawa anda mempunyai belanjawan sebanyak $ 1,000.

    1. Di bawah keadaan apa mungkin lebih baik untuk memfokuskan sumber anda ke sebilangan kecil klinik dan di bawah keadaan apa mungkin lebih baik untuk menyebarkannya dengan lebih meluas?
    2. Faktor apa yang akan menentukan saiz kesan terkecil yang anda dapat mengesan secara pasti dengan anggaran anda?
    3. Tulis memo yang menjelaskan perkara ini kepada pembiaya yang berpotensi.
  20. [ keras , memerlukan matematik ] Masalah utama dengan kursus dalam talian adalah gangguan: ramai pelajar yang memulakan kursus akhirnya keluar. Bayangkan anda bekerja di platform pembelajaran dalam talian, dan seorang pereka di platform telah mencipta bar kemajuan visual yang difikirkannya akan membantu mencegah pelajar berhenti dari kursus. Anda ingin menguji kesan bar kemajuan pada pelajar dalam kursus sains sosial komputasi yang besar. Selepas menangani sebarang isu etika yang mungkin timbul dalam eksperimen, anda dan rakan-rakan anda bimbang bahawa kursus itu mungkin tidak mempunyai pelajar yang cukup untuk mengesan kesan bar perkembangan. Dalam pengiraan berikut, anda boleh mengandaikan bahawa separuh daripada pelajar akan menerima bar kemajuan dan separuh tidak. Selanjutnya, anda boleh mengandaikan bahawa tiada gangguan. Dalam erti kata lain, anda boleh mengandaikan bahawa peserta hanya dipengaruhi oleh sama ada mereka menerima rawatan atau kawalan; mereka tidak dilaksanakan sama ada orang lain menerima rawatan atau kawalan (untuk definisi yang lebih formal, lihat bab 8 Gerber and Green (2012) ). Jejaki apa-apa andaian tambahan yang anda buat.

    1. Katakan bar kemajuan dijangka akan meningkatkan nisbah pelajar yang menamatkan kelas dengan 1 mata peratusan; apakah saiz sampel yang diperlukan untuk mengesan kesannya?
    2. Katakan bar kemajuan dijangka akan meningkatkan nisbah pelajar yang menamatkan kelas dengan 10 mata peratusan; apakah saiz sampel yang diperlukan untuk mengesan kesannya?
    3. Sekarang bayangkan bahawa anda telah menjalankan eksperimen ini, dan pelajar yang telah menyelesaikan semua bahan kursus telah mengambil peperiksaan akhir. Apabila anda membandingkan skor peperiksaan akhir pelajar yang menerima bar kemajuan dengan skor orang yang tidak, anda dapati, banyak yang mengejutkan anda, bahawa pelajar yang tidak menerima bar kemajuan sebenarnya menjaringkan lebih tinggi. Adakah ini bermakna bahawa bar kemajuan menyebabkan pelajar kurang belajar? Apa yang anda boleh belajar dari data hasil ini? (Petunjuk: Lihat bab 7 dari Gerber and Green (2012) )
  21. [ sangat susah , memerlukan pengekodan , kegemaran saya ] Bayangkan bahawa anda bekerja sebagai ahli sains data di syarikat teknologi. Seseorang dari jabatan pemasaran meminta bantuan anda dalam menilai percubaan yang mereka merancang untuk mengukur pulangan pelaburan (ROI) untuk kempen iklan dalam talian yang baru. ROI ditakrifkan sebagai keuntungan bersih dari kempen yang dibahagikan dengan kos kempen. Sebagai contoh, kempen yang tidak memberi kesan kepada jualan akan mempunyai ROI sebanyak -100%; kempen dimana keuntungan yang dihasilkan adalah sama dengan kos akan mempunyai ROI sebanyak 0; dan kempen di mana keuntungan yang dihasilkan adalah dua kali ganda kos akan mempunyai ROI sebanyak 200%.

    Sebelum melancarkan percubaan, jabatan pemasaran memberikan anda maklumat berikut berdasarkan kajian terdahulu mereka (sebenarnya, nilai-nilai ini adalah tipikal dari kempen iklan dalam talian sebenar yang dilaporkan dalam Lewis dan Rao (2015) ):

    • Purata jualan setiap pelanggan mengikuti taburan log-normal dengan min $ 7 dan sisihan piawai $ 75.
    • Kempen ini dijangka meningkatkan jualan sebanyak $ 0.35 setiap pelanggan, yang sepadan dengan peningkatan keuntungan $ 0.175 setiap pelanggan.
    • Saiz rancangan yang dirancang ialah 200,000 orang: separuh dalam kumpulan rawatan dan separuh dalam kumpulan kawalan.
    • Kos kempen adalah $ 0.14 setiap peserta.
    • ROI yang dijangka untuk kempen adalah 25% [ \((0.175 - 0.14)/0.14\) ]. Dalam erti kata lain, jabatan pemasaran percaya bahawa untuk setiap 100 dolar dibelanjakan untuk pemasaran, syarikat akan memperoleh tambahan $ 25 keuntungan.

    Tulis memo yang menilai eksperimen yang dicadangkan ini. Memo anda harus menggunakan bukti dari simulasi yang anda buat, dan ia harus membahas dua isu utama: (1) Adakah anda mengesyorkan melancarkan percubaan ini seperti yang dirancang? Jika ya, mengapa? Jika tidak, mengapa tidak? Pastikan jelas mengenai kriteria yang anda gunakan untuk membuat keputusan ini. (2) Saiz sampel apa yang anda cadangkan untuk eksperimen ini? Sekali lagi pastikan anda jelas tentang kriteria yang anda gunakan untuk membuat keputusan ini.

    Memo yang baik akan menangani kes tertentu ini; memo yang lebih baik akan umum daripada kes ini dalam satu cara (cth. tunjukkan bagaimana perubahan keputusan sebagai fungsi saiz kesan kempen); dan memo yang hebat akan membentangkan hasil keseluruhan yang menyeluruh. Memo anda harus menggunakan graf untuk membantu menggambarkan hasil anda.

    Berikut adalah dua petunjuk. Pertama, jabatan pemasaran mungkin memberikan anda beberapa maklumat yang tidak perlu, dan mungkin mereka gagal memberi anda beberapa maklumat yang diperlukan. Kedua, jika anda menggunakan R, sedar bahawa fungsi rlnorm () tidak berfungsi dengan cara yang diharapkan oleh ramai orang.

    Aktiviti ini akan memberi anda latihan dengan analisis kuasa, mewujudkan simulasi, dan menyampaikan hasil anda dengan perkataan dan graf. Ia harus membantu anda menjalankan analisis kuasa untuk apa-apa jenis percubaan, bukan hanya eksperimen yang direka untuk menganggar ROI. Aktiviti ini mengandaikan bahawa anda mempunyai pengalaman dengan ujian statistik dan analisis kuasa. Sekiranya anda tidak biasa dengan analisis kuasa, saya cadangkan anda membaca "A Power Primer" oleh Cohen (1992) .

    Aktiviti ini diilhamkan oleh kertas indah oleh RA Lewis and Rao (2015) , yang jelas menggambarkan batasan statistik asas eksperimen besar-besaran. Kertas mereka-yang pada mulanya mempunyai tajuk provokatif "Pada Keadaan Berhampiran Mengukur Pulangan untuk Pengiklanan" -bayangkan betapa sukarnya untuk mengukur pulangan pelaburan iklan dalam talian, walaupun dengan eksperimen digital yang melibatkan berjuta-juta pelanggan. Lebih umum, RA Lewis and Rao (2015) menggambarkan fakta statistik asas yang sangat penting untuk eksperimen usia digital: sukar untuk menganggarkan kesan rawatan kecil di tengah-tengah data hasil bising.

  22. [ sangat susah , memerlukan matematik ] Adakah sama dengan soalan sebelumnya, tetapi, bukannya simulasi, anda harus menggunakan hasil analisis.

  23. [ sangat susah , memerlukan matematik , memerlukan pengekodan ] Lakukan sama dengan soalan sebelumnya, tetapi gunakan kedua-dua simulasi dan hasil analisis.

  24. [ sangat susah , memerlukan matematik , memerlukan pengekodan ] Bayangkan bahawa anda telah menulis memo yang diterangkan di atas, dan seseorang dari jabatan pemasaran menyediakan satu maklumat baru: mereka mengharapkan korelasi 0.4 antara jualan sebelum dan selepas eksperimen. Bagaimanakah perubahan cadangan ini dalam memo anda? (Petunjuk: lihat seksyen 4.6.2 untuk lebih lanjut mengenai penganggar perbezaan antara dan perbezaan penganggar perbezaan.)

  25. [ keras , memerlukan matematik ] Untuk menilai keberkesanan program bantuan pekerjaan berasaskan web yang baru, sebuah universiti menjalankan percubaan kawalan rawak di kalangan 10,000 pelajar yang memasuki tahun akhir sekolah mereka. Langganan percuma dengan maklumat log masuk unik dihantar melalui jemputan e-mel eksklusif kepada 5,000 pelajar yang dipilih secara rawak, sementara 5,000 pelajar lain berada dalam kumpulan kawalan dan tidak mempunyai langganan. Dua belas bulan kemudian, satu tinjauan susulan (tanpa respons tidak) menunjukkan bahawa dalam kedua-dua kumpulan rawatan dan kawalan, 70% pelajar telah memperoleh pekerjaan sepenuh masa dalam bidang pilihan mereka (jadual 4.6). Oleh itu, perkhidmatan berasaskan web tidak memberi kesan.

    Walau bagaimanapun, saintis data pintar di universiti melihat data sedikit lebih rapat dan mendapati hanya 20% pelajar dalam kumpulan rawatan yang pernah masuk ke akaun setelah menerima e-mel. Lebih jauh lagi, dan agak mengejutkan, di kalangan mereka yang masuk ke laman web, hanya 60% telah memperoleh pekerjaan sepenuh masa dalam bidang pilihan mereka, yang lebih rendah daripada kadar bagi orang yang tidak log masuk dan lebih rendah daripada kadar untuk orang dalam keadaan kawalan (jadual 4.7).

    1. Sediakan penjelasan mengenai apa yang mungkin berlaku.
    2. Apakah dua cara yang berbeza untuk mengira kesan rawatan dalam eksperimen ini?
    3. Memandangkan keputusan ini, patutkah perkhidmatan ini diberikan kepada semua pelajar? Hanya untuk menjadi jelas, ini bukan soalan dengan jawapan yang mudah.
    4. Apa yang perlu mereka lakukan seterusnya?

    Petunjuk: Persoalan ini melampaui bahan yang dibahas dalam bab ini, tetapi menangani isu yang lazim dalam eksperimen. Reka bentuk jenis eksperimen ini kadang-kadang dipanggil reka bentuk galakan kerana peserta digalakkan terlibat dalam rawatan. Masalah ini adalah contoh dari apa yang disebut ketidakpatuhan satu sisi (lihat bab 5 Gerber and Green (2012) ).

  26. [ keras ] Selepas pemeriksaan lanjut, ternyata percubaan yang dijelaskan dalam soalan sebelumnya lebih rumit. Ternyata 10% orang di dalam kumpulan kawalan membayar akses kepada perkhidmatan tersebut, dan mereka mencapai 65% (jadual 4.8).

    1. Tulis e-mel yang meringkaskan apa yang anda fikir sedang berlaku dan cadangkan tindakan.

    Petunjuk: Persoalan ini melampaui bahan yang dibahas dalam bab ini, tetapi menangani isu yang lazim dalam eksperimen. Masalah ini adalah contoh dari apa yang disebut ketidakpatuhan dua sisi (lihat bab 6 dari Gerber and Green (2012) ).

Jadual 4.6: Paparan Mudah Data dari Eksperimen Perkhidmatan Karier
Kumpulan Saiz Kadar pekerjaan
Memandangkan akses ke laman web 5,000 70%
Tidak diberikan akses ke laman web 5,000 70%
Jadual 4.7: Paparan Lengkap Data daripada Eksperimen Perkhidmatan Karier
Kumpulan Saiz Kadar pekerjaan
Memandangkan akses ke laman web dan log masuk 1,000 60%
Memandangkan akses ke laman web dan tidak pernah masuk 4,000 72.5%
Tidak diberikan akses ke laman web 5,000 70%
Jadual 4.8: Paparan Penuh Data dari Eksperimen Perkhidmatan Kerjaya
Kumpulan Saiz Kadar pekerjaan
Memandangkan akses ke laman web dan log masuk 1,000 60%
Memandangkan akses ke laman web dan tidak pernah masuk 4,000 72.5%
Tidak diberi akses ke laman web dan membayarnya 500 65%
Tidak diberikan akses ke laman web dan tidak membayar untuknya 4,500 70.56%