2.4.3.1 eksperimen Asli

Eksperimen semula jadi mengambil kesempatan daripada peristiwa rawak di dunia. peristiwa rawak + sentiasa ke sistem data = eksperimen semula jadi

Kunci untuk eksperimen terkawal rawak membolehkan perbandingan yang adil adalah rawak itu. Walau bagaimanapun, kadang-kadang sesuatu yang berlaku di dunia yang pada dasarnya memberikan orang secara rawak atau hampir secara rawak untuk rawatan yang berbeza. Salah satu contoh yang paling jelas daripada strategi menggunakan eksperimen semula jadi datang dari penyelidikan Angrist (1990) yang mengukur kesan perkhidmatan tentera ke atas pendapatan.

Semasa perang di Vietnam, Amerika Syarikat meningkat saiz angkatan tenteranya melalui draf. Dalam usaha untuk membuat keputusan yang mana rakyat akan dipanggil ke dalam perkhidmatan, kerajaan AS diadakan loteri. Setiap tarikh lahir diwakili di atas sekeping kertas, dan kertas ini telah diletakkan di dalam balang kaca yang besar. Seperti yang ditunjukkan dalam Rajah 2.5, ini slip kertas telah diambil daripada balang satu demi satu untuk menentukan perintah itu bahawa orang muda akan dipanggil untuk berkhidmat (wanita muda tidak tertakluk kepada draf). Berdasarkan keputusan, lelaki yang lahir pada 14 September telah dipanggil pertama, lelaki yang lahir pada 24 April telah dipanggil kedua, dan sebagainya. Akhirnya, dalam loteri ini, manusia dilahirkan pada 195 hari yang berbeza dipanggil untuk perkhidmatan manakala lelaki dilahirkan pada 171 hari tidak dipanggil.

Rajah 2.5: Kongres Alexander Pirnie (R-NY) lukisan kapsul pertama untuk mendapatkan draf Selective Service pada 1 Disember, 1969. Joshua Angrist (1990) digabungkan draf loteri dengan data pendapatan daripada Pentadbiran Keselamatan Sosial untuk menganggarkan kesan perkhidmatan tentera atas pendapatan. Ini adalah satu contoh penyelidikan menggunakan eksperimen semula jadi. Sumber: Wikimedia Commons

Rajah 2.5: Kongres Alexander Pirnie (R-NY) lukisan kapsul pertama untuk mendapatkan draf Selective Service pada 1 Disember, 1969. Joshua Angrist (1990) digabungkan draf loteri dengan data pendapatan daripada Pentadbiran Keselamatan Sosial untuk menganggarkan kesan perkhidmatan tentera atas pendapatan. Ini adalah satu contoh penyelidikan menggunakan eksperimen semula jadi. Sumber: Wikimedia Commons

Walaupun ia mungkin tidak ketara, draf loteri mempunyai persamaan penting untuk percubaan terkawal rawak: dalam kedua-dua keadaan peserta secara rawak untuk menerima rawatan. Dalam kes draf loteri, jika kita berminat untuk mengetahui tentang kesan-kesan draf-kelayakan dan perkhidmatan tentera ke atas pendapatan pasaran buruh yang berikutnya, kita boleh membandingkan hasil bagi orang-orang yang tarikh lahir adalah di bawah potong loteri (contohnya, September 14, April 24, dan lain-lain) dengan hasil bagi orang-orang yang lahir adalah selepas potong (contohnya, February 20, 2 Disember, dan lain-lain).

Memandangkan rawatan ini sedang dirangka telah secara rawak, kita boleh mengukur kesan rawatan ini untuk apa-apa keputusan yang telah diukur. Sebagai contoh, Angrist (1990) digabungkan maklumat tentang siapa yang telah dipilih secara rawak dalam draf dengan data pendapatan yang telah dikumpulkan oleh Pentadbiran Keselamatan Sosial untuk membuat kesimpulan bahawa pendapatan veteran putih kira-kira 15% kurang daripada pendapatan setanding bukan veteran . Penyelidik lain telah menggunakan helah yang sama juga. Sebagai contoh, Conley and Heerwig (2011) digabungkan maklumat tentang siapa yang telah dipilih secara rawak dalam draf dengan data isi rumah yang dikumpul daripada Penyiasatan 2000 Banci dan 2005 American Community dan mendapati bahawa begitu lama selepas draf, terdapat sedikit kesan jangka panjang perkhidmatan tentera pada pelbagai hasil seperti tempoh perumahan (memiliki berbanding menyewa) dan kestabilan kediaman (kemungkinan telah bergerak sebelum lima tahun).

Sebagai contoh ini menggambarkan, kadang-kadang kuasa-kuasa sosial, politik, atau semula jadi membuat eksperimen atau hampir eksperimen yang boleh dimanfaatkan oleh penyelidik. Selalunya eksperimen semulajadi adalah cara yang terbaik untuk menganggarkan hubungan sebab dan akibat dalam tetapan di mana ia tidak beretika atau praktikal untuk menjalankan eksperimen terkawal rawak. Mereka adalah satu strategi yang penting untuk menemui perbandingan adil dalam data bukan eksperimen. strategi penyelidikan ini boleh dirumuskan oleh persamaan ini:

\ [\ teks {rawak (atau seolah-olah rawak) event} + \ teks {sentiasa ke aliran data} = \ teks {eksperimen semulajadi} \ qquad (2.1) \]

Walau bagaimanapun, analisis eksperimen semulajadi boleh menjadi agak rumit. Sebagai contoh, dalam kes draf Vietnam, bukan semua orang yang draf-layak akhirnya berkhidmat (terdapat pelbagai pengecualian). Dan, pada masa yang sama, beberapa orang yang tidak merangka-layak menawarkan diri untuk perkhidmatan. Ia seolah-olah dalam perbicaraan klinikal ubat baru, sesetengah orang dalam kumpulan rawatan tidak mengambil ubat mereka dan beberapa orang dalam kumpulan kawalan entah bagaimana menerima dadah. Masalah ini, yang dipanggil ketidakpatuhan dua belah bahagian, dan juga pelbagai masalah lain diterangkan dengan lebih terperinci dalam beberapa bacaan yang disyorkan pada akhir bab ini.

Strategi mengambil kesempatan yang berlaku secara semulajadi tugasan rawak mendahului era digital, tetapi kelaziman data besar membuat strategi ini lebih mudah untuk digunakan. Sebaik sahaja anda sedar beberapa rawatan telah secara rawak, sumber-sumber data yang besar boleh menyediakan data hasil yang anda perlukan untuk membandingkan keputusan bagi orang-orang dalam keadaan rawatan dan kawalan. Sebagai contoh, dalam kajiannya tentang kesan draf dan tentera perkhidmatan, Angrist dibuat menggunakan rekod pendapatan daripada Pentadbiran Keselamatan Sosial; tanpa ini data hasil, kajian beliau tidak mungkin dapat dicapai. Dalam kes ini, Pentadbiran Keselamatan Sosial adalah sentiasa ke sumber data yang besar. Oleh kerana lebih ramai dikumpul secara automatik sumber data wujud, kita akan mempunyai lebih banyak hasil data yang boleh mengukur kesan perubahan dicipta oleh perubahan luaran.

Untuk menggambarkan strategi ini dalam era digital, mari kita mempertimbangkan Mas dan Moretti ini (2009) penyelidikan elegan pada kesan rakan-rakan kepada produktiviti. Walaupun di permukaan ia mungkin kelihatan berbeza daripada kajian Angrist tentang kesan Draf Vietnam, dalam struktur kedua-dua mereka mengikut corak dalam persamaan. 2.1.

Mas dan Moretti diukur bagaimana rakan-rakan menjejaskan produktiviti pekerja. Dalam satu tangan, mempunyai rakan sebaya bekerja keras mungkin membawa pekerja untuk meningkatkan produktiviti mereka kerana tekanan rakan sebaya. Atau, di sisi lain, rakan sebaya bekerja keras mungkin menyebabkan pekerja lain untuk mengendur lebih. Cara yang paling jelas untuk mengkaji kesan peer kepada produktiviti akan menjadi percubaan terkawal rawak di mana pekerja secara rawak untuk syif dengan pekerja tahap produktiviti yang berbeza dan kemudian menyebabkan produktiviti diukur untuk semua orang. Penyelidik, bagaimanapun, tidak mengawal jadual pekerja dalam mana-mana perniagaan yang sebenar, dan sebagainya Mas dan Moretti terpaksa bergantung kepada satu eksperimen semula jadi yang berlaku di sebuah pasar raya.

Sama seperti persamaan. 2.1, kajian mereka mempunyai dua bahagian. Pertama, mereka menggunakan balak dari sistem pasaraya checkout mempunyai tepat, individu, dan sentiasa ke ukuran produktiviti: bilangan item diimbas sesaat. Dan, kedua, kerana cara penjadualan yang telah dilakukan di pasar raya ini, mereka mempunyai berhampiran komposisi rawak rakan-rakan. Dalam erti kata lain, walaupun penjadualan juruwang tidak ditentukan oleh loteri, ia pada dasarnya rawak. Dalam amalan, keyakinan yang kita ada dalam eksperimen semula jadi sering bergantung kepada yang munasabah ini "as-jika" tuntutan rawak. Mengambil kesempatan daripada variasi rawak ini, Mas dan Moretti mendapati bahawa bekerja dengan rakan-rakan produktiviti yang lebih tinggi meningkatkan produktiviti. Selanjutnya, Mas dan Moretti digunakan saiz dan kekayaan set data mereka untuk bergerak di luar anggaran sebab dan kesan untuk meneroka dua isu lebih penting dan halus: kepelbagaian kesan ini (yang mana jenis pekerja adalah kesan yang lebih besar) dan mekanisme belakang kesan (mengapa mempunyai rakan-rakan produktiviti yang tinggi membawa kepada produktiviti yang lebih tinggi). Kita akan kembali kepada kedua-dua penting isu kepelbagaian-kesan rawatan dan mekanisme-dalam Bab 5 apabila kita membincangkan eksperimen dengan lebih terperinci.

Generalisasi daripada kajian mengenai kesan Draf Vietnam ke atas pendapatan dan kajian kesan rakan-rakan kepada produktiviti, Jadual 2.3 meringkaskan kajian-kajian lain yang mempunyai struktur yang sama tepat: menggunakan sentiasa ke sumber data untuk mengukur kesan daripada beberapa peristiwa . Seperti Jadual 2.3 menjelaskan, eksperimen semula jadi di mana-mana jika anda hanya tahu bagaimana untuk mencari mereka.

Jadual 2.3: Contoh eksperimen semulajadi menggunakan sumber data yang besar. Kesemua kajian ini mengikuti resipi yang sama asas: rawak peristiwa (atau seolah-olah rawak) + sentiasa ke sistem data. Lihat Dunning (2012) untuk lebih banyak contoh.
tumpuan substantif Source eksperimen semula jadi Sentiasa ke data sumber Citation
Peer kesan kepada produktiviti proses penjadualan data checkout Mas and Moretti (2009)
pembentukan persahabatan taufan Facebook Phan and Airoldi (2015)
Spread emosi hujan Facebook Coviello et al. (2014)
Rakan sebaya untuk sebaya pemindahan ekonomi gempa bumi data wang mudah alih Blumenstock, Fafchamps, and Eagle (2011)
tingkah laku penggunaan peribadi 2013 US penutupan kerajaan data kewangan peribadi Baker and Yannelis (2015)
kesan ekonomi sistem recommender pelbagai data penyemakan imbas di Amazon Sharma, Hofman, and Watts (2015)
Kesan tekanan pada bayi dalam kandungan 2006 Israel-Hizbullah perang rekod kelahiran Torche and Shwed (2015)
Membaca tingkah laku di Wikipedia ayat-ayat Snowden balak Wikipedia Penney (2016)

Dalam amalan, penyelidik menggunakan dua strategi yang berbeza untuk mencari eksperimen semula jadi, kedua-duanya boleh membuahkan hasil. Sesetengah penyelidik bermula dengan sentiasa ke sumber data dan mencari peristiwa rawak di dunia; orang lain bermula dengan peristiwa rawak di dunia dan mencari sumber data yang menangkap kesannya. Akhir sekali, perhatikan bahawa kekuatan eksperimen semula jadi tidak datang dari kecanggihan analisis statistik, tetapi dari penjagaan dalam mencari perbandingan yang adil dicipta oleh kemalangan bernasib baik dalam sejarah.