2.4.3.1 thí nghiệm tự nhiên

Thí nghiệm tự nhiên tận dụng lợi thế của sự kiện ngẫu nhiên trên thế giới. sự kiện ngẫu nhiên + luôn-trên hệ thống dữ liệu = thử nghiệm tự nhiên

Chìa khóa để thí nghiệm kiểm soát ngẫu nhiên cho phép so sánh công bằng là sự ngẫu nhiên. Tuy nhiên, đôi khi một cái gì đó xảy ra trong thế giới mà chủ yếu giao cho người ngẫu nhiên hoặc gần như ngẫu nhiên để điều trị khác nhau. Một trong những ví dụ rõ ràng nhất về chiến lược của việc sử dụng thí nghiệm tự nhiên xuất phát từ nghiên cứu của Angrist (1990) , đo lường hiệu quả của các dịch vụ quân sự về thu nhập.

Trong cuộc chiến tranh ở Việt Nam, Hoa Kỳ tăng kích thước của các lực lượng vũ trang của mình thông qua một dự thảo. Để quyết định mà công dân sẽ được gọi vào dịch vụ, chính phủ Mỹ đã tổ chức xổ số. Mỗi ngày sinh đã được đại diện trên một mảnh giấy, và các giấy tờ đã được đặt trong một lọ thủy tinh lớn. Như thể hiện trong hình 2.5, các mảnh giấy đã được rút ra từ bình một lúc một thời gian để xác định thứ tự mà những người đàn ông trẻ tuổi sẽ được kêu gọi phục vụ (phụ nữ trẻ không chịu dự thảo). Dựa trên các kết quả, người đàn ông sinh ngày 14 tháng 9 được gọi là đầu tiên, người đàn ông sinh ra vào ngày 24 tháng được gọi là thứ hai, và như vậy. Cuối cùng, trong xổ số này, người đàn ông sinh ra trên 195 ngày khác nhau được gọi đến dịch vụ trong khi những người đàn ông sinh ra trên 171 ngày không được gọi.

Hình 2.5: Dân biểu Alexander Pirnie (R-NY) vẽ các viên nang đầu tiên cho dự thảo Selective Service trên 01 Tháng Mười Hai, 1969. Joshua Angrist (1990) kết hợp dự thảo xổ số với thu nhập dữ liệu từ Sở An Sinh Xã Hội để ước lượng ảnh hưởng của vụ quân sự về thu nhập. Đây là một ví dụ về nghiên cứu sử dụng một thử nghiệm tự nhiên. Nguồn: Wikimedia Commons

Hình 2.5: Dân biểu Alexander Pirnie (R-NY) vẽ các viên nang đầu tiên cho dự thảo Selective Service trên 01 Tháng Mười Hai, 1969. Joshua Angrist (1990) kết hợp dự thảo xổ số với thu nhập dữ liệu từ Sở An Sinh Xã Hội để ước lượng ảnh hưởng của vụ quân sự về thu nhập. Đây là một ví dụ về nghiên cứu sử dụng một thử nghiệm tự nhiên. Nguồn: Wikimedia Commons

Mặc dù nó có thể không được ngay lập tức rõ ràng, một dự thảo xổ số có một sự tương đồng quan trọng đối với một thí nghiệm ngẫu nhiên: trong cả hai trường hợp người tham gia được phân ngẫu nhiên để điều trị. Trong trường hợp dự thảo xổ số, nếu chúng ta quan tâm tìm hiểu về những tác động của dự thảo-hội đủ điều kiện và dịch vụ quân sự vào thu nhập của thị trường lao động tiếp theo, chúng ta có thể so sánh kết quả cho những người có ngày sinh sống dưới ngưỡng xổ số (ví dụ, 14 tháng chín, tháng tư 24, vv) với những kết quả cho những người có ngày sinh nhật là sau khi cắt (ví dụ, 20 tháng 2, ngày 02 tháng 12, vv).

Cho rằng điều trị này được soạn thảo đã được chỉ định ngẫu nhiên, sau đó chúng tôi có thể đo lường hiệu quả của điều trị này cho bất kỳ kết quả đó đã được đo. Ví dụ, Angrist (1990) kết hợp các thông tin về người được chọn ngẫu nhiên trong dự thảo với các dữ liệu thu nhập đã được thu thập bởi Cục quản lý an sinh xã hội để kết luận rằng thu nhập của các cựu chiến binh trắng thấp hơn so với thu nhập của đương phi cựu chiến binh khoảng 15% . các nhà nghiên cứu khác đã sử dụng một thủ thuật tương tự. Ví dụ, Conley and Heerwig (2011) kết hợp các thông tin về người được chọn ngẫu nhiên trong dự thảo với các dữ liệu hộ gia đình thu được từ việc khảo sát 2.000 điều tra dân số và 2005 cộng đồng Hoa Kỳ và thấy rằng quá lâu sau khi bản dự thảo, đã có ít ảnh hưởng lâu dài của nghĩa vụ quân sự trên nhiều kết quả như nhiệm kỳ của nhà ở (sở hữu so với cho thuê) và ổn định dân cư (khả năng có di chuyển trong năm năm trước).

Ví dụ này minh họa, đôi khi các lực lượng xã hội, chính trị, hoặc tự nhiên tạo ra những thí nghiệm hoặc gần các thí nghiệm có thể được thừa hưởng bởi các nhà nghiên cứu. Thường thí nghiệm tự nhiên là cách tốt nhất để ước lượng mối quan hệ nhân-quả trong các môi trường mà nó không phải là đạo đức hoặc thực hiện các thí nghiệm ngẫu nhiên có kiểm soát. Họ là một chiến lược quan trọng để phát hiện sự so sánh công bằng trong dữ liệu phi thực nghiệm. Chiến lược nghiên cứu này có thể được tóm tắt bằng phương trình này:

\ [\ text {ngẫu nhiên (hoặc như thể ngẫu nhiên) sự kiện} + \ text {luôn-trên dòng dữ liệu} = \ text {thí nghiệm tự nhiên} \ qquad (2.1) \]

Tuy nhiên, việc phân tích các thí nghiệm tự nhiên có thể được khá khó khăn. Ví dụ, trong trường hợp của các dự thảo Việt Nam, không phải tất cả những người dự thảo-hội đủ điều kiện đã kết thúc phục vụ (có nhiều ngoại lệ). Và, cùng một lúc, một số người đã không được dự thảo-hội đủ điều kiện tình nguyện phục vụ. Đó là nếu như trong một thử nghiệm lâm sàng một loại thuốc mới, một số người trong nhóm điều trị không dùng thuốc của họ và một số người trong nhóm kiểm soát bằng cách nào đó đã nhận được thuốc. Vấn đề này, được gọi là hai mặt không tuân thủ, cũng như nhiều vấn đề khác được mô tả chi tiết hơn trong một số các bài đọc khuyến cáo ở cuối chương này.

Chiến lược lợi dụng tự nhiên phân ngẫu nhiên đi trước thời đại số, nhưng tỷ lệ của dữ liệu lớn làm cho chiến lược này dễ dàng hơn nhiều để sử dụng. Một khi bạn nhận ra một số điều trị đã được chỉ định ngẫu nhiên, các nguồn dữ liệu lớn có thể cung cấp các dữ liệu kết quả mà bạn cần để so sánh các kết quả cho người dân trong điều kiện điều trị và kiểm soát. Ví dụ, trong nghiên cứu của ông về tác động của dự thảo và nghĩa vụ quân sự, Angrist đã sử dụng bản ghi thu nhập từ Cục An ninh xã hội; không có dữ liệu kết quả này, nghiên cứu của ông sẽ không thể thực hiện được. Trong trường hợp này, Cục An ninh xã hội là luôn luôn-trên nguồn dữ liệu lớn. Khi ngày càng tự động khác thu thập các nguồn dữ liệu tồn tại, chúng ta sẽ có dữ liệu kết quả hơn có thể đo lường tác động của những thay đổi được tạo ra bởi sự thay đổi ngoại sinh.

Để minh họa cho chiến lược này trong thời đại kỹ thuật số, chúng ta hãy xem xét Mas và Moretti của (2009) nghiên cứu thanh lịch về ảnh hưởng của các đồng nghiệp về năng suất. Mặc dù trên bề mặt nó có thể trông khác hơn so với nghiên cứu của Angrist về những tác động của Dự thảo Việt Nam, trong cấu trúc cả hai đều làm theo các mô hình trong eq. 2.1.

Mas và Moretti đo như thế nào đồng nghiệp ảnh hưởng đến năng suất của người lao động. Một mặt, có một peer khó làm việc có thể dẫn người lao động để tăng năng suất của họ, vì áp lực đồng đẳng. Hoặc, mặt khác, một peer làm việc chăm chỉ có thể dẫn người lao động khác để giảm bớt sự nhiệt nhiều hơn. Cách rõ ràng nhất để nghiên cứu tác dụng ngang hàng về năng suất sẽ là một điều khiển thí nghiệm ngẫu nhiên mà người lao động được phân ngẫu nhiên vào ca với người lao động của các mức năng suất khác nhau và sau đó kết quả là năng suất được đo cho tất cả mọi người. Các nhà nghiên cứu, tuy nhiên, không kiểm soát tiến độ của công nhân trong bất kỳ doanh nghiệp thực sự, và vì vậy Mas và Moretti đã phải dựa vào một thí nghiệm tự nhiên diễn ra tại một siêu thị.

Cũng giống như eq. 2.1, nghiên cứu của họ đã có hai phần. Đầu tiên, họ đã sử dụng các bản ghi từ các hệ thống siêu thị kiểm tra để có một chính xác, cá nhân, và luôn luôn-trên thước đo năng suất: số lượng các mục quét mỗi giây. Và thứ hai, vì cách lập lịch trình đã được thực hiện tại siêu thị này, họ đã gần sáng tác ngẫu nhiên của các đồng nghiệp. Nói cách khác, mặc dù lịch trình của thủ quỹ không được xác định bởi một số, đó là bản chất ngẫu nhiên. Trong thực tế, sự tự tin, chúng tôi có trong các thí nghiệm tự nhiên thường xuyên xoay quanh tính hợp lý của "như nếu" tuyên bố ngẫu nhiên này. Tận dụng lợi thế của sự biến đổi ngẫu nhiên này, Mas và Moretti thấy rằng làm việc với các đồng nghiệp năng suất cao hơn làm tăng năng suất. Hơn nữa, Mas và Moretti sử dụng kích thước và phong phú của bộ dữ liệu của họ để di chuyển vượt ra ngoài dự toán của các nguyên nhân và kết quả để khám phá hai vấn đề quan trọng và tinh tế hơn: không đồng nhất của hiệu ứng này (mà các loại nhân là ảnh hưởng lớn hơn) và cơ chế phía sau có hiệu lực (tại sao không có đồng nghiệp năng suất cao dẫn đến năng suất cao hơn). Chúng tôi sẽ trở lại với hai quan trọng vấn đề, không đồng nhất của hiệu quả điều trị và cơ chế trong Chương 5 khi chúng ta thảo luận về thí nghiệm chi tiết hơn.

Khái quát từ các nghiên cứu về tác động của Dự thảo Việt Nam trên thu nhập và các nghiên cứu về tác động của các đồng nghiệp về năng suất, Bảng 2.3 tóm tắt các nghiên cứu khác có cấu trúc tương tự chính xác này: sử dụng một luôn luôn-trên nguồn dữ liệu để đo lường tác động của một số sự kiện . Như Bảng 2.3 cho thấy rõ, các thí nghiệm tự nhiên ở khắp nơi nếu bạn chỉ biết làm thế nào để tìm kiếm chúng.

Bảng 2.3: Ví dụ về các thí nghiệm tự nhiên sử dụng nguồn dữ liệu lớn. Tất cả những nghiên cứu tiếp theo cùng một công thức cơ bản: sự kiện ngẫu nhiên (hoặc như thể ngẫu nhiên) + luôn-trên hệ thống dữ liệu. Xem Dunning (2012) để biết thêm các ví dụ.
tập trung nội dung Nguồn thí nghiệm tự nhiên Luôn luôn-trên dữ liệu nguồn Trích dẫn
Peer hưởng đến năng suất quá trình lập kế hoạch dữ liệu thanh toán Mas and Moretti (2009)
hình thành tình bạn bão Facebook Phan and Airoldi (2015)
Lây lan của cảm xúc mưa Facebook Coviello et al. (2014)
Ngang ngang nhau để chuyển giao kinh tế động đất dữ liệu tiền điện thoại di động Blumenstock, Fafchamps, and Eagle (2011)
hành vi tiêu dùng cá nhân 2013 tắt máy chính phủ Mỹ dữ liệu tài chính cá nhân Baker and Yannelis (2015)
Tác động kinh tế của hệ thống tư khác nhau dữ liệu duyệt web ở Amazon Sharma, Hofman, and Watts (2015)
Ảnh hưởng của stress lên thai nhi 2006 Israel-Hezbollah chiến tranh hồ sơ sinh Torche and Shwed (2015)
Đọc sách hành vi trên Wikipedia tiết lộ Snowden bản ghi Wikipedia Penney (2016)

Trong thực tế, các nhà nghiên cứu sử dụng hai chiến lược khác nhau cho việc tìm kiếm thí nghiệm tự nhiên, cả hai đều có thể được hiệu quả. Một số nhà nghiên cứu bắt đầu với sự luôn-trên nguồn dữ liệu và tìm kiếm các sự kiện ngẫu nhiên trên thế giới; những người khác bắt đầu với sự kiện ngẫu nhiên trên thế giới và tìm kiếm các nguồn dữ liệu mà chụp ảnh hưởng của họ. Cuối cùng, lưu ý rằng sức mạnh của các thí nghiệm tự nhiên không xuất phát từ sự tinh tế của các phân tích thống kê, nhưng từ việc chăm sóc trong việc khám phá một so sánh công bằng tạo ra bởi một tai nạn may mắn của lịch sử.