2.4.3.1 자연 실험

자연 실험은 세계의 임의의 이벤트를 이용한다. 랜덤 이벤트 + 항상 데이터 시스템 = 자연 실험

공정한 비교를 가능하게 무작위 대조 실험의 핵심은 랜덤입니다. 그러나 가끔 뭔가 근본적으로 다른 치료에 무작위로 랜덤하게 또는 거의 사람들을 할당 세계에서 발생합니다. 자연적인 실험을 사용하는 전략의 명확한 실시 예 중 하나의 연구로부터 온다 Angrist (1990) 실적 군 서비스의 효과를 측정한다.

베트남 전쟁 동안, 미국은 초안을 통해 군대의 크기를 증가했다. 서비스로 호출 할 것이다 시민을 결정하기 위해, 미국 정부는 추첨을 가졌다. 모든 생년월일이 종이에 표시하고,이 논문은 대형 유리 병에 넣었다. 그림 2.5에 나타낸 바와 같이, 종이의 이러한 전표 젊은 남자가 (젊은 여성이 초안이 적용되지 않은) 봉사하도록 부름 될 순서를 결정하기 위해 한 번에 단지 하나에서 도출되었다. 결과를 바탕으로 9 월 14 일에 태어난 사람은 그래서 4 월 24 일에 태어난 남자가 두 번째라고했다, 첫째라고 하였다. 171일에 태어난 남자가 호출되지 않은 상태에서 궁극적으로,이 복권에, 195 다른 일에 태어난 사람은 서비스라고했다.

그림 2.5 년 12 월 1 일에 선택적 서비스 초안에 대한 첫 번째 캡슐을 그리는 하원 의원 알렉산더 Pirnie (R-NY)은 병역의 효과를 추정하기 위해 사회 보장국 (Social Security Administration)에서 실적 데이터 초안 복권 1969 여호수아 Angrist (1990)를 결합 실적에. 이것은 자연 실험을 이용하여 조사하는 예이다. 출처 : 위키 미디어 공용

그림 2.5 년 12 월 1 일에 선택적 서비스 초안에 대한 첫 번째 캡슐을 그리는 하원 의원 알렉산더 Pirnie (R-NY)은 1969 년 여호수아 Angrist (1990) 병역의 효과를 추정하기 위해 사회 보장국 (Social Security Administration)에서 실적 데이터 초안 추첨을 결합 실적에. 이것은 자연 실험을 이용하여 조사하는 예이다. 출처 : 위키 미디어 공용

즉시 나타나지 않을 수도 있지만, 초안 추첨은 무작위 대조 실험에 중요한 유사성을 가지고 두 경우 모두에서 참가자들은 무작위로 치료를받을 할당됩니다. 초안 복권의 경우, 우리는 초안 자격 이후 노동 시장 실적에 병역의 효과에 대해 학습에 관심이 있다면, 우리는 그 생년월일 (복권 차단 밑에 있었다 사람들을 위해 결과를 비교할 수 있습니다 예를 들어 9 월 14 월 생일 컷오프 후 명 있었다 (예를 들면 2 월 20 일 12 월 2 등)에 대한 결과 24 등).

드래프트되는이 처리는 임의로 할당 된 것을 고려할 때를 측정 한 결과 모든이 치료의 효과를 측정 할 수있다. 예를 들어, Angrist (1990) 무작위로 흰색 참전 용사의 실적 비교가 아닌 베테랑의 실적보다 약 15 % 이하라고 결론을 내릴 수있는 사회 보장국 (Social Security Administration)에 의해 수집 된 실적 데이터 초안에서 선택한 사람에 대한 정보를 결합 . 다른 연구자도 비슷한 트릭을 사용했다. 예를 들어, Conley and Heerwig (2011) 무작위로 2000 년 인구 조사에서 2005 년 미국 지역 사회 실태 조사에서 수집 된 가정용 데이터 초안에서 선택한 사람에 대한 정보를 결합 너무 오래 초안 후, 거의 장기적인 효과가 있다는 것을 발견 이러한 주택 보유 (임대 대 소유)​​ 및 주거 안정성 (지난 5 년 동안 이동 한 가능성)와 같은 결과의 다양한에 병역.

이 예에서 보듯, 때로는 사회적, 정치적, 또는 자연의 힘은 실험이나 연구자들에 의해 활용 될 수 있습니다 가까운 실험을 만듭니다. 무작위 실험을 실행 윤리적 비실용적이고 종종 자연 실험 설정의 인과 관계를 추정 할 수있는 가장 좋은 방법이다. 그들은 비 실험 데이터에 공정한 비교를 발견하기위한 중요한 전략이다. 이 연구 전략이 방정식으로 요약 될 수있다 :

\ [\ 텍스트 {무작위 (랜덤 것처럼) 이벤트} + \ 텍스트 {항상 데이터 스트림} = \ 텍스트 {자연 실험} \ qquad (2.1) \]

그러나, 천연의 실험 분석은 상당히 까다로울 수있다. 예를 들어, 베트남 초안의 경우, 모든 사람 초안 자격 봉사 결국 누구 (면제의 다양한 있었다). 그리고 동시에, 초안-자격이되지 않은 일부 사람들은 서비스를위한 자원. 새로운 약물의 임상 시험에서, 처리 군의 일부 사람들이 약을 복용하지 않은 경우 대조군 일부 사람들 든 약물을받은이 있었다. 이 양면 위반이라는 문제뿐만 아니라 다른 많은 문제점이 장 끝에 권장 판독 일부에서 더 상세히 설명된다.

자연적으로 무작위 할당을 발생 활용의 전략은 디지털 시대에 선행하지만, 빅 데이터의 유병률은 사용이 전략이 훨씬 쉬워집니다. 당신은 어떤 치료가 무작위로 할당 된 실현되면, 빅 데이터 소스를 사용하면 처리 및 제어 상태에서 인물에 대한 결과를 비교하기 위해 필요한 결과 데이터를 제공 할 수 있습니다. 예를 들어, 초안과 병역의 효과에 자신의 연구에서, Angrist는 사회 보장국 (Social Security Administration)에서 실적 기록을 사용했다; 이 결과 자료없이, 그의 연구는 불가능했을 것입니다. 이 경우, 사회 보장국 (Social Security Administration)은 항상 큰 데이터 소스입니다. 점점 자동으로 수집 된 데이터 소스가 존재할 때, 우리는 외인성 변화에 의해 작성된 변화의 효과를 측정 할 수있는 더 많은 결과 데이터를 가질 것이다.

디지털 시대에이 전략을 설명하기 위해 마스와 모레티의 생각 해보자 (2009) 생산성에 동료의 효과에 우아한 연구. 표면에이 구조에서, 베트남 초안의 효과에 대한 Angrist의 연구와 다를 수 있지만 둘 다 EQ의 패턴을 따른다. 2.1.

마스와 모레티는 동료 근로자의 생산성에 미치는 영향을 측정했다. 한편, 하드 작업 피어를 갖는 때문에 또래 집단의 압력의 생산성을 높이기 위해 직원을 이끌 수 있습니다. 또는, 한편, 열심히 피어 더욱 느슨하게 다른 작업자 이어질 수있다. 생산성에 피어 효과를 연구 할 수있는 명확한 방법 것 작업자가 임의로 다른 생산성 수준의 근로자와 변화에 할당 한 다음 그 결과 생산성이 모두 측정하는 무작위 대조 실험합니다. 연구진은 그러나, 실제 사업에 근로자의 일정을 제어하지 않는, 그래서 마스와 모레티는 슈퍼마켓에서 일어난 자연 실험에 의존해야했다.

그냥 EQ 등을들 수있다. 2.1, 그들의 연구는 두 부분을 가지고 있었다. 첫째, 정확한 개별이 슈퍼마켓 계산대 시스템에서 로그를 사용하고, 생산성을 측정 상시 초당 검사 항목의 수. 그리고, 두 번째, 그 때문에 일정이 슈퍼마켓에서 수행 된 방식으로, 그들은 동료의 임의의 조성 근처에 있습니다. 즉, 점원의 스케쥴링 추첨에 의해 결정되지 않더라도, 그것은 본질적으로 랜덤이었다. 실제로, 우리는 자연 실험에서이 자신감과 자주 "로-경우"임의의 주장의 타당성에 달려있다. 이 임의의 변형을 활용, 마스와 모레티는 더 높은 생산성 동료들과 작업하는 생산성을 증가 시킨다는 것을 발견했다. 또한, 마스와 모레티이 더 중요하고 미묘한 문제를 탐구하는 원인과 결과의 추정을 넘어 이동하는 크기와 자신의 데이터 세트의 풍요 로움을 사용 : (노동자의 종류가 효과가 크다있는)이 효과의 이질성과 메커니즘을 효과 뒤에 (왜 높은 생산성 동료가 더 높은 생산성으로 이어질 필요하지 않습니다). 우리가보다 상세하게 실험을 논의 할 때 우리는 치료 효과 및 메커니즘 인 제 5 장이 두 가지 중요한 문제-이질성으로 돌아갑니다.

실적과 생산성에 동료 효과의 연구에 베트남 초안의 효과에 대한 연구에서 일반화, 표 2.3이 동일한 구조를 가지고 다른 연구를 요약 :는 항상-에 데이터 소스 일부 이벤트의 영향을 측정하기 위해 사용 . 표 2.3은 명확하게 당신은 단지 그들을 찾는 방법을 알고있는 경우에, 자연 실험은 도처에있다.

표 2.3 : 빅 데이터 소스를 사용하여 자연 실험의 예. 무작위 (랜덤 것처럼) 이벤트 + 데이터 시스템 상시 : 이러한 모든 연구는 동일한 기본 조리법을 따르십시오. 보기 Dunning (2012) 추가 예제.
실질적인 초점 자연 실험 자료 항상 데이터 소스 소환
생산성에 영향을 피어 예약 프로세스 체크 아웃 데이터 Mas and Moretti (2009)
우정 형성 태풍 페이스 북 Phan and Airoldi (2015)
감정의 확산 페이스 북 Coviello et al. (2014)
경제 전송을 피어 투 피어 지진 모바일 돈 데이터 Blumenstock, Fafchamps, and Eagle (2011)
개인 소비 행동 2013 미국 정부의 종료 개인 금융 데이터 Baker and Yannelis (2015)
추천 시스템의 경제적 영향 여러 아마존에서 인터넷 사용 정보 Sharma, Hofman, and Watts (2015)
태아에 대한 스트레스의 영향 2006 이스라엘 - 헤즈볼라 전쟁 출생 기록 Torche and Shwed (2015)
위키 백과에 동작을 읽기 스노 덴의 계시 위키 백과 로그 Penney (2016)

실제로, 연구진은 생육 할 수 있습니다 둘 다 자연 실험을 찾기위한 두 가지 전략을 사용합니다. 일부 연구자들은 데이터 상시 소스로 시작하고 세계의 랜덤 이벤트를 찾습니다; 다른 사람은 세계에서 랜덤 이벤트로 시작하고 그 영향을 캡처 데이터 소스를 찾습니다. 마지막으로, 자연 실험의 강도는 통계 분석의 정교함에서하지 온다, 그러나 역사의 운이 사고에 의해 생성 된 공정한 비교를 발견의 치료에서 알 수 있습니다.