2.4.3 근사 실험

우리는 우리가 할 수없는 실험에 근접 할 수 있습니다. 특히 디지털 시대의 혜택을 두 가지 방법이 일치하는 자연 실험을하고 있습니다.

많은 중요한 과학 및 정책 질문이 원인이다. 이제 생각해 보자, 예를 들어, 다음과 같은 질문 : 임금의 직업 훈련 프로그램의 효과는 무엇인가? 이 질문에 대답하는 한 가지 방법은 작업자가 임의로 훈련을 받거나 교육을받을 수 없습니다하는 중 할당 된 무작위 통제 실험이 될 것이다. 그런 다음 연구자들은 단순히 그것을받지 못한 것들에 대한 교육을받은 사람들의 임금을 비교함으로써 이들 참가자에 대한 교육의 효과를 추정 할 수있다.

랜덤 : 단순 비교로 인해 데이터도 수집하기 전에 발생 뭔가 유효합니다. 랜덤하지 않고, 문제는 더 복잡합니다. 연구원은 자발적으로 가입을하지 않은 사람들에게 훈련에 가입 한 사람들의 임금을 비교할 수 있습니다. 그 비교는 아마 교육을받은 사람들이 더 많이 벌었 다 보여,하지만 얼마나 많은이의 때문에 훈련이며, 가입 훈련 사람들이 가입하지 않는 훈련을 것과 다르기 때문에 얼마나 많은이의 무엇입니까? 즉, 사람이 두 그룹의 임금을 비교하는 공정이다?

공정한 비교에 대한이 문제는 실험을 실행하지 않고 인과 관계 추정을하는 것은 불가능하다고 생각하는 일부 연구자을 이끌고 있습니다. 이 주장은 너무 멀리 간다. 이 실험은 인과 효과에 대한 가장 강력한 증거를 제공하는 것은 사실이지만, 가치 인과 견적을 제공 할 수있는 다른 전략이있다. 대신 (수동적으로 데이터를 관찰하는 경우에는) 그 인과 추정치 (실험의 경우) 쉽거나 불가능하거나있는 사고, 연속 강한 내지 약한 (도 함께 누워 인과 추정하기위한 전략으로 생각하는 것이 좋다 2.4). 연속체의 강력한 끝에서 제어 실험을 무작위있다. 그러나, 이들은 종종 많은 치료가 정부 나 기업의 협력 비현실적인 금액을 필요로하기 때문에 사회 연구를 수행하기 어려운; 아주 간단하게 우리가 할 수없는 많은 실험이있다. 나는 강점과 무작위 대조 실험의 약점 모두 4 장을 모두 바칠 것, 그리고 어떤 경우에는, 실험 방법으로 관찰 선호하는 강한 윤리적 인 이유가 있다고 주장합니다.

그림 2.4 : 추정 인과 효과에 대한 연구 전략의 연속체.

그림 2.4 : 추정 인과 효과에 대한 연구 전략의 연속체.

연속체를 따라 이동, 연구자가 명시 적으로 무작위 배정하지 않은 경우가 있습니다. 즉, 연구진은 실제로 실험을하지 않고 실험과 같은 지식을 배울하려고한다; 당연히,이 까다로운 일이 될 것입니다,하지만 빅 데이터는 크게 이러한 상황에서 인과 관계 추정을 할 수있는 능력을 향상시킨다.

때로는 세계의 임의성이 연구자에 대한 실험 같은 것을 만드는 일 설정이 있습니다. 이러한 설계는 자연 실험라고하며, 그들 절 2.4.3.1에서 상세히 고려 될 것이다. 빅 데이터 소스-들은 항상 자연과의 두 가지 기능 크기는-크게 발생할 때 자연 실험에서 배울 수있는 우리의 능력을 향상시킵니다.

더 멀리 무작위 대조 실험에서 이동, 때로는 우리가 자연 실험에 근접하는 데 사용할 수있는 자연에도 이벤트가 없습니다. 이러한 설정에서는,주의 깊게 실험을 근사하기위한 시도가 아닌 실험 내에서 비​​교를 구성 할 수있다. 이러한 설계는 일치라고하며, 그들 절 2.4.3.2에서 상세히 고려 될 것이다. 자연 실험과 마찬가지로, 일치는 큰 데이터 소스에서 혜택을 디자인이다. 특히, 방대한 크기 두 경우의 수 및 유형에 따라 정보면에 케이스 - 크게 정합을 용이하게한다. 자연 실험과 일치의 주요 차이점은 자연 실험에서 연구자가 치료를 할당하고 무작위로 생각되었다되는 과정을 알고 있다는 것입니다.

자연 실험과 일치 : 실험을 수행 할 욕망을 자극 공정한 비교의 개념은 두 가지 다른 방식의 기초가. 이러한 접근 방식은 당신이 이미 가지고있는 데이터의 안에 앉아 공정한 비교를 발견하여 수동적으로 관찰 데이터에서 인과 효과를 추정 할 수있게된다.