Математические заметки

В этом приложении я обобщу некоторые идеи о том, чтобы сделать причинный вывод из неэкспериментальных данных в несколько более математической форме. Существует два основных подхода: структура причинного графа, наиболее связанная с Иудеей Перл и его коллегами, и структура потенциальных результатов, наиболее связанные с Дональдом Рубином и его коллегами. Я представлю структуру потенциальных результатов, потому что она более тесно связана с идеями в математических заметках в конце главы 3 и 4. Для получения дополнительной информации о структуре причинных графов я рекомендую Pearl, Glymour, and Jewell (2016) (вводный ) и Pearl (2009) (продвинутый). Для изучения причинно-следственной логики в книжной форме, которая объединяет структуру потенциальных результатов и структуру причинного графа, я рекомендую Morgan and Winship (2014) .

Цель этого приложения - помочь вам устроиться с нотацией и стилем традиции потенциальных результатов, чтобы вы могли перейти к некоторым из более технических материалов, написанных на эту тему. Во-первых, я опишу структуру потенциальных результатов. Затем я буду использовать его для дальнейшего обсуждения естественных экспериментов, подобных тому, что Angrist (1990) о влиянии военной службы на заработок. Это приложение в значительной степени опирается на Imbens and Rubin (2015) .

Потенциальные рамки результатов

Структура потенциальных результатов состоит из трех основных элементов: единиц , методов лечения и потенциальных результатов . Чтобы проиллюстрировать эти элементы, давайте рассмотрим стилизованную версию вопроса, затронутого в Angrist (1990) : Каков эффект военной службы на заработок? В этом случае мы можем определить единицы, которые будут людьми, имеющими право на проект 1970 года в Соединенных Штатах, и мы можем индексировать этих людей с помощью \(i = 1, \ldots, N\) . Лечение в этом случае может быть «служить в армии» или «не служить в армии». Я назову их условиями лечения и контроля, и я напишу \(W_i = 1\) если человек \(i\) находится в условии обработки и \(W_i = 0\) если человек \(i\) находится в контрольном условии. Наконец, потенциальные результаты более концептуально сложны, поскольку они предполагают «потенциальные» результаты; вещи, которые могли произойти. Для каждого человека, имеющего право на проект 1970 года, мы можем представить сумму, которую они заработали бы в 1978 году, если бы они служили в армии, которую я назову \(Y_i(1)\) , и сумму, которую они заработали бы в 1978, если они не служили в армии, которую я назову \(Y_i(0)\) . В структуре потенциальных исходов \(Y_i(1)\) и \(Y_i(0)\) считаются фиксированными величинами, а \(W_i\) - случайной величиной.

Выбор единиц, лечения и результатов имеет решающее значение, поскольку он определяет, что можно и не может извлечь из исследования. Выбор единиц - людей, имеющих право на проект 1970 года, - не включает женщин, и поэтому без дополнительных предположений это исследование не расскажет нам ничего о влиянии военной службы на женщин. Решения о том, как определять лечение и результаты, также важны. Например, следует ли сосредоточить внимание на интересе к служению в армии или в бою? Должен ли результат интереса заработать или удовлетворенность работой? В конечном счете выбор единиц, лечения и результатов должен определяться научными и политическими целями исследования.

Учитывая выбор единиц, лечения и потенциальных результатов, причинный эффект лечения на человека \(i\) , \(\tau_i\) , является

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Другими словами, мы сравниваем, сколько человек \(i\) заработал бы после того, как служил бы, сколько человек \(i\) заработал бы без обслуживания. Для меня, экв. 2.1 является самым ясным способом определения причинно-следственного эффекта, и хотя это очень просто, эта структура оказывается обобщаемой многими важными и интересными способами (Imbens and Rubin 2015) .

При использовании структуры потенциальных результатов я часто считаю полезным выписать таблицу, показывающую потенциальные результаты и эффекты лечения для всех подразделений (таблица 2.5). Если вы не можете представить себе такую ​​таблицу для своего исследования, то вам может потребоваться уточнить ваши определения ваших подразделений, методы лечения и возможные результаты.

Таблица 2.5: Таблица потенциальных результатов
Человек Заработок в условиях лечения Заработок в условиях контроля Эффект лечения
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Имею в виду \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Однако при определении причинного эффекта таким образом мы сталкиваемся с проблемой. Почти во всех случаях мы не можем наблюдать как потенциальные результаты. То есть, конкретный человек либо служил, либо не служил. Поэтому мы наблюдаем один из потенциальных результатов - \(Y_i(1)\) или \(Y_i(0)\) но не оба. Неспособность наблюдать как потенциальные исходы является такой большой проблемой, что Holland (1986) назвала ее фундаментальной проблемой причинного вывода .

К счастью, когда мы проводим исследования, у нас есть не только один человек; скорее, у нас много людей, и это предлагает путь вокруг фундаментальной проблемы причинного вывода. Вместо того, чтобы оценивать эффект лечения на индивидуальном уровне, мы можем оценить средний эффект лечения для всех единиц:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Это уравнение все еще выражается через \(\tau_i\) , которые ненаблюдаемы, но с некоторой алгеброй (eq 2.8 Gerber and Green (2012) ), получаем

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Это показывает, что если мы сможем оценить средний результат по лечению при лечении ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) и средний результат популяции под контролем ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), то мы можем оценить средний лечебный эффект, даже без оценки эффекта лечения для любого конкретного человека.

Теперь, когда я определил нашу оценку и то, что мы пытаемся оценить, я перейду к тому, как мы можем оценить ее с помощью данных. И здесь мы непосредственно сталкиваемся с проблемой, что мы наблюдаем только один из потенциальных результатов для каждого человека; мы видим, что \(Y_i(0)\) или \(Y_i(1)\) (таблица 2.6). Мы могли бы оценить средний эффект лечения, сравнивая доходы людей, которые служили заработка людей, которые не служили:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

где \(N_t\) и \(N_c\) - количество людей в условиях лечения и контроля. Этот подход будет хорошо работать, если назначение лечения не зависит от потенциальных результатов, которое иногда называется невежеством . К сожалению, в отсутствие эксперимента невежество не всегда выполняется, что означает, что оценка в уравнении 2.4 вряд ли даст хорошую оценку. Один из способов думать об этом заключается в том, что в отсутствие случайного назначения лечения, экв. 2.4 не сравнивается, как с подобным; он сравнивает доходы разных людей. Или выраженные несколько разные, без случайного назначения лечения, распределение лечения, вероятно, связано с потенциальными результатами.

В главе 4 я опишу, как рандомизированные контролируемые эксперименты могут помочь исследователям сделать каузальные оценки, и здесь я опишу, как исследователи могут использовать естественные эксперименты, такие как лотерея.

Таблица 2.6: Таблица наблюдаемых результатов
Человек Заработок в условиях лечения Заработок в условиях контроля Эффект лечения
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Имею в виду ? ? ?

Естественные

Один из подходов к созданию причинно-следственных оценок без проведения эксперимента - это поиск чего-то в мире, который случайно назначил вам лечение. Этот подход называется естественными экспериментами . Во многих ситуациях, к сожалению, природа не произвольно доставляет лечение, которое вы хотите, чтобы заинтересованная популяция. Но иногда природа случайным образом обеспечивает соответствующее лечение. В частности, я рассмотрю случай, когда есть вторичное лечение, которое побуждает людей получать первичное лечение . Например, этот проект можно рассматривать как случайное назначенное вторичное лечение, которое побуждало некоторых людей к первичному лечению, которое служило в армии. Этот дизайн иногда называют дизайном поощрения . И метод анализа, который я опишу для обработки этой ситуации, иногда называют инструментальными переменными . В этой ситуации, с некоторыми предположениями, исследователи могут использовать поощрение, чтобы узнать о влиянии первичного лечения для определенного подмножества единиц.

Для того, чтобы обрабатывать два разных метода лечения - поощрение и первичное лечение - нам нужны новые обозначения. Предположим, что некоторые люди произвольно составлены ( \(Z_i = 1\) ) или не составлены ( \(Z_i = 0\) ); в этой ситуации \(Z_i\) иногда называют инструментом .

Среди тех, кто был составлен, некоторые служили ( \(Z_i = 1, W_i = 1\) ), а некоторые не ( \(Z_i = 1, W_i = 0\) ). Аналогично, среди тех, кто не был составлен, некоторые служили ( \(Z_i = 0, W_i = 1\) ), а некоторые не ( \(Z_i = 0, W_i = 0\) ). Потенциальные результаты для каждого человека теперь могут быть расширены, чтобы показать их статус как для поощрения, так и для лечения. Например, пусть \(Y(1, W_i(1))\) является заработком человека \(i\) если он был составлен, где \(W_i(1)\) является его статусом обслуживания, если он составлен. Кроме того, мы можем разделить население на четыре группы: компиляторы, никогда не принимающие участие, защитники и всегда принимающие решения (таблица 2.7).

Таблица 2.7: Четыре типа людей
Тип Сервис, если он составлен Сервис, если не составлен
законопослушных Да, \(W_i(Z_i=1) = 1\) Нет, \(W_i(Z_i=0) = 0\)
Никогда-берущие Нет, \(W_i(Z_i=1) = 0\) Нет, \(W_i(Z_i=0) = 0\)
Defiers Нет, \(W_i(Z_i=1) = 0\) Да, \(W_i(Z_i=0) = 1\)
Всегда-берущие Да, \(W_i(Z_i=1) = 1\) Да, \(W_i(Z_i=0) = 1\)

Прежде чем обсуждать оценку эффекта лечения (например, военную службу), мы можем сначала определить два эффекта поощрения (т. Е. Составление). Во-первых, мы можем определить влияние поощрения на первичное лечение. Во-вторых, мы можем определить влияние поощрения на результат. Оказывается, эти два эффекта можно объединить, чтобы дать оценку влияния лечения на определенную группу людей.

Во-первых, эффект поощрения на лечение может быть определен для человека \(i\) как

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Кроме того, эта величина может быть определена по всей совокупности как

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Наконец, мы можем оценить \(\text{ITT} _{W}\) используя данные:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

где \(\bar{W}^{\text{obs}}_1\) - наблюдаемая скорость лечения для тех, кого поощряли, и \(\bar{W}^{\text{obs}}_0\) является наблюдаемый курс лечения для тех, кто не поощрялся. \(\text{ITT}_W\) также иногда называют скоростью поглощения .

Затем эффект поощрения на результат может быть определен для человека \(i\) следующим образом:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Кроме того, эта величина может быть определена по всей совокупности как

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Наконец, мы можем оценить \(\text{ITT}_{Y}\) используя данные:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

где \(\bar{Y}^{\text{obs}}_1\) - наблюдаемый результат (например, прибыль) для тех, кого поощряли (например, составленные) и \(\bar{W}^{\text{obs}}_0\) является наблюдаемым результатом для тех, кто не поощрялся.

Наконец, мы обращаем наше внимание на эффект интереса: влияние первичного обращения (например, военной службы) на результат (например, заработок). К сожалению, оказывается, что вообще нельзя оценивать этот эффект для всех единиц. Однако, с некоторыми предположениями, исследователи могут оценить влияние лечения на лиц, подающих жалобу (то есть людей, которые будут служить, если они составлены, и людей, которые не будут служить, если не составлены, таблица 2.7). Я назову эту оценку и средний причинно-следственный эффект (CACE) (который также иногда называют местным средним эффектом лечения , ПОЗЖЕ):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

где \(G_i\) жертвует группу человека \(i\) (см. таблицу 2.7), а \(N_{\text{co}}\) - это количество compliers. Другими словами, уравнение 2.11 сравнивает доходы претендентов, которые составлены \(Y_i(1, W_i(1))\) и не составлены \(Y_i(0, W_i(0))\) . Оценка и в уравнении 2.11, по-видимому, сложно оценить по наблюдаемым данным, потому что невозможно идентифицировать собеседников, использующих только наблюдаемые данные (чтобы знать, является ли кто-то нарушителем, вам нужно будет наблюдать, служил ли он при составлении и служил ли он, когда он не был составлен).

Оказывается - что-то удивительно: если есть какие-либо компиляторы, то при условии, что вы делаете три дополнительных предположения, можно оценить CACE по наблюдаемым данным. Во-первых, следует предположить, что назначение лечения является случайным. В случае лотереи это разумно. Однако в некоторых случаях, когда естественные эксперименты не зависят от физической рандомизации, это предположение может быть более проблематичным. Во-вторых, нужно предположить, что они не являются защитниками (это предположение иногда также называют предположением монотонности). В контексте проекта представляется разумным предположить, что очень мало людей, которые не будут служить, если они будут составлены и будут служить, если они не будут составлены. В-третьих, и, наконец, приходит самое важное предположение, которое называется ограничением исключения . При ограничении исключения необходимо предположить, что весь эффект назначения лечения передается через лечение. Другими словами, следует предположить, что нет прямого эффекта поощрения результатов. Например, в случае проекта лотереи необходимо предположить, что статус проекта не влияет на доходы, кроме как на военную службу (рисунок 2.11). Ограничение исключения может быть нарушено, если, например, люди, которые были призваны, потратили больше времени в школе, чтобы избежать обслуживания, или если работодатели с меньшей вероятностью наняли людей, которые были призваны.

Рисунок 2.11. Ограничение на исключение требует, чтобы поощрение (проект лотереи) влияло на результат (заработок) только на лечение (военная служба). Ограничение исключения может быть нарушено, если, например, люди, которые были призваны, потратили больше времени в школе, чтобы избежать обслуживания, и что это увеличение времени в школе привело к увеличению заработка.

Рисунок 2.11. Ограничение на исключение требует, чтобы поощрение (проект лотереи) влияло на результат (заработок) только на лечение (военная служба). Ограничение исключения может быть нарушено, если, например, люди, которые были призваны, потратили больше времени в школе, чтобы избежать обслуживания, и что это увеличение времени в школе привело к увеличению заработка.

Если эти три условия (случайное присвоение лечению, отсутствие защитников и ограничение исключения) выполнены, то

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

поэтому мы можем оценить CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Один из способов подумать о CACE заключается в том, что разница в результатах между теми, кого поощряли, и теми, которые не поощряются, раздуты по уровню охвата.

Следует иметь в виду два важных оговорки. Во-первых, ограничение исключения является сильным предположением, и его необходимо обосновывать на индивидуальной основе, что часто требует экспертизы предметной области. Ограничение исключения не может быть оправдано рандомизацией поощрения. Во-вторых, общая практическая задача с инструментальным переменным анализом возникает, когда поощрение мало влияет на восприятие лечения (когда \(\text{ITT}_W\) мало). Это называется слабым инструментом , и это приводит к множеству проблем (Imbens and Rosenbaum 2005; Murray 2006) . Один из способов подумать о проблеме со слабыми инструментами состоит в том, что \(\widehat{\text{CACE}}\) может быть чувствителен к небольшим искажениям в \(\widehat{\text{ITT}_Y}\) -потенциально из-за нарушения ограничений исключения - потому что эти смещения увеличиваются малым \(\widehat{\text{ITT}_W}\) (см. уравнение 2.13). Грубо говоря, если лечение, которое назначает природа, не оказывает большого влияния на лечение, о котором вы заботитесь, тогда вам будет трудно узнать о том, какое лечение вы заботитесь.

См. Главу 23 и 24 Imbens and Rubin (2015) для более формальной версии этого обсуждения. Традиционный эконометрический подход к инструментальным переменным обычно выражается в терминах оценки уравнений, а не потенциальных результатов. Для введения с этой другой точки зрения см. Angrist and Pischke (2009) , а для сравнения между двумя подходами см. Раздел 24.6 « Imbens and Rubin (2015) . Альтернативное, немного менее формальное представление о подходе к инструментальным переменным приводится в главе 6 Gerber and Green (2012) . Более подробно об ограничениях на исключение см. D. Jones (2015) . Aronow and Carnegie (2013) описывают дополнительный набор предположений, которые могут быть использованы для оценки ATE, а не CACE. Подробнее о том, как естественные эксперименты могут быть очень сложными для интерпретации, см. Sekhon and Titiunik (2012) . Для более общего введения в естественные эксперименты, который выходит за рамки подхода, основанного на инструментальных переменных, также включают конструкции, такие как разрыв регрессии - см. Dunning (2012) .