ਮੈਥੇਮੈਟਿਕਲ ਨੋਟਸ

ਮੈਨੂੰ ਲਗਦਾ ਹੈ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਸਮਝਣ ਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਤਰੀਕਾ ਸੰਭਾਵੀ ਨਤੀਜੇ ਫਰੇਮਵਰਕ ਹੈ (ਜੋ ਕਿ ਮੈਂ ਕਾਂਡ 2 ਵਿੱਚ ਗਣਿਤਕ ਨੋਟ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਸੀ). ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਲਈ ਫਰੇਮਵਰਕ ਦਾ ਵਿਚਾਰ ਡਿਜ਼ਾਇਨ-ਅਧਾਰਤ ਨਮੂਨੇ ਦੇ ਵਿਚਾਰਾਂ ਨਾਲ ਬਹੁਤ ਗੂੜ੍ਹਾ ਰਿਸ਼ਤਾ ਹੈ ਜਿਸ ਬਾਰੇ ਮੈਂ ਅਧਿਆਇ 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . ਇਹ ਅੰਤਿਕਾ ਅਜਿਹੇ ਢੰਗ ਨਾਲ ਲਿਖਿਆ ਗਿਆ ਹੈ ਕਿ ਉਸ ਕੁਨੈਕਸ਼ਨ ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਗਿਆ ਹੈ. ਇਹ ਜ਼ੋਰ ਥੋੜ੍ਹਾ ਗੈਰ-ਪਰੰਪਰਾਗਤ ਹੈ, ਪਰ ਮੈਂ ਸੋਚਦਾ ਹਾਂ ਕਿ ਸੈਂਪਲਿੰਗ ਅਤੇ ਪ੍ਰਯੋਗਾਂ ਵਿਚਕਾਰ ਸਬੰਧ ਮਦਦਗਾਰ ਹੈ: ਇਸਦਾ ਮਤਲਬ ਇਹ ਹੈ ਕਿ ਜੇ ਤੁਸੀਂ ਸੈਂਪਲਿੰਗ ਬਾਰੇ ਕੁਝ ਜਾਣਦੇ ਹੋ ਤਾਂ ਤੁਸੀਂ ਪ੍ਰਯੋਗਾਂ ਬਾਰੇ ਅਤੇ ਕੁੱਝ ਨੂੰ ਪ੍ਰਭਾਵਾਂ ਬਾਰੇ ਜਾਣਦੇ ਹੋ. ਜਿਵੇਂ ਕਿ ਮੈਂ ਇਹਨਾਂ ਨੋਟਾਂ ਵਿੱਚ ਵਿਖਾਂਗਾ, ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਦੇ ਢਾਂਚੇ ਕਾਰਨ ਪ੍ਰਭਾਵੀ ਪ੍ਰਭਾਵਾਂ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਲਈ ਨਿਰੰਤਰ ਨਿਯੰਤਰਿਤ ਪ੍ਰਯੋਗਾਂ ਦੀ ਤਾਕਤ ਦਾ ਪਤਾ ਲਾਇਆ ਜਾਂਦਾ ਹੈ ਅਤੇ ਇਹ ਪੂਰੀ ਤਰਾਂ ਲਾਗੂ ਕੀਤੇ ਪ੍ਰਯੋਗਾਂ ਦੇ ਨਾਲ ਕੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਦੀ ਸੀਮਾਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ.

ਇਸ ਅੰਤਿਕਾ ਵਿਚ, ਮੈਂ ਸੰਭਾਵੀ ਨਤੀਜੇ ਫਰੇਮਵਰਕ ਦਾ ਵਰਣਨ ਕਰਾਂਗਾ, ਜੋ ਕਿ ਇਹ ਨੋਟਸ ਨੂੰ ਸਵੈ-ਸੰਪੂਰਨ ਬਣਾਉਣ ਲਈ ਅਧਿਆਇ 2 ਵਿੱਚ ਗਣਿਤਕ ਨੋਟਸ ਵਿੱਚੋਂ ਕੁੱਝ ਸਮਗਰੀ ਨੂੰ ਨਕਲ ਕਰਨਾ ਹੈ. ਫਿਰ ਮੈਂ ਔਸਤ ਇਲਾਜ ਪ੍ਰਭਾਵਾਂ ਦੇ ਅੰਦਾਜ਼ੇ ਦੀ ਸ਼ੁੱਧਤਾ ਦੇ ਬਾਰੇ ਕੁੱਝ ਲਾਭਦਾਇਕ ਨਤੀਜਿਆਂ ਦਾ ਵਰਣਨ ਕਰਾਂਗਾ, ਜਿਸ ਵਿੱਚ ਅਨੁਕੂਲ ਅਲੋਕੇਸ਼ਨ ਦੀ ਚਰਚਾ ਅਤੇ ਅੰਤਰ-ਇਨ-ਫਰਕ ਦੇ ਅਨੁਮਾਨ ਲਗਾਉਣ ਵਾਲੇ ਸ਼ਾਮਲ ਹੋਣਗੇ. ਇਹ ਅੰਤਿਕਾ Gerber and Green (2012) ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਖਿੱਚਦਾ ਹੈ.

ਸੰਭਾਵੀ ਨਤੀਜੇ ਫਰੇਮਵਰਕ

ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਦੇ ਫਰੇਮਵਰਕ ਨੂੰ ਦਰਸਾਉਣ ਲਈ, ਵਿਕਟੋਰੀਆ ਵਿਚ ਆਉਣ ਵਾਲੇ ਯੋਗਦਾਨਾਂ 'ਤੇ ਬਾਰਨਾਰਸਟ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਪ੍ਰਭਾਵ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਲਈ ਆਓ ਅਸੀਂ ਰੈਸਟੀਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਤ ਦੇ ਤਜ਼ਰਬੇ ਵੱਲ ਵਾਪਸ ਚੱਲੀਏ. ਸੰਭਾਵਿਤ ਨਤੀਜੇ ਫਰੇਮਵਰਕ ਦੇ ਤਿੰਨ ਮੁੱਖ ਤੱਤ ਹਨ: ਇਕਾਈਆਂ , ਇਲਾਜ ਅਤੇ ਸੰਭਾਵੀ ਨਤੀਜੇ . ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਟ ਦੇ ਮਾਮਲੇ ਵਿਚ, ਇਕਾਈਆਂ ਸੰਪਾਦਕ ਦੇ ਹੱਕਦਾਰ ਸਨ- ਜਿਹੜੇ ਯੋਗਦਾਨ ਦੇ ਚੋਟੀ ਦੇ 1% ਵਿਚ ਸ਼ਾਮਲ ਸਨ - ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਜੇ ਇਕ ਬਾਰੈਨਸਟਾਰ ਨਹੀਂ ਮਿਲਿਆ ਸੀ ਅਸੀਂ ਇਹਨਾਂ ਸੰਪਾਦਕਾਂ ਨੂੰ \(i = 1 \ldots N\) ਇੰਡੈਕਸ ਕਰ ਸਕਦੇ ਹਾਂ. ਆਪਣੇ ਤਜ਼ਰਬੇ ਦੇ ਇਲਾਜ "ਬਾਰ ਮਾਰਟਰ" ਜਾਂ "ਕੋਈ ਬਰਨਸਟਾਰ" ਨਹੀਂ ਸਨ ਅਤੇ ਮੈਂ \(W_i = 1\) ਜੇਕਰ ਵਿਅਕਤੀ \(i\) ਇਲਾਜ ਦੀ ਸਥਿਤੀ ਵਿਚ ਹੈ ਅਤੇ \(W_i = 0\) ਹੋਰ ਨਹੀਂ. ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਦੇ ਢਾਂਚੇ ਦਾ ਤੀਜਾ ਹਿੱਸਾ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਣ ਹੈ: ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਇਹ ਬਿੱਟ ਹੋਰ ਸੰਕਲਪਪੂਰਨ ਮੁਸ਼ਕਿਲ ਹਨ ਕਿਉਂਕਿ ਉਹ "ਸੰਭਾਵੀ" ਨਤੀਜਿਆਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ-ਜੋ ਹੋ ਸਕਦੀਆਂ ਹਨ. ਹਰੇਕ ਵਿਕਿਪੀਡਿਆ ਐਡੀਟਰ ਲਈ, ਤੁਸੀਂ ਉਸ ਇਲਾਜ ਦੀ ਸੰਖਿਆ ( \(Y_i(1)\) ) ਅਤੇ ਉਸ \(Y_i(1)\) ਦੀ ਗਿਣਤੀ ਨੂੰ ਅੰਦਾਜ਼ਾ ਲਗਾ ਸਕਦੇ ਹੋ ਜੋ ਉਸਨੂੰ ਕੰਟ੍ਰੋਲ ਦੀ ਸਥਿਤੀ ਵਿਚ ਕਰ ਸਕਦੀ ਹੈ ( \(Y_i(0)\) ).

ਨੋਟ ਕਰੋ ਕਿ ਇਕਾਈਆਂ, ਇਲਾਜਾਂ ਅਤੇ ਨਤੀਜਿਆਂ ਦੀ ਇਹ ਚੋਣ ਇਹ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੀ ਹੈ ਕਿ ਇਸ ਤਜਰਬੇ ਤੋਂ ਕੀ ਸਿੱਖਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਉਦਾਹਰਨ ਲਈ, ਬਿਨਾਂ ਕਿਸੇ ਵਾਧੂ ਧਾਰਨਾਵਾਂ ਦੇ, ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਤ ਸਾਰੇ ਵਿਕੀਪੀਡੀਆ ਸੰਪਾਦਕਾਂ 'ਤੇ ਬਾਬਰਸਟਾਰਸ ਦੇ ਪ੍ਰਭਾਵਾਂ ਜਾਂ ਸੰਪਾਦਨ ਗੁਣਵੱਤਾ ਦੇ ਨਤੀਜਿਆਂ ਬਾਰੇ ਕੁਝ ਨਹੀਂ ਕਹਿ ਸਕਦੇ. ਆਮ ਤੌਰ 'ਤੇ, ਇਕਾਈਆਂ, ਇਲਾਜਾਂ ਅਤੇ ਨਤੀਜਿਆਂ ਦੀ ਚੋਣ ਅਧਿਐਨ ਦੇ ਟੀਚਿਆਂ' ਤੇ ਅਧਾਰਤ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ.

ਇਹਨਾਂ ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਨੂੰ ਦਿੱਤਾ ਗਿਆ- ਜਿਸ ਨੂੰ ਸਾਰਣੀ 4.5 ਵਿੱਚ ਸੰਖੇਪ ਕੀਤਾ ਗਿਆ ਹੈ - ਇੱਕ ਵਿਅਕਤੀ ਨੂੰ \(i\) ਜਿਵੇਂ ਕਿ \(i\) ਤੌਰ ਤੇ ਵਿਅਕਤੀ ਦੇ ਇਲਾਜ ਲਈ ਕਾਰਨਾਮਾ ਪ੍ਰਭਾਸ਼ਿਤ ਕਰ ਸਕਦਾ ਹੈ

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

ਮੇਰੇ ਲਈ, ਇਹ ਸਮੀਕਰਨ ਪ੍ਰਕਿਰਿਆ ਪ੍ਰਭਾਵ ਨੂੰ ਪ੍ਰਭਾਸ਼ਿਤ ਕਰਨ ਦਾ ਸਭ ਤੋਂ ਸਾਫ਼ ਤਰੀਕਾ ਹੈ, ਅਤੇ ਹਾਲਾਂਕਿ ਬਹੁਤ ਹੀ ਅਸਾਨ ਹੋਵੇ, ਇਹ ਢਾਂਚਾ ਕਈ ਮਹੱਤਵਪੂਰਣ ਅਤੇ ਦਿਲਚਸਪ (Imbens and Rubin 2015) ਵਿੱਚ ਆਮ (Imbens and Rubin 2015) .

ਸਾਰਣੀ 4.5: ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਦੀ ਸੂਚੀ
ਵਿਅਕਤੀ ਇਲਾਜ ਦੀ ਹਾਲਤ ਵਿੱਚ ਸੰਪਾਦਨ ਕੰਟਰੋਲ ਸਥਿਤੀ ਵਿੱਚ ਸੰਪਾਦਨ ਇਲਾਜ ਪ੍ਰਭਾਵ
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
ਮਤਲਬ \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

ਜੇ ਅਸੀਂ ਇਸ ਤਰੀਕੇ ਨਾਲ ਕਾਰਜਕਰਤਾ ਨੂੰ ਪਰਿਭਾਸ਼ਤ ਕਰਦੇ ਹਾਂ, ਫਿਰ ਵੀ, ਅਸੀਂ ਇੱਕ ਸਮੱਸਿਆ ਵਿੱਚ ਚਲੇ ਜਾਂਦੇ ਹਾਂ. ਤਕਰੀਬਨ ਸਾਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਅਸੀਂ ਦੋਵੇਂ ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਦੀ ਪਾਲਣਾ ਨਹੀਂ ਕਰਦੇ. ਭਾਵ, ਇਕ ਵਿਸ਼ੇਸ਼ ਵਿਕਿਪੀਡਿਆ ਸੰਪਾਦਕ ਨੂੰ ਇੱਕ ਬਰਾਂਸਟਾਰ ਮਿਲਿਆ ਜਾਂ ਨਹੀਂ. ਇਸ ਲਈ, ਅਸੀਂ ਇੱਕ ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਨੂੰ ਵੇਖਦੇ ਹਾਂ - \(Y_i(1)\) ਜਾਂ \(Y_i(0)\) -ਪਰ ਦੋਨੋ ਨਹੀਂ. ਦੋਵਾਂ ਸੰਭਾਵੀ ਨਤੀਜਿਆਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਵਿਚ ਅਸਮਰੱਥਾ ਅਜਿਹੀ ਵੱਡੀ ਸਮੱਸਿਆ ਹੈ ਜੋ Holland (1986) ਨੇ ਇਸ ਨੂੰ ਸੰਭਾਵੀ ਸਿਧਾਂਤ ਦੀ ਬੁਨਿਆਦੀ ਸਮੱਸਿਆ ਕਿਹਾ.

ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ, ਜਦੋਂ ਅਸੀਂ ਖੋਜ ਕਰ ਰਹੇ ਹਾਂ, ਸਾਡੇ ਕੋਲ ਕੇਵਲ ਇੱਕ ਵਿਅਕਤੀ ਨਹੀਂ ਹੈ, ਸਾਡੇ ਕੋਲ ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਹਨ, ਅਤੇ ਇਹ ਮੌਲਿਕ ਸਮੱਸਿਆ ਦਾ ਸੰਕਲਪ ਹੈ. ਵਿਅਕਤੀਗਤ-ਪੱਧਰ ਦੇ ਇਲਾਜ ਦੇ ਅਸਰ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਬਜਾਏ, ਅਸੀਂ ਔਸਤ ਇਲਾਜ ਦੇ ਨਤੀਜੇ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾ ਸਕਦੇ ਹਾਂ:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

ਇਹ ਅਜੇ ਵੀ \(\tau_i\) ਰੂਪ ਵਿੱਚ ਪ੍ਰਗਟ ਕੀਤਾ ਗਿਆ ਹੈ ਜੋ \(\tau_i\) , ਪਰ ਕੁਝ ਬੀਜ ਗਣਿਤ (ਗਰਿਬਰ Gerber and Green (2012) ਦੇ ਈਕੀ 2.8) ਸਾਨੂੰ ਮਿਲਦਾ ਹੈ

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

ਸਮੀਕਰਨ 4.3 ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਜੇਕਰ ਅਸੀਂ ਆਬਾਦੀ ਦੇ ਔਸਤ ਨਤੀਜਿਆਂ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾ ਸਕਦੇ ਹਾਂ ਕਿ ਇਲਾਜ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ਅਤੇ ਆਬਾਦੀ ਔਸਤਨ ਨਤੀਜੇ ਕੰਟਰੋਲ ਹੇਠ ਹਨ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), ਤਾਂ ਅਸੀਂ ਕਿਸੇ ਵੀ ਵਿਸ਼ੇਸ਼ ਵਿਅਕਤੀ ਦੇ ਇਲਾਜ ਦੇ ਪ੍ਰਭਾਵ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਏ ਬਿਨਾਂ, ਔਸਤ ਇਲਾਜ ਦੇ ਨਤੀਜੇ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾ ਸਕਦੇ ਹਾਂ.

ਹੁਣ ਜਦੋਂ ਮੈਂ ਆਪਣਾ ਅੰਦਾਜ਼ਾ ਪ੍ਰੀਭਾਸ਼ਤ ਕੀਤਾ ਹੈ- ਜਿਸ ਚੀਜ਼ ਦਾ ਅਸੀਂ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਾਂ-ਮੈਂ ਇਸ ਗੱਲ ਵੱਲ ਧਿਆਨ ਦੇਵਾਂਗਾ ਕਿ ਅਸਲ ਵਿੱਚ ਅਸੀਂ ਡਾਟਾ ਨਾਲ ਅੰਦਾਜ਼ਾ ਕਿਵੇਂ ਲਗਾ ਸਕਦੇ ਹਾਂ. ਮੈਂ ਇਸ ਅੰਦਾਜ਼ੇ ਦੇ ਚੁਣੌਤੀ ਬਾਰੇ ਸੈਂਪਲਿੰਗ ਸਮੱਸਿਆ ਦੇ ਬਾਰੇ ਸੋਚਣਾ ਪਸੰਦ ਕਰਦਾ ਹਾਂ (ਅਧਿਆਇ 3 ਵਿੱਚ ਗਣਿਤਕ ਨੋਟਸ ਵੱਲ ਵਾਪਸ ਪਰਤਣਾ). ਕਲਪਨਾ ਕਰੋ ਕਿ ਅਸੀਂ ਅਰਾਮਦਾਇਕ ਤੌਰ ਤੇ ਕੁਝ ਲੋਕਾਂ ਨੂੰ ਇਲਾਜ ਦੀ ਸਥਿਤੀ ਵਿੱਚ ਪਾਲਣ ਲਈ ਚੁਣਦੇ ਹਾਂ ਅਤੇ ਅਸੀਂ ਨਿਯਮਤ ਤੌਰ ਤੇ ਕੁਝ ਲੋਕਾਂ ਨੂੰ ਨਿਯੰਤਰਣ ਦੀ ਸਥਿਤੀ ਵਿੱਚ ਦੇਖਣ ਲਈ ਚੁਣਦੇ ਹਾਂ, ਫਿਰ ਅਸੀਂ ਹਰ ਹਾਲਤ ਵਿੱਚ ਔਸਤ ਨਤੀਜੇ ਦਾ ਅਨੁਮਾਨ ਲਗਾ ਸਕਦੇ ਹਾਂ:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

ਜਿੱਥੇ \(N_t\) ਅਤੇ \(N_c\) ਇਲਾਜ ਅਤੇ ਨਿਯੰਤ੍ਰਣ ਹਾਲਤਾਂ ਵਿਚ ਲੋਕਾਂ ਦੀ ਸੰਖਿਆ ਹੈ. ਸਮੀਕਰਨ 4.4 ਇਕ ਫਰਕ-ਦਾ-ਅਰਥ ਅੰਦਾਜ਼ਾ ਹੈ. ਸੈਂਪਲਿੰਗ ਡਿਜ਼ਾਇਨ ਦੇ ਕਾਰਨ, ਅਸੀਂ ਜਾਣਦੇ ਹਾਂ ਕਿ ਪਹਿਲਾ ਟਰਮ ਔਸਤ ਨਤੀਜਿਆਂ ਲਈ ਨਿਰਪੱਖ ਅੰਦਾਜ਼ਾ ਹੈ ਅਤੇ ਦੂਜੀ ਪਾਰੀ ਕੰਟਰੋਲ ਹੇਠ ਇੱਕ ਨਿਰਪੱਖ ਅਨੁਮਾਨਕ ਹੈ.

ਰੈਂਡਮਾਇਜ਼ੀ ਯੋਗ ਕਰਨ ਬਾਰੇ ਹੋਰ ਵਿਚਾਰ ਕਰਨ ਦਾ ਇਕ ਹੋਰ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਇਲਾਜ ਅਤੇ ਨਿਯੰਤਰਣ ਸਮੂਹਾਂ ਵਿਚਾਲੇ ਤੁਲਨਾ ਨਿਰਪੱਖ ਹੈ ਕਿਉਂਕਿ ਰੈਂਡਮਾਈਜੇਸ਼ਨ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਦੋ ਸਮੂਹ ਇਕ-ਦੂਜੇ ਦੇ ਸਮਾਨ ਹੋਣਗੇ. ਇਹ ਸਮਾਨ ਸਾਡੇ ਦੁਆਰਾ ਮਾਪੀਆਂ ਗਈਆਂ ਚੀਜ਼ਾਂ (ਜੋ ਪ੍ਰਯੋਗ ਤੋਂ 30 ਦਿਨ ਪਹਿਲਾਂ ਦੇ ਸੰਪਾਦਨਾਂ ਦੀ ਸੰਖਿਆ) ਅਤੇ ਜਿਹੜੀਆਂ ਚੀਜ਼ਾਂ ਅਸੀਂ ਮਾਪੀਆਂ ਨਹੀਂ ਹਨ (ਲਿੰਗ ਕਹਿੰਦੇ ਹਨ) ਲਈ ਰੱਖੀਆਂ ਹਨ. ਦੋਨੋ ਦੇਖਿਆ ਅਤੇ unobserved ਕਾਰਕ 'ਤੇ ਸੰਤੁਲਨ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਇਹ ਯੋਗਤਾ ਨੂੰ ਨਾਜ਼ੁਕ ਹੁੰਦਾ ਹੈ. ਅਸਪਸ਼ਟ ਕਾਰਕਾਂ 'ਤੇ ਆਟੋਮੈਟਿਕ ਬੈਲੰਸਿੰਗ ਦੀ ਸ਼ਕਤੀ ਦੇਖਣ ਲਈ, ਆਓ ਇਹ ਅਨੁਮਾਨ ਲਗਾਓ ਕਿ ਭਵਿੱਖ ਦੀ ਖੋਜ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਪੁਰਸ਼ ਔਰਤਾਂ ਨਾਲੋਂ ਪੁਰਸਕਾਰ ਲਈ ਜ਼ਿਆਦਾ ਜਵਾਬਦੇਹ ਹਨ. ਕੀ ਉਹ ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਟ ਦੇ ਤਜਰਬੇ ਦੇ ਨਤੀਜਿਆਂ ਨੂੰ ਰੱਦ ਕਰਨਗੇ? ਨਹੀਂ. ਬੇਤਰਤੀਬ ਨਾਲ ਉਹ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹਨ ਕਿ ਉਮੀਦ ਵਿੱਚ ਸਾਰੇ ਅਸੁਰੱਖਿਅਤ ਸੰਤੁਲਿਤ ਹੋਣਗੇ. ਅਣਜਾਣੇ ਦੇ ਵਿਰੁੱਧ ਇਹ ਸੁਰੱਖਿਆ ਬਹੁਤ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੈ, ਅਤੇ ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਣ ਤਰੀਕਾ ਹੈ ਕਿ ਪ੍ਰਯੋਗ ਅਧਿਆਇ 2 ਵਿਚ ਦੱਸੀਆਂ ਗੈਰ-ਪ੍ਰਯੋਗਾਤਮਕ ਤਕਨੀਕਾਂ ਤੋਂ ਭਿੰਨ ਹੈ.

ਸਮੁੱਚੇ ਆਬਾਦੀ ਲਈ ਇਲਾਜ ਦੇ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਦੇ ਨਾਲ-ਨਾਲ, ਲੋਕਾਂ ਦੇ ਕਿਸੇ ਸਮੂਹ ਨੂੰ ਇਲਾਜ ਲਈ ਪ੍ਰਭਾਸ਼ਿਤ ਕਰਨਾ ਸੰਭਵ ਹੈ. ਇਸ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਇਕ ਸ਼ਰਤ-ਭਰਪੂਰ ਔਸਤ ਟਰੀਟਮੈਂਟ ਪਰਭਾਵ (CATE) ਕਿਹਾ ਜਾਂਦਾ ਹੈ. ਮਿਸਾਲ ਦੇ ਤੌਰ ਤੇ, ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਟ ਦੇ ਅਧਿਐਨ ਵਿਚ, ਆਓ ਇਹ \(X_i\) ਕਿ \(X_i\) ਇਹ ਹੈ ਕਿ ਸੰਪਾਦਕ ਪ੍ਰਯੋਗ ਤੋਂ 90 ਦਿਨ ਪਹਿਲਾਂ ਸੰਪਾਦਕਾਂ ਦੀ ਮੱਧ ਗਿਣਤੀ ਤੋਂ ਉੱਪਰ ਜਾਂ ਹੇਠਾਂ ਸੀ. ਇੱਕ ਇਹ ਹਲਕੇ ਅਤੇ ਭਾਰੀ ਸੰਪਾਦਕਾਂ ਲਈ ਵੱਖਰੇ ਤੌਰ ਤੇ ਇਲਾਜ ਪ੍ਰਭਾਵ ਨੂੰ ਗਿਣ ਸਕਦਾ ਹੈ.

ਸੰਭਾਵੀ ਨਤੀਜੇ ਫਰੇਮਵਰਕ ਸਾਕਾਰ ਅਨੁਮਾਨ ਅਤੇ ਪ੍ਰਯੋਗਾਂ ਬਾਰੇ ਸੋਚਣ ਦਾ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਤਰੀਕਾ ਹੈ. ਹਾਲਾਂਕਿ, ਦੋ ਵਾਧੂ ਗੁੰਝਲਦਾਰੀਆਂ ਹਨ ਜੋ ਤੁਹਾਨੂੰ ਧਿਆਨ ਵਿਚ ਰੱਖਣਾ ਚਾਹੀਦਾ ਹੈ. ਸਟੈਬਲ ਯੂਨਿਟ ਟ੍ਰੀਟਮੈਂਟ ਵੈਲਯੂ ਐਸੌਮਪਸ਼ਨ (ਐਸ ਯੂ ਟੀ ਐੱਫ) ਦੇ ਤਹਿਤ ਇਹਨਾਂ ਦੋ ਜਟਿਲਤਾਵਾਂ ਨੂੰ ਅਕਸਰ ਇਕੱਠੇ ਲਿਪਾਇਆ ਜਾਂਦਾ ਹੈ. SUTVA ਦਾ ਪਹਿਲਾ ਹਿੱਸਾ ਇਹ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ ਕਿ ਵਿਅਕਤੀ ਲਈ ਇਕੋ ਇਕ ਗੱਲ \(i\) ਦੇ ਨਤੀਜਾ ਇਹ ਹੈ ਕਿ ਕੀ ਉਹ ਵਿਅਕਤੀ ਇਲਾਜ ਜਾਂ ਨਿਯੰਤਰਣ ਦੀ ਸਥਿਤੀ ਵਿੱਚ ਹੈ. ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਇਹ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ ਕਿ ਵਿਅਕਤੀ \(i\) ਦਾ ਦੂਜਿਆਂ ਲੋਕਾਂ ਨੂੰ ਦਿੱਤੇ ਗਏ ਇਲਾਜ ਦੁਆਰਾ ਪ੍ਰਭਾਵ ਨਹੀਂ ਪੈਂਦਾ ਹੈ ਇਸ ਨੂੰ ਕਈ ਵਾਰ "ਕੋਈ ਦਖਲਅੰਦਾਜ਼ੀ" ਜਾਂ "ਕੋਈ ਸਪਿਲਵਰ ਨਹੀਂ" ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਇਸ ਤਰਾਂ ਲਿਖਿਆ ਜਾ ਸਕਦਾ ਹੈ:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

ਜਿੱਥੇ ਕਿ \(\mathbf{W_{-i}}\) ਵਿਅਕਤੀ ਤੋਂ ਇਲਾਵਾ ਹਰੇਕ ਲਈ ਇਲਾਜ ਸਥਿਤੀਆਂ ਦੀ ਇੱਕ ਵੈਕਟਰ ਹੈ \(i\) ਇਸ ਦਾ ਉਲੰਘਣ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਇੱਕ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਜੇ ਇੱਕ ਵਿਅਕਤੀ ਦਾ ਇਲਾਜ ਕਿਸੇ ਹੋਰ ਵਿਅਕਤੀ ਦੇ ਨਾਲ ਵੱਧਦਾ ਹੈ, ਭਾਵੇਂ ਉਹ ਸਕਾਰਾਤਮਕ ਜਾਂ ਨਕਾਰਾਤਮਕ ਹੈ ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਤ ਦੇ ਤਜਰਬੇ ਤੇ ਵਾਪਸ ਆਉਣਾ, ਦੋ ਦੋਸਤਾਂ ਦੀ ਕਲਪਨਾ ਕਰੋ \(i\) ਅਤੇ \(j\) ਅਤੇ ਉਹ ਵਿਅਕਤੀ \(i\) ਇੱਕ ਬਰਾਂਸਟਾਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ \(j\) ਨਹੀਂ ਕਰਦਾ. ਜੇ \(i\) ਬਾਰ ਮਾਰਸਟਾਰ ਕਾਰਨਾਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਕੇ \(j\) ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦੀ ਭਾਵਨਾ ਤੋਂ ਬਾਹਰ) ਸੋਧ ਜਾਂ ਘੱਟ (ਨਿਰਾਸ਼ਾ ਦੇ ਭਾਵ ਤੋਂ), ਤਾਂ ਸੁਤਵੀ ਦਾ ਉਲੰਘਣ ਕੀਤਾ ਗਿਆ ਹੈ. ਇਹ ਵੀ ਉਲੰਘਣਾ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ ਜੇ ਇਲਾਜ ਦਾ ਅਸਰ ਦੂਜੇ ਇਲਾਜਾਂ ਦੇ ਲੋਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ. ਮਿਸਾਲ ਦੇ ਤੌਰ ਤੇ, ਜੇ ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਟ ਨੇ 100 ਦੇ ਬਜਾਏ 1,000 ਜਾਂ 10,000 ਬਰਾਂਸਟਰਾਂ ਨੂੰ ਬਾਹਰ ਕੱਢਿਆ ਸੀ, ਤਾਂ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਇਸਨੇ ਬਾਰਨਾਰਸਟ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕੀਤਾ ਹੋਵੇ.

ਦੂਜੀ ਮੁੱਦੇ ਨੂੰ SUTVA ਵਿਚ ਚਲਾਇਆ ਜਾਂਦਾ ਹੈ ਇਹ ਧਾਰਨਾ ਹੈ ਕਿ ਇਕੋ ਇਕ ਢੁੱਕਵਾਂ ਇਲਾਜ ਉਹੀ ਹੈ ਜੋ ਖੋਜਕਾਰ ਵੱਲੋਂ ਪ੍ਰਦਾਨ ਕੀਤਾ ਗਿਆ ਹੈ; ਇਸ ਧਾਰਨਾ ਨੂੰ ਕਈ ਵਾਰੀ ਕਿਸੇ ਓਹਲੇ ਇਲਾਜ ਜਾਂ ਬੇਦਖਲੀ ਨਹੀਂ ਕਿਹਾ ਜਾਂਦਾ. ਮਿਸਾਲ ਦੇ ਤੌਰ ਤੇ, ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਟ ਵਿਚ, ਇਹ ਸ਼ਾਇਦ ਅਜਿਹਾ ਮਾਮਲਾ ਹੋ ਗਿਆ ਹੈ ਕਿ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸੰਪਾਦਕਾਂ ਨੂੰ ਇਕ ਪ੍ਰਸਿੱਧ ਐਡੀਟਰਸ ਪੰਨੇ ਤੇ ਦਿਖਾਉਣ ਦਾ ਕਾਰਨ ਬਣਦਾ ਹੈ ਅਤੇ ਇਹ ਪ੍ਰਸਿੱਧ ਐਡੀਟਰਸ ਪੰਨੇ 'ਤੇ ਹੋ ਰਿਹਾ ਹੈ- ਬਰਾਂਸਟਾਰ- ਜਿਸ ਨੇ ਸੰਪਾਦਨ ਰਵੱਈਏ ਵਿਚ ਬਦਲਾਵ ਲਿਆ. ਜੇ ਇਹ ਸੱਚ ਹੈ, ਤਾਂ ਬਾਰ ਮਾਰਟਰ ਦਾ ਪ੍ਰਭਾਵ ਪ੍ਰਸਿੱਧ ਸੰਪਾਦਕਾਂ ਪੰਨੇ ਤੇ ਹੋਣ ਦੇ ਪ੍ਰਭਾਵ ਤੋਂ ਵੱਖਰਾ ਨਹੀਂ ਹੈ. ਬੇਸ਼ੱਕ, ਇਹ ਸਪੱਸ਼ਟ ਨਹੀਂ ਹੈ ਕਿ, ਵਿਗਿਆਨਕ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਤੋਂ, ਇਸ ਨੂੰ ਆਕਰਸ਼ਕ ਜਾਂ ਗੈਰਵਰਤਣਯੋਗ ਸਮਝਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ. ਭਾਵ, ਤੁਸੀਂ ਇਕ ਖੋਜਕਰਤਾ ਦੀ ਕਲਪਨਾ ਕਰ ਸਕਦੇ ਹੋ ਕਿ ਬਾਰਨਾਰਸਟ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਪ੍ਰਭਾਵ ਵਿੱਚ ਬਾਰਾਂ ਦੇ ਤਜਰਬੇ ਤੋਂ ਬਾਅਦ ਆਉਣ ਵਾਲੇ ਸਾਰੇ ਇਲਾਜ ਸ਼ਾਮਲ ਹਨ. ਜਾਂ ਤੁਸੀਂ ਅਜਿਹੀ ਸਥਿਤੀ ਦੀ ਕਲਪਨਾ ਕਰ ਸਕਦੇ ਹੋ ਜਿੱਥੇ ਇੱਕ ਖੋਜ ਇਸ ਸਭ ਕੁਝ ਤੋਂ ਬਾਗਾਰ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਅਲਗ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹੈ. ਇਸ ਬਾਰੇ ਸੋਚਣ ਦਾ ਇਕ ਤਰੀਕਾ ਹੈ ਕਿ Gerber and Green (2012) (ਪੀ. 41) ਕੀ ਹੈ, ਜੋ ਕਿ ਕੁਝ ਵੀ ਹੈ ਜੋ "ਸਮਰੂਪਤਾ ਵਿਚ ਟੁੱਟਣ" ਨੂੰ ਕਹਿੰਦੇ ਹਨ? ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿਚ, ਕੀ ਇਲਾਜ ਤੋਂ ਇਲਾਵਾ ਕੁੱਝ ਵੀ ਹੈ ਜਿਸ ਨਾਲ ਇਲਾਜ ਅਤੇ ਨਿਯੰਤਰਣ ਦੀਆਂ ਹਾਲਤਾਂ ਵਿਚ ਲੋਕਾਂ ਦਾ ਵੱਖੋ-ਵੱਖਰਾ ਇਲਾਜ ਹੋ ਸਕਦਾ ਹੈ? ਸਮਰੂਪੀਆਂ ਨੂੰ ਤੋੜਨ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਮੈਡੀਕਲ ਟਰਾਇਲਾਂ ਵਿਚ ਕੰਟਰੋਲ ਗਰੁੱਪ ਦੇ ਮੁੱਖ ਮਰੀਜ਼ਾਂ ਨੂੰ ਪਲੇਸਬੋ ਗੋਲ਼ੀ ਲੈਣ ਲਈ ਕਿਹਦੀਆਂ ਹਨ. ਇਸ ਤਰ੍ਹਾਂ, ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇਹ ਯਕੀਨੀ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ ਕਿ ਦੋ ਹਾਲਤਾਂ ਵਿਚ ਇਕੋ ਫਰਕ ਅਸਲ ਦਵਾਈ ਹੈ ਅਤੇ ਗੋਲੀ ਲੈਣ ਦਾ ਤਜਰਬਾ ਨਹੀਂ ਹੈ.

ਸੁਤਵਾ 'ਤੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, Gerber and Green (2012) ਦੇ ਭਾਗ 2.7, Morgan and Winship (2014) ਦੇ ਹਿੱਸੇ 2.5 Morgan and Winship (2014) ਅਤੇ Imbens and Rubin (2015) ਦੇ ਭਾਗ 1.6 ਦੇਖੋ.

ਸ਼ੁੱਧਤਾ

ਪਿਛਲੇ ਭਾਗ ਵਿੱਚ, ਮੈਂ ਦੱਸਿਆ ਹੈ ਕਿ ਇਲਾਜ ਦੇ ਔਸਤ ਦਾ ਅੰਦਾਜ਼ਾ ਕਿਵੇਂ ਲਗਾਉਣਾ ਹੈ. ਇਸ ਭਾਗ ਵਿੱਚ, ਮੈਂ ਉਨ੍ਹਾਂ ਅਨੁਮਾਨਾਂ ਦੀ ਪਰਿਵਰਤਨ ਬਾਰੇ ਕੁਝ ਸੁਝਾਅ ਮੁਹੱਈਆ ਕਰਾਂਗਾ.

ਜੇ ਤੁਸੀਂ ਦੋ ਨਮੂਨੇ ਵਿਚਲੇ ਫਰਕ ਦੇ ਅੰਦਾਜ਼ੇ ਦੇ ਅੰਦਾਜ਼ੇ ਦੇ ਤੌਰ ਤੇ ਔਸਤ ਇਲਾਜ ਦੇ ਅਨੁਪਾਤ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਬਾਰੇ ਸੋਚਦੇ ਹੋ, ਤਾਂ ਇਹ ਦਰਸਾਉਣਾ ਸੰਭਵ ਹੈ ਕਿ ਔਸਤ ਇਲਾਜ ਪ੍ਰਭਾਵ ਦੀ ਮਿਆਰੀ ਗਲਤੀ ਹੈ:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

ਜਿੱਥੇ \(m\) ਲੋਕਾਂ ਨੂੰ ਇਲਾਜ ਲਈ ਨਿਯੁਕਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ \(Nm\) ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਲਈ (ਵੇਖੋ Gerber and Green (2012) , eq. 3.4). ਇਸ ਲਈ, ਜਦੋਂ ਤੁਸੀਂ ਇਹ ਸੋਚਦੇ ਹੋ ਕਿ ਕਿੰਨੇ ਕੁ ਲੋਕ ਇਲਾਜ ਲਈ ਨਿਯੁਕਤ ਕੀਤੇ ਜਾਂਦੇ ਹਨ ਅਤੇ ਕਿੰਨੇ ਨਿਯੰਤਰਿਤ ਕਰਨ ਲਈ ਨਿਯੁਕਤ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ ਕਿ ਜੇ \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , ਤਾਂ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ \(m \approx N / 2\) , ਜਿੰਨਾ ਚਿਰ ਇਲਾਜ ਅਤੇ ਨਿਯੰਤ੍ਰਣ ਦੀ ਲਾਗਤ ਇਕੋ ਜਿਹੀ ਹੋਵੇ. ਸਮੀਕਰਨ 4.6 ਇਹ ਸਪੱਸ਼ਟ ਕਰਦਾ ਹੈ ਕਿ ਬੌਡ ਅਤੇ ਸਹਿਕਰਮੀਆਂ (2012) ਵੋਟਿੰਗ 'ਤੇ ਸਮਾਜਿਕ ਜਾਣਕਾਰੀ ਦੇ ਪ੍ਰਭਾਵਾਂ ਬਾਰੇ ਪ੍ਰਯੋਗ (ਚਿੱਤਰ 4.18) ਪ੍ਰਯੋਗਸ਼ੀਲ ਅੰਦਾਜ਼ਿਆਂ ਨਾਲ ਸੀ. ਯਾਦ ਕਰੋ ਕਿ ਇਲਾਜ ਵਿੱਚ ਇਲਾਜ ਦੇ 98% ਹਿੱਸੇਦਾਰ ਹਨ. ਇਸ ਦਾ ਮਤਲਬ ਸੀ ਕਿ ਕੰਟਰੋਲ ਸਥਿਤੀ ਵਿਚਲੇ ਅਸਲ ਸੁਭਾਅ ਦਾ ਅਨੁਮਾਨ ਸਹੀ ਨਹੀਂ ਸੀ ਜਿਵੇਂ ਕਿ ਇਹ ਹੋ ਸਕਦਾ ਸੀ, ਜਿਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਲਾਜ ਅਤੇ ਨਿਯੰਤਰਣ ਦੀ ਸਥਿਤੀ ਵਿਚਲੇ ਅੰਦਾਜ਼ਨ ਅੰਦਾਜ਼ੇ ਦਾ ਅਨੁਮਾਨ ਬਿਲਕੁਲ ਸਹੀ ਨਹੀਂ ਸੀ ਜਿਵੇਂ ਕਿ ਇਹ ਹੋ ਸਕਦਾ ਹੈ. ਹਾਲਤਾਂ ਵਿਚ ਹਿੱਸੇਦਾਰਾਂ ਦੇ ਅਨੁਕੂਲ ਨਿਰਧਾਰਨ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, ਜਿਸ ਵਿਚ ਲਾਗਤ ਦੀਆਂ ਹਾਲਤਾਂ ਵਿਚ ਭਿੰਨਤਾ ਸ਼ਾਮਲ ਹੈ, List, Sadoff, and Wagner (2011) .

ਅੰਤ ਵਿੱਚ, ਮੁੱਖ ਪਾਠ ਵਿੱਚ, ਮੈਂ ਦੱਸਿਆ ਕਿ ਕਿਵੇਂ ਅੰਤਰ-ਅੰਦਾਜ਼ੀ ਅਨੁਮਾਨਕ, ਜੋ ਆਮ ਤੌਰ ਤੇ ਇੱਕ ਮਿਕਸਡ ਡਿਜ਼ਾਇਨ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਇੱਕ ਅੰਤਰ-ਇਨ-ਇੰਸਪੈਕਟਰ ਦੁਆਰਾ ਛੋਟੇ ਬਦਲਾਅ ਦੀ ਅਗਵਾਈ ਕਰ ਸਕਦਾ ਹੈ, ਜੋ ਆਮ ਤੌਰ ਤੇ ਦੋਨਾਂ ਵਿਸ਼ਿਆਂ ਡਿਜ਼ਾਈਨ ਜੇ \(X_i\) ਇਲਾਜ ਤੋਂ ਪਹਿਲਾਂ ਦੇ ਨਤੀਜੇ ਦਾ ਮੁਲਾਂਕਣ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਫਰਕ-ਇਨ-ਫਰਕ ਦੀ ਪਹੁੰਚ ਨਾਲ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਲਈ ਅਸੀਂ ਜਿਸ ਮਾਤਰਾ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਾਂ ਇਹ ਹੈ:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

ਉਸ ਮਾਤ੍ਰਾ ਦੀ ਮਿਆਰੀ ਗਲਤੀ (ਵੇਖੋ Gerber and Green (2012) , eq. 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

ਇਕ ਏ ਦੀ ਤੁਲਨਾ 4.6 ਅਤੇ eq. 4.8 ਦੱਸਦਾ ਹੈ ਕਿ ਫਰਕ-ਇਨ-ਫਰਕ ਦੀ ਪਹੁੰਚ ਵਿੱਚ ਇੱਕ ਛੋਟਾ ਮਿਆਰੀ ਗਲਤੀ ਹੋਵੇਗੀ ਜਦੋਂ ( Gerber and Green (2012) , ਈ. 4.6)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

ਲਗਭਗ, ਜਦੋਂ \(X_i\) ਬਹੁਤ ਹੀ ਪ੍ਰਭਾਵੀ ਹੈ \(Y_i(1)\) ਅਤੇ \(Y_i(0)\) , ਤਾਂ ਤੁਸੀਂ ਫਰਕ ਦੀ ਤੁਲਨਾ ਵਿਚ ਫਰਕ ਦੇ ਅੰਤਰ ਤੋਂ ਵਧੇਰੇ ਸਹੀ ਅਨੁਮਾਨ ਲੈ ਸਕਦੇ \(Y_i(0)\) ਦਾ ਅਰਥ ਹੈ ਇਕ. ਰੈਸਟਿਵੋ ਅਤੇ ਵੈਨ ਡੀ ਰਿਜਤ ਦੇ ਤਜਰਬੇ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਇਸ ਬਾਰੇ ਸੋਚਣ ਦਾ ਇਕ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਲੋਕਾਂ ਦੁਆਰਾ ਸੰਪਾਦਿਤ ਕੀਤੀ ਜਾਣ ਵਾਲੀ ਰਾਸ਼ੀ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਕੁਦਰਤੀ ਬਦਲਾਅ ਹੁੰਦੇ ਹਨ, ਇਸ ਲਈ ਇਹ ਇਲਾਜ ਅਤੇ ਨਿਯੰਤਰਣ ਦੀਆਂ ਸਥਿਤੀਆਂ ਦੀ ਤੁਲਨਾ ਕਰਦਾ ਹੈ: ਕਿਸੇ ਰਿਸ਼ਤੇਦਾਰ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਮੁਸ਼ਕਲ ਹੈ ਆਲੋਚਕ ਨਤੀਜੇ ਡਾਟਾ ਵਿੱਚ ਛੋਟੇ ਪ੍ਰਭਾਵ. ਪਰ ਜੇ ਤੁਸੀਂ ਇਸ ਕੁਦਰਤੀ ਤੌਰ ਤੇ ਵਿਭਿੰਨਤਾ ਨੂੰ ਫਰਕ ਸਮਝਦੇ ਹੋ, ਤਾਂ ਬਹੁਤ ਘੱਟ ਪਰਿਵਰਤਨ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਇਹ ਇੱਕ ਛੋਟਾ ਜਿਹਾ ਪ੍ਰਭਾਵ ਖੋਜਣਾ ਆਸਾਨ ਬਣਾਉਂਦਾ ਹੈ.

Frison and Pocock (1992) ਨੂੰ ਫਰਕ ਔਫ-ਮੀਜ਼, ਫਰਕ ਆਫ ਫਰਕਸ, ਅਤੇ ਐਕੋਕੋ-ਆਧਾਰਿਤ ਪਹੁੰਚ ਦੀ ਸਹੀ ਅਨੁਪਾਤ ਲਈ ਵਧੇਰੇ ਸਧਾਰਣ ਸੈਟਿੰਗ ਵਿਚ ਦੇਖੋ ਜਿੱਥੇ ਮਲਟੀਪਲ ਮਾਪ ਪ੍ਰੀ-ਟ੍ਰੀਟਮੈਂਟ ਅਤੇ ਪੋਸਟ-ਟ੍ਰੀਟਮੈਂਟ ਹਨ. ਖਾਸ ਤੌਰ 'ਤੇ, ਉਹ ਐਨੋਕੋਵਾ ਦੀ ਜ਼ੋਰਦਾਰ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਨ, ਜਿਸ ਨੂੰ ਮੈਂ ਇੱਥੇ ਸ਼ਾਮਲ ਨਹੀਂ ਕੀਤਾ ਹੈ. ਇਸਦੇ ਇਲਾਵਾ, ਮਲਟੀਪਲ ਪੋਸਟ-ਇਲਾਜ ਨਤੀਜਿਆਂ ਦੇ ਉਪਾਵਾਂ ਦੇ ਮਹੱਤਵ ਦੀ ਚਰਚਾ ਲਈ McKenzie (2012) ਦੇਖੋ.