ಗಣಿತದ ಟಿಪ್ಪಣಿಗಳು

ಪ್ರಯೋಗಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಅತ್ಯುತ್ತಮ ಮಾರ್ಗವೆಂದರೆ ಸಂಭವನೀಯ ಪರಿಣಾಮಗಳ ಚೌಕಟ್ಟಾಗಿದೆ (ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ನಾನು ಗಣಿತದ ಟಿಪ್ಪಣಿಗಳಲ್ಲಿ ಚರ್ಚಿಸಿದ). ಸಂಭಾವ್ಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟನ್ನು ವಿನ್ಯಾಸ-ಆಧರಿತ ಮಾದರಿಗಳಿಂದ ಕಲ್ಪನೆಗಳಿಗೆ ಸಂಬಂಧಿಸಿದೆ, ನಾನು ಅಧ್ಯಾಯ 3 ರಲ್ಲಿ ವಿವರಿಸಿದೆ (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . ಸಂಪರ್ಕವನ್ನು ಒತ್ತಿಹೇಳಲು ಈ ಅನುಬಂಧವನ್ನು ಬರೆಯಲಾಗಿದೆ. ಈ ಮಹತ್ವ ಸ್ವಲ್ಪ ಸಾಂಪ್ರದಾಯಿಕವಲ್ಲದದ್ದು, ಆದರೆ ಮಾದರಿ ಮತ್ತು ಪ್ರಯೋಗಗಳ ನಡುವಿನ ಸಂಪರ್ಕ ಸಹಾಯಕವಾಗಿದೆಯೆಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ: ಇದರರ್ಥ ನೀವು ಮಾದರಿಗಳ ಬಗ್ಗೆ ಏನನ್ನಾದರೂ ತಿಳಿದಿದ್ದರೆ ನೀವು ಪ್ರಯೋಗಗಳ ಬಗ್ಗೆ ಮತ್ತು ಅದರ ವಿರುದ್ಧವಾಗಿ ತಿಳಿದಿರುತ್ತೀರಿ. ಈ ಟಿಪ್ಪಣಿಗಳಲ್ಲಿ ನಾನು ತೋರಿಸಿದಂತೆ, ಸಂಭಾವ್ಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟನ್ನು ಯಾದೃಚ್ಛಿಕ ನಿಯಂತ್ರಿತ ಪ್ರಯೋಗಗಳ ಶಕ್ತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ, ಅಂದಾಜು ಮಾಡಬಹುದಾದ ಪರಿಣಾಮಗಳನ್ನು ಅಂದಾಜು ಮಾಡಲು ಮತ್ತು ನಿಖರವಾಗಿ ಕಾರ್ಯಗತಗೊಳಿಸಿದ ಪ್ರಯೋಗಗಳೊಂದಿಗೆ ಸಹ ಮಾಡಬಹುದಾದ ಮಿತಿಗಳನ್ನು ಅದು ತೋರಿಸುತ್ತದೆ.

ಈ ಅನುಬಂಧದಲ್ಲಿ, ಸಂಭಾವ್ಯ ಫಲಿತಾಂಶಗಳ ಫ್ರೇಮ್ವರ್ಕ್ ಅನ್ನು ನಾನು ವಿವರಿಸುತ್ತೇನೆ, ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ಗಣಿತದ ಟಿಪ್ಪಣಿಗಳಿಂದ ಕೆಲವು ವಸ್ತುಗಳನ್ನು ನಕಲಿಸುವುದು ಈ ಟಿಪ್ಪಣಿಗಳನ್ನು ಹೆಚ್ಚು ಸ್ವಯಂ-ಒಳಗೊಂಡಿರುವಂತೆ ಮಾಡುತ್ತದೆ. ನಂತರ ನಾನು ಸೂಕ್ತವಾದ ಹಂಚಿಕೆ ಮತ್ತು ಭಿನ್ನಾಭಿಪ್ರಾಯದ ಅಂದಾಜಿನ ವ್ಯತ್ಯಾಸದ ಚರ್ಚೆ ಸೇರಿದಂತೆ ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮಗಳ ಅಂದಾಜುಗಳ ನಿಖರತೆಯ ಬಗ್ಗೆ ಕೆಲವು ಉಪಯುಕ್ತ ಫಲಿತಾಂಶಗಳನ್ನು ವಿವರಿಸುತ್ತೇನೆ. ಈ ಅನುಬಂಧವು Gerber and Green (2012) ಮೇಲೆ ಹೆಚ್ಚು ಸೆಳೆಯುತ್ತದೆ.

ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟನ್ನು

ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟನ್ನು ವಿವರಿಸಲು, ವಿಕಿಪೀಡಿಯ ಭವಿಷ್ಯದ ಕೊಡುಗೆಗಳ ಬಗ್ಗೆ ಬಾರ್ನ್ಸ್ಟಾರ್ ಸ್ವೀಕರಿಸುವ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡಲು ರೆಟಿವೊ ಮತ್ತು ವಾನ್ ಡಿ ರಿಜಟ್ ಪ್ರಯೋಗಕ್ಕೆ ಹಿಂತಿರುಗಿ. ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟಿನಲ್ಲಿ ಮೂರು ಪ್ರಮುಖ ಅಂಶಗಳಿವೆ: ಘಟಕಗಳು , ಚಿಕಿತ್ಸೆಗಳು ಮತ್ತು ಸಂಭಾವ್ಯ ಫಲಿತಾಂಶಗಳು . ರೆಸ್ಟ್ವೊ ಮತ್ತು ವ್ಯಾನ್ ಡಿ ರಿಜ್ಟ್ನ ಸಂದರ್ಭದಲ್ಲಿ, ಘಟಕಗಳು ಎಡಿಟರ್ಗಳಿಗೆ ಅರ್ಹವಾದವು- ಅಗ್ರ 1% ರಷ್ಟು ಪಾಲುದಾರರು-ಇನ್ನೂ ಬಾರ್ನ್ಸ್ಟಾರ್ ಸ್ವೀಕರಿಸದವರಾಗಿದ್ದರು. ನಾವು ಈ ಸಂಪಾದಕಗಳನ್ನು \(i = 1 \ldots N\) . ಅವರ ಪ್ರಾಯೋಗಿಕ ಚಿಕಿತ್ಸೆಗಳು "ಬಾರ್ನ್ಸ್ಟಾರ್" ಅಥವಾ "ನೋ ಬರ್ನ್ಸ್ಟಾರ್", ಮತ್ತು ನಾನು \(W_i = 1\) ಚಿಕಿತ್ಸೆಯಲ್ಲಿ ಮತ್ತು \(W_i = 0\) ವ್ಯಕ್ತಿಯು \(i\) ಆಗಿದ್ದರೆ \(i\) \(W_i = 0\) . ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟಿನ ಮೂರನೇ ಅಂಶವು ಅತ್ಯಂತ ಮುಖ್ಯವಾಗಿದೆ: ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳು . ಇವುಗಳು ಬಿಟ್ ಹೆಚ್ಚು ಕಲ್ಪನಾತ್ಮಕವಾಗಿ ಕಷ್ಟವಾಗಿದ್ದು ಏಕೆಂದರೆ ಅವುಗಳು "ಸಂಭವನೀಯ" ಪರಿಣಾಮಗಳನ್ನು ಉಂಟುಮಾಡಬಹುದು-ಸಂಭವಿಸಬಹುದಾದ ವಿಷಯಗಳು. ಪ್ರತಿ ವಿಕಿಪೀಡಿಯಾ ಸಂಪಾದಕರಿಗಾಗಿ, ಅವರು ಚಿಕಿತ್ಸೆಯ ಸ್ಥಿತಿಯಲ್ಲಿ ( \(Y_i(1)\) ) ಮತ್ತು ಅವರು ನಿಯಂತ್ರಣ ಸ್ಥಿತಿ ( \(Y_i(0)\) ಮಾಡುವ ಸಂಖ್ಯೆಯ ಸಂಪಾದನೆಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಲ್ಪಿಸಬಹುದು. ).

ಈ ಪ್ರಯೋಗಗಳು, ಚಿಕಿತ್ಸೆಗಳು ಮತ್ತು ಫಲಿತಾಂಶಗಳ ಈ ಆಯ್ಕೆಯು ಈ ಪ್ರಯೋಗದಿಂದ ಕಲಿಯಬಹುದಾದ ಯಾವುದನ್ನು ವಿವರಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ. ಉದಾಹರಣೆಗೆ, ಯಾವುದೇ ಹೆಚ್ಚುವರಿ ಊಹೆಗಳಿಲ್ಲದೆ, ರೆಸಿವೊ ಮತ್ತು ವ್ಯಾನ್ ಡಿ ರಿಜಟ್ ಎಲ್ಲಾ ವಿಕಿಪೀಡಿಯ ಸಂಪಾದಕಗಳಲ್ಲಿ ಅಥವಾ ಬರ್ನ್ಸ್ಟಾರ್ಗಳ ಪರಿಣಾಮಗಳ ಬಗ್ಗೆ ಸಂಪಾದನೆಯ ಗುಣಮಟ್ಟವನ್ನು ಹೇಳುವುದಿಲ್ಲ. ಸಾಮಾನ್ಯವಾಗಿ, ಘಟಕಗಳು, ಚಿಕಿತ್ಸೆಗಳು, ಮತ್ತು ಫಲಿತಾಂಶಗಳ ಆಯ್ಕೆ ಅಧ್ಯಯನದ ಗುರಿಗಳನ್ನು ಆಧರಿಸಿರಬೇಕು.

ಈ ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡಲಾಗಿದೆ-ಇದು ಟೇಬಲ್ 4.5 ರಲ್ಲಿ ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಲ್ಪಟ್ಟಿರುತ್ತದೆ- ಒಬ್ಬ ವ್ಯಕ್ತಿಯ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮದ ಪರಿಣಾಮವನ್ನು \(i\) ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸಬಹುದು

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

ನನಗೆ, ಈ ಸಮೀಕರಣವು ಒಂದು ಪರಿಣಾಮಕಾರಿ ಪರಿಣಾಮವನ್ನು ವಿವರಿಸುವ ಸ್ಪಷ್ಟ ಮಾರ್ಗವಾಗಿದೆ, ಮತ್ತು ಅತ್ಯಂತ (Imbens and Rubin 2015) , ಈ ಚೌಕಟ್ಟನ್ನು ಅನೇಕ ಮುಖ್ಯ ಮತ್ತು ಆಸಕ್ತಿದಾಯಕ ವಿಧಾನಗಳಲ್ಲಿ (Imbens and Rubin 2015) ಸಾಮಾನ್ಯೀಕರಿಸಬಹುದಾಗಿದೆ.

ಕೋಷ್ಟಕ 4.5: ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳ ಪಟ್ಟಿ
ವ್ಯಕ್ತಿ ಚಿಕಿತ್ಸೆಯ ಸ್ಥಿತಿಯಲ್ಲಿ ಸಂಪಾದನೆಗಳು ನಿಯಂತ್ರಣ ಸ್ಥಿತಿಯಲ್ಲಿ ಸಂಪಾದನೆಗಳು ಚಿಕಿತ್ಸೆ ಪರಿಣಾಮ
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
ಎನ್ \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
ಅರ್ಥ \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

ನಾವು ಈ ರೀತಿಯಾಗಿ ಕಾರಣವನ್ನು ವಿವರಿಸಿದರೆ, ನಾವು ಸಮಸ್ಯೆಯೊಂದನ್ನು ಎದುರಿಸುತ್ತೇವೆ. ಬಹುತೇಕ ಎಲ್ಲಾ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳನ್ನು ನಾವು ಗಮನಿಸುವುದಿಲ್ಲ. ಅಂದರೆ, ಒಂದು ನಿರ್ದಿಷ್ಟ ವಿಕಿಪೀಡಿಯ ಸಂಪಾದಕನು ಬಾರ್ನ್ಸ್ಟಾರ್ ಅಥವಾ ಸ್ವೀಕರಿಸಲಿಲ್ಲ. ಆದ್ದರಿಂದ, ನಾವು ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳಾದ \(Y_i(1)\) ಅಥವಾ \(Y_i(0)\) - ಆದರೆ ಎರಡೂ ಅಲ್ಲ. ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳೆರಡನ್ನೂ ವೀಕ್ಷಿಸಲು ಅಸಮರ್ಥತೆ ಅಂತಹ ಒಂದು ಪ್ರಮುಖ ಸಮಸ್ಯೆಯಾಗಿದ್ದು, Holland (1986) ಇದು ಮೂಲಭೂತ ಸಮಸ್ಯೆಯ ಕಾಸಾಲ್ ಇನ್ಫರೆನ್ಸ್ ಎಂದು ಕರೆದಿದೆ.

ಅದೃಷ್ಟವಶಾತ್, ನಾವು ಸಂಶೋಧನೆ ನಡೆಸುತ್ತಿರುವಾಗ, ನಮಗೆ ಕೇವಲ ಒಬ್ಬ ವ್ಯಕ್ತಿಯಿಲ್ಲ, ನಮಗೆ ಅನೇಕ ಜನರಿದ್ದಾರೆ, ಮತ್ತು ಇದು ಕಾಸ್ಸಾಲ್ ಇನ್ಫರೆನ್ಸ್ನ ಮೂಲಭೂತ ಸಮಸ್ಯೆಗೆ ಒಂದು ಮಾರ್ಗವನ್ನು ನೀಡುತ್ತದೆ. ವೈಯಕ್ತಿಕ ಮಟ್ಟದ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡಲು ಪ್ರಯತ್ನಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ, ನಾವು ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡಬಹುದು:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

ಇದು ಇನ್ನೂ \(\tau_i\) ಪದಗಳಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲ್ಪಡುತ್ತದೆ, ಆದರೆ ಕೆಲವು ಬೀಜಗಣಿತದೊಂದಿಗೆ ( Gerber and Green (2012) ನ Eq 2.8) ನಾವು ಪಡೆಯುತ್ತೇವೆ

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

ಸಮೀಕರಣದ 4.3 ಪ್ರಕಾರ ನಾವು ಚಿಕಿತ್ಸೆಯಡಿಯಲ್ಲಿ ಜನಸಂಖ್ಯೆ ಸರಾಸರಿ ಫಲಿತಾಂಶವನ್ನು ಅಂದಾಜು ಮಾಡಬಹುದಾದರೆ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ಮತ್ತು ಜನಸಂಖ್ಯೆ ಸರಾಸರಿ ಫಲಿತಾಂಶವು ನಿಯಂತ್ರಣದಲ್ಲಿದೆ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), ನಂತರ ಯಾವುದೇ ನಿರ್ದಿಷ್ಟ ವ್ಯಕ್ತಿಗೆ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡದೆ ಸಹ, ನಾವು ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡಬಹುದು.

ಈಗ ನಾವು ನಮ್ಮ ಅಂದಾಜುಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಿದ್ದೇವೆ-ನಾವು ಅಂದಾಜು ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತಿರುವ ವಿಷಯ- ನಾವು ನಿಜವಾಗಿ ಅದನ್ನು ಹೇಗೆ ದತ್ತಾಂಶದಿಂದ ಅಂದಾಜು ಮಾಡಬಲ್ಲೆವು ಎಂದು ತಿರುಗುತ್ತದೆ. ಈ ಅಂದಾಜಿನ ಸವಾಲನ್ನು ಮಾದರಿ ಸಮಸ್ಯೆಯಂತೆ ಯೋಚಿಸುವುದು ನಾನು ಇಷ್ಟಪಡುತ್ತೇನೆ (3 ನೇ ಅಧ್ಯಾಯದಲ್ಲಿ ಗಣಿತದ ಟಿಪ್ಪಣಿಗಳಿಗೆ ಯೋಚಿಸಿ). ನಾವು ಯಾದೃಚ್ಛಿಕವಾಗಿ ಚಿಕಿತ್ಸೆಯಲ್ಲಿ ಸ್ಥಿತಿಯನ್ನು ಗಮನಿಸಲು ಕೆಲವು ಜನರನ್ನು ಆರಿಸಿ ಮತ್ತು ನಾವು ಯಾದೃಚ್ಛಿಕವಾಗಿ ನಿಯಂತ್ರಣ ಸ್ಥಿತಿಯಲ್ಲಿ ವೀಕ್ಷಿಸಲು ಕೆಲವು ಜನರನ್ನು ಆರಿಸಿ, ನಂತರ ನಾವು ಪ್ರತಿ ಸ್ಥಿತಿಯಲ್ಲಿ ಸರಾಸರಿ ಫಲಿತಾಂಶವನ್ನು ಅಂದಾಜು ಮಾಡಬಹುದು:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

ಅಲ್ಲಿ \(N_t\) ಮತ್ತು \(N_c\) ಚಿಕಿತ್ಸೆಯಲ್ಲಿ ಮತ್ತು ನಿಯಂತ್ರಣ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿರುವ ಜನರ ಸಂಖ್ಯೆ. ಸಮೀಕರಣ 4.4 ಎಂದರೆ ಅಂದಾಜು ಅಂದಾಜುಗಾರ. ಮಾದರಿ ವಿನ್ಯಾಸದ ಕಾರಣದಿಂದಾಗಿ, ಚಿಕಿತ್ಸೆಯಡಿಯಲ್ಲಿನ ಸರಾಸರಿ ಫಲಿತಾಂಶಕ್ಕಾಗಿ ಮೊದಲ ಪದವು ಪಕ್ಷಪಾತವಿಲ್ಲದ ಅಂದಾಜುದಾರನೆಂದು ನಾವು ತಿಳಿದಿದ್ದೇವೆ ಮತ್ತು ಎರಡನೆಯ ಅವಧಿ ನಿಯಂತ್ರಣವಿಲ್ಲದ ಪಕ್ಷಪಾತವಿಲ್ಲದ ಅಂದಾಜಕವಾಗಿದೆ.

ಯಾದೃಚ್ಛಿಕಗೊಳಿಸುವಿಕೆಯು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದರ ಬಗ್ಗೆ ಯೋಚಿಸುವುದು ಇನ್ನೊಂದು ಮಾರ್ಗವಾಗಿದೆ, ಇದು ಚಿಕಿತ್ಸೆ ಮತ್ತು ನಿಯಂತ್ರಣ ಗುಂಪುಗಳ ನಡುವಿನ ಹೋಲಿಕೆ ನ್ಯಾಯೋಚಿತವಾಗಿದೆ ಏಕೆಂದರೆ ಯಾದೃಚ್ಛಿಕತೆಯು ಎರಡು ಗುಂಪುಗಳು ಪರಸ್ಪರ ಹೋಲುತ್ತದೆ ಎಂದು ಖಚಿತಪಡಿಸುತ್ತದೆ. ನಾವು ಹೋಲಿಸಿದ ವಿಷಯಗಳಿಗೆ (ಪ್ರಯೋಗಕ್ಕಿಂತ ಮುಂಚೆ 30 ದಿನಗಳಲ್ಲಿ ಸಂಪಾದನೆಗಳ ಸಂಖ್ಯೆಯನ್ನು ಹೇಳುವುದಾದರೆ) ಮತ್ತು ನಾವು ಅಳತೆ ಮಾಡದಿರುವ ವಿಷಯಗಳಿಗೆ (ಲಿಂಗದೆಂದು ಹೇಳುತ್ತಾರೆ) ಈ ಹೋಲಿಕೆಯನ್ನು ಹೊಂದಿದೆ. ಗಮನಿಸಿದ ಮತ್ತು ಗಮನಿಸದ ಅಂಶಗಳ ಮೇಲೆ ಸಮತೋಲನವನ್ನು ಖಚಿತಪಡಿಸುವ ಈ ಸಾಮರ್ಥ್ಯವು ವಿಮರ್ಶಾತ್ಮಕವಾಗಿದೆ. ಲೆಕ್ಕಪರಿಶೋಧಕ ಅಂಶಗಳ ಮೇಲೆ ಸ್ವಯಂಚಾಲಿತ ಸಮತೋಲನದ ಶಕ್ತಿಯನ್ನು ನೋಡುವುದಕ್ಕಾಗಿ, ಮಹಿಳೆಯರಿಗಿಂತ ಪುರುಷರು ಪುರುಷರಿಗೆ ಹೆಚ್ಚು ಪ್ರತಿಸ್ಪಂದನೆ ನೀಡುತ್ತಾರೆ ಎಂದು ಮುಂದಿನ ಸಂಶೋಧನೆಯು ಊಹಿಸುತ್ತದೆ. ಅದು ರೆಸಿವೋ ಮತ್ತು ವ್ಯಾನ್ ಡೆ ರಿಜ್ಟ್ರ ಪ್ರಯೋಗದ ಫಲಿತಾಂಶಗಳನ್ನು ಅಮಾನ್ಯಗೊಳಿಸಬಹುದೇ? ಯಾದೃಚ್ಛಿಕಗೊಳಿಸುವಿಕೆಯಿಂದ, ಎಲ್ಲ ನಿರೀಕ್ಷಿತವಲ್ಲದರು ನಿರೀಕ್ಷೆಯಲ್ಲಿ, ಸಮತೋಲಿತರಾಗುತ್ತಾರೆ ಎಂದು ಅವರು ಖಚಿತಪಡಿಸಿದರು. ಅಜ್ಞಾತರಿಗೆ ವಿರುದ್ಧವಾಗಿರುವ ಈ ಸಂರಕ್ಷಣೆ ಅತ್ಯಂತ ಶಕ್ತಿಯುತವಾಗಿದೆ, ಮತ್ತು ಇದು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ವಿವರಿಸಿದ ಪ್ರಾಯೋಗಿಕವಲ್ಲದ ತಂತ್ರಗಳಿಂದ ಪ್ರಯೋಗಗಳು ವಿಭಿನ್ನವಾದ ಒಂದು ಪ್ರಮುಖ ವಿಧಾನವಾಗಿದೆ.

ಸಂಪೂರ್ಣ ಜನಸಂಖ್ಯೆಯ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದರ ಜೊತೆಗೆ, ಜನರ ಉಪವಿಭಾಗಕ್ಕೆ ಚಿಕಿತ್ಸೆ ಪರಿಣಾಮವನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು ಸಾಧ್ಯವಿದೆ. ಇದನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಶರತ್ತಿನ ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮ (CATE) ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ರೆಸಿವೊ ಮತ್ತು ವ್ಯಾನ್ ಡಿ ರಿಜ್ಟ್ ಅವರ ಅಧ್ಯಯನದ ಪ್ರಕಾರ, ಪ್ರಯೋಗವು 90 ದಿನಗಳ ಮೊದಲು ಸಂಪಾದಕರ ಸರಾಸರಿ ಸಂಖ್ಯೆಯ ಮೇಲೆ ಅಥವಾ ಸಂಪಾದಕರಾಗಿದೆಯೆ ಎಂಬುದು \(X_i\) ಎಂದು \(X_i\) . ಈ ಬೆಳಕು ಮತ್ತು ಭಾರೀ ಸಂಪಾದಕರಿಗೆ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಲೆಕ್ಕಹಾಕಬಹುದು.

ಸಂಭವನೀಯ ಫಲಿತಾಂಶಗಳ ಚೌಕಟ್ಟನ್ನು ಕಾರಣವಾದ ನಿರ್ಣಯ ಮತ್ತು ಪ್ರಯೋಗಗಳ ಬಗ್ಗೆ ಯೋಚಿಸುವುದು ಪ್ರಬಲ ಮಾರ್ಗವಾಗಿದೆ. ಹೇಗಾದರೂ, ನೀವು ನೆನಪಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕಾದ ಎರಡು ಹೆಚ್ಚುವರಿ ಸಂಕೀರ್ಣತೆಗಳಿವೆ. ಈ ಎರಡು ಸಂಕೀರ್ಣತೆಗಳನ್ನು ಹೆಚ್ಚಾಗಿ ಒಗ್ಗೂಡಿಸಲಾಗುತ್ತದೆ ಸ್ಟಬಲ್ ಯೂನಿಟ್ ಟ್ರೀಟ್ಮೆಂಟ್ ವ್ಯಾಲ್ಯೂ ಅಸಂಪ್ಷನ್ (SUTVA) ಪದ. SUTVA ಯ ಮೊದಲ ಭಾಗವು ವ್ಯಕ್ತಿಯು \(i\) ಫಲಿತಾಂಶಕ್ಕೆ ಸಂಬಂಧಪಟ್ಟ ವಿಷಯವೆಂದರೆ ಆ ವ್ಯಕ್ತಿಯು ಚಿಕಿತ್ಸೆಯಲ್ಲಿ ಅಥವಾ ನಿಯಂತ್ರಣ ಸ್ಥಿತಿಯಲ್ಲಿದ್ದಾನೆ ಎಂಬ ಊಹೆಯಿದೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಇತರ ಜನರಿಗೆ ನೀಡಲಾದ ಚಿಕಿತ್ಸೆಯಿಂದಾಗಿ ಆ ವ್ಯಕ್ತಿಯು \(i\) ಪ್ರಭಾವ ಬೀರುವುದಿಲ್ಲ ಎಂದು ಭಾವಿಸಲಾಗಿದೆ. ಇದನ್ನು ಕೆಲವೊಮ್ಮೆ "ಯಾವುದೇ ಹಸ್ತಕ್ಷೇಪ" ಅಥವಾ "ಇಲ್ಲ ಸ್ಪಿಲ್ಲೋವರ್ಗಳು" ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ, ಮತ್ತು ಇದನ್ನು ಹೀಗೆ ಬರೆಯಬಹುದು:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

ಎಲ್ಲಿ \(\mathbf{W_{-i}}\) ವ್ಯಕ್ತಿಯು \(i\) ಹೊರತುಪಡಿಸಿ ಎಲ್ಲರಿಗೂ ಚಿಕಿತ್ಸೆ ಸ್ಥಿತಿಗಳ ವೆಕ್ಟರ್ ಆಗಿದೆ. ಒಬ್ಬ ವ್ಯಕ್ತಿಯ ಚಿಕಿತ್ಸೆಯು ಇನ್ನೊಬ್ಬ ವ್ಯಕ್ತಿಗೆ ಧನಾತ್ಮಕವಾಗಿ ಅಥವಾ ಋಣಾತ್ಮಕವಾಗಿ ಚೆಲ್ಲುತ್ತದೆಯಾದರೆ ಇದು ಉಲ್ಲಂಘಿಸಬಹುದಾದ ಒಂದು ವಿಧಾನವಾಗಿದೆ. Restivo ಮತ್ತು ವ್ಯಾನ್ ಡೆ ರಿಜಟ್ನ ಪ್ರಯೋಗಕ್ಕೆ ಹಿಂತಿರುಗಿದ ನಂತರ, \(i\) ಮತ್ತು \(j\) ಮತ್ತು ಆ ವ್ಯಕ್ತಿ \(i\) ಇಬ್ಬರು ಸ್ನೇಹಿತರನ್ನು ಬರ್ನ್ಸ್ಟಾರ್ ಸ್ವೀಕರಿಸುತ್ತಾರೆ ಮತ್ತು \(j\) ಮಾಡುವುದಿಲ್ಲ. ಬಾರ್ನ್ಸ್ಟಾರ್ಗೆ \(j\) ಅನ್ನು ಹೆಚ್ಚು (ಸಂಪಾದನೆಯ ಅರ್ಥದಲ್ಲಿ) ಸಂಪಾದಿಸಲು ಅಥವಾ ಕಡಿಮೆ (ಹತಾಶೆಯ ಅರ್ಥದಲ್ಲಿ) ಸಂಪಾದಿಸಲು \(i\) ಆಗಿದ್ದರೆ, ನಂತರ SUTVA ಅನ್ನು ಉಲ್ಲಂಘಿಸಲಾಗಿದೆ. ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವು ಚಿಕಿತ್ಸೆ ಪಡೆಯುವ ಇತರ ಜನರ ಒಟ್ಟು ಸಂಖ್ಯೆಯ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದ್ದರೆ ಅದನ್ನು ಉಲ್ಲಂಘಿಸಬಹುದು. ಉದಾಹರಣೆಗೆ, ರೆಸ್ಟ್ವೊ ಮತ್ತು ವ್ಯಾನ್ ಡಿ ರಿಜ್ಟ್ 100 ಕ್ಕಿಂತ ಬದಲಾಗಿ 1,000 ಅಥವಾ 10,000 ಬಾರ್ನ್ಸ್ಟಾರ್ಗಳನ್ನು ನೀಡಿದ್ದರೆ, ಇದು ಬಾರ್ನ್ಸ್ಟಾರ್ ಅನ್ನು ಪಡೆಯುವ ಪರಿಣಾಮವನ್ನು ಪ್ರಭಾವಿಸುತ್ತದೆ.

ಎರಡನೆಯ ಸಂಚಿಕೆಯು SUTVA ಆಗಿ ಸುತ್ತುವರಿಯಲ್ಪಟ್ಟಿದೆ, ಇದು ಸಂಶೋಧಕನು ನೀಡುವ ಏಕೈಕ ಸೂಕ್ತವಾದ ಚಿಕಿತ್ಸೆಯಾಗಿದೆ; ಈ ಕಲ್ಪನೆಯನ್ನು ಕೆಲವೊಮ್ಮೆ ಗುಪ್ತ ಚಿಕಿತ್ಸೆಗಳು ಅಥವಾ ಹೊರಗಿಡುವಿಕೆ ಎಂದು ಕರೆಯಲಾಗುವುದಿಲ್ಲ. ಉದಾಹರಣೆಗೆ, ರೆಸಿವೊ ಮತ್ತು ವ್ಯಾನ್ ಡಿ ರಿಜಟ್ನಲ್ಲಿ, ಬಾರ್ನ್ಸ್ಟಾರ್ ನೀಡುವ ಮೂಲಕ ಸಂಶೋಧಕರು ಸಂಪಾದಕರನ್ನು ಜನಪ್ರಿಯ ಸಂಪಾದಕರ ಪುಟದಲ್ಲಿ ಕಾಣಿಸಿಕೊಂಡಿತು ಮತ್ತು ಅದು ಜನಪ್ರಿಯ ಸಂಪಾದಕರ ಪುಟದಲ್ಲಿ-ಬಾರ್ನ್ಸ್ಟಾರ್- ಇದು ಸಂಪಾದನೆ ನಡವಳಿಕೆಯ ಬದಲಾವಣೆಯನ್ನು ಉಂಟುಮಾಡಿದೆ. ಇದು ನಿಜವಾಗಿದ್ದರೆ, ಬರ್ನಾರ್ಸ್ಟರಿನ ಪರಿಣಾಮವು ಜನಪ್ರಿಯ ಸಂಪಾದಕರ ಪುಟದ ಪರಿಣಾಮದಿಂದ ಭಿನ್ನವಾಗಿರುವುದಿಲ್ಲ. ಸಹಜವಾಗಿ, ಒಂದು ವೈಜ್ಞಾನಿಕ ದೃಷ್ಟಿಕೋನದಿಂದ, ಇದು ಆಕರ್ಷಕ ಅಥವಾ ಆಕರ್ಷಕವಲ್ಲದ ಎಂದು ಪರಿಗಣಿಸಬೇಕಾದರೆ ಅದು ಸ್ಪಷ್ಟವಾಗಿಲ್ಲ. ಅಂದರೆ, ಬಾರ್ನ್ಸ್ಟಾರ್ ಅನ್ನು ಸ್ವೀಕರಿಸುವ ಪರಿಣಾಮವು ಬರ್ನ್ಸ್ಟಾರ್ ಪ್ರಚೋದಿಸುವ ಎಲ್ಲಾ ನಂತರದ ಚಿಕಿತ್ಸೆಯನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ ಎಂದು ಸಂಶೋಧಕರು ಹೇಳಿದ್ದಾರೆ. ಅಥವಾ ಈ ಎಲ್ಲಾ ಸಂಗತಿಗಳಿಂದ ಬಾರ್ನ್ಸ್ಟಾರ್ಸ್ನ ಪರಿಣಾಮವನ್ನು ಪ್ರತ್ಯೇಕಿಸಲು ಒಂದು ಸಂಶೋಧನೆಯು ಬಯಸಿದ ಪರಿಸ್ಥಿತಿಯನ್ನು ನೀವು ಊಹಿಸಬಹುದು. Gerber and Green (2012) (ಸರಿಸುಮಾರು) "ಸಮ್ಮಿತಿಗೆ ಮುರಿದುಹೋಗುವಿಕೆ" ಎಂದು ಕರೆದೊಯ್ಯುವ ಯಾವುದಾದರೂ Gerber and Green (2012) ಎಂದು ಕೇಳಲು ಇದರ ಬಗ್ಗೆ ಯೋಚಿಸುವುದು ಒಂದು ಮಾರ್ಗವೇ? ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಚಿಕಿತ್ಸೆ ಮತ್ತು ನಿಯಂತ್ರಣ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ಜನರು ವಿಭಿನ್ನವಾಗಿ ಚಿಕಿತ್ಸೆ ಪಡೆಯುವ ಚಿಕಿತ್ಸೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಬೇರೆ ಯಾವುದೂ ಇಲ್ಲವೇ? ಸಮ್ಮಿತಿ ಮುರಿಯುವುದರ ಬಗ್ಗೆ ಕಳವಳಗಳು ವೈದ್ಯಕೀಯ ಪರೀಕ್ಷೆಗಳಲ್ಲಿ ನಿಯಂತ್ರಣ ಗುಂಪಿನಲ್ಲಿನ ಪ್ರಮುಖ ರೋಗಿಗಳು ಪ್ಲೇಸ್ಬೊ ಮಾತ್ರೆ ತೆಗೆದುಕೊಳ್ಳಲು ಕಾರಣವಾಗಿವೆ. ಆ ರೀತಿಯಲ್ಲಿ, ಎರಡು ಪರಿಸ್ಥಿತಿಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೆಂದರೆ ನಿಜವಾದ ಔಷಧ ಮತ್ತು ಮಾತ್ರೆ ತೆಗೆದುಕೊಳ್ಳುವ ಅನುಭವವಲ್ಲ ಎಂದು ಸಂಶೋಧಕರು ಖಚಿತವಾಗಿ ಹೇಳಬಹುದು.

SUTVA ಕುರಿತು ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ, Morgan and Winship (2014) Gerber and Green (2012) , ವಿಭಾಗ 2.5 ರ Morgan and Winship (2014) ಮತ್ತು ವಿಭಾಗ 1.6 Imbens and Rubin (2015) ವಿಭಾಗ 2.7 ಅನ್ನು ನೋಡಿ.

ನಿಖರತೆ

ಹಿಂದಿನ ವಿಭಾಗದಲ್ಲಿ, ನಾನು ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡಲು ಹೇಗೆ ವಿವರಿಸಿದ್ದೇನೆ. ಈ ವಿಭಾಗದಲ್ಲಿ, ಆ ಅಂದಾಜಿನ ವ್ಯತ್ಯಾಸದ ಕುರಿತು ನಾನು ಕೆಲವು ವಿಚಾರಗಳನ್ನು ನೀಡುತ್ತೇನೆ.

ಎರಡು ಮಾದರಿಯ ವಿಧಾನಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಅಂದಾಜು ಮಾಡುವಂತೆ ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮವನ್ನು ಅಂದಾಜು ಮಾಡುವುದರ ಬಗ್ಗೆ ನೀವು ಯೋಚಿಸಿದರೆ, ಸರಾಸರಿ ಚಿಕಿತ್ಸೆಯ ಪರಿಣಾಮದ ಪ್ರಮಾಣಿತ ದೋಷವು:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

ಅಲ್ಲಿ \(m\) ಜನರು ಚಿಕಿತ್ಸೆಗಾಗಿ ನಿಯೋಜಿಸಲಾಗಿದೆ ಮತ್ತು ನಿಯಂತ್ರಣಕ್ಕೆ \(Nm\) (ನೋಡಿ Gerber and Green (2012) , ಇಕ್. 3.4). ಆದ್ದರಿಂದ, ಎಷ್ಟು ಜನರು ಚಿಕಿತ್ಸೆಗೆ ನಿಯೋಜಿಸಲು ಮತ್ತು ಎಷ್ಟು ನಿಯಂತ್ರಿಸಲು ನಿಯೋಜಿಸಲು ಬಗ್ಗೆ ಯೋಚಿಸುವಾಗ, ನೀವು \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , ನಂತರ ನೀವು \(m \approx N / 2\) ಬಯಸುತ್ತೀರಿ, ಚಿಕಿತ್ಸೆ ಮತ್ತು ನಿಯಂತ್ರಣದ ವೆಚ್ಚಗಳು ಒಂದೇ ಆಗಿರುತ್ತದೆ. ಮತದಾನದ ಮೇಲಿನ ಸಾಮಾಜಿಕ ಮಾಹಿತಿಯ ಪರಿಣಾಮಗಳ ಕುರಿತು ಬಾಂಡ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳ ವಿನ್ಯಾಸ (2012) ಏಕೆ ವಿಶ್ಲೇಷಣೆ 4.6 ಸ್ಪಷ್ಟೀಕರಿಸುತ್ತದೆ (ಅಂಕಿ 4.18) ಅಂಕಿಅಂಶಗಳ ಪ್ರಕಾರ ಅಸಮರ್ಥವಾಗಿದೆ. ಚಿಕಿತ್ಸೆಯ ಸ್ಥಿತಿಯಲ್ಲಿ 98% ಪಾಲ್ಗೊಳ್ಳುವವರು ಹೊಂದಿದ್ದಾರೆಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ. ಇದರರ್ಥ ನಿಯಂತ್ರಣ ಸ್ಥಿತಿಯಲ್ಲಿನ ಸರಾಸರಿ ನಡವಳಿಕೆ ನಿಖರವಾಗಿ ಅಂದಾಜು ಮಾಡಲಾಗಿಲ್ಲ ಎಂದು ಅಂದಾಜಿಸಲಾಗಿಲ್ಲ, ಇದರ ಅರ್ಥವೆಂದರೆ ಚಿಕಿತ್ಸೆ ಮತ್ತು ನಿಯಂತ್ರಣ ಸ್ಥಿತಿಯ ನಡುವಿನ ಅಂದಾಜು ವ್ಯತ್ಯಾಸವನ್ನು ನಿಖರವಾಗಿ ಅಂದಾಜು ಮಾಡಲಾಗಿಲ್ಲ ಎಂದು ಅಂದಾಜು ಮಾಡಲಾಗುವುದಿಲ್ಲ. ಪಾಲ್ಗೊಳ್ಳುವವರ ಸೂಕ್ತ ಹಂಚಿಕೆಗೆ ಸಂಬಂಧಿಸಿದಂತೆ, ಪರಿಸ್ಥಿತಿಗಳ ನಡುವೆ ವೆಚ್ಚಗಳು ಭಿನ್ನವಾಗಿರುವುದನ್ನು ಒಳಗೊಂಡಂತೆ ಪರಿಸ್ಥಿತಿಗಳಿಗೆ, List, Sadoff, and Wagner (2011) .

ಅಂತಿಮವಾಗಿ, ಮುಖ್ಯ ಪಠ್ಯದಲ್ಲಿ, ವ್ಯತ್ಯಾಸದ-ವ್ಯತ್ಯಾಸದ ಅಂದಾಜನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಮಿಶ್ರ ವಿನ್ಯಾಸದಲ್ಲಿ ಹೇಗೆ ಬಳಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ವಿವರಿಸಬಹುದು, ಒಂದು ವ್ಯತ್ಯಾಸ-ಅಂದಾಜು ಅಂದಾಜುಗಿಂತ ಸಣ್ಣ ಭಿನ್ನತೆಗೆ ಕಾರಣವಾಗಬಹುದು, ಇದನ್ನು ಸಾಮಾನ್ಯವಾಗಿ-ವಿಷಯಗಳ ನಡುವೆ ಬಳಸಲಾಗುತ್ತದೆ ವಿನ್ಯಾಸ. ಚಿಕಿತ್ಸೆಯ ಮೊದಲು ಫಲಿತಾಂಶದ ಮೌಲ್ಯವು \(X_i\) ಆಗಿದ್ದರೆ, ವ್ಯತ್ಯಾಸದ ವ್ಯತ್ಯಾಸದೊಂದಿಗೆ ನಾವು ಅಂದಾಜು ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತಿರುವ ಪ್ರಮಾಣವೆಂದರೆ:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

ಆ ಪ್ರಮಾಣದಲ್ಲಿನ ಸಾಮಾನ್ಯ ದೋಷವೆಂದರೆ (ನೋಡಿ Gerber and Green (2012) , ಇಕ್. 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Eq ನ ಹೋಲಿಕೆ. 4.6 ಮತ್ತು eq. 4.8 ರಲ್ಲಿ ಭಿನ್ನಾಭಿಪ್ರಾಯದ ವ್ಯತ್ಯಾಸವು ಸಣ್ಣ ಪ್ರಮಾಣಿತ ದೋಷವನ್ನು ಹೊಂದಿರುತ್ತದೆ (ನೋಡಿ Gerber and Green (2012) , eq 4.6)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

ಸ್ಥೂಲವಾಗಿ, \(X_i\) \(Y_i(1)\) ಮತ್ತು \(Y_i(0)\) \(X_i\) ಅನ್ನು ಬಹಳ ಮುನ್ಸೂಚನೆಯುಳ್ಳದ್ದಾಗಿದ್ದರೆ, ನಂತರ ವ್ಯತ್ಯಾಸದ ವ್ಯತ್ಯಾಸಕ್ಕಿಂತಲೂ ಭಿನ್ನಾಭಿಪ್ರಾಯದ ವ್ಯತ್ಯಾಸದಿಂದ ನೀವು ಹೆಚ್ಚು ನಿಖರವಾದ ಅಂದಾಜುಗಳನ್ನು ಪಡೆಯಬಹುದು. ಅಂದರೆ ಒಂದು. ರೆಸ್ಟ್ವೊ ಮತ್ತು ವ್ಯಾನ್ ಡೆ ರಿಜಟ್ ಅವರ ಪ್ರಯೋಗದ ಬಗ್ಗೆ ಯೋಚಿಸಲು ಒಂದು ಮಾರ್ಗವೆಂದರೆ ಜನರು ಸಂಪಾದಿಸುವ ಪ್ರಮಾಣದಲ್ಲಿ ಸಾಕಷ್ಟು ನೈಸರ್ಗಿಕ ವ್ಯತ್ಯಾಸವಿದೆ, ಆದ್ದರಿಂದ ಇದು ಚಿಕಿತ್ಸೆಯನ್ನು ಮತ್ತು ನಿಯಂತ್ರಣ ಪರಿಸ್ಥಿತಿಯನ್ನು ಕಷ್ಟಕರವಾಗಿ ಹೋಲುತ್ತದೆ: ಇದು ಸಂಬಂಧವನ್ನು ಪತ್ತೆ ಹಚ್ಚುವುದು ಕಷ್ಟ ಗದ್ದಲದ ಫಲಿತಾಂಶ ಡೇಟಾದಲ್ಲಿ ಸಣ್ಣ ಪರಿಣಾಮ. ಆದರೆ ನೀವು ನೈಸರ್ಗಿಕವಾಗಿ ಸಂಭವಿಸುವ ವ್ಯತ್ಯಾಸವನ್ನು ವ್ಯತ್ಯಾಸಗೊಳಿಸಿದರೆ, ಆಗ ಕಡಿಮೆ ವ್ಯತ್ಯಾಸವಿದೆ, ಮತ್ತು ಅದು ಸಣ್ಣ ಪರಿಣಾಮವನ್ನು ಸುಲಭವಾಗಿ ಗುರುತಿಸುತ್ತದೆ.

Frison and Pocock (1992) , ವಿಧಾನಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸ, ಭಿನ್ನಾಭಿಪ್ರಾಯಗಳ ವ್ಯತ್ಯಾಸ, ಮತ್ತು ANCOVA- ಆಧರಿತ ವಿಧಾನಗಳು ಹೆಚ್ಚಿನ ಅಳತೆಗಳನ್ನು ಪೂರ್ವ-ಚಿಕಿತ್ಸೆ ಮತ್ತು ನಂತರದ ಚಿಕಿತ್ಸೆಯಲ್ಲಿ ಇರುವ ಸಾಮಾನ್ಯ ಸೆಟ್ಟಿಂಗ್ಗಳಲ್ಲಿ ನೋಡಿ. ನಿರ್ದಿಷ್ಟವಾಗಿ, ಅವರು ಬಲವಂತವಾಗಿ ANCOVA ಅನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತಾರೆ, ಅದು ನಾನು ಇಲ್ಲಿ ಒಳಗೊಂಡಿಲ್ಲ. ಇದಲ್ಲದೆ, McKenzie (2012) ನೋಡಿ ನಂತರದ ಚಿಕಿತ್ಸೆಯ ನಂತರದ ಫಲಿತಾಂಶಗಳ ಬಹುಮುಖ್ಯತೆಯ ಚರ್ಚೆಗೆ.