Tunaweza takriban majaribio kwamba hatuwezi kufanya. Njia mbili kwamba hasa kunufaika na umri digital ni vinavyolingana na majaribio ya asili.
muhimu kisayansi na sera maswali mengi ni causal. Hebu fikiria, kwa mfano, swali yafuatayo: nini athari za kazi mpango wa mafunzo juu ya mshahara? Moja ya njia ya kujibu swali hili itakuwa na randomized kudhibitiwa majaribio ambapo wafanyakazi walikuwa nasibu kwa ajili ya ama kupokea mafunzo au si kupokea mafunzo. Kisha, watafiti inaweza makisio athari za mafunzo kwa ajili ya washiriki hawa kwa kifupi kulinganisha mshahara wa watu ambao walipata mafunzo kwa wale ambao hawakuwa kuipokea.
kulinganisha rahisi ni halali kwa sababu ya jambo ambalo hufanyika kabla data hata zilizokusanywa: Ubahatishaji. Bila Ubahatishaji, tatizo ni trickier sana. mtafiti inaweza kulinganisha mishahara ya watu ambao kwa hiari saini kwa ajili ya mafunzo kwa wale ambao hawakuwa saini-up. kulinganisha ambayo pengine kuonyesha kwamba watu ambao walipata mafunzo chuma zaidi, lakini ni kiasi gani cha hii ni kwa sababu ya mafunzo na kiasi gani cha hii ni kwa sababu watu ishara-up kwa ajili ya mafunzo ni tofauti na wale ambao hawana ishara-up kwa ajili ya mafunzo? Kwa maneno mengine, ni haki kwa kulinganisha mshahara wa makundi haya mawili ya watu?
Tatizo hili kuhusu kulinganisha haki inaongoza baadhi ya watafiti kuamini kuwa ni vigumu kufanya makadirio causal bila ya mbio majaribio. Madai haya huenda pia mbali. Wakati ni kweli kwamba majaribio kutoa ushahidi wenye nguvu kwa ajili ya madhara causal, kuna mikakati mingine ambayo inaweza kutoa makadirio causal thamani. Badala ya kufikiri kwamba makadirio causal ni aidha rahisi (katika kesi ya majaribio) au haiwezekani (katika kesi ya passively aliona data), ni bora kufikiri ya mikakati ya kufanya makadirio causal uongo pamoja mwendelezo kutoka nguvu na dhaifu (Kielelezo 2.4). Mwishoni nguvu ya utoaji ni randomized majaribio kudhibitiwa. Lakini, hizi mara nyingi ni vigumu kufanya katika utafiti wa kijamii kwa sababu tiba nyingi zinahitaji kiasi unrealistic ya ushirikiano kutoka kwa serikali au makampuni; rahisi kabisa kuna watu majaribio mengi ambayo hatuwezi kufanya. Nami kujishughulisha wote wa sura ya 4 kwa uwezo na udhaifu wa randomized kudhibitiwa majaribio, na mimi itabidi wanasema kuwa katika baadhi ya kesi, kuna sababu zenye nguvu ya kimaadili kupendelea uchunguzi kwa njia ya majaribio.
Kusonga pamoja mwendelezo, kuna hali ambapo watafiti si wazi randomized. Yaani, watafiti wanajaribu kujifunza maarifa majaribio-kama bila kweli kufanya majaribio; asili, hii ni kwenda kuwa gumu, lakini data big inaboresha sana uwezo wetu wa kufanya makadirio causal katika hali hizi.
Wakati mwingine kuna mazingira ambapo randomness katika dunia hutokea kwa kuunda kitu kama majaribio kwa watafiti. Miundo hizi zinaitwa majaribio ya asili, na wao yatazingatiwa kwa undani katika Sehemu 2.4.3.1. makala mbili ya data kubwa vyanzo-asili yao ya daima-on na wao ukubwa-huongeza sana uwezo wetu wa kujifunza kutoka kwa majaribio ya asili wakati wao kutokea.
Kusonga zaidi mbali na randomized kudhibitiwa majaribio, wakati mwingine kuna hata tukio katika asili kwamba tunaweza kutumia kwa takriban majaribio ya asili. Katika mazingira haya, tunaweza makini kujenga kulinganisha ndani ya data zisizo majaribio katika jaribio la takriban majaribio. Miundo hizi zinaitwa vinavyolingana, na wao yatazingatiwa kwa undani katika Sehemu 2.4.3.2. Kama majaribio ya asili, vinavyolingana ni kubuni kwamba pia faida kutoka vyanzo kubwa data. Hasa, mkubwa ukubwa-katika suala la idadi ya matukio na aina ya habari kwa kila kesi-kwa kiasi kikubwa kuwezesha vinavyolingana. tofauti muhimu kati ya majaribio ya asili na vinavyolingana ni kwamba katika majaribio ya asili mtafiti anajua mchakato wa kupitia ambayo matibabu alipewa na anaamini kuwa ni random.
Dhana ya kulinganisha haki kwamba motisha tamaa ya kufanya majaribio pia iliongoza njia mbili mbadala: majaribio ya asili na vinavyolingana. Mbinu hizi kukuwezesha kukadiria madhara causal kutoka data passively kuzingatiwa na kugundua kulinganisha haki ameketi ndani ya takwimu kwamba tayari una.