2.4.3 experimente Apropierea

Putem aproximative experimente pe care nu le putem face. Două abordări care beneficiază în special de la vârsta digitală sunt potrivite și experimente naturale.

Multe dintre importante întrebări științifice și politice sunt cauzale. Să ne gândim, de exemplu, următoarea întrebare: care este efectul unui program de formare de locuri de muncă pe salarii? O modalitate de a răspunde la această întrebare ar fi cu un experiment randomizat, controlat, în cazul în care muncitorii au fost repartizati aleatoriu pentru a primi fie de formare sau nu beneficiază de o formare. Apoi, cercetatorii ar putea estima efectul de formare a acestor participanți prin simpla comparare a salariilor persoanelor care au primit de formare pentru cei care nu au primit-o.

Comparația simplă este validă din cauza a ceva ce se întâmplă înainte ca datele au fost colectate chiar: randomizare. Fără a randomizare, problema este mult mai complicată. Un cercetător ar putea compara salariile persoanelor care au semnat în mod voluntar pentru formarea celor care nu au semnat-up. Această comparație ar arăta, probabil, că persoanele care au beneficiat de formare a câștigat mai mult, dar cât de mult din acest lucru este din cauza formării și cât de mult din acest lucru se datorează faptului că oamenii care se înscriu-up pentru formare sunt diferite de cele pe care nu o înscriere pentru antrenament? Cu alte cuvinte, este corect să se compare salariile acestor două grupuri de oameni?

Această preocupare cu privire la comparatii corecte conduce pe unii cercetători să creadă că este imposibil să se facă estimări cauzale fără a executa un experiment. Această afirmație a merge prea departe. Deși este adevărat că experimentele furnizează cele mai puternice dovezi pentru efectele cauzale, există și alte strategii care pot oferi estimări cauzale valoroase. În loc de a gândi că estimările cauzale sunt fie ușor (în cazul experimentelor) sau imposibilă (în cazul observat pasiv datelor), este mai bine să se gândească la strategii pentru a face estimări cauzale situate de-a lungul unui proces continuu de la cel mai puternic la cel mai slab (Figura 2.4). La cel mai puternic capăt al continuumului sunt randomizate experimente controlate. Însă, acestea sunt adesea dificil de făcut în cercetarea socială, deoarece multe tratamente necesită cantități nerealiste de cooperare din partea guvernelor sau companiilor; pur și simplu, există mai multe experimente pe care nu le putem face. Voi dedica tot capitolul 4 atât punctele forte și punctele slabe ale experimentelor randomizate controlate, iar eu voi argumenta că, în unele cazuri, există motive etice foarte puternice pentru a prefera observațional metodelor experimentale.

Figura 2.4: Continuum strategiilor de cercetare pentru efectele cauzale estimate.

Figura 2.4: Continuum strategiilor de cercetare pentru efectele cauzale estimate.

Se deplasează de-a lungul continuumului, există situații în care cercetătorii nu au randomizat în mod explicit. Asta este, cercetătorii încearcă să învețe cunoștințe de experiment, fără a face de fapt un experiment; în mod natural, acest lucru va fi dificil, dar datele mari imbunatateste foarte mult capacitatea noastra de a face estimări cauzale în aceste situații.

Uneori, există setări în cazul în care, în lume, dezordine se întâmplă pentru a crea ceva ca un experiment pentru cercetători. Aceste modele sunt numite experimente naturale, iar acestea vor fi luate în considerare în detaliu în secțiunea 2.4.3.1. Două caracteristici ale surselor-lor mari de date de natură mereu pe și mărimea lor, în mare măsură, îmbunătățește capacitatea noastră de a învăța de la experimentele naturale atunci când acestea apar.

Se deplasează mai departe de experimente controlate randomizate, uneori, nu există nici măcar un eveniment în natură pe care le putem folosi pentru a aproxima un experiment natural. În aceste setări, putem construi cu atenție comparații în datele de bază non-experimentale într-o încercare de a apropia un experiment. Aceste modele sunt numite de potrivire, iar acestea vor fi luate în considerare în detaliu în secțiunea 2.4.3.2. La fel ca experimentele naturale, potrivirea este un design care beneficiază de asemenea surse de date mari. În special, dimensiunea masivă, atât în ​​ceea ce privește numărul de cazuri și tipul de informații pe caz, în mare măsură, facilitează potrivirea. Diferența esențială dintre experimente naturale și de potrivire este că, în experimente naturale cercetătorul cunoaște procesul prin care tratamentul a fost repartizat și consideră că este aleatoare.

Conceptul de comparații echitabile care au motivat dorințele de a face experimente sta la baza , de asemenea , cele două abordări alternative: experimente naturale si de potrivire. Aceste abordări vă vor permite să se estimeze efectele cauzale din datele observate în mod pasiv prin descoperirea unor comparații corecte care stau în interiorul datelor pe care le au deja.