2.4.3 experiments que s'aproxima

Podem aproximar experiments que no podem fer. Dos enfocaments que beneficiïn especialment a partir de l'era digital són coincidents i els experiments naturals.

Molts importants qüestions científiques i de política són causals. Considerem, per exemple, la següent pregunta: quin és l'efecte d'un programa de capacitació laboral en els salaris? Una manera de respondre a aquesta pregunta seria amb un experiment controlat aleatori on els treballadors van ser assignats a l'atzar a rebre una formació o no rebre entrenament. Després, els investigadors van poder estimar l'efecte de l'entrenament per a aquests participants simplement comparant els salaris de les persones que van rebre l'entrenament per als que no l'han acollit.

La simple comparació és vàlida, degut a alguna cosa que passa abans que fins i tot es van recollir les dades: l'aleatorització. Sense l'assignació a l'atzar, el problema és molt més complicat. Un investigador podria comparar els salaris de les persones que van signar voluntàriament per a la formació dels que no registre. Aquesta comparació probablement demostren que les persones que van rebre capacitació van guanyar més, però quant d'això és causa de la formació i quant d'això és perquè la gent d'inscriure per a l'entrenament són diferents de les que no subscriguin a punt per a la formació? En altres paraules, ¿és just comparar els salaris d'aquests dos grups de persones?

Aquesta preocupació per comparacions justes porta a alguns investigadors a creure que és impossible fer estimacions causals sense executar un experiment. Aquesta afirmació va massa lluny. Si bé és cert que els experiments proporcionen l'evidència més forta dels efectes causals, hi ha altres estratègies que poden proporcionar estimacions causals valuosos. En lloc de pensar que les estimacions causals són ben fàcil (en el cas dels experiments) o impossible (en el cas de forma passiva les dades observades), és millor pensar en les estratègies per fer estimacions causals s'estén al llarg d'un continu que va de fort al més dèbil (Figura 2.4). En l'extrem més fort del continu són aleatoris experiments controlats. No obstant això, aquests sovint són difícils de fer en la investigació social, perquè molts tractaments requereixen quantitats poc realistes de cooperació per part dels governs o empreses; simplement hi ha molts experiments que no podem fer. Vaig a dedicar tot el capítol 4 de les fortaleses i debilitats dels experiments controlats aleatoris, i vaig a argumentar que, en alguns casos, hi ha raons ètiques fortes per preferir observacional als mètodes experimentals.

Figura 2.4: continu de les estratègies d'investigació dels efectes causals estimats.

Figura 2.4: continu de les estratègies d'investigació dels efectes causals estimats.

Movent-se al llarg del continu, hi ha situacions en què els investigadors no han aleatoris de manera explícita. És a dir, els investigadors estan tractant d'aprendre els coneixements experiment similar sense fer realment un experiment; Naturalment, això va a ser complicat, però les dades de gran millora en gran mesura la nostra capacitat per fer estimacions causals en aquestes situacions.

A vegades hi ha llocs on l'aleatorietat en el món passa a crear una mena experiment per als investigadors. Aquests dissenys es diuen experiments naturals, i que seran considerades en detall en la secció 2.4.3.1. Dues característiques de les fonts de dades grans-seva naturalesa sempre activa i la seva grandària augmenta en gran mesura la nostra capacitat d'aprendre dels experiments naturals quan es produeixen.

Però avançar més lluny d'experiments controlats aleatoris, de vegades ni tan sols hi ha un esdeveniment en la natura que podem utilitzar per aproximar-se a un experiment natural. En aquesta configuració, podem construir acuradament les comparacions dins de les dades no experimentals en un intent d'aproximar un experiment. Aquests dissenys són cridats a joc, i que es consideraran en detall en la secció 2.4.3.2. Igual que els experiments naturals, a joc és un disseny que també es beneficia de les fonts de dades grans. En particular, la mida, tant massiu en termes del nombre de casos i el tipus d'informació per casos i facilita en gran mesura coincident. La diferència clau entre els experiments naturals i coincident és que en experiments naturals que l'investigador coneix el procés a través del qual s'assigna i es creu que és aleatòria del tractament.

El concepte de comparacions justes que van motivar als desitjos de fer experiments també subjau en els dos enfocaments alternatius: experiments naturals i coincident. Aquests enfocaments li permetrà estimar els efectes causals a partir de dades observades de forma passiva mitjançant el descobriment de comparacions justes que se sentin dins de les dades que ja té.