2.4.3.1 Natuerlike eksperiminten

Natuerlike eksperiminten nimme foardiel fan willekeurige foarfallen yn de wrâld. random evenemint + altyd-op gegevens systeem = natuerlike eksperimint

De kaai nei willekeurich kontrolearren eksperiminten ynskeakeljen earlike ferliking is it randomization. Mar, sa no en dan wat bart der yn 'e wrâld, dat yn wêzen kieze minsken willekeurich of hast willekeurich nei ferskillende behannelings. Ien fan helderste foarbylden fan de strategy fan it gebrûk fan natuerlike eksperiminten komt út it ûndersyk fan Angrist (1990) , dat mjit it effekt fan militêre tsjinsten op ynkomsten.

Yn de oarloch yn Fietnam, de Feriene Steaten wreide de grutte fan syn wapene troepen troch in ûntwerp. Om te beslisse hokker boargers soe wurde neamd yn tsjinst, de Amerikaanske regear hâlden in lottery. Alle Birthdate waard fertsjintwurdige op in stik papier, en dizze papieren waarden pleatst yn in grutte glazen pot. As bliken yn Figure 2.5, dy slips fan papier waarden lutsen út de amer ien op in tiid om te bepalen fan de folchoarder dat jonge minsken soe wurde neamd te tsjinjen (jonge froulju wiene net ûnder it ûntwerp). Op grûn fan de resultaten, mannen berne op 14 septimber waarden neamd earst, manlju berne op 24 april waarden neamd twadde, en sa op. Uteinlik, yn dizze loterij, mannen berne op 195 ferskillende dagen waarden neamd nei tsjinst wylst minsken berne op 171 dagen waarden net neamd.

Figuer 2.5: Kongreslid Alexander Pirnie (R-NY) tekening fan de earste kapsule foar de Taal, Service ûntwerp op 1 desimber, 1969 Joshua Angrist (1990) kombinearre it ûntwerp lottery mei winst gegevens út de Sosjale Security Administration te skatten it effekt fan de militêre tsjinst op earnings. Dit is in foarbyld fan ûndersyk mei help fan in natuerlike eksperimint. Boarne: Wikipedy

Figuer 2.5: Kongreslid Alexander Pirnie (R-NY) tekening fan de earste kapsule foar de Taal, Service ûntwerp op 1 desimber, 1969 Joshua Angrist (1990) kombinearre it ûntwerp lottery mei winst gegevens út de Sosjale Security Administration te skatten it effekt fan de militêre tsjinst op earnings. Dit is in foarbyld fan ûndersyk mei help fan in natuerlike eksperimint. Boarne: Wikipedy

Hoewol't it miskien net daliks skyn, in ûntwerp lottery hat in krityske oerienkomst nei in willekeurich kontrolearre eksperimint: yn beide sitewaasjes dielnimmers wurde willekeurich tawiisd oan in behanneling. Yn it gefal fan 'e ûntwerp lottery, as wy binne ynteressearre yn learen oer de effekten fan it ûntwerp-eligibility en militêre tsjinst op lettere arbeidsmerkbelied fertsjinsten, kinne wy ​​ferlykje resultaten foar minsken waans birthdates wienen ûnder de loterij cutoff (bygelyks, septimber 14, april 24, ensfh) mei de útkomsten foar minsken waans jierdeis wiene nei de cutoff (bygelyks, febrewaris 20, desimber 2, ensfh).

Jûn dat dit behanneling fan dat opsteld is willekeurich tawiisd, wy kinne dan mjitten it effekt fan dizze behanneling foar eltse útkomst dat is mjitten. Bygelyks, Angrist (1990) kombinearre de ynformaasje oer dy't willekeurich selektearre yn it ûntwerp mei de winst gegevens dy't waard sammele troch de Social Security Administration oan konkludearje dat de opbringsten fan wite feteranen wiene sa'n 15% minder as de opbringsten fan ferlykbere net-feteranen . Oare ûndersikers hawwe brûkt in fergelykbere trick likegoed. Bygelyks, Conley and Heerwig (2011) kombinearre de ynformaasje oer dy't willekeurich selektearre yn it ûntwerp mei húshâlden gegevens sammele fan de 2000 Census en 2005 Amerikaanske Mienskip Survey en fûn dat sa lang nei it ûntwerp, der wie net folle lange-termyn effekt fan militêre tsjinst op ferskaat fan útkomsten lykas wenjen amtstermyn (besit fersus ferhieren) en residential stabiliteit (kâns fan hawwen ferhuze yn foargeande fiif jier).

As dit foarbyld yllustrearret, soms sosjale, politike, of natuerlike krêften meitsje eksperiminten of near-eksperiminten dat kin wurde leveraged troch ûndersikers. Faak natuerlike eksperiminten binne de bêste manier te skatten oarsaak-en-effekt relaasjes yn ynstellings dêr't it is net etyske of praktysk te rinne willekeurich regele eksperiminten. Se binne in wichtige strategy foar ûntdekking earlike ferlikings yn net-eksperimentele gegevens. Dit ûndersyk strategy kin wurde gearfette troch dizze fergeliking:

\ [\ tekst {random (of as willekeurich) evenemint} + \ tekst {altyd-op gegevens stream} = \ tekst {natuerlike eksperimint} \ qquad (2.1) \]

Lykwols, de analyze fan natuerlike eksperiminten kin wêze hiel lestich. Bygelyks, yn it gefal fan 'e Fietnam ûntwerp, net elkenien dy't wie draught-beneaming telâne serving (der wienen in ferskaat fan ûntheffings). En, op 'e selde tiid, in pear minsken dy't net draught-oanmerking komme frijwillich foar tsjinst. It wie as yn in klinyske proses fan in nije drug, guon minsken yn de behanneling groep net nimme harren medisinen en guon fan de minsken yn 'e kontrôle groep of andere manier krige de drug. Dit probleem, neamd twa-sided noncompliance, lykas in soad oare swierrichheden wurde beskreaun yn grutter detail yn guon fan de oanrikkemandearre lêzingen oan de ein fan dit haadstik.

De strategy fan nimmen foardiel fan natuere foarkommende willekeurige opdracht foarôfgiet de digitale leeftyd, mar it foarkommen fan grutte gegevens makket dizze strategy folle makliker te brûken. Sadree't jo realisearje wat behanneling is tawiisd willekeurich, grutte gegevens boarnen kinne biede de útkomst gegevens dy't jo nedich hawwe om te ferlykjen de resultaten foar minsken yn de behanneling en kontrôle betingsten. Bygelyks, yn syn stúdzje fan de effekten fan it ûntwerp en militêre tsjinst, Angrist makke gebrûk fan fertsjinsten records út it Sosjaal Security Administration; sûnder dizze útkomst gegevens, syn stúdzje soe net west ha mooglik. Yn dit gefal, de Social Security Administration is it altyd-op grutte gegevens boarne. As mear en mear automatysk sammele gegevens boarnen bestean, wy sille hawwe mear útkomst gegevens dat kin mjitte de effekten fan feroarings makke troch exogenous fariaasje.

As yllustraasje dizze strategy yn it digitale tiidrek, litte wy beskôgje Mas en Moretti s (2009) elegante ûndersyk op it effekt fan leeftydsgenoaten op produktiviteit. Hoewol't op it oerflak is miskien sjogge oars as Angrist syn stúdzje oer de effekten fan 'e Fietnam Draft, yn struktuer se beide folgje it patroan yn eq. 2.1.

Mas en Moretti meat hoe't leeftydsgenoaten beynfloedzje de produktiviteit fan de arbeiders. Oan de iene kant, it hawwen fan in hurde wurkjen peer kin liede arbeiders te fergrutsjen harren produktiviteit fanwege peer druk. Of, oan 'e oare kant, in hurde wurkjen peer kin liede oare arbeiders oan slack ôf noch mear. De helderste manier te studearjen peer effekten op Produktivität soe wêze in willekeurich kontrolearren eksperimint dêr't arbeiders binne willekeurich tawiisd oan ferskowings mei arbeiders fan ferskillende produktiviteit nivo en dan ûntstiene Produktivität wurdt metten foar elkenien. Ûndersikers, lykwols, net behearskje it skema fan de arbeiders yn in echte bedriuw, en sa Mas en Moretti moast in berop dwaan op in natuerlike eksperimint dy't fûn plak yn in supermerk.

Krekt as eq. 2.1, harren stúdzje hie twa dielen. Earst, se brûkte de logs fan 'e supermerk kassa systeem om in sekuere, yndividu, en altyd-op maatregel fan produktiviteit: it tal items scand per sekonde. En, twadde, want fan 'e wei dat Roastering waard dien op dit supermerk, se hawwe yn de omkriten fan willekeurige gearstalling fan leeftydsgenoaten. Yn oare wurden, ek al de Roastering fan kassiers wurdt net bepaald troch in loterij, dat wie yn wêzen random. Yn de praktyk, it betrouwen hawwe wy yn natuerlike eksperiminten faak Hinges op de plausibility fan dit "as-as" samar oanspraak. Taking foardiel fan dizze random fariaasje, Mas en Moretti fûn dat wurke mei hegere produktiviteit leeftydsgenoaten ferheget produktiviteit. Fierder, Mas en Moretti brûkte de grutte en rykdom fan harren dataset om bûten de schatting fan oarsaak-en-effekt te ferkennen twa wichtiger en subtile saken: heterogeneity fan dizze effekt (foar hokker soarten fan arbeiders is it effekt grutter) en meganisme efter it effekt (wêrom docht mei hege produktiviteit peers liede ta hegere produktiviteit). Wy sille werom nei dizze twa wichtige kwestjes-heterogeneity fan behanneling effekten en meganismen-yn haadstik 5 doe't wy beprate eksperiminten yn mear detail.

Generalizing út de stúdzjes op it effekt fan de Fietnam Untwerp op winst en de stúdzje fan it effekt fan leeftydsgenoaten op produktiviteit, Tabel 2.3 fettet oare ûndersiken dy't hawwe dit krekte deselde struktuer: mei help fan in altyd-op gegevens boarne te mjitten de gefolgen fan guon evenemint . As Tabel 2.3 makket dúdlik, natuerlike eksperiminten binne oeral as jo krekt witte hoe om te sykjen foar harren.

Tabel 2.3: Foarbylden fan natuerlike eksperiminten mei help fan grutte gegevens boarnen. Al dizze stúdzjes folgje deselde basis resept: random (of as willekeurich) evenemint + altyd-op gegevens systeem. Sjoch Dunning (2012) foar mear foarbylden.
ynhâldlike fokus Boarne fan natuerlike eksperimint Always-op gegevens boarne Citation
Peer effekten op produktiviteit Roastering proses checkout gegevens Mas and Moretti (2009)
freonskip formaasje orkanen Facebook Phan and Airoldi (2015)
Fersprieding fan emoasjes rein Facebook Coviello et al. (2014)
Peer te peer ekonomyske oerstappen ierdskodding mobile jild data Blumenstock, Fafchamps, and Eagle (2011)
Persoanlike konsumpsje gedrach 2013 Amerikaanske regear ôfslute persoanlike finânsjes gegevens Baker and Yannelis (2015)
Ekonomyske gefolgen fan recommender systemen ferskate blêdzjen gegevens by Amazon Sharma, Hofman, and Watts (2015)
Effekt fan stress op ûnberne poppen 2006 Israel-Hezbollah oarloch Birth records Torche and Shwed (2015)
Reading gedrach op Wikipedia Snowden Revelations Wikipedy logs Penney (2016)

Yn 'e praktyk, ûndersikers brûke twa ferskillende strategyen foar finen natuerlike eksperiminten, beide fan dat kin wêze fruchtber. Guon ûndersikers begjinne mei de altyd-op gegevens boarne en sjoch foar willekeurige foarfallen yn 'e wrâld; oaren begjinne mei willekeurige foarfallen yn de wrâld en sjogge om gegevens boarnen dy't fêstlizze harren ynfloed. Ta beslút, fernimme dat de krêft fan natuerlike eksperiminten komt net út it raffinemint fan 'e statistyske analyze, mar fan de soarch yn ûntdekking in earlike ferliking makke troch in lokkige tafal fan skiednis.