2.4.3.1 arbrofion Naturiol

Arbrofion naturiol yn manteisio ar ddigwyddiadau ar hap yn y byd. Digwyddiad ar hap + bob amser-ar system ddata = arbrofi naturiol

Yr allwedd i arbrofion rheoledig ar hap gan alluogi cymhariaeth deg yw'r randomization. Fodd bynnag, o bryd i'w gilydd bydd rhywbeth yn digwydd yn y byd sydd yn ei hanfod yn neilltuo pobl ar hap neu bron ar hap i wahanol driniaethau. Un o enghreifftiau cliriaf o'r strategaeth o ddefnyddio arbrofion naturiol yn dod o'r ymchwil Angrist (1990) sy'n mesur effaith gwasanaethau milwrol ar enillion.

Yn ystod y rhyfel yn Fietnam, yr Unol Daleithiau wedi cynyddu maint ei lluoedd arfog drwy drafft. Er mwyn penderfynu a fyddai'n cael dinasyddion yn cael eu galw i mewn i wasanaeth, cynhaliodd y llywodraeth yr Unol Daleithiau loteri. Pob dyddiad geni, yn cael ei gynrychioli ar ddarn o bapur, a'r papurau hyn yn cael eu rhoi mewn jar gwydr mawr. Fel y dangosir yn Ffigur 2.5, slipiau hyn o bapur yn cael eu tynnu o'r jar un ar y tro i benderfynu ar y drefn y byddai'r dynion ifanc yn cael eu galw i wasanaethu (nid merched ifanc yn destun drafft). Yn seiliedig ar ganlyniadau, a elwir dynion a anwyd ar Fedi 14 eu gyntaf, dynion a anwyd ar Ebrill 24 oed yn a elwir yn ail, ac yn y blaen. Yn y pen draw, yn loteri hwn, dynion a anwyd ar 195 diwrnod gwahanol yn cael eu galw i wasanaeth er nad dynion a anwyd ar 171 o ddiwrnodau eu galw.

Ffigur 2.5: Cyngreswr Alexander Pirnie (R-NY) tynnu y capsiwl cyntaf ar gyfer y drafft y Gwasanaeth Dewisol ar Ragfyr 1, 1969. Joshua Angrist (1990) cyfunol y loteri drafft data enillion o Ddeddf Gweinyddu Nawdd Cymdeithasol gyda i amcangyfrif yr effaith o wasanaeth milwrol ar enillion. Mae hwn yn enghraifft o ymchwil gan ddefnyddio arbrawf naturiol. Ffynhonnell: Wikimedia Commons

Ffigur 2.5: Cyngreswr Alexander Pirnie (R-NY) tynnu y capsiwl cyntaf ar gyfer y drafft y Gwasanaeth Dewisol ar Ragfyr 1, 1969. Joshua Angrist (1990) cyfunol y loteri drafft data enillion o Ddeddf Gweinyddu Nawdd Cymdeithasol gyda i amcangyfrif yr effaith o wasanaeth milwrol ar enillion. Mae hwn yn enghraifft o ymchwil gan ddefnyddio arbrawf naturiol. Ffynhonnell: Wikimedia Commons

Er efallai na fydd yn amlwg ar unwaith, loteri drafft mae tebygrwydd hanfodol i arbrawf rheoledig ar hap: yn y ddwy sefyllfa sy'n cymryd rhan yn cael eu neilltuo ar hap i dderbyn triniaeth. Yn achos y loteri drafft, os oes diddordeb mewn dysgu am effeithiau drafft-cymhwyster a gwasanaeth milwrol ar enillion y farchnad lafur wedi hynny yr ydym ni, gallwn gymharu canlyniadau ar gyfer pobl y mae eu birthdates yn is na'r cutoff loteri (ee, 14 Medi, Ebrill 24, ac ati) gyda'r canlyniadau i bobl y mae eu pen-blwyddi yn ôl y cutoff (ee, Chwefror 20, 2 Rhagfyr, ac ati).

O ystyried bod y driniaeth hon o cael eu drafftio wedi cael ei neilltuo ar hap, yna gallwn fesur effaith y driniaeth hon ar gyfer unrhyw ganlyniad sydd wedi cael ei fesur. Er enghraifft, Angrist (1990) yn cyfuno gwybodaeth am bwy oedd yn ddewiswyd ar hap yn y drafft data enillion a gasglwyd gan y Gweinyddu Nawdd Cymdeithasol i ddod i'r casgliad bod enillion cyn-filwyr gwyn oedd tua 15% yn llai nag enillion cymharol nad ydynt yn cyn-filwyr gyda . Mae ymchwilwyr eraill wedi defnyddio tric tebyg yn ogystal. Er enghraifft, Conley and Heerwig (2011) yn cyfuno gwybodaeth am bwy oedd yn ddewiswyd ar hap yn y drafft gyda data cartrefi a gesglir o'r Arolwg 2000 Cyfrifiad a 2005 Gymuned Americanaidd a chanfuwyd bod mor hir ar ôl y drafft, mae llawer o effaith yn y tymor hir oedd gwasanaeth milwrol ar amrywiaeth o ganlyniadau megis deiliadaeth tai (yn berchen yn erbyn rhentu) a sefydlogrwydd preswyl (tebygolrwydd o fod wedi symud mewn pum mlynedd flaenorol).

Gan fod yr enghraifft hon yn dangos, weithiau grymoedd cymdeithasol, gwleidyddol, neu naturiol yn creu arbrofion neu'n agos-arbrofion y gellir eu ysgogi gan ymchwilwyr. Yn aml, arbrofion naturiol yw'r ffordd orau i amcangyfrif perthnasoedd achos-ac-effaith mewn lleoliadau lle nad yw'n moesegol neu ymarferol i redeg arbrofion rheoledig ar hap. Maent yn strategaeth bwysig ar gyfer darganfod cymariaethau teg mewn data nad ydynt yn arbrofol. Gall hyn strategaeth ymchwil yn cael ei chrynhoi gan hafaliad hwn:

\ [\ destun {hap (neu fel pe bai hap) Digwyddiad} + \ destun {bob amser-ar llif data} = \ destun {arbrawf naturiol} \ qquad (2.1) \]

Fodd bynnag, gall y dadansoddiad o arbrofion naturiol fod yn eithaf anodd. Er enghraifft, yn achos y drafft Fietnam, nid yw pawb oedd drafft-cymwys a ddaeth i ben i fyny yn gwasanaethu (roedd amrywiaeth o eithriadau). Ac, ar yr un pryd, mae rhai pobl nad oedd yn drafftio-gymwys wirfoddolodd am wasanaeth. Roedd fel petai mewn treial clinigol o gyffur newydd, nid yw rhai pobl yn y grŵp driniaeth yn cymryd eu meddyginiaeth a rhai o'r bobl yn y grŵp rheoli rhywsut derbyn y cyffur. Mae hyn yn broblem, a elwir yn noncompliance dwy-ochr, yn ogystal â llawer o broblemau eraill yn cael eu disgrifio'n fwy manwl mewn rhai o'r darlleniadau a argymhellir ar ddiwedd y bennod hon.

Mae'r strategaeth o gymryd mantais o digwydd aseiniad ar hap yn naturiol o flaen yr oes ddigidol, ond nifer yr achosion o ddata mawr yn gwneud y strategaeth hon yn llawer haws i'w defnyddio. Unwaith y byddwch yn sylweddoli peth driniaeth wedi cael ei neilltuo ar hap, gall ffynonellau data mawr yn darparu'r data canlyniadau sydd eu hangen arnoch er mwyn cymharu canlyniadau ar gyfer pobl yn y driniaeth a rheoli amodau. Er enghraifft, yn ei astudiaeth o effeithiau'r gwasanaeth drafft a milwrol, a wnaed Angrist defnyddio cofnodion o enillion y Gweinyddu Nawdd Cymdeithasol; heb hyn ddata canlyniadau, ni fyddai ei astudiaeth wedi bod yn bosibl. Yn yr achos hwn, mae'r Gweinyddu Nawdd Cymdeithasol yw'r ffynhonnell data mawr bob amser-ar. Wrth i fwy a gasglwyd yn fwy awtomatig ffynonellau data yn bodoli, bydd gennym fwy o ddata ar ganlyniadau all fesur effeithiau newidiadau a grëwyd gan amrywiad alldarddol.

I ddangos y strategaeth hon yn yr oes ddigidol, gadewch i ni ystyried Mas a Moretti yn (2009) ymchwil cain ar effaith cyfoedion ar gynhyrchiant. Er bod ar yr wyneb gallai edrych yn wahanol nag astudio Angrist am effeithiau'r Drafft Fietnam, o ran strwythur y ddau ohonynt yn dilyn y patrwm yn eq. 2.1.

Mas a Moretti mesur sut cyfoedion yn effeithio ar gynhyrchiant y gweithwyr. Ar y naill law, gallai cael cyfoedion yn gweithio'n galed arwain gweithwyr i gynyddu eu cynhyrchiant oherwydd pwysau gan gyfoedion. Neu, ar y llaw arall, gallai cyfoedion gweithio'n galed arwain gweithwyr eraill i hydrin i ffwrdd hyd yn oed mwy. Byddai'r ffordd gliriaf i astudio effeithiau cyfoedion ar gynhyrchiant fod yn arbrawf rheoledig ar hap lle mae gweithwyr yn cael eu neilltuo ar hap i sifftiau gyda gweithwyr o wahanol lefelau cynhyrchiant ac yna arwain cynhyrchiant ei fesur ar gyfer pawb. Ymchwilwyr, fodd bynnag, nid ydynt yn rheoli'r rhestr o weithwyr mewn unrhyw fusnes go iawn, ac felly roedd Mas a Moretti i ddibynnu ar arbrawf naturiol a gynhaliwyd mewn archfarchnad.

Yn union fel eq. 2.1, roedd eu hastudiaeth ddwy ran. Yn gyntaf, maent yn defnyddio logiau o'r system til archfarchnad i gael fanwl gywir, unigolyn, a bob amser-ar y mesur o gynhyrchiant: nifer yr eitemau a sganio yr eiliad. Ac, yn ail, oherwydd y ffordd y amserlennu ei wneud yn yr archfarchnad hon, mae ganddynt ger cyfansoddiad ar hap o gyfoedion. Mewn geiriau eraill, er nad amserlennu arianwyr cael ei bennu gan loteri, roedd yn ei hanfod hap. Yn ymarferol, yr hyder sydd gennym mewn arbrofion naturiol yn aml yn dibynnu ar y hygrededd o hyn "fel-os" hawliad ar hap. Gan fanteisio ar amrywiad ar hap hwn, dod o hyd Mas a Moretti bod gweithio gyda chyfoedion cynhyrchiant uwch yn cynyddu cynhyrchiant. Bellach, defnyddir Mas a Moretti maint a chyfoeth eu set ddata i symud y tu hwnt i'r amcangyfrif o achos-ac-effaith i archwilio dau fater pwysicach a chynnil: heterogenedd o effaith hon (ar gyfer pa fathau o weithwyr yw'r effaith mwy) a mecanwaith y tu ôl i'r effaith (pam mae cael cymheiriaid cynhyrchiant uchel yn arwain at gynhyrchiant uwch). Byddwn yn dychwelyd at y ddau yn bwysig materion-heterogenedd o effeithiau triniaeth a mecanweithiau-ym Mhennod 5 pan fyddwn yn trafod arbrofion yn fwy manwl.

Generalizing o'r astudiaethau ar effaith y Drafft Fietnam ar enillion a'r astudiaeth o effaith y cyfoedion ar gynhyrchiant, Tabl 2.3 yn crynhoi'r astudiaethau eraill sy'n cael un strwythur yn union hon: defnyddio bob amser-ar y ffynhonnell ddata i fesur effaith i ryw ddigwyddiad y . Fel y mae Tabl 2.3 yn ei gwneud yn glir, arbrofion naturiol ym mhobman os ydych yn unig yn gwybod sut i chwilio amdanynt.

Tabl 2.3: Enghreifftiau o arbrofion naturiol gan ddefnyddio ffynonellau data mawr. Mae'r holl astudiaethau hyn yn dilyn yr un rysáit sylfaenol: Digwyddiad ar hap (neu fel pe bai hap) + bob amser-ar system ddata. Gweler Dunning (2012) am ragor o enghreifftiau.
ffocws sylweddol Ffynhonnell arbrawf naturiol Bob amser-ar ddata ffynhonnell Enwi
Cymheiriaid effeithiau ar gynhyrchiant broses gofrestru data desg dalu Mas and Moretti (2009)
ffurfio cyfeillgarwch corwyntoedd Facebook Phan and Airoldi (2015)
Lledaeniad o emosiynau glaw Facebook Coviello et al. (2014)
Cymheiriaid i gyfoedion trosglwyddiadau economaidd daeargryn data arian symudol Blumenstock, Fafchamps, and Eagle (2011)
ymddygiad defnydd personol 2013 US shutdown llywodraeth data cyllid personol Baker and Yannelis (2015)
Effaith economaidd o systemau recommender amrywiol data pori yn Amazon Sharma, Hofman, and Watts (2015)
Effaith straen ar babanod heb eu geni 2006 rhyfel Israel-Hezbollah gofnodion geni Torche and Shwed (2015)
Darllen hymddygiad ar Wicipedia datgeliadau Snowden logiau Wicipedia Penney (2016)

Yn ymarferol, mae ymchwilwyr yn defnyddio dwy strategaeth wahanol ar gyfer dod o hyd i arbrofion naturiol, gall y ddau ohonynt fod yn ffrwythlon. Mae rhai ymchwilwyr yn dechrau â'r ffynhonnell bob amser-ar ddata a chwilio am ddigwyddiadau ar hap yn y byd; mae eraill yn dechrau gyda digwyddiadau ar hap yn y byd ac yn chwilio am ffynonellau data sy'n dal eu heffaith. Yn olaf, yn sylwi nad yw'r cryfder arbrofion naturiol yn dod o'r natur soffistigedig y dadansoddiad ystadegol, ond o ofal wrth ddarganfod cymhariaeth deg a grëwyd gan ddamwain ffodus o hanes.