Натуральныя эксперыменты перавагі выпадковых падзей у свеце. выпадковае падзея + заўсёды на сістэме дадзеных = натуральны эксперымент
Ключ да рандомізірованный кантраляваных эксперыментаў, якія дазваляюць справядлівае параўнанне з'яўляецца рандомизации. Тым не менш, час ад часу нешта адбываецца ў свеце, які па сутнасці прызначае людзей выпадковым чынам або амаль выпадковым чынам, каб розныя віды лячэння. Адным з яркіх прыкладаў стратэгіі выкарыстання прыродных эксперыментаў адбываецца ад даследаванні Angrist (1990) , які вымярае ўплыў ваеннай службы на прыбытак.
Падчас вайны ў В'етнаме, Злучаныя Штаты павялічылі памер сваіх узброеных сіл праз праект. Для таго, каб вырашыць, якія грамадзяне назвалі б у эксплуатацыю, урад ЗША правялі латарэю. Кожная дата нараджэння была прадстаўлена на аркушы паперы, і гэтыя дакументы былі змешчаныя ў вялікай шкляной банку. Як паказана на малюнку 2.5, гэтыя палоскі паперы былі ўзятыя са збанка па адным за раз, каб вызначыць парадак, у якім маладыя людзі будуць прызваны служыць (маладыя жанчыны, якія не падлягалі праекта). На падставе вынікаў, людзі, народжаныя 14 верасня былі названыя па-першае, людзі, народжаныя 24 красавіка былі названыя другі, і гэтак далей. У рэшце рэшт, у гэтай латарэі, мужчыны, якія нарадзіліся на 195 розныя дні былі прызваны на службу ў той час як мужчыны, якія нарадзіліся на 171 дзён не былі названыя.
Хоць гэта можа быць не адразу, праект латарэі мае крытычнае падабенства з рандомізірованного кантраляванага эксперыменту: у абодвух выпадках ўдзельнікі выпадковым чынам прызначалі лячэнне. У выпадку праекта латарэі, калі мы зацікаўлены ў вывучэнні наступстваў праекта-права і ваеннай службы на наступныя рынку працы прыбытку, мы можам параўнаць вынікі для людзей, чые даты нараджэння былі ніжэй латарэі абразання (напрыклад, 14 верасня, Красавік 24 і г.д.) з вынікамі для людзей, чые дні нараджэння былі пасля абразання (напрыклад, 20 лютага, 2 снежня, і г.д.).
Улічваючы, што гэта лячэнне ў стадыі распрацоўкі былі выпадковым чынам размеркаваны, мы можам вымераць эфект гэтага лячэння для любога выніку, які быў вымяраецца. Напрыклад, Angrist (1990) у спалучэнні з інфармацыяй аб тым, хто быў выпадковым чынам выбраны ў праекце з дадзенымі аб даходах, які збіраецца Адміністрацыі сацыяльнага забеспячэння , каб зрабіць выснову , што прыбыткі белых ветэранаў былі прыкладна на 15% менш , чым заробак параўнальных , якія не з'яўляюцца ветэранамі , Іншыя даследчыкі выкарыстоўвалі падобны прыём, а таксама. Напрыклад, Conley and Heerwig (2011) у спалучэнні з інфармацыяй аб тым, хто быў выпадковым чынам выбраны ў праекце з бытавымі дадзенымі , сабранымі з абследавання 2000 перапісу і 2005 амерыканскага грамадства і выявілі , што так доўга пасля таго, як праект, быў мала доўгатэрміновы эфект ваенная служба на розных вынікаў, такіх як валодання жыллём (якая валодае ў параўнанні з арэндай) і жылы стабільнасці (верагоднасць таго, што пераехаўшы ў папярэднія пяць гадоў).
Як паказвае гэты прыклад, часам сацыяльныя, палітычныя ці прыродныя сілы ствараюць эксперыменты ці амаль эксперыменты, якія могуць быць выкарыстаны даследнікамі. Часта натуральныя эксперыменты з'яўляюцца лепшым спосабам ацаніць прычынна-выніковыя сувязі ў тых месцах, дзе гэта не этычна ці непрактычна для запуску рандомізірованный кантраляваных эксперыментаў. Яны з'яўляюцца важнай стратэгіяй для выяўлення справядлівага параўнання ў неэкспериментальных дадзеных. Гэтая стратэгія даследавання можна падсумаваць наступным суадносінамі:
\ [\ {Тэкст выпадковым чынам (ці як быццам выпадковае) падзея} + \ {тэкст заўсёды на патоку дадзеных} = \ {тэкст натуральны эксперымент} \ qquad (2.1) \]
Тым не менш, аналіз натуральных эксперыментаў можа быць даволі складана. Напрыклад, у выпадку праекта ў В'етнаме, не ўсе, хто быў прызыўнога права ў канчатковым выніку выступае (былі розныя канфіскацыі). І, у той жа час, некаторыя людзі, якія не былі скразнякоў права добраахвотна на службу. Гэта было, як быццам у клінічным выпрабаванні новага прэпарата, некаторыя людзі ў групе лячэння не прымалі іх лекі і некаторыя з людзей у кантрольнай групе нейкім чынам атрымаў прэпарат. Гэтая праблема, званая двухбаковая няўзгодненасць, а таксама мноства іншых праблем, якія апісаны больш падрабязна ў некаторых з рэкамендаваных паказанняў у канцы дадзенага раздзела.
Стратэгія выкарыстання пераваг натуральным рандомизации папярэднічае лічбавай стагоддзе, але распаўсюджанасць вялікіх аб'ёмаў дадзеных робіць гэтую стратэгію нашмат прасцей у выкарыстанні. Пасля таго, як вы разумееце, некаторыя лячэнне было прызначана выпадковым чынам, вялікія крыніцы дадзеных могуць падаць дадзеныя аб выніках, што вам трэба для таго, каб параўнаць вынікі для людзей у лячэнні і кантрольных умовах. Напрыклад, у сваім даследаванні наступстваў праекта і ваеннай службы, Angrist выкарыстоўвалі прыбытку запісаў з Адміністрацыі сацыяльнага забеспячэння; без гэтага зыходу дадзеных, яго даследаванне не было б магчыма. У гэтым выпадку Адміністрацыя сацыяльнага забеспячэння з'яўляецца заўсёды на вялікі крыніца дадзеных. Паколькі існуе ўсё больш і больш, аўтаматычна сабраны крыніцы дадзеных, мы будзем мець больш выніковага дадзеныя, якія могуць вымераць ўплыў змяненняў, створаных экзагеннай варыяцыі.
Каб праілюстраваць гэтую стратэгію ў эпоху лічбавых тэхналогій , давайце разгледзім Mas і Марэці (2009) элегантнае даследаванне пра ўплыў аднагодкаў на прадукцыйнасць. Хоць на паверхні гэта можа выглядаць некалькі інакш, чым вывучэнне Angrist ідзе аб уздзеянні праекта ў В'етнаме, у структуры яны абодва ідуць за ўзорам у раўнанні. 2.1.
Мас і Марэці вымяраецца, як аднагодкі ўплываюць на прадукцыйнасць працы работнікаў. З аднаго боку, маючы працавіты пэра можа прывесці рабочых для павышэння іх прадукцыйнасці з-за ціску з боку аднагодкаў. Або, з другога боку, працавіты аднагодкаў можа прывесці іншых работнікаў цкаваць яшчэ больш. Найзыркі спосаб вывучэння аднарангавыя ўплыў на прадукцыйнасць была б рандомізірованного кантраляванага эксперыменту, дзе рабочыя выпадковым чынам размеркаваны на зрухі з работнікамі розных узроўняў прадукцыйнасці, а затым у выніку чаго прадукцыйнасць вымяраецца для ўсіх. Даследчыкі, аднак, не кантралююць графік рабочых у любым рэальным бізнэсе, і так Мас і Марэці павінны былі спадзявацца на натуральны эксперымент, які праходзіў у супермаркеце.
Гэтак жа, як ек. 2.1, іх даследаванне складалася з двух частак. Па-першае, яны выкарыстоўвалі бярвёны з сістэмы супермаркет Checkout, каб мець дакладную, індывідуальны, і заўсёды па меры прадукцыйнасці: колькасць сканаваных у секунду. І, па-другое, з-за спосабу, што планаванне было зроблена ў гэтым супермаркеце, яны маюць амаль выпадковым складам аднагодкаў. Іншымі словамі, нават пры тым, што планаванне касіраў не было вызначаецца латарэю, гэта было па сутнасці выпадковым чынам. На практыцы мы маем упэўненасць у натуральных эксперыментах часта залежыць ад праўдападобнасці гэтага "як калі б" выпадковага прэтэнзіі. Карыстаючыся гэтай выпадковай варыяцыі, Мас і Марэці выявілі, што праца з больш высокімі калегамі прадукцыйнасці павышае прадукцыйнасць працы. Акрамя таго, Мас і Марэці выкарыстаў памер і багацце іх набору дадзеных для перамяшчэння за межы ацэнкі прычынна-следчых вывучыць два важных і тонкіх пытанняў: гетэрагеннасць гэтага эфекту (для якіх віды працоўных эфект больш) і механізм за эфекту (чаму маючы высокія аднагодкі прадукцыйнасці прыводзіць да павышэння прадукцыйнасці працы). Мы вернемся да гэтых двух важных пытаннях-гетэрагеннасць эфектаў лячэння і механізмаў-в чале 5, калі мы абмяркоўваем эксперыменты больш падрабязна.
Абагульняючы даследаванні пра ўплыў праекта В'етнама на заробкі і вывучэнне ўплыву аднагодкаў па прадукцыйнасці, Табліца 2.3 абагульняе іншыя даследаванні, якія маюць дакладна такую ж структуру: з дапамогай заўсёды на крыніцы дадзеных для ацэнкі ўплыву якой-небудзь падзеі , Як відаць з табліцы 2.3 ясна, натуральныя эксперыменты ўсюды, калі вы проста ведаеце, як іх шукаць.
Асноўная накіраванасць | Крыніца натуральнага эксперыменту | Заўсёды-на зыходных дадзеных | цытаванне |
---|---|---|---|
Peer ўплыў на прадукцыйнасць | працэс планавання | выпіска дадзеных | Mas and Moretti (2009) |
фарміраванне дружбы | ураганы | Phan and Airoldi (2015) | |
распаўсюджванне эмоцый | дождж | Coviello et al. (2014) | |
Аднарангавыя эканамічныя пераклады | землятрус | мабільных грашовых дадзеных | Blumenstock, Fafchamps, and Eagle (2011) |
Асабістае паводзіны спажывання | 2013 завяршэнне работы ўрада ЗША | асабістыя дадзеныя фінансы | Baker and Yannelis (2015) |
Эканамічнае ўздзеянне рэкамендацыйных сістэм | розны | Дадзеныя аб прагледжаных на Amazon | Sharma, Hofman, and Watts (2015) |
Ўплыў стрэсу на ненароджаных дзяцей | 2006 Ізраіль-Хезболлах вайна | запісы аб нараджэнні | Torche and Shwed (2015) |
Чытанне паводзіны ў Вікіпедыі | Snowden адкрыццяў | часопісы Вікіпедыя | Penney (2016) |
На практыцы, даследчыкі выкарыстоўваюць дзве розныя стратэгіі для пошуку прыродных эксперыментаў, абодва з якіх могуць быць плённымі. Некаторыя даследчыкі пачынаюць з заўсёды-на зыходных дадзеных і шукаць выпадковых падзей у свеце; іншыя пачынаюць са выпадковымі падзеямі ў свеце і шукаць крыніцы дадзеных, якія захопліваюць іх ўплыў. Нарэшце, звярніце ўвагу, што сіла натуральных эксперыментаў зыходзіць не ад складанасці статыстычнага аналізу, але ад медыцынскай дапамогі ў раскрыцці справядлівага параўнання, створаны шчаслівай выпадковасці гісторыі.