2.4.3 приближавање експерименти

Можемо приближно експерименте које не можемо да урадимо. Два приступа који посебно имају користи од дигиталног доба се поклапају и природне експерименте.

Многе важне научне и политичке питања су узрочно. Размотримо, на пример, следеће питање: какав је ефекат програма обуке за посао на плате? Један од начина да се одговори на ово питање ће бити са случајном контролисаном експерименту, где су радници насумично одабране у било обуку или не обуку. Онда, истраживачи могли проценити ефекат тренинга за ових учесника једноставним поређењем плате људи који су добили обуку онима који нису добили.

Једноставна поређење је важећа због нечега што се дешава пре него што су подаци још прикупљају: на рандомизације. Без насумичног, проблем је много компликованије. Истраживач могу да упореде плате људи који су се добровољно пријавили за обуку онима који нису потписали-уп. То поређење вероватно показати да људи који су прошли обуку зарадио више, али колико је то због тренинга и колико је то зато што људи који Пријава за обуку су другачији од оних који не потпишу-уп за обуку? Другим речима, то је фер да упореде плате ове две групе људи?

Ова забринутост због фер поређења доводи неке истраживаче да верују да је немогуће да процене узрочно-последичне без покретања експеримента. Ова тврдња иде предалеко. Иако је истина да експерименти пружају најјаче доказе за узрочних ефеката, постоје и друге стратегије које могу пружити драгоцене процене узрочно-последичне. Уместо размишљања да процене каузалне су или лако (у случају експеримената) или немогуће (у случају пасивно посматрати података), боље је да стратегија за израду узрочно-последичне процене леже дуж континуума од најјаче до најслабије (Слика 2.4). На најјаче крају континуума су насумично контролисане експерименте. Али, то су често тешко урадити у друштвена истраживања, јер разни третмани захтевају нереалне износе сарадње од стране влада или компанија; једноставно постоје многи експерименти који не можемо учинити. Ја ћу посветити све Цхаптер 4 на оба предности и слабости рандомизираних контролисаних експеримената, а ја ћу рећи да у неким случајевима, постоје јаки етичких разлога да воле посматрања у експерименталним методама.

Слика 2.4: Континуум истраживачких стратегија за процењене ефекте каузалним.

Слика 2.4: Континуум истраживачких стратегија за процењене ефекте каузалним.

Креће дуж континуума, постоје ситуације у којима истраживачи нису експлицитно насумично. То је, истраживачи покушавају да науче експеримента налик знање без стварног експеримент; наравно, ово ће бити компликовано, али велики подаци у великој мери побољшава нашу способност да се узрочно-последичне процене у оваквим ситуацијама.

Понекад постоје параметри где случајност у свету дешава да створи нешто попут експеримента за истраживаче. Ови пројекти се називају природним експерименте, и они ће бити детаљно размотрено у одељку 2.4.3.1. Две особине великих извора-своје податке увек на природе и њихове величине-у великој мери повећава нашу способност да учи од природних експеримената када до њих дође.

Мовинг даље од рандомизираних контролисаних експеримената, понекад не постоји ни један догађај у природи које можемо да користимо за приближно природни експеримент. У овим подешавањима, пажљиво смо се конструисати поређења унутар не-експерименталних података у покушају да приближи експеримент. Ови пројекти се зове усклађивање, и они ће бити детаљно размотрено у одељку 2.4.3.2. Као и природних експеримената, одговарајући је дизајн који такође има користи од великих извора података. Конкретно, масивни величине, како у погледу броја предмета и врсте информација по случају-у великој мери олакшава усклађивање. Кључна разлика између природних експеримената и упаривања је да у природним експериментима истраживач зна процес кроз који је додељен лечење и верује да је то случајно.

Концепт фер поређења која је мотивисала жеља да раде експерименте и лежи у основи два алтернативна приступа: природне експерименте и подударања. Ови приступи ће вам омогућити да процените узрочне ефекте од пасивно посматраних података откривајући фер поређење седи унутар података које већ имате.