Eksperimentet laboratorike të ofrojë kontroll, eksperimentet në terren ofrojnë realizëm, dhe eksperimentet në terren digjitale kombinuar kontrollin dhe realizëm në shkallë.
Eksperimentet vijnë në forma dhe madhësi të ndryshme. Në të kaluarën, studiuesit kanë gjetur të dobishme për të organizuar eksperimente përgjatë një vazhdimësie midis eksperimenteve laboratorike dhe eksperimenteve në terren . Tani, megjithatë, hulumtuesit duhet të organizojnë eksperimente përgjatë një vazhdim të dytë midis eksperimenteve analoge dhe eksperimenteve dixhitale . Ky hapësirë dy-dimensionale e dizajnit do t'ju ndihmojë të kuptoni pikat e forta dhe dobësitë e qasjeve të ndryshme dhe të nxjerrni në pah fushat e mundësive më të mëdha (figura 4.1).
Një dimension përgjatë të cilit eksperimentet mund të organizohen është dimensioni i fushës së laboratorit. Shumë eksperimente në shkencat shoqërore janë eksperimente laboratorike ku studentët universitarë kryejnë detyra të çuditshme në një laborator për kredi kursesh. Ky lloj eksperimenti dominon kërkimet në psikologji, sepse u mundëson hulumtuesve të krijojnë mjedise të kontrolluara me saktësi për të izoluar dhe testuar saktësisht teoritë specifike rreth sjelljes shoqërore. Për disa probleme, megjithatë, diçka ndihet paksa e çuditshme për të nxjerrë përfundime të forta rreth sjelljes njerëzore nga njerëz të tillë të pazakontë që kryejnë detyra të tilla të pazakonta në një mjedis kaq të pazakontë. Këto shqetësime kanë çuar në një lëvizje drejt eksperimenteve në terren . Eksperimentet në terren kombinojnë dizajnin e fortë të eksperimenteve të kontrollit të randomizuar me grupe më përfaqësuese të pjesëmarrësve që kryejnë detyra më të zakonshme në mjedise më natyrore.
Megjithëse disa njerëz mendojnë për laboratorë dhe eksperimente në terren si metoda konkurruese, është mirë të mendoni për ato si plotësuese, me pikat e forta dhe dobësitë e ndryshme. Për shembull, Correll, Benard, and Paik (2007) përdorën si një eksperiment laborator dhe një eksperiment në terren në një përpjekje për të gjetur burimet e "dënimit të amësisë." Në Shtetet e Bashkuara, nënat fitojnë më pak para sesa gratë pa fëmijë, madje edhe kur duke krahasuar gratë me aftësi të ngjashme që punojnë në punë të ngjashme. Ka shumë shpjegime të mundshme për këtë model, një nga të cilat është se punëdhënësit janë të njëanshëm ndaj nënave. (Është interesante fakti që e kundërta duket e vërtetë për baballarët: ata tentojnë të fitojnë më shumë se meshkujt e krahasueshëm pa fëmijë.) Me qëllim të vlerësimit të paragjykimeve të mundshme kundër nënave, Correll dhe kolegët zhvilluan dy eksperimente: një në laborator dhe një në terren.
Së pari, në një eksperiment laboratorik u thanë pjesëmarrësve, të cilët ishin studentët e kolegjit, se një kompani po bënte një kërkim pune për një person për të udhëhequr departamentin e ri të marketingut në Bregun Lindor. Studentëve u tha se kompania donte ndihmën e tyre në procesin e punësimit dhe atyre u kërkua që të rishikonin rinisjet e disa kandidatëve të mundshëm dhe t'i vlerësonin kandidatët në një numër të madhësive, si inteligjenca e tyre, ngrohtësia dhe angazhimi për të punuar. Më tej, nxënësve u pyetën nëse ata do të rekomandonin punësimin e aplikantit dhe atë që ata do të rekomandonin si një pagë fillestare. Sidoqoftë, pa njohur studentët, të rinjtë ishin ndërtuar në mënyrë specifike për të qenë të ngjashme përveç një gjëje: disa prej tyre sinjalizuan amësinë (duke përmendur përfshirjen në një shoqatë prind-mësues) dhe disa nuk e kishin. Correll dhe kolegët gjetën se studentët kishin më pak gjasa të rekomandonin punësimin e nënave dhe se u ofruan atyre një pagë më të ulët fillestare. Më tej, përmes një analize statistikore të vlerësimeve dhe vendimeve lidhur me punësimin, Correll dhe kolegët gjetën se disavantazhet e nënave u shpjeguan kryesisht nga fakti se ata ishin të rangut më të ulëta sa i përket kompetencës dhe angazhimit. Kështu, ky eksperiment laborator lejoi Correll dhe kolegët për të matur një efekt shkaktar dhe të japë një shpjegim të mundshëm për këtë efekt.
Natyrisht, dikush mund të jetë skeptik për nxjerrjen e konkluzioneve për të gjithë tregun e punës në SHBA bazuar në vendimet e disa qindra studentëve të cilët me gjasë nuk kanë pasur kurrë një punë të rregullt, e lëre më të punësojnë dikë. Prandaj, Correll dhe kolegët gjithashtu zhvilluan një eksperiment plotësues në terren. Ata iu përgjigjën qindra hapjeve të reklamuara të punës me letra të mbuluara të rreme dhe rifilluan. Ngjashëm me materialet që tregohen për studentët, disa rinis kanë sinjalizuar amësinë dhe disa nuk kanë. Correll dhe kolegët gjetën se nënat ishin më pak të ngjarë të merrnin thirrje për intervista se sa femrat pa fëmijë të kualifikuar në mënyrë të barabartë. Me fjalë të tjera, punëdhënësit e vërtetë duke marrë vendime të rëndësishme në një mjedis natyror u sollën shumë si studentë. A kanë marrë vendime të ngjashme për të njëjtën arsye? Për fat të keq, ne nuk e dimë. Studiuesit nuk ishin në gjendje të kërkonin nga punëdhënësit që të vlerësonin kandidatët ose të shpjegonin vendimet e tyre.
Kjo palë eksperimentesh zbulon shumë për eksperimentet laboratorike dhe në terren në përgjithësi. Eksperimentet e laboratorit ofrojnë hulumtuesit pothuajse të plotë kontrollin e mjedisit në të cilin pjesëmarrësit janë duke marrë vendime. Kështu, për shembull, në eksperiment laborator, Correll dhe kolegët ishin në gjendje të siguroheshin që të gjitha rinisjet të lexoheshin në një mjedis të qetë; në eksperiment në terren, disa nga të rinjtë mund të mos jenë lexuar madje. Për më tepër, për shkak se pjesëmarrësit në mjedisin e laboratorit e dinë se po studiohen, studiuesit shpesh janë në gjendje të mbledhin të dhëna shtesë që mund të ndihmojnë në shpjegimin e arsyeve pse pjesëmarrësit po marrin vendimet e tyre. Për shembull, Correll dhe kolegët kërkuan pjesëmarrësit në eksperiment laborator për të vlerësuar kandidatët në përmasa të ndryshme. Ky lloj i të dhënave të procesit mund të ndihmojë hulumtuesit të kuptojnë mekanizmat pra dallimet në mënyrën se si pjesëmarrësit trajtojnë rinis.
Nga ana tjetër, këto karakteristika të njëjta të njëjta që i kam përshkruar si avantazhe, konsiderohen edhe disa herë si disavantazhe. Studiuesit që preferojnë eksperimente në terren argumentojnë se pjesëmarrësit në eksperimentet laboratorike mund të veprojnë shumë ndryshe, sepse ata e dinë se po studiohen. Për shembull, në eksperiment laborator, pjesëmarrësit mund të kenë menduar qëllimin e hulumtimit dhe ndryshuan sjelljen e tyre në mënyrë që të mos dukeshin të njëanshëm. Më tej, hulumtuesit që preferojnë eksperimente në terren mund të argumentojnë se dallimet e vogla në rinisje mund të dallohen vetëm në një mjedis laboratorik shumë të pastër dhe të pastër, dhe kështu eksperimenti laboratorik do të mbivlerësojë efektin e amësisë në vendimet reale të punësimit. Së fundi, shumë përkrahës të eksperimenteve në terren kritikojnë mbështetjen e eksperimenteve të laboratorëve në pjesëmarrësit e WEIRD-së: kryesisht studentë nga vendet perëndimore, të arsimuara, të industrializuara, të pasura dhe demokratike (Henrich, Heine, and Norenzayan 2010a) . Eksperimentet nga Correll dhe kolegët (2007) ilustrojnë dy ekstremet në vazhdimësinë e fushës së laboratorit. Midis këtyre dy ekstremeve ekzistojnë gjithashtu një sërë modelesh hibride, duke përfshirë qasje të tilla si sjellja e jo-studentëve në një laborator ose duke shkuar në fushë, por ende duke pasur pjesëmarrës të kryejnë një detyrë të pazakontë.
Përveç dimensionit të fushës së laboratorit që ka ekzistuar në të kaluarën, mosha digjitale do të thotë se hulumtuesit tani kanë një dimension të dytë të madh përgjatë të cilit eksperimentet mund të ndryshojnë: analog-dixhital. Ashtu si ekzistojnë eksperimente të pastra laboratorike, eksperimente të pastra në terren dhe një shumëllojshmëri hibride midis tyre, ka eksperimente të pastra analoge, eksperimente të pastra digjitale dhe një shumëllojshmëri të hibrideve. Është e ndërlikuar të ofrohet një përkufizim formal i këtij dimensioni, por një përkufizim i dobishëm pune është se eksperimentet plotësisht digjitale janë eksperimente që përdorin infrastrukturën digjitale për të rekrutuar pjesëmarrësit, për të randomizuar, për të ofruar trajtime dhe për të matur rezultatet. Për shembull, Studimi Restivo dhe van de Rijt (2012) i barnstars dhe Wikipedia ishte një eksperiment plotësisht digjital, sepse ai përdorte sisteme dixhitale për të katër këto hapa. Po kështu, eksperimente plotësisht analoge nuk përdorin infrastrukturën digjitale për asnjë nga këto katër hapa. Shumë nga eksperimentet klasike në psikologji janë plotësisht eksperimente analoge. Midis këtyre dy ekstremeve ekzistojnë eksperimente pjesërisht digjitale që përdorin një kombinim të sistemeve analoge dhe digjitale.
Kur disa njerëz mendojnë për eksperimentet dixhitale, ata menjëherë mendojnë për eksperimente online. Kjo është për të ardhur keq sepse mundësitë për të drejtuar eksperimentet dixhitale nuk janë vetëm në internet. Studiuesit mund të kryejnë eksperimente pjesërisht digjitale duke përdorur pajisje digjitale në botën fizike me qëllim që të ofrojnë trajtime ose të matin rezultatet. Për shembull, studiuesit mund të përdorin smartphones për të ofruar trajtime ose sensorë në mjedisin e ndërtuar për të matur rezultatet. Në fakt, siç do ta shohim më vonë në këtë kapitull, hulumtuesit kanë përdorur tashmë matësit e fuqisë në shtëpi për të matur rezultatet në eksperimentet rreth konsumit të energjisë që përfshin 8.5 milionë familje (Allcott 2015) . Meqë pajisjet digjitale integrohen gjithnjë e më shumë në jetën e njerëzve dhe sensorët bëhen të integruar në mjedisin e ndërtuar, këto mundësi për të drejtuar eksperimente pjesërisht digjitale në botën fizike do të rriten në mënyrë dramatike. Me fjalë të tjera, eksperimentet dixhitale nuk janë vetëm eksperimente online.
Sistemet digjitale krijojnë mundësi të reja për eksperimente kudo përgjatë vazhdimit të fushës së laboratorit. Në eksperimentet e pastra laboratorike, për shembull, hulumtuesit mund të përdorin sisteme dixhitale për matje më të hollësishme të sjelljes së pjesëmarrësve; një shembull i këtij lloji të matjes së përmirësuar është pajisja për ndjekjen e syve që ofron masa të sakta dhe të vazhdueshme të vendndodhjes së shikimit. Mosha dixhitale gjithashtu krijon mundësinë për të kryer eksperimente laboratorike në internet. Për shembull, hulumtuesit kanë miratuar me shpejtësi Amazon Mechanical Turk (MTurk) për të rekrutuar pjesëmarrës për eksperimente online (figura 4.2). MTurk përputhet me "punëdhënësit" të cilët kanë detyra që duhet të përfundojnë me "punëtorët" të cilët dëshirojnë t'i plotësojnë këto detyra për para. Ndryshe nga tregjet tradicionale të punës, megjithatë, detyrat e përfshira zakonisht kërkojnë vetëm pak minuta për të përfunduar dhe gjithë ndërveprimi ndërmjet punëdhënësit dhe punonjësit është online. Sepse MTurk imiton aspekte të eksperimenteve tradicionale laboratorike - duke paguar njerëzit për të kryer detyra që nuk do të bënin falas - është e përshtatshme natyrisht për lloje të caktuara të eksperimenteve. Në thelb, MTurk ka krijuar infrastrukturën për menaxhimin e një pjese të pjesëmarrësve - rekrutimin dhe pagimin e njerëzve - dhe hulumtuesit kanë përfituar nga kjo infrastrukturë për të kapur në një pishinë gjithnjë në dispozicion të pjesëmarrësve.
Sistemet digjitale krijojnë mundësi edhe më të mëdha për eksperimente në terren. Në veçanti, ato u mundësojnë studiuesve që të kombinojnë kontrollin e ngushtë dhe të dhënat e procesit që lidhen me eksperimentet laboratorike me pjesëmarrësit më të larmishëm dhe cilësimet më të natyrshme që lidhen me eksperimentet laboratorike. Përveç kësaj, eksperimentet në fushën digjitale gjithashtu ofrojnë tre mundësi që kanë tendencë të vështirë në eksperimentet analoge.
Së pari, ndërsa shumica e laboratorëve analogë dhe eksperimenteve në terren kanë qindra pjesëmarrës, eksperimentet në fushën digjitale mund të kenë miliona pjesëmarrës. Ky ndryshim në shkallë është sepse disa eksperimente digjitale mund të prodhojnë të dhëna me kosto zero të ndryshueshme. Kjo është, pasi studiuesit kanë krijuar një infrastrukturë eksperimentale, rritja e numrit të pjesëmarrësve zakonisht nuk rrit koston. Rritja e numrit të pjesëmarrësve me një faktor prej 100 apo më shumë nuk është vetëm një ndryshim sasior ; kjo është një ndryshim cilësor , sepse i mundëson hulumtuesve të mësojnë gjëra të ndryshme nga eksperimentet (p.sh., heterogjeniteti i efekteve të trajtimit) dhe për të drejtuar dizajne eksperimentale krejtësisht të ndryshme (p.sh., eksperimente të grupeve të mëdha). Kjo pikë është kaq e rëndësishme, do të kthehem në fund të kapitullit kur të ofroj këshilla rreth krijimit të eksperimenteve dixhitale.
Së dyti, ndërkohë që shumica e eksperimenteve analoge në laborator dhe në terren i trajtojnë pjesmarrësit si vegla të padallueshme, eksperimentet në fushën digjitale shpesh përdorin informacion mbi pjesëmarrësit në fazën e projektimit dhe analizës së hulumtimit. Ky informacion i sfondit, i cili quhet informacion para trajtimit , shpesh është i disponueshëm në eksperimentet dixhitale, sepse ato drejtohen në krye të sistemeve gjithmonë të matjes (shih kapitullin 2). Për shembull, një studiues në Facebook ka shumë më tepër informata për parablerjen rreth njerëzve në eksperimentin e saj të fushës digjitale sesa një studiues i universitetit ka për njerëzit në eksperimentin e saj analog në terren. Ky (Higgins, Sävje, and Sekhon 2016) mundëson dizajne eksperimentale më të efektshme - të tilla si bllokimi (Higgins, Sävje, and Sekhon 2016) dhe rekrutimi i pjesëmarrësve (Eckles, Kizilcec, and Bakshy 2016) dhe analiza më të detajuara, të tilla si vlerësimi i heterogjenitetit të efekteve të trajtimit (Athey and Imbens 2016a) dhe përshtatjen e covariatit për saktësi të përmirësuar (Bloniarz et al. 2016) .
Së treti, ndërkohë që shumë eksperimente laboratorike dhe laboratorike ofrojnë trajtime dhe maten rezultatet në një sasi relativisht të kompresuar të kohës, disa eksperimente në fushën digjitale ndodhin gjatë kohëzgjatjeve shumë më të gjata. Për shembull, eksperimenti i Restivo dhe van de Rijt kishte matur rezultatet e përditshme për 90 ditë dhe një nga eksperimentet që unë do t'ju tregoj më vonë në kapitullin (Ferraro, Miranda, and Price 2011) zbuluar rezultatet për tre vjet në fund të fundit kosto. Këto tre mundësi-përmasat, informacionet e para-trajtimit, dhe trajtimet gjatësore dhe rezultatet e rezultateve-lindin më së shpeshti kur eksperimentet drejtohen në krye të sistemeve gjithnjë në matje (shih kapitullin 2 për më shumë në sistemet gjithnjë në matje).
Ndërsa eksperimentet në fushën digjitale ofrojnë shumë mundësi, ato gjithashtu ndajnë disa dobësi me të dy laboratorët analog dhe eksperimentet analoge në terren. Për shembull, eksperimentet nuk mund të përdoren për të studiuar të kaluarën dhe ata vetëm mund të vlerësojnë efektet e trajtimeve që mund të manipulohen. Gjithashtu, ndonëse eksperimentet padyshim janë të dobishme për të udhëhequr politikën, udhëzimet e sakta që mund të ofrojnë janë disi të kufizuara për shkak të ndërlikimeve të tilla si varësia mjedisore, problemet e pajtueshmërisë dhe ekuilibri (Banerjee and Duflo 2009; Deaton 2010) . Eksperimentet në fushën digjitale gjithashtu zmadhojnë shqetësimet etike të krijuara nga eksperimentet në terren - një temë që do të adresoj më vonë në këtë kapitull dhe në kapitullin 6.