4.6.2 Ehitage oma disainile eetika: asendada, täiustada ja vähendada

See tõlge loodi arvuti. ×

4.6.2 Ehitage oma disainile eetika: asendada, täiustada ja vähendada

Tee oma eksperimendi inimlikum asendades eksperimendid mitte eksperimentaalsed uuringud, rafineerimine ravi, vähendades osalejate arv.

Teine nõuanne, mida ma digitaalsete eksperimentide projekteerimisel sooviksin pakkuda, puudutab eetikat. Nagu Resplo ja van de Rijti eksperiment barnstarsi kohta Wikipedias näitab, tähendab ka kulude vähenemine seda, et eetika muutub teadusuuringute disaini üha olulisemaks osaks. Lisaks 6. peatükis kirjeldatud inimteadlaste uurimistöödele suunatud eetilistele raamistikele võivad digitaalsete eksperimentide kujundajad ka tugineda erinevatest allikatest pärinevatele eetilistele ideedele: eetilised põhimõtted, mis on välja töötatud loomade eksperimentide juhtimiseks. Eelkõige pakkusid oma maamärkide raamatus humanitaartehnoloogia põhimõtted Russell and Burch (1959) välja kolm põhimõtet, mis peaksid loomkatseid juhtima: asendada, täpsustama ja vähendama. Ma sooviksin teha ettepaneku, et neid kolme R-d saaks kasutada ka veidi muudetud kujul - inimkatsetuste kavandamiseks. Eriti,

Asenda: kui võimalik, asendage katsed vähem invasiivsete meetoditega.
Täpsusta: täpsustage ravi nii, et see oleks võimalikult kahjutu.
Vähendage: vähendage eksperimendis osalejate arvu nii palju kui võimalik.

Selleks, et need kolm R-d oleksid konkreetsed ja näitaksid, kuidas need võivad viia paremini ja humaansemalt eksperimentaalse disaini kujundamiseni, kirjeldan ma veebipõhist välikatset, mis tekitas eetilisi arutelusid. Siis kirjeldan, kuidas kolm R-d viitavad konkreetsele ja praktilistele muudatustele eksperimendi kujunduses.

Üks kõige eetilisematest arutlustest tehtud digitaalsetest eksperimentidest tegi Adam Kramer, Jamie Guillroy ja Jeffrey Hancock (2014) ja seda nimetatakse "emotsionaalseks nakkuseks". See eksperiment toimus Facebookis ja selle põhjuseks oli teaduslike ja praktilised küsimused. Sel ajal oli kasutajate Facebooki domineerivaks mooduseks News Facebook, mis oli kasutaja Facebooki sõprade abil algoritmiliselt kureeritud Facebooki oleku värskenduste kogum. Mõned Facebooki kriitikud osutasid sellele, et kuna Uudistevoog on enamasti positiivseid postitusi - sõpradega, kes näitavad oma viimast pidu - see võib põhjustada kasutajate tunde kurbust, sest nende elu tundus võrdlemisel vähem põnev. Teiselt poolt, võib-olla mõju on täpselt vastupidine: võib-olla näeme, et teie sõber hea ajaga muudaks teid õnnelikuks. Nende konkureerivate hüpoteeside käsitlemiseks ja meie arusaamade edastamiseks selle kohta, kuidas tema emotsioonid mõjutavad tema sõprade emotsioone, käitus Kramer ja tema kolleegid eksperimendi. Nad panid ligikaudu 700 000 kasutajat ühe nädala jooksul nelja rühma: "negatiivsuse vähenenud" grupp, kelle jaoks negatiivsete sõnadega postitusi (nt "kurb") juhuslikult blokeeriti uudistevoogis; positiivsuse vähendatud rühm, kelle jaoks positiivsete sõnadega postitused (nt "õnnelikud") olid juhuslikult blokeeritud; ja kaks kontrollrühma. Negatiivsuse vähendatud rühma kontrollrühmas blokeeriti postitused juhuslikult samadel kiirustel kui "negatiivsus-vähendatud" rühm, kuid emotsionaalset sisu arvesse võtmata. "Positiivsusega vähendatud" rühma kontrollrühm oli konstrueeritud paralleelselt. Selle katse ülesehitus näitab, et sobiv kontrollrühm ei ole alati üks ilma muudatusteta. Mõnikord võtab kontrollrühm kasutusele ravi, et luua täpsem võrdlus, mida uurimist vajav küsimus nõuab. Igal juhul olid postitused, mis olid uudistevoogist blokeeritud, kasutajate jaoks veel saadaval Facebooki veebisaidi muudest osadest.

Kramer ja tema kolleegid leidsid, et positiivsuse vähenenud seisundis osalejate puhul vähenes positiivsete sõnade protsent nende olekuvärskendustes ja negatiivsete sõnate osakaal suurenes. Teisest küljest, negatiivsuse vähenenud seisundis osalejate puhul suurenes positiivsete sõnade osakaal ja negatiivsete sõnade osakaal (joonis 4.24). Kuid need mõjud olid üsna väikesed: positiivsete ja negatiivsete sõnade erinevus ravi ja kontrollide vahel oli umbes 1 sõna 1000 sõnaga.

Joonis 4.24: Tõendid emotsionaalse nakatumise kohta (Kramer, Guillory ja Hancock 2014). Negatiivsuse vähenenud seisundis osalejad kasutasid vähem negatiivseid sõnu ja positiivsemaid sõnu ning positiivsuse vähenenud seisundis osalejad kasutasid rohkem negatiivseid sõnu ja vähem positiivseid sõnu. Baarid tähistavad standardseid vigu. Kohandatud Kramer, Guillory ja Hancock (2014), joonis 1.

Joonis 4.24: Tõendid emotsionaalse nakatumise kohta (Kramer, Guillory, and Hancock 2014) . Negatiivsuse vähenenud seisundis osalejad kasutasid vähem negatiivseid sõnu ja positiivsemaid sõnu ning positiivsuse vähenenud seisundis osalejad kasutasid rohkem negatiivseid sõnu ja vähem positiivseid sõnu. Baarid tähistavad standardseid vigu. Kohandatud Kramer, Guillory, and Hancock (2014) , joonis 1.

Enne selle eksperimendiga tõstatatud eetiliste küsimuste arutamist tahaksin kirjeldada kolme teaduslikku probleemi, kasutades mõnda peatükist varasematest ideedest. Esiteks ei ole selge, kuidas katse tegelikud andmed ühendavad teoreetiliste väidetega; Teisisõnu on küsimusi konstruktsiooni kehtivuse kohta. Ei ole selge, et positiivsete ja negatiivsete sõnaartiklite arv on osalejate emotsionaalse seisundi hea näitaja, kuna (1) pole selge, et sõnad, mida inimesed postitavad, on nende emotsioonide hea näitaja ja (2) see ei ole selge, et konkreetse tunde analüüsimise tehnika, mida kasutavad teadlased suudavad usaldusväärselt seostada emotsioone (Beasley and Mason 2015; Panger 2016) . Teisisõnu, võib olla kallutatud signaali halb mõõde. Teiseks, eksperimendi kavandamine ja analüüs ei räägi meile sellest, kellele kõige rohkem mõju avaldub (st ei ole analüüsitud raviefektide heterogeensust) ja milline võiks olla mehhanism. Sel juhul oli uurijatel palju teavet osalejate kohta, kuid neid käsitleti põhiliselt analüüside vidinatena. Kolmandaks, selle eksperimendi mõju suurus oli väga väike; töötlemis- ja kontrollitingimuste vahe on umbes 1 1000 sõnaga. Kramer ja tema kolleegid teatasid oma artiklis, et selle suuruse mõju on tähtis, sest sadu miljoneid inimesi saavad iga päev oma uudistevoogu. Teisisõnu väidavad nad, et isegi kui mõjud on igale inimesele väikesed, on need kokku suured. Isegi kui nõustuksite selle argumendiga, pole ikka veel selge, kas sellise suuruse mõju on emotsioonide levikuga seotud üldisema teadusliku küsimuse seisukohalt oluline (Prentice and Miller 1992) .

Peale nende teaduslike küsimuste, just mõned päevad pärast seda, kui see paber oli avaldatud Rahvusliku Teaduste Akadeemia menetluses , oli nii teadlaste kui ajakirjanduse tohutu tõrjutus (ma kirjeldan selle arutelu argumente üksikasjalikumalt peatükis 6 ) Selles arutelus tõstatatud küsimused põhjustasid ajakirjale haruldase "teadusliku väljenduskirja" teadustöö eetika ja eetilise läbivaatuse protsessi kohta (Verma 2014) .

Arvestades emotsionaalse nakkusega seotud tausta, tahaksin nüüd näidata, et kolm R-d võivad soovitada konkreetseid ja praktilisi parandusi tegelike uuringute tegemiseks (mida iganes sa võiksid isiklikult mõelda selle konkreetse eksperimendi eetikale). Esimene R asendab : teadlased peaksid võimaluse korral proovima asendada katsed vähem invasiivsete ja riskantsete tehnikatega. Näiteks võiksid uurijad kasutada juhusliku kontrollitud eksperimendi asemel looduslikku katset . Nagu peatükis 2 kirjeldatud, on looduslikud katsed olukorras, kus maailmas juhtub midagi, mis läheneb töötlemiste juhusliku määramisega (nt loterii, et otsustada, kes sõjaväelasest saab). Loodusliku eksperimendi eetiline eelis on see, et teadlane ei pea ravi andma: keskkond teeb seda teie jaoks. Näiteks peaaegu samaaegselt emotsionaalse nakkusliku katsega, Lorenzo Coviello et al. (2014) kasutavad seda, mida võiks nimetada emotsionaalse nakkusliku loodusliku eksperimendiks. Coviello ja tema kolleegid avastasid, et inimesed postitavad rohkem negatiivseid sõnu ja vähem positiivseid sõnu päevadel, kus see sajab. Seepärast suutsid ilmastiku juhuslikud variatsioonid uurida uudistevoogude muudatuste mõju, ilma et peaks üldse sekkuma. Ilm oli nende jaoks eksperiment. Nende protseduuri üksikasjad on natuke keerulised, kuid meie eesmärkide jaoks on kõige olulisem see, et kasutades loomulikku katset Coviello ja kolleegid suutsid õppida emotsioonide levikut, ilma et oleks vaja oma katset käitada.

Teine kolmest R-st täpsustatakse : teadlased peaksid püüdma täiustada oma ravimeetodit, et need oleksid võimalikult ohutud. Näiteks võiksid teadlased pigem positiivse või negatiivse sisu hoogustamiseks selle asemel, et blokeerida kas positiivset või negatiivset sisu. See stimuleeriv disain oleks muutnud osalejate uudistevoogude emotsionaalset sisu, kuid see oleks käsitlenud üht kriitikute väljendatud muret, et eksperimendid võisid põhjustada osalejatele olulise teabe puudumise oma uudistevooga. Krameri ja kolleegide kasutatud kujundusega on tõenäoliselt tähtis sõnum blokeeritud, kuna see ei ole. Kuid suurema disaini korral oleksid nihutatud sõnumid vähem tähtsad.

Lõpuks, kolmas R vähendab : teadlased peaksid püüdma oma eksperimendis osalejate arvu vähendada nende teadusliku eesmärgi saavutamiseks vajalikule tasemele. Analoogkatsetes toimus see loomulikult osalejate suurte muutuvate kulude tõttu. Kuid digitaalsetes eksperimentides, eriti nullmõõtmeliste kuludega, ei puutu teadlased oma eksperimendi suurusega kulusid kokku ning see võib põhjustada tarbetult suuri katseid.

Näiteks võib Kramer ja tema kolleegid kasutada nende osalejate jaoks eeltöötlust puudutavat teavet, näiteks eeltöötluse postitamise käitumist, et muuta nende analüüs tõhusamaks. Täpsemalt öeldes võis Kramer ja tema kolleegid võrrelda positiivsete sõnade osakaalu töötlemis- ja kontrollitingimustes võrreldes positiivsete sõnade osakaalu muutusega tingimuste vahel; lähenemist, mida mõnikord nimetatakse segatud disainiks (joonis 4.5) ja mida mõnikord nimetatakse erinevus-erinevuste hindajaks. See tähendab, et iga osaleja jaoks oleksid teadlased võinud luua muutuse skoori (ravi järgnev käitumine $-$ eeltöötluse käitumine) ja seejärel võrrelda ravitulemuste ja kontrollitingimuste osalejate muutuste skoori. See erinevus-in-difference lähenemine on statistiliselt tõhusam, mis tähendab, et teadlased saavad saavutada sama statistilise usaldusväärsuse, kasutades palju väiksemaid proove.

Ilma toorta andmeteta on keeruline täpselt teada, kui tõhusam oleks erinevus-erinevuste hindaja sellisel juhul olnud. Aga me saame vaadata ka muid sarnaseid eksperimente umbkaudse idee jaoks. Deng et al. (2013) teatasid, et kasutades erineva erinevuse hindaja vormi, suutis neil kolme erineva online-eksperimendi abil vähendada nende hinnangute erinevust umbes 50% võrra; sarnased tulemused on teatanud Xie and Aurisset (2016) . See 50% dispersioonide vähenemine tähendab seda, et emotsionaalse nakkushaiguse teadlased oleksid võinud proovi kahekordselt lõigata, kui nad oleksid kasutanud mõnevõrra erinevat analüüsimeetodit. Teisisõnu, analüüsi pisikeses muutuses võis eksperimendis osaleda 350 000 inimest.

Siinkohal võite küsida, miks peaksid teadlased hoolt kandma, et 350 000 inimest oleks tarbetult seotud emotsionaalse nakkusega. Emotsionaalse nakkushaiguse puhul on kaks eripära, mis muudavad muret vajaliku liigse suurusega, ja neid funktsioone jagavad paljud digitaalsed välieksperimendid: (1) on ebakindel, kas eksperiment kahjustab vähemalt mõnda osalejat ja (2) osaleb ei olnud vabatahtlik. Tundub mõistlik proovida hoida eksperimente, millel on need võimalused võimalikult väikesed.

Selleks, et olla selge, ei tähenda soov katse suuruse vähendamiseks, et te ei tohiks kasutada suuri, nullidega muutuva kuluga eksperimente. See tähendab lihtsalt seda, et teie katsed ei tohiks olla suuremad kui teie teadusliku eesmärgi saavutamiseks. Üks oluline viis tagada, et katse on sobiva suurusega, on teostada võimsuse analüüsi (Cohen 1988) . Analoogiaastal tegid teadlased enamasti võimsuse analüüse, et veenduda, et nende uuring ei olnud liiga väike (st vähene võimsus). Nüüd aga peaksid teadlased tegema jõuanalüüse, et veenduda, et nende uuring ei ole liiga suur (st üle jõu).

Kokkuvõtteks võib öelda, et kolm R-asendavad, täpsustavad ja vähendavad põhimõtteid, mis võivad aidata teadlastel luua eetikat oma eksperimentaalsesse disaini. Muidugi on kõik need võimalikud muutused emotsionaalseks nakkushaiguseks kompromissid. Näiteks looduslike eksperimentide tõendid ei ole alati nii puhas kui randomiseeritud eksperimentidel, ning sisu tõukejõu võib olla logistiliselt raskendatud kui sisu blokeerimine. Niisiis ei pidanud nende muudatuste esilekutsumine teiste teadlaste otsuste teistmoodi arvestama. Pigem oli see illustreerida, kuidas kolme R-d võiks realistlikus olukorras rakendada. Tegelikult on kompromisside küsimus pidevalt uurimisprojektis, ja digitaalajastul on need kompromissid enamasti seotud eetiliste kaalutlustega. Hiljem, 6. peatükis, pakun mõningaid põhimõtteid ja eetilisi raamistikke, mis aitavad teadlastel neid kompromisse mõista ja arutada.