4.6.2 Konstruu etikon en vian dezajnon: anstataŭigi, rafini kaj redukti

Tiu traduko estis kreitaj de komputilo. ×

4.6.2 Konstruu etikon en vian dezajnon: anstataŭigi, rafini kaj redukti

Fari vian eksperimenton pli humana anstataŭigante eksperimentoj kun ne-eksperimentaj studoj, rafinante la traktadoj, kaj reduktante la nombron da partoprenantoj.

La dua konsilo, kiun mi ŝatus proponi pri desegnado de ciferecaj eksperimentoj, koncernas etikon. Kiel la eksperimenta Restivo kaj van de Rijt sur grekaĵejoj en Vikipedio montras, malpliigita kosto signifas, ke etiko fariĝos ĉiufoje pli grava parto de esplorado. Krom la etikaj kadroj, kiuj gvidas homajn aferojn, kiujn mi priskribos en la ĉapitro 6, esploristoj desegnantaj ciferecajn eksperimentojn ankaŭ povas desegni etikajn ideojn de malsama fonto: la etikaj principoj evoluigitaj por gvidi eksperimentojn kun bestoj. En aparta, en siaj limŝtonaj libroj, Principoj de Humana Eksperimenta Tekniko , Russell and Burch (1959) proponis tri principojn, kiuj devus gvidi bestajn esplorojn: anstataŭigi, rafini kaj redukti. Mi ŝatus proponi, ke ĉi tiuj tri R-a ankaŭ povas esti uzataj - laŭ iomete modifita formo - por gvidi la desegnon de homaj eksperimentoj. Precipe,

Anstataŭigi: Anstataŭigi eksperimentojn kun malpli invasaj metodoj, se eble.
Rifini: Redakti la traktadon por fari ĝin kiel senkulpa kiel eble.
Redukti: Reduzu la nombro de partoprenantoj en via eksperimento kiel eble plej multe.

Por fari ĉi tiujn konkretojn de tri R kaj montri kiel ili eble povas konduki al pli bona kaj pli humana eksperimenta dezajno, mi priskribos enretan kampuŝan eksperimenton, kiu generis etikan debaton. Tiam mi priskribos kiel la tri R sugestas konkretajn kaj praktikajn ŝanĝojn al la dezajno de la eksperimento.

Unu el la plej etikaj diskutataj eksperimentoj de cifereca kampo estis realigita fare de Adam Kramer, Jamie Guillroy, kaj Jeffrey Hancock (2014) kaj nomiĝas "Emotional Contagion". La eksperimento okazis en Facebook kaj estis instigita de miksaĵo de sciencaj kaj Praktikaj demandoj. Tiutempe, la reganta maniero, kiun uzantoj interagis kun Facebook estis Novaĵoj Feed, algoritme kuracita aro de Facebook-ĝisdatigoj de uzantoj de Facebook-amikoj. Kelkaj kritikistoj de Facebook sugestis, ke la Novaĵoj Feed havas plejpartajn pozitivajn poŝtojn, kiuj montras sian plej lastan partion - povus kaŭzi ke la uzantoj sentu malĝojan ĉar iliaj vivoj ŝajnis malpli ekscitaj kompare. Aliflanke, eble la efiko estas ĝuste male: eble via amiko bonan tempon farus vin feliĉa. Por trakti ĉi tiujn konkurencajn hipotezon-kaj antaŭenigi nian komprenon pri kiel emocioj de persono influas la emociojn de siaj amikoj-Kramer kaj kolegoj kuris eksperimenton. Ili metis ĉirkaŭ 700,000 uzantojn en kvar grupojn dum unu semajno: grupo de "negativ-reduktita", por kiu afiŝoj kun negativaj vortoj (ekz. "Malĝojaj") estis hazarde blokitaj de aperi en la Novaĵoj Feed; grupo de "pozitiva-reduktita" por kiu afiŝoj kun pozitivaj vortoj (ekzemple "feliĉaj") estis hazarde blokitaj; kaj du komandaj grupoj. En la grupo de kontrolo por la "negativ-reduktita" grupo, afiŝoj estis hazarde blokitaj samtempe ol la "negativ-reduktita" grupo sed sen konsideri la emocian enhavon. La grupo de kontrolo por la "pozitiva-reduktita" grupo estis konstruita paralele. La dezajno de ĉi tiu eksperimento ilustras, ke la taŭga komerca grupo ne ĉiam estas unu kun neniuj ŝanĝoj. Prefere, foje, la komanda grupo ricevas traktadon por krei la precizan komparon, kiun esploras demando postulas. En ĉiuj kazoj, la afiŝoj, kiuj estis blokitaj de la News Feed ankoraŭ estis haveblaj por uzantoj tra aliaj partoj de la retejo de Facebook.

Kramer kaj kolegoj trovis, ke por partoprenantoj en la pozitiva-malpliigita kondiĉo, la procento de pozitivaj vortoj en iliaj statusaj ĝisdatigoj malpliiĝis kaj la procento de negativaj vortoj pliiĝis. Aliflanke, por partoprenantoj en la negativ-reduktita kondiĉo, la procento de pozitivaj vortoj pliiĝis kaj la negativaj vortoj malpliiĝis (figuro 4.24). Tamen, ĉi tiuj efikoj estis sufiĉe malgrandaj: la diferenco en pozitivaj kaj negativaj vortoj inter traktadoj kaj kontroloj estis proksimume 1 en 1,000 vortoj.

Figuro 4.24: Evidenteco de emocia kontakto (Kramer, Guillory, kaj Hancock 2014). Partoprenantoj en la negativ-reduktita kondiĉo uzis malpli negativajn vortojn kaj pli pozitivajn vortojn, kaj partoprenantoj en la reduktita kondiĉo uzis pli negativajn vortojn kaj malpli pozitivajn vortojn. Baroj reprezentas taksitajn normajn erarojn. Adaptita de Kramer, Guillory, kaj Hancock (2014), figuro 1.

Figuro 4.24: Evidenteco de emocia kontakto (Kramer, Guillory, and Hancock 2014) . Partoprenantoj en la negativ-reduktita kondiĉo uzis malpli negativajn vortojn kaj pli pozitivajn vortojn, kaj partoprenantoj en la reduktita kondiĉo uzis pli negativajn vortojn kaj malpli pozitivajn vortojn. Baroj reprezentas taksitajn normajn erarojn. Adaptita de Kramer, Guillory, and Hancock (2014) , figuro 1.

Antaŭ diskuti la etikajn demandojn, kiujn mi proponas, mi volas priskribi tri sciencajn aferojn uzante iujn ideojn de pli frue en la ĉapitro. Unue, ĝi ne estas klara kiel la realaj detaloj de la eksperimento konektas al la teoriaj asertoj; Alivorte, estas demandoj pri konstruado de valideco. Ne estas klare, ke la pozitivaj kaj negativaj vortoj estas fakte bona indikilo de la emocia stato de partoprenantoj ĉar (1) ne klare, ke la vortoj, kiujn homoj poŝtas, estas bona indikilo de siaj emocioj kaj (2) ĝi ne estas klare, ke la aparta analizo-tekniko, kiun uzis la esploristoj, kapablas fidinde malsukcesi emociojn (Beasley and Mason 2015; Panger 2016) . Alivorte, povus esti malbona mezuro de parola signalo. Due, la dezajno kaj analizo de la eksperimento ne rakontas al ni nenion pri kiu plej efikis (tio estas, ne ekzistas analizo pri heterogeneco de traktaj efikoj) kaj kia estas la mekanismo. En ĉi tiu kazo, la esploristoj havis multan informon pri la partoprenantoj, sed ili estis esence traktataj kiel widgets en la analizo. Tria, la efika grandeco en ĉi tiu eksperimento estis tre malgranda; la diferenco inter la traktado kaj kontrolo-kondiĉoj estas ĉirkaŭ 1 en 1,000 vortoj. En sia papero, Kramer kaj kolegoj konsideras, ke efiko de ĉi tiu grandeco estas grava, ĉar centoj da milionoj da homoj aliras sian News Feed ĉiutage. Alivorte, ili argumentas, ke se efektoj estas malgrandaj por ĉiu persono, ili estas grandaj en tuta. Eĉ se vi akceptus ĉi tiun argumenton, ĝi ankoraŭ ne estas klara se efiko de ĉi tiu grandeco gravas pri la pli ĝenerala scienca demando pri la disvastiĝo de emocio (Prentice and Miller 1992) .

Krom ĉi tiuj sciencaj demandoj, nur tagojn post kiam ĉi tiu papero estis publikigita en Proceedings de la Nacia Akademio de Sciencoj , estis granda kriado de ambaŭ esploristoj kaj gazetaro (mi priskribos la argumentojn en ĉi tiu debato pli detale en la ĉapitro 6 ). La aferoj levitaj en ĉi tiu debato kaŭzis ke la ĵurnalo publikigas maloftajn "redaktajn esprimojn de maltrankvilo" pri la etiko kaj la etika revizia procezo por la esplorado (Verma 2014) .

Konsiderante ĉi tiu fono pri Emocia Kontagado, mi volus nun montri, ke la tri Roj povas sugesti konkretajn, praktikajn pliboniĝojn por realaj studoj (kiom ajn vi povus persone pensi pri la etiko de ĉi tiu aparta eksperimento). La unua R anstataŭas : esploristoj devus serĉi anstataŭi eksperimentojn kun malpli invasivaj kaj riskaj teknikoj, se eble. Ekzemple, anstataŭ kurado de hazarda kontrolita eksperimento, la esploristoj povus eksplodi naturajn eksperimentojn . Kiel priskribita en ĉapitro 2, naturaj eksperimentoj estas situacioj, kie io okazas en la mondo, kiu proksimigas la hazardan faron de traktadoj (ekz. Loterio por decidi, kiu estos redaktita en militistaron). La etika avantaĝo de natura eksperimento estas, ke la esploristo ne devas liveri traktadojn: la medio faras tion por vi. Ekzemple, preskaŭ samtempe kun la eksperimento de Emocia Kontagado, Lorenzo Coviello et al. (2014) eksplodis, kion oni povus nomi natura eksperimento. Coviello kaj kolegoj malkovris, ke homoj postulas pli negativajn vortojn kaj malpli pozitivajn vortojn dum la tagoj, kie pluvas. Sekve, per uzado de hazarda variado en la vetero, ili povis studi la efikon de ŝanĝoj en la Novaĵoj-Retejo sen neceso interveni. Estis kvazaŭ la vetero kuradis ilian eksperimenton por ili. La detaloj de ilia proceduro estas iom komplika, sed la plej grava punkto por niaj celoj ĉi tie estas, ke per natura eksperimento, Coviello kaj kolegoj povis lerni pri la disvastiĝo de emocioj sen neceso ekzekuti sian propran eksperimenton.

La dua el la tri Rikoltoj estas rafinita : esploristoj devas streĉi iliajn traktadojn por fari ilin kiel senkulpe kiel eble. Ekzemple, anstataŭ bloki enhavon, kiu estis aŭ pozitiva aŭ negativa, la esploristoj povus pliigi enhavon, kiu estis pozitiva aŭ negativa. Ĉi tiu impulsa dezajno ŝanĝus la emocian enhavon de la "Novaĵoj-Fluoj" de la partoprenantoj, sed ĝi traktus unu el la maltrankviloj, kiujn kritikistoj esprimis: ke la eksperimentoj povus kaŭzi ke partoprenantoj perdas gravan informon en sia News Feed. Kun la dezajno uzata de Kramer kaj kolegoj, mesaĝo grava estas eble plej blokita kiel unu ne. Tamen, kun pliigita dezajno, la mesaĝoj, kiuj estus delokitaj, estus tiuj, kiuj estas malpli gravaj.

Fine la tria R reduktas : esploristoj devus redukti la numeron de partoprenantoj en sia eksperimento al la minimuma neceso por atingi sian sciencan celon. En analogaj eksperimentoj, tio okazis nature pro la grandaj variabloj de partoprenantoj. Sed en ciferecaj eksperimentoj, precipe tiuj, kiuj havas nulajn kostojn, la esploristoj ne alfrontas kostan limon sur la grandeco de sia eksperimento, kaj ĉi tio havas la eblecon konduki al nenecese grandaj eksperimentoj.

Ekzemple, Kramer kaj kolegoj povus esti uzataj antaŭprokrataj informoj pri siaj partoprenantoj, kiel ekzemple antaŭprokratajn kondutojn, por ke ilia analizo estu pli efika. Pli specife, prefere ol komparante la proporcion de pozitivaj vortoj en la traktado kaj kontrolkondiĉoj, Kramer kaj kolegoj povus kompari la ŝanĝon en la proporcio de pozitivaj vortoj inter kondiĉoj; alfluo kiu foje estas nomata miksita dezajno (figuro 4.5) kaj iam nomata diferenco-en-diferenca estimilo. Tio estas, por ĉiu partoprenanto, la esploristoj povis esti kreita ŝanĝon interpunkcio (post-traktado konduto $-$ antaŭ-traktado konduto) kaj poste kompari la ŝanĝo dekojn da partoprenantoj en la traktado kaj kontrolo kondiĉoj. Ĉi tiu diferenco-en-diferenca aliro estas pli efika statistike, kio signifas, ke esploristoj povas atingi la saman statistikan konfidon uzante multe pli malgrandajn specimenojn.

Sen havi la krudan datumon, estas malfacile scii ĝuste kiom pli efika diferenco-en-diferenca taksiilo estus en ĉi tiu kazo. Sed ni povas rigardi aliajn rilatajn eksperimentojn por malgrava ideo. Deng et al. (2013) raportis ke per uzado de formo de la diferenco-en-diferenca taksiilo, ili povis redukti la variancon de iliaj taksoj ĉirkaŭ ĉirkaŭ 50% en tri malsamaj enretaj eksperimentoj; Similaj rezultoj estis raportitaj de Xie and Aurisset (2016) . Ĉi tiu redukto de 50% de varianco signifas, ke la Emociaj Kontagaj esploristoj eble povus tranĉi ilian ekzemplon en duono, se ili uzus iomete malsaman analizan metodon. Alivorte, kun eta ŝanĝo en la analizo, 350,000 homoj povus esti indulgitaj partopreni en la eksperimento.

Je ĉi tiu punkto, vi eble demandas, kial esploristoj devas zorgi, ĉu 350,000 homoj en Emotional Contagion nenecese. Ekzistas du apartaj trajtoj de Emocia Kontagado, kiuj zorgas pri troa grandeco taŭga, kaj ĉi tiuj trajtoj estas dividitaj de multaj ciferecaj eksperimentoj: (1) estas necerteco pri ĉu la eksperimento kaŭzos difekton al almenaŭ iuj partoprenantoj kaj (2) partopreno ne estis propra-vola. Ŝajnas esti racia provi konservi eksperimentojn, kiuj havas ĉi tiujn eblecojn kiel eble plej malgrandan.

Por esti klara, la deziro redukti la grandecon de via eksperimento ne signifas, ke vi ne kuru grandajn, nulajn kostajn eksperimentojn. Ĝi simple signifas, ke viaj eksperimentoj ne devas esti pli grandaj ol vi bezonas por atingi vian sciencan celon. Grava maniero certigi, ke eksperimento taŭge gravas, efektivigi potencan analizon (Cohen 1988) . En la analoga aĝo, esploristoj ĝenerale faris potencan analizon por certigi, ke ilia studo ne estis tro malgranda (tio estas, sub-funkciigita). Nun, tamen, esploristoj devas fari potencan analizon por certigi, ke ilia studo ne estas tro granda (tio estas, superforta).

En konkludo, la tri R's-anstataŭas, rafinas kaj reduktas-provizojn kiuj povas helpi esploristojn konstrui etikon en siajn eksperimentajn dezajnojn. Kompreneble, ĉiu el ĉi tiuj eblaj ŝanĝoj al Emocia Kontagado prezentas komercajn oferojn. Ekzemple, evidenteco de naturaj eksperimentoj ne ĉiam estas tiel pura kiel tio de hazardigitaj eksperimentoj, kaj plibonigi enhavon povus esti logike pli malfacile apliki ol bloki enhavon. Do, la celo sugesti ĉi tiujn ŝanĝojn ne devis rekompenci la decidojn de aliaj esploristoj. Prefere, ĝi estis ilustri kiel la tri R's povus esti aplikitaj en realisma situacio. Fakte, la demando de komercajxoj venas dum la tuta tempo en esplorado, kaj en la ciferecaj aĝo, ĉi tiuj komercaj oficejoj plu pliigos etikajn konsiderojn. Poste, en ĉapitro 6, mi proponos iujn principojn kaj etikajn kadrojn, kiuj povas helpi esploristojn kompreni kaj diskuti ĉi tiujn komercojn.