4.6.2 Anstataŭigi, Rafini kaj Redukti

Tiu traduko estis kreitaj de komputilo. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

4.6.2 Anstataŭigi, Rafini kaj Redukti

Fari vian eksperimenton pli humana anstataŭigante eksperimentoj kun ne-eksperimentaj studoj, rafinante la traktadoj, kaj reduktante la nombron da partoprenantoj.

La dua peco de konsilo ke mi ŝatus proponi pri dizajnado diĝita eksperimentoj koncernas etiko. Kiel la Restivo kaj van de Rijt eksperimento sur barnstars en Vikipedio spektakloj, malkreskis kostoj signifas ke etiko fariĝos ĉiam pli grava parto de esploro dezajno. Krom la etikaj kadroj gvidante homaj temoj esploro ke mi priskribu en Ĉapitro 6, esploristoj desegnanta diĝita eksperimentoj povas ankaŭ desegni sur etikaj ideoj de malsama fonto: la etikaj principoj evoluigita por gvidi eksperimentoj implikantaj bestojn. Aparte, en sia orientilo libro Principles of Humane Eksperimenta Tekniko, Russell and Burch (1959) proponis tri principojn kiuj devus gvidi besto esploro: Anstataŭigi, Rafini kaj Redukti. Mi ŝatus proponi ke tiuj tri R povas ankaŭ esti uzata-en iomete modifita formo-gvidi la dezajnon de homaj eksperimentoj. Precipe,

Anstataŭigi: anstataŭigi eksperimentojn kun malpli invada metodoj laŭeble
Rafini: rafini la traktadon por igi ĝin kiel simplaj kiel ebla
Redukti: redukti la numeron de partoprenantoj en vian eksperimenton laŭeble

Por fari tiujn tri R konkreta kaj montri kiom ili povas potenciale konduki al bona kaj pli humana eksperimenta dezajno, mi priskribus reta kampo eksperimento kiu generis etikan debaton. Poste mi priskribi kiel la tri R sugesti konkretajn kaj praktikajn ŝanĝojn al la dezajno de la eksperimento.

Unu el la plej etike diskutis diĝita kampo eksperimentoj estas "Emocia kontaĝas", kiu estis direktita de Adam Kramer, Jamie Gillroy kaj Jeffrey Hancock (2014) . La eksperimento okazis en Facebook kaj estis motivita de miksaĵo de sciencaj kaj praktikaj demandoj. Tiutempe, la reganta maniero ke uzantoj interagas kun Facebook estis la Novaĵoj Feed, la algorítmicamente kuracas aro de Facebook statuso ĝisdatigoj de uzanto Facebook amikoj. Iuj kritikistoj de Facebook estis sugestite ke pro la Novaĵoj Feed havas plejparte pozitivan afiŝojn-amikoj paradi sian lastan partion-tio povus kaŭzi uzantoj senti malĝoja ĉar iliaj vivoj ŝajnas malpli ekscita kompare. Aliflanke, eble la efekto estas ĝuste la malo; eble vidante vian amikon havanta bonan tempon farus vin senti feliĉaj? Por trakti tiujn konkurantaj hipotezo-kaj avanci nian komprenon de kiel persono emocioj estas efikita de ŝiaj amikoj emociojn-Kramer kaj kolegoj kuris eksperimento. La esploristoj metis ĉirkaŭ 700.000 uzantoj en kvar grupoj por unu semajno: de "negatividad reduktita" grupo, por kiu afiŝojn kun negativaj vortoj (ekz, malĝoja) estis hazarde forbarita de aperante la Novaĵoj Feed; a "pozitiveco reduktita" grupo por kiu afiŝojn kun pozitivaj vortoj (ekz, feliĉa) estis hazarde blokis; kaj du grupoj de kontrolo. En la grupo de kontrolo por la "negatividad reduktita" grupo, fostoj estis hazarde blokis al la sama imposto kiel la "negatividad reduktita" grupo sed sen konsidero al la emocia enhavo. La kontrolgrupo por la "pozitiveco reduktita" grupo estis konstruita en paralela modo. La dezajno de ĉi tiu eksperimento ilustras ke la adekvata kontrolo grupo ne ĉiam sen ŝanĝoj. Prefere, kelkfoje la kontrolgrupo ricevas traktadon por krei la preciza komparo tiu esplora demando postulas. En ĉiuj kazoj, la posts kiu estis blokita de la Novaĵoj Feed ankoraŭ havebla por uzantoj tra aliaj partoj de la Facebook paĝo.

Kramer kaj kolegoj trovis ke por partoprenantoj en la pozitiveco reduktita kondiĉo, la procento de pozitivaj vortoj en ilia statuso ĝisdatigoj malpliiĝis kaj la procento de negativaj vortoj pliigita. Aliflanke, por partoprenantoj en la negatividad reduktita kondiĉo, la procento de pozitivaj vortoj pliigita kaj la procento de negativaj vortoj malpliigita (Figuro 4.23). Tamen, tiuj efikoj estis sufiĉe malgranda: la diferenco en pozitiva kaj negativa vortoj inter traktadoj kaj kontroloj estis proksimume 1 en 1000 vortoj.

Figuro 4.23: Indico de emocia kontaĝo (Kramer, Guillory kaj Hancock 2014). Procenton de pozitivaj vortoj kaj negativaj vortoj de eksperimentaj kondiĉoj. Stangoj reprezentas taksita normo eraroj.

Figuro 4.23: Indico de emocia kontaĝo (Kramer, Guillory, and Hancock 2014) . Procenton de pozitivaj vortoj kaj negativaj vortoj de eksperimentaj kondiĉoj. Stangoj reprezentas taksita normo eraroj.

Mi metis diskuton de la sciencaj aspektoj de tiu eksperimento en la plua legado sekcio ĉe la fino de la ĉapitro, sed bedaŭrinde, ĉi tiu eksperimento estas plej konata por generi etika debato. Nur tagojn post tiu papero estis publikigita en Proceedings de la Nacia Akademio de Sciencoj, ekzistis enorma protestego de ambaŭ esploristoj kaj la gazetaro. Koleregon ĉirkaŭ la papero temigis du ĉefajn punktojn: 1) partoprenantoj ne havigas neniun konsento preter la normo Facebook terminoj de servo por traktado kiu pripenso povus kaŭzi malutilon al partoprenantoj kaj 2) la studo ne estis suferintaj triaj etikaj revizio (Grimmelmann 2015) . La etikaj demandoj levitaj en tiu debato kaŭzis la revuo rapide publikigi malofta "redakcia esprimo de maltrankvilo" pri la etiko kaj etikaj revizio procezo por la esploro (Verma 2014) . En postaj jaroj, la eksperimento daŭrigis esti fonto de intensa debato kaj malkonsento, kaj tiu malkonsento eble havis la neintencitan efikon de veturado en la ombrojn multaj aliaj eksperimentoj kiuj estas plenumataj de kompanioj (Meyer 2014) .

Donita ke fono pri Emocia kontaĝas, mi nun ŝatus montri ke la 3 R povas sugesti konkretajn, praktikajn plibonigoj por reala studoj (ajn vi povus persone opinias pri la etiko de tiu aparta eksperimento). La unua R estas Anstataŭigi: esploristoj devas sercxi anstataŭigi eksperimentojn kun malpli invasiva kaj riska teknikojn, se eblas. Ekzemple, anstataŭ kuri eksperimento, la investigadores povis esti ekspluatita natura eksperimento. Kiel priskribite en Ĉapitro 2, naturaj eksperimentoj estas situacioj kie io okazas en la mondo kiu aproksimas la hazarda asigno de traktadoj (ekzemple, loterion por decidi kiu estos redaktita en la Milito). La avantaĝo de natura eksperimento estas ke la esploristo ne devas liveri traktadoj; la medio faras ke por vi. Alivorte, per natura eksperimento, esploristoj ne estus necesa por eksperimente manipuli popola Novaĵoj Fluoj.

Fakte, preskaŭ samtempe kun la Emocia kontaĝas eksperimento, Coviello et al. (2014) estis ekspluatanta kio povus esti nomata Emocia kontaĝas natura eksperimento. Ilia alproksimiĝo, kiu uzas teknikon nomita instrumentaj variabloj, estas iom komplikita se vi neniam vidis lin antaŭe. Do, por klarigi kial oni bezonis, ni konstruu al ĝi. La unua ideo ke iuj esploristoj havu studi emocia kontaĝas estus kompari viajn afiŝojn sur tagojn kie via News Feed estis tre pozitivaj por viaj artikoloj sur tagojn kie via News Feed estis tre negativa. Tiu aliro estus bone se la celo estis nur antaŭdiri la emocia enhavo de viaj artikoloj, sed tiu aliro estas problema se la celo estas studi la kaŭzan efikon de via News Feed sur via afiŝojn. Vidi la problemon kun tiu dezajno, konsideri Rikoltfesto. En Usono, pozitiva afiŝojn spike kaj negativaj afiŝojn vertikalon sur Thanksgiving. Tiel, sur Thanksgiving, esploristoj povis vidi ke via News Feed estis tre pozitiva kaj kiu vi afiŝis pozitiva aferojn tiel. Sed via pozitiva postenoj povus esti kaŭzita de Rikoltfesto ne por la enhavo de via Novaĵoj Feed. Anstataŭe, por taksi la kaŭzan efikon esploristoj bezonos iun kiu ŝanĝas la enhavon de via News Feed sen rekte ŝanĝanta viajn emociojn. Feliĉe, ekzistas io simila okazas ĉiuj la tempo: la vetero.

Coviello kaj kolegoj trovis ke pluva tago en ies urbo, averaĝe, malpliigi la proporcion de posts kiu estas pozitiva en ĉirkaŭ 1 procento punkto kaj pliigi la proporcion de posts kiu estas negativa je ĉirkaŭ 1 procento punkto. Do Coviello kaj kolegoj ekspluatita tiu fakto studi emocia kontaĝo sen neceso experimentalmente manipuli ies Novaĵoj Feed. En esenco, kion ili faris estas mezuro kiel viaj artikoloj estis efikita de la vetero en la urboj kie viaj amikoj loĝas. Vidi kial ĉi faras senton, imagu ke vi loĝas en Novjorko kaj vi havas amikon vivanta en Seatlo. Nun imagu ke iam ĝi startas pluvas en Seatlo. Ĉi pluvo en Seattle ne rekte influas vian humoron, sed ĝi kaŭzos vian Novaĵoj Feed esti malpli pozitiva kaj pli negativa pro via amiko afiŝojn. Tiel, la pluvo en Seatlo hazarde manipulas vian Novaĵoj Feed. Turnante tiu intuicio en fidinda statistika procedo estas komplikita (kaj la ĝusta alproksimiĝo uzita de Coviello kaj kolegoj estas iom nenorma) do mi metis pli detala diskuto en la plua legado sekcio. La plej grava afero por memori pri Coviello kaj kolego alproksimiĝo estas ke ĝi ebligis ilin studi emocia kontaĝo sen la bezono por kuri eksperimenton kiu potenciale povus malutili partoprenantoj, kaj tio estos la kazo, ke en multaj aliaj agordoj vi povas anstataŭigi eksperimentojn kun aliaj teknikoj.

Dua en la 3 Rs estas Rafini: esploristoj devas sercxi rafini iliajn traktadoj por kaŭzi la plej malgrandan malutilon ebla. Ekzemple, anstataŭ blokante enhavo kiu estis aŭ pozitiva aŭ negativa, la investigadores povis esti helpata enhavo kiu estis pozitiva aŭ negativa. Ĉi akcelanta dezajno estus ŝanĝita la emocia enhavo de partoprenantoj Novaĵoj Fluoj, sed estus traktitaj unu el la konzerno ke kritikistoj esprimis ke la eksperimentoj povus esti kaŭzita partoprenantoj perdi gravaj informoj en ilia Novaĵoj Feed. Kun la dezajno uzita de Kramer kaj kolegoj, mesaĝo kiu estas grava estas kiel probable esti blokita kiel unu kiu ne. Tamen, kun akcelanta dezajno, la mesaĝoj kiuj estus delokitaj estus kiuj estas malpli grava.

Fine, la tria R estas Redukti: esploristoj devas sercxi por redukti la nombron da partoprenantoj en ilia eksperimento, se eblas. En la pasinteco, tiu redukto okazis nature pro la ŝanĝiĝema kosto de analoga eksperimentoj estis altaj, kiuj kuraĝigis esploro optimumigi iliajn dezajnon kaj analizon. Tamen, kiam estas nulo variablo kosto datumojn, esploristoj ne alfrontas kosto limigo sur la grandeco de ilia eksperimento, kaj tiu havas la potencialon konduki al nenecese grandaj eksperimentoj.

Ekzemple, Kramer kaj kolegoj povus esti uzita antaŭ-traktado informon pri liaj partoprenantoj -kiel antaŭ- traktado afisxo konduto-fari ilian analizon pli efika. Pli specife, prefere ol komparado la proporcio de pozitivaj vortoj en la traktado kaj kontrolo kondiĉoj, Kramer kaj kolegoj povus esti komparitaj la ŝanĝo en la proporcio de pozitivaj vortoj inter kondiĉoj; alproksimiĝo ofte nomata diferenco-en-diferencoj kaj kiu estas tre rilata al la miksita dezajno kiun mi priskribis pli frue en la ĉapitro (Figuro 4.5). Tio estas, por ĉiu partoprenanto, la investigadores povis kreis ŝanĝo partituro (post-traktado konduto - antaŭ-traktado konduto) kaj poste kompari la ŝanĝo partituroj de partoprenantoj en la traktado kaj kontrolo kondiĉoj. Tiu diferenco-en-diferencoj alproksimiĝo estas pli efika statistike, kio signifas ke esploristoj povas atingi la sama statistika konfido uzante multe pli malgrandaj specimenoj. Alivorte, al la ne traktante partoprenantojn kiel "widgets", esploristoj povas ofte akiri pli precizan taksoj.

Sen havi la krudaj datumoj estas malfacile scii ĝuste kiom pli efika diferenco-en-diferencoj enfokusigas estus estinta en tiu kazo. Sed, Deng et al. (2013) raportis ke en tri enreta eksperimentoj sur la Bing serĉilon ili povis redukti la variancon de iliaj taksoj de ĉirkaŭ 50%, kaj simila rezultoj estis raportitaj por iuj rete eksperimentoj ĉe Netflix (Xie and Aurisset 2016) . Tiu 50% varianco redukto signifas ke la Emocia kontaĝas esploristoj eble povis tranĉi sian specimenon en duono se ili uzis iomete malsaman analizon metodoj. Alivorte, kun eta ŝanĝo en la analizo, 350.000 personoj povus esti ŝparita partoprenon en la eksperimento.

Ĉe tiu punkto vi povus esti demandante kial esploristoj devus zorgi se 350.000 personoj estis en Emotional kontaĝas nenecese. Ekzistas du apartaj trajtoj de Emocia kontaĝas kiuj faras zorgon kun troa grandeco taŭga, kaj tiuj funkcioj estas dividita de multaj diĝita kampo eksperimentojn: 1) ekzistas necerteco sur se la eksperimento kaŭzos malutilon al almenaŭ kelkaj partoprenantoj kaj 2) partopreno ne libervola. En eksperimentoj kun tiuj du karakterizaĵoj ŝajnas konsilinde konservi la eksperimentojn tiel malgranda kiel ebla.

En konkludo, la tri R's-Replace, Rafini kaj redukti-disponigi principoj kiuj povas helpi esploristoj konstrui etikon en sia eksperimenta dezajnoj. Kompreneble, ĉiu de ĉi tiuj eblaj ŝanĝoj al Emocia kontaĝas enkondukas komerco-offs. Ekzemple, evidenteco de naturaj eksperimentoj ne ĉiam kiel pura kiel evidenteco de randomigitaj eksperimentoj kaj akcelanta eble estus pli logísticamente malfacila de implementar kiu bloko. Do, la celo sugestante tiuj ŝanĝoj ne estis dua-diveni la decidoj de aliaj esploristoj. Prefere, ĝi estis por ilustri kiel la tri R povus apliki en realisma situacio.