Gawin ang iyong mga eksperimento mas makatao sa pamamagitan ng pagpapalit ng mga eksperimento sa mga di-pang-eksperimentong pag-aaral, pag-pino ang paggamot, at ang pagbabawas ng bilang ng mga kalahok.
Ang ikalawang piraso ng payo na gusto kong mag-alok tungkol sa pagdisenyo ng mga digital na mga eksperimento silbi etika. Bilang ang Restivo at van de Rijt eksperimento sa barnstars sa Wikipedia palabas, nabawasan ang mga gastos ay nangangahulugan na etika ay naging isang unting mahalagang bahagi ng disenyo ng pananaliksik. Bilang karagdagan sa mga etikal na frameworks paggabay pantao paksa pananaliksik na kukunin ko na naglalarawan sa Kabanata 6, mga mananaliksik pagdisenyo ng mga digital na mga eksperimento ay maaari ring gumuhit sa etikal ideya mula sa ibang pinagmulan: ang etikal prinsipyo na binuo upang gabayan mga eksperimento na kinasasangkutan hayop. Sa partikular, sa kanilang landmark book Principles of Humane Experimental Technique, Russell and Burch (1959) ipinanukalang tatlong alituntunin na dapat gumabay hayop pananaliksik: Palitan, Dalisayin, at Bawasan. Gusto kong imungkahi na ang tatlong R ay maaari ding gamitin-in ng isang bahagyang binagong form-upang gabayan ang disenyo ng tao eksperimento. Sa partikular,
Upang gumawa ng kongkreto mga tatlong R at ipakita kung paano maaari nilang potensyal na humantong sa mas mahusay at mas makatao experimental disenyo, kukunin ko na ilarawan ang isang online field eksperimento na nabuo etikal debate. Pagkatapos ay kukunin ko naglalarawan kung paano iminumungkahi ang tatlong R kongkreto at praktikal na mga pagbabago sa disenyo ng eksperimento.
Isa sa mga pinaka ethically debated eksperimento digital field ay "Emotional Lalin," kung saan ay isinasagawa sa pamamagitan ng Adam Kramer, Jamie Gillroy, at Jeffrey Hancock (2014) . Ang eksperimento ay naganap sa Facebook at ay motivated sa pamamagitan ng isang halo ng pang-agham at praktikal na mga katanungan. Sa oras, ang mga nangingibabaw na paraan na ang mga gumagamit interacted sa Facebook ay ang News Feed, isang algorithm na gawa hanay ng mga update ng katayuan sa Facebook mula sa mga kaibigan sa Facebook ng isang gumagamit. Ang ilang mga critics ng Facebook ay iminungkahing na dahil ang News Feed ay halos positibo post-mga kaibigan na nagpapakita off ang kanilang mga pinakabagong party-ito ay maaaring maging sanhi ng mga user sa pakiramdam malungkot dahil ang kanilang buhay ay tila mas kapana-panabik sa paghahambing. Sa kabilang banda, marahil ang epekto ay eksakto ang kabaligtaran; siguro nakikita ang iyong kaibigan sa pagkakaroon ng isang magandang panahon ay gumawa sa tingin mo masaya? Upang tugunan ang mga kakumpetensyang hypothesis-at upang isulong ang aming unawa sa kung paano emosyon ng isang tao ay naapektuhan ng kanyang mga kaibigan 'mga damdamin-Kramer at kasamahan ran isang eksperimento. Ang mga mananaliksik na inilagay tungkol sa 700,000 mga gumagamit sa apat na grupo sa isang sanglinggo: isang "negatibiti nabawasan" na grupo, para sa kanino mga post na may mga negatibong mga salita (eg, sad) ay sapalarang naharang mula sa paglitaw sa News Feed; isang "positivity nabawasan" group para kanino mga post na may positibong salita (eg, masaya) ay sapalarang naharang; at dalawang grupo control. Sa control group para sa "negatibiti nabawasan" na grupo, mga post ay sapalarang naharang sa parehong rate bilang ang "negatibiti nabawasan" group ngunit walang pagsasaalang-alang sa ang emosyonal na nilalaman. Ang control group para sa "positivity nabawasan" group ay constructed sa isang parallel na fashion. Ang disenyo ng eksperimento na ito ay naglalarawan na ang naaangkop na control group ay hindi palaging ang isa na walang mga pagbabago. Sa halip, kung minsan ang control group na natatanggap ng isang paggamot upang lumikha ng tumpak na paghahambing na isang pananaliksik tanong ay nangangailangan. Sa lahat ng kaso, ang mga post na ay na-block mula sa Feed News ay magagamit sa mga gumagamit pa rin sa pamamagitan ng iba pang mga bahagi ng website Facebook.
Kramer at kasamahan natagpuan na para sa mga kalahok sa positivity nabawasan kondisyon, ang porsyento ng mga positibong salita sa kanilang mga update ng katayuan nabawasan at ang porsyento ng mga negatibong salita nadagdagan. Sa kabilang dako, para sa mga kalahok sa negatibiti nabawasan kondisyon, ang porsyento ng mga positibong salita nadagdagan at ang porsyento ng mga negatibong salita nabawasan (Figure 4.23). Subalit, ang mga epekto ay masyadong maliit: ang pagkakaiba sa mga positibo at negatibong mga salita sa pagitan paggamot at kontrol ay tungkol sa 1 sa 1,000 salita.
Ko na ilagay sa isang talakayan ng mga pang-agham na aspeto ng eksperimento na ito sa karagdagang seksyon sa pagbabasa sa dulo ng kabanata, ngunit sa kasamaang palad, ang eksperimentong ito ay pinaka-kilala para sa pagbuo etikal debate. Just araw matapos ang papel na ito ay nai-publish sa mga pamamaraan ng National Academy of Sciences, nagkaroon ng napakalaking biglang sigaw mula sa parehong mga mananaliksik at mga press. Outrage buong papel nakatutok sa dalawang pangunahing mga puntos: 1) kalahok ay hindi magbigay ng anumang mga pahintulot sa kabila ng standard Facebook terms-of-service para sa isang paggamot na ang ilang mga pag-iisip ay maaaring maging sanhi ng pinsala sa mga kalahok at 2) ang pag-aaral ay hindi undergone third-party etikal pagsusuri (Grimmelmann 2015) . Ang etikal katanungan itataas sa debate na ito sanhi ng journal upang mabilis-publish ng isang bihirang "editorial expression ng pag-aalala" tungkol sa tamang pag-uugali at etikal proseso ng pagsusuri para sa pananaliksik (Verma 2014) . Sa kasunod na taon, ang eksperimento ay patuloy na maging isang mapagkukunan ng matinding debate at hindi pagkakaintindihan, at ito hindi pagkakasundo ay maaaring nagkaroon ng unintended epekto ng pagmamaneho sa ang mga anino ng maraming iba pang mga eksperimento na ay ginanap sa pamamagitan ng mga kompanya ng (Meyer 2014) .
Given na background tungkol Emotional Lalin, Gusto ko ngayon gusto upang ipakita na ang 3 R ay maaaring magmungkahi ng kongkreto, praktikal na pagpapabuti para sa tunay na mga pag-aaral (kahit anong maaari mong personal na palagay tungkol sa mga etika ng mga ito partikular na eksperimento). Ang unang R ay Palitan: mananaliksik ay dapat na humingi upang palitan mga eksperimento na may mas mababa nagsasalakay at mapanganib na pamamaraan, kung maaari. Halimbawa, sa halip na tumakbo ang isang eksperimento, ang mga mananaliksik ay maaaring magkaroon ng pinagsamantalahan ng isang natural na eksperimento. Tulad ng inilarawan sa Kabanata 2, natural na mga eksperimento mga sitwasyon kung saan may mangyari sa mundo na nagtataya ng random assignment ng paggamot (halimbawa, isang lottery upang magpasya kung sino ay drafted sa militar). Ang bentahe ng isang natural na eksperimento ay na ang mga researcher ay hindi kailangang maghatid paggamot; ang kapaligiran ay na para sa iyo. Sa ibang salita, na may isang likas na eksperimento, ang mga mananaliksik ay hindi na kailangan upang pagtuklas manipulahin ng mga tao News Feeds.
Sa katunayan, halos concurrently sa Emotional Contagion eksperimento, Coviello et al. (2014) ay exploiting kung ano ang maaaring tinatawag na isang emosyonal lalin natural eksperimento. Ang kanilang mga diskarte, na kung saan ay gumagamit ng isang pamamaraan na tinatawag na instrumental variable, ay isang bit kumplikado kung hindi pa ninyo nakita ito bago. Kaya, upang ipaliwanag kung bakit ito ay kinakailangan, sabihin bumuo ng hanggang sa ito. Ang unang ideya na ang ilang mga mananaliksik ay maaaring magkaroon upang mag-aral emosyonal lalin ay upang ihambing ang iyong mga post sa mga araw kung saan ang iyong News Feed ay napaka-positibong sa iyong mga post sa mga araw na kung saan ang iyong News Feed ay napaka negatibo. Diskarte na ito ay magiging masarap kung ang layunin ay lamang upang mahulaan ang emosyonal na nilalaman sa iyong mga post, ngunit ang paraan na ito ay may problemang kung ang layunin ay upang pag-aralan ang pananahilan epekto ng iyong News Feed sa iyong mga post. Upang makita ang mga problema sa ito disenyo, isaalang-alang ang Thanksgiving. Sa US, positibong posts spike at negatibong mga post pabigat sa panghulog sa Thanksgiving. Kaya, sa Thanksgiving, mga mananaliksik ay maaaring makita na ang iyong News Feed ay napaka-positibong at na-post ka ng positibong mga bagay pati na rin. Subalit, ang iyong positibong posts maaaring ay sanhi ng Thanksgiving hindi sa pamamagitan ng ang nilalaman ng iyong News Feed. Sa halip, upang matantya ang pananahilan epekto mananaliksik kailangan ng isang bagay na ang mga pagbabago sa nilalaman ng iyong News Feed walang direkta pagbabago ng iyong damdamin. Sa kabutihang palad, mayroong isang bagay tulad na nangyayari sa lahat ng oras: ang panahon.
Coviello at kasamahan natagpuan na ang isang araw ng kagipitan sa lungsod ng isang tao ay, sa karaniwan, bawasan ang proporsyon ng mga post na ay positibo sa pamamagitan ng tungkol sa 1 porsyento point at dagdagan ang proporsyon ng mga post na mga negatibong sa pamamagitan ng tungkol sa 1 porsyento point. Pagkatapos, Coviello at kasamahan pinagsamantalahan ang katotohanang ito sa pag-aaral emosyonal lalin nang hindi nangangailangan upang pagtuklas manipulahin News Feed ng sinuman. Sa kakanyahan ano ang kanilang ginawa ay sukatan kung paano ang iyong mga post ay naapektuhan ng lagay ng panahon sa mga lungsod kung saan ang iyong mga kaibigan nakatira. Upang makita kung bakit ito ang akma, isipin na kayo ay nakatira sa New York City at mayroon kang isang kaibigan na nakatira sa Seattle. Ngayon isipin na ang isang araw ay nagsisimula umulan sa Seattle. Ito ulan sa Seattle ay hindi direktang makakaapekto sa iyong mood, ngunit ito ay maging sanhi ng iyong News Feed upang maging mas positibo at higit pang mga negatibong dahil sa mga post ng iyong kaibigan. Kaya, ang pag-ulan sa Seattle random manipulates iyong News Feed. Ang pag-on ito intuwisyon sa isang maaasahang statistical pamamaraan ay kumplikado (at ang eksaktong diskarte na ginagamit ng Coviello at kasamahan ay isang bit non-standard) kaya ko na maglagay ng isang mas detalyadong diskusyon sa karagdagang seksyon sa pagbabasa. Ang pinaka-mahalagang bagay upang tandaan tungkol Coviello at diskarte kasamahan ay na ito pinagana ang mga ito upang mag-aral emosyonal lalin na walang ang kailangan upang magpatakbo ng isang eksperimento na maaaring potensyal na makapinsala sa mga kalahok, at maaaring ito ay ang kaso na sa maraming iba pang mga setting maaari mong palitan eksperimento sa iba pang mga pamamaraan.
Pangalawa sa 3 Rs ay Dalisayin: mananaliksik ay dapat na humingi upang pinuhin ang kanilang mga paggamot upang maging sanhi ng ang pinakamaliit na pinsala maaari. Halimbawa, sa halip na pag-block ng nilalaman na ay alinman sa positibo o negatibong, ang mga mananaliksik ay maaaring magkaroon ng boosted nilalaman na ay positibo o negatibo. Ito boosting disenyo ay nagbago ang emosyonal na nilalaman ng mga kalahok News Feeds, ngunit ito ay may direksiyon ang isa sa mga pag-aalala na critics ipinahayag: ipakilala mo sa mga eksperimento ay may dulot kalahok upang makaligtaan ang mga mahahalagang impormasyon sa kanilang News Feed. Sa ang disenyo na ginagamit ng Kramer at kasamahan, ang isang mensahe na mahalaga ay na malamang na ma-block na parang hindi. Gayunman, na may isang boosting disenyo, ang mga mensahe na ay displaced ay magiging mga na ay mas mahalaga.
Sa wakas, ang ikatlong R ay Bawasan: mananaliksik ay dapat na humingi upang mabawasan ang bilang ng mga kalahok sa kanilang mga eksperimento, kung maaari. Sa nakaraan, pagbabawas na ito nangyari natural dahil ang variable na gastos ng analog eksperimento ay mataas, kung saan hinihikayat pananaliksik upang i-optimize ang kanilang mga disenyo at pagtatasa. Gayunman, kapag may zero variable data ng gastos, mga mananaliksik ay hindi mukha ng isang cost pagpilit sa laki ng kanilang mga eksperimento, at ito ay may potensyal na humantong sa hindi kinakailangan malaki eksperimento.
Halimbawa, Kramer at kasamahan ay maaaring magkaroon ng ginagamit na impormasyon pre-paggamot tungkol sa kanilang mga kalahok-tulad ng mga pre-paggamot sa pag-post na pag-uugali-upang gawin ang kanilang pag-aaral na mas mahusay. Higit pang mga partikular, sa halip na paghahambing ng proporsyon ng positibong salita sa paggamot at kontrol na mga kondisyon, Kramer at kasamahan ay maaaring magkaroon ng kung ihahambing sa pagbabago sa ang bahagdan ng mga positibong salita sa pagitan ng mga kondisyon; isang diskarte madalas na tinatawag na pagkakaiba-in-pagkakaiba at na kung saan ay malapit na nauugnay sa mixed disenyo na ko na inilarawan mas maaga sa kabanata (Figure 4.5). Iyon ay, para sa bawat kalahok, ang mga mananaliksik ay maaaring may ginawa ang isang pagbabago na marka (post-treatment pag-uugali - pre-treatment pag-uugali) at pagkatapos ay inihambing ang mga marka ng pagbabago ng mga kalahok sa paggamot at kontrol kondisyon. Ang pagkakaiba-in-pagkakaiba diskarte ay mas mahusay istatistika, na nangangahulugan na ang mga mananaliksik ay maaaring makamit ang parehong statistical kumpiyansa gamit mas maliit samples. Sa ibang salita, sa pamamagitan ng hindi pagpapagamot ng mga kalahok tulad ng "widgets", mga mananaliksik ay madalas na nakakakuha ng mas tumpak na pagtatantya.
Nang hindi na kinakailangang ang mga raw data na ito ay mahirap na malaman eksakto kung magkano ang mas mahusay na ng isang pagkakaiba-in-pagkakaiba diskarte maaaring naging sa kasong ito. Ngunit, Deng et al. (2013) iniulat na sa tatlong online eksperimento sa mga search engine Bing sila ay magagawang upang mabawasan ang pag-iiba ng kanilang mga pagtatantya sa pamamagitan ng tungkol sa 50%, at mga katulad na resulta ay iniulat para sa ilang mga online na mga eksperimento sa Netflix (Xie and Aurisset 2016) . Ito 50% pagkakaiba pagbabawas ay nangangahulugan na ang emosyonal lalin mananaliksik ay maaaring may been able sa hiwa ng kanilang sample sa kalahati kung sila ay ginagamit ng isang bahagyang iba't-ibang pamamaraan sa pagtatasa. Sa ibang salita, na may isang maliit na maliit na pagbabago sa pag-aaral, 350,000 mga tao ay maaaring ay nai-spared pakikilahok sa eksperimento.
Sa puntong ito maaari kang maging nagtataka kung bakit mga mananaliksik ay dapat pag-aalaga kung 350,000 mga tao'y nagsisipaghintay Emotional Lalin kung hindi kinakailangan. Mayroong dalawang mga partikular na mga tampok ng emosyonal lalin na gumawa-aalala na may labis na laki angkop, at mga tampok na ito ay ibinahagi sa pamamagitan ng maraming mga digital na field eksperimento: 1) mayroong kawalan ng katiyakan tungkol sa kung ang eksperimento ay maging sanhi ng pinsala sa hindi bababa sa ilang mga kalahok at 2) partisipasyon ay hindi kusang-loob. Sa mga eksperimento gamit ang dalawang mga katangian tila maipapayo upang panatilihin ang eksperimento bilang maliit na hangga't maaari.
Sa wakas, ang tatlong R's-Palitan, Pinuhin, at Bawasan-nagbibigay prinsipyo na maaaring makatulong sa mga mananaliksik bumuo etika sa kanilang pang-eksperimentong disenyo. Of course, bawat isa sa mga posibleng mga pagbabago sa emosyonal lalin introduces trade-offs. Halimbawa, katibayan mula sa natural na mga eksperimento ay hindi palaging bilang malinis na bilang ebidensiya mula randomized mga eksperimento at boosting maaaring naging mas logistically mahirap na ipatupad kaysa sa block. Kaya, ang layunin ng nagmumungkahi ng mga pagbabagong ito ay hindi sa ikalawang-hulaan ang mga desisyon ng iba pang mga mananaliksik. Sa halip, ito ay upang ilarawan kung paano ang tatlong R maipatupad sa isang makatotohanang sitwasyon.