Výzkumná etika tradičně zahrnuje také témata, jako jsou vědecké podvody a přidělování úvěrů. Tato Institute of Medicine and National Academy of Sciences and National Academy of Engineering (2009) jsou podrobněji diskutována v tématu " Bytí vědec" v Institute of Medicine and National Academy of Sciences and National Academy of Engineering (2009) .
Tato kapitola je silně ovlivněna situací ve Spojených státech. Další informace o etickém přezkumu v jiných zemích naleznete v kapitolách 6-9 Desposato (2016b) . Pro argument, že biomedicínské etické principy, které ovlivnily tuto kapitolu, jsou nadměrně americké, vidí Holm (1995) . Pro další historické hodnocení orgánů pro kontrolu institucí ve Spojených státech viz Stark (2012) . Časopis PS: Politologie a politika uspořádal odborné sympozium o vztazích mezi politickými vědci a IRB; viz Martinez-Ebers (2016) .
Zpráva společnosti Belmont a následná nařízení ve Spojených státech mají tendenci rozlišovat mezi výzkumem a praxí. V této kapitole jsem nerozlišoval, protože si myslím, že etické zásady a rámce platí pro obě nastavení. Více o tomto rozlišení a problémech, které představí, viz Beauchamp and Saghai (2012) , MN Meyer (2015) , boyd (2016) a Metcalf and Crawford (2016) .
Více o dozoru nad výzkumem na Facebooku naleznete v článku Jackman and Kanerva (2016) . Názory na dohled nad výzkumem u firem a nevládních organizací viz Calo (2013) , Polonetsky, Tene, and Jerome (2015) a Tene and Polonetsky (2016) .
V souvislosti s používáním údajů z mobilních telefonů, které pomohou řešit epidemii Ebola v západní Africe v roce 2014 (Wesolowski et al. 2014; McDonald 2016) , více o rizicích soukromí dat mobilních telefonů viz Mayer, Mutchler, and Mitchell (2016) . Pro příklady dřívějších krizových výzkumů využívajících data z mobilních telefonů viz Bengtsson et al. (2011) a Lu, Bengtsson, and Holme (2012) , a více o etice krizového výzkumu, viz ( ??? ) .
Mnoho lidí napsalo o citové nákazě. Časopis Research Ethics věnoval celý svůj problém v lednu roku 2016 k diskusi o experimentu; viz Hunter and Evans (2016) . Sborník národních akademiků vědy publikoval dvě části o experimentu: Kahn, Vayena, and Mastroianni (2014) a Fiske and Hauser (2014) . Jiné kusy o pokusu jsou: Puschmann and Bozdag (2014) , Meyer (2014) , Grimmelmann (2015) , MN Meyer (2015) , ( ??? ) , Kleinsman and Buckley (2015) , Shaw (2015) , a ( ??? ) .
Pokud jde o hromadný dohled, poskytují se široké přehledy v Mayer-Schönberger (2009) a Marx (2016) . Pro konkrétní příklad měnících se nákladů na dohled Bankston and Soltani (2013) odhadují, že sledování podezřelého z trestného činu pomocí mobilních telefonů je asi 50krát levnější než používání fyzického dozoru. Viz také Ajunwa, Crawford, and Schultz (2016) k diskuzi o dozoru v práci. Bell and Gemmell (2009) poskytují optimistický pohled na sebeobranu.
Kromě toho, že mohou sledovat pozorovatelné chování, které je veřejné nebo částečně veřejné (např. Chuť, vázání a čas), vědci mohou stále více odvodit věci, které mnozí účastníci považují za soukromé. Například Michal Kosinski a kolegové (2013) ukázali, že mohou odvodit citlivé informace o lidech, jako je sexuální orientace a užívání návykových látek, z zdánlivě obyčejných digitálních stopových dat (Facebook Likes). To by mohlo znít kouzelně, ale přístup Kosinski a jeho kolegové - který kombinoval digitální stopy, průzkumy a supervizované učení - je ve skutečnosti něco, o čem jsem vám již řekl. Připomeňme si to v kapitole 3 (Otázky). Řekla jsem vám, že Joshua Blumenstock a kolegové (2015) spojili data průzkumu s daty z mobilních telefonů, aby odhadli chudobu ve Rwandě. Tento přesně stejný přístup, který lze využít k účinnému měření chudoby v rozvojové zemi, lze také využít k potenciálnímu porušování soukromí.
Více informací o možných neúmyslných sekundárních využití údajů o zdravotních O'Doherty et al. (2016) viz O'Doherty et al. (2016) . Vedle potenciálu pro neúmyslné sekundární využití by vytvoření neúplné hlavní databáze mohlo mít mírný vliv na společenský a politický život, pokud lidé nebudou ochotni číst určité materiály nebo diskutovat o některých tématech; viz Schauer (1978) a Penney (2016) .
V situacích s překrývajícími se pravidly se někdy výzkumník zabývá "regulatorním nakupováním" (Grimmelmann 2015; Nickerson and Hyde 2016) . Zejména někteří výzkumní pracovníci, kteří se chtějí vyhnout nadměrnému dohledu nad IRB, mohou vytvářet partnerství s výzkumnými pracovníky, na které se IRB nevztahují (např. Lidé v podnicích nebo nevládních organizacích), a tyto kolegy shromažďují a de-identifikují data. Poté může výzkumný pracovník s IRB analyzovat tyto de-identifikované údaje bez dohledu IRB, protože výzkum se již nepovažuje za "výzkum lidských subjektů", přinejmenším podle některých interpretací současných pravidel. Tento druh vyhýbání se IRB pravděpodobně není v souladu se zásadou založenou na přístupu k etice v oblasti výzkumu.
V roce 2011 začala snaha aktualizovat společné pravidlo a tento proces byl konečně dokončen v roce 2017 ( ??? ) . Další informace o těchto snahách o aktualizaci společného pravidla naleznete v tématu Evans (2013) , National Research Council (2014) , Hudson and Collins (2015) a Metcalf (2016) .
Klasický princip založený na přístupu k biomedicínské etice je Beauchamp and Childress (2012) . Navrhují, aby čtyři hlavní principy měly řídit biomedicínskou etiku: respekt k autonomii, nemalosti, výhodnosti a spravedlnosti. Zásada nemalosti vyžaduje, aby se člověk zdržel ubližování ostatním lidem. Tento koncept je hluboce spojen s hypokratickou myšlenkou "Neškodte". V etice v oblasti výzkumu je tento princip často kombinován se zásadou výhodnosti, ale viz kapitola 5 z @ beauchamp_principles_2012 o více o rozdílu mezi oběma. Pro kritiku, že tyto zásady jsou příliš americké, vidí Holm (1995) . Další informace o vyvažování, kdy se konflikt zásad, viz Gillon (2015) .
Všechny čtyři zásady v této kapitole byly také navrženy tak, aby vedly etický dohled nad výzkumem prováděným u společností a nevládních organizací (Polonetsky, Tene, and Jerome 2015) prostřednictvím orgánů nazvaných "Výzkumné komise spotřebitelů" (Calo 2013) .
Kromě respektování autonomie Belmontova zpráva také uznává, že ne každý člověk je schopen pravého sebeurčení. Například děti, lidé trpící onemocněním nebo lidé žijící v situacích s velmi omezenou svobodou nemusí být schopni jednat jako plně autonomní jedinci a tito lidé jsou tedy vystaveni zvláštní ochraně.
Uplatňování principu respektu k osobám v digitálním věku může být náročné. Například ve výzkumu digitálního věku může být obtížné poskytnout zvláštní ochranu lidem se sníženou schopností sebeurčení, protože výzkumníci často o svých účastnících vědí jen velmi málo. Informovaný souhlas v oblasti sociálního výzkumu v digitálním věku je obrovskou výzvou. V některých případech může skutečně informovaný souhlas trpět paradoxem transparentnosti (Nissenbaum 2011) , kde jsou informace a porozumění v konfliktu. Zhruba pokud budou výzkumníci poskytovat úplné informace o povaze sběru dat, analýze dat a praktikách zabezpečení dat, bude pro mnoho účastníků těžké pochopit. Ale pokud vědci poskytují srozumitelné informace, mohou jim chybějí důležité technické detaily. Ve zdravotnickém výzkumu v analogickém věku - dominujícím prostředí, o němž se zabývá Belmontova zpráva - si člověk dokáže představit, že doktor mluví jednotlivě s každým účastníkem, aby pomohl vyřešit paradox průhlednosti. V on-line studiích zahrnujících tisíce nebo miliony lidí není takový přístup "tváří v tvář" možný. Druhým problémem se souhlasem v digitálním věku je skutečnost, že v některých studiích, jako jsou analýzy rozsáhlých datových úložišť, by bylo nepraktické získat informovaný souhlas od všech účastníků. O těchto a dalších otázkách o informovaném souhlasu se dále zabývám v části 6.6.1. Navzdory těmto obtížím bychom však měli pamatovat na to, že informovaný souhlas není ani nezbytný ani dostatečný pro dodržování osob.
Další informace o lékařském výzkumu před informovaným souhlasem viz Miller (2014) . Podrobné zpracování informovaného souhlasu viz Manson and O'Neill (2007) . Viz též doporučené údaje o informovaném souhlasu uvedené níže.
Znepokojení kontextu jsou škody, které výzkum může způsobit nikoliv konkrétním lidem, nýbrž společenskému prostředí. Tento koncept je trochu abstraktní, ale ilustruji to klasickým příkladem: Studie poroty Wichity (Vaughan 1967; Katz, Capron, and Glass 1972, chap. 2) - také někdy nazvaný projekt Chicago Jury (Cornwell 2010) . V této studii vědci z Chicagské univerzity v rámci rozsáhlejší studie sociálních aspektů právního systému tajně zaznamenali šest porotců poroty ve Wichitě v Kansasu. Soudci a právníci ve věcech schválili nahrávky a byl přísný dohled nad procesem. Porotci však nevěděli, že se vyskytly záznamy. Jakmile byla studie objevena, došlo k veřejnému odporu. Ministerstvo spravedlnosti zahájilo vyšetřování studie a vědci byli povoláni svědčit před Kongresem. Nakonec Kongres přijal nový zákon, který činí nezákonné tajné zaznamenávání poroty.
Zájem kritiků Studie poroty Wichity nebyl rizikem poškození účastníků; spíše to bylo riziko poškození v kontextu jednání poroty. To znamená, že lidé si mysleli, že jestliže členové poroty nevěří, že mají diskuse v bezpečném a chráněném prostoru, bylo by pro jednání porotce těžší pokračovat v budoucnosti. Kromě porady poroty existují další specifické společenské kontexty, které společnost poskytuje dodatečnou ochranu, jako jsou vztahy mezi advokáty a klienty a psychologickou péčí (MacCarthy 2015) .
Riziko poškození kontextu a narušení sociálních systémů také vznikají v některých politických experimentech v politické vědě (Desposato 2016b) . Jako příklad kontextu citlivějšího výpočtu nákladů a přínosů pro politický experiment v politické oblasti viz Zimmerman (2016) .
Kompenzace pro účastníky byla projednána v řadě nastavení týkajících se výzkumu digitálního věku. Lanier (2014) navrhuje platit účastníkům digitální stopy, které vytvářejí. Bederson and Quinn (2011) diskutují o platbách v on-line trzích práce. Nakonec Desposato (2016a) navrhuje platit účastníky v terénních experimentech. Zdůrazňuje, že i když účastníci nemohou být vypláceni přímo, může být dárce uděleno skupině pracující v jejich zastoupení. Například v Encore, výzkumníci mohli dárcovit skupinu, která pracuje na podpoře přístupu na internet.
Smlouvy o smlouvách o službách by měly mít menší váhu než smlouvy uzavřené mezi rovnými stranami a než zákony vytvořené legitimní vládou. Situace, kdy vědci porušili smlouvy o smlouvách o službách v minulosti, se obvykle zabývaly automatizovanými dotazy, aby se ověřilo chování společností (podobně jako experimenty v terénu pro měření diskriminace). Další diskuse viz Vaccaro et al. (2015) , Bruckman (2016a) a Bruckman (2016b) . Jako příklad empirického výzkumu, který popisuje podmínky služby, viz Soeller et al. (2016) . Další informace o možných právních problémech, s nimiž se výzkumníci potýkají, pokud porušují smluvní podmínky, viz Sandvig and Karahalios (2016) .
Je zřejmé, že bylo napsáno obrovské množství důsledků a deontologie. Jako příklad toho, jak mohou být tyto etické rámce a další použity k odůvodnění ohledně výzkumu digitálního věku, viz Zevenbergen et al. (2015) . Jako příklad toho, jak lze aplikovat na terénní experimenty v rozvojové ekonomice, viz Baele (2013) .
Další informace o auditorských studiích týkajících se diskriminace viz Pager (2007) a Riach and Rich (2004) . Nejen, že tyto studie neinformovaly o souhlasu, ale také zahrnují podvod bez debriefingu.
Desposato (2016a) a Humphreys (2015) nabízejí poradenství o terénních experimentech bez souhlasu.
Sommers and Miller (2013) zhodnotí mnoho argumentů ve prospěch toho, aby nebyli účastníci po podvodu informováni, a tvrdí, že výzkumní pracovníci by se měli vzdát debetování
"Za velmi omezeného souboru okolností, konkrétně v terénním výzkumu, v němž debriefing představuje značné praktické bariéry, ale vědci by neměli žádné výčitky ohledně debriefingu, pokud by mohli. Výzkumným pracovníkům by nemělo být dovoleno, aby se vzdali debriefingu, aby zachovali fond naivních účastníků, chránili před účastí hněvu nebo chránili účastníky před poškozením. "
Jiní argumentují tím, že v některých situacích, kdy je debriefing více škodlivý než dobrý, je třeba se vyhnout (Finn and Jakobsson 2007) . Debriefing je případ, kdy někteří výzkumníci upřednostňují respekt k osobám nad výhodou, zatímco někteří výzkumníci dělají opak. Jedním z možných řešení by bylo najít způsoby, jak předávat účastníkům zkušenosti s učením. To znamená, že spíše než myslet na debriefing jako na něco, co může způsobit škody, může být také debriefing něco, co prospěje účastníkům. Jako příklad tohoto typu vzdělávacího debriefingu viz Jagatic et al. (2007) . Psychologové vyvinuli techniky pro debriefing (DS Holmes 1976a, 1976b; Mills 1976; Baumrind 1985; Oczak and Niedźwieńska 2007) a některé z nich mohou být užitečně aplikovány na výzkum digitálního věku. Humphreys (2015) nabízí zajímavé myšlenky ohledně odloženého souhlasu , který je úzce spjat s strategií debriefingu, kterou jsem popsal.
Myšlenka dotazování vzorku účastníků o jejich souhlas je souvisí s tím, co Humphreys (2015) nazývá odvodený souhlas .
Další myšlenkou související s informovaným souhlasem, která byla navržena, je vybudovat skupinu lidí, kteří souhlasí s tím, že budou v online experimentech (Crawford 2014) . Někteří argumentovali, že tento panel by byl nestoudný vzorek lidí. Ale kapitola 3 (Otázky) ukazuje, že tyto problémy jsou potenciálně adresovatelné pomocí post stratifikace. Také souhlas s tím, aby byl na panelu, by mohl pokrývat různé experimenty. Jinými slovy, účastníci nemusí souhlasit s každým pokusem jednotlivě, což je koncept nazvaný široký souhlas (Sheehan 2011) . Více o rozdílech mezi jednorázovým souhlasem a souhlasem pro každou studii, stejně jako o možném hybridu, viz Hutton and Henderson (2015) .
Důležitou technickou vlastností datových souborů, které obsahují podrobné informace o lidech, představuje Netflixova cena, která není ani jedinečná, a proto nabízí důležité ponaučení o možnosti "anonymizace" moderních sociálních datových souborů. Soubory s mnoha informacemi o každé osobě jsou pravděpodobně řídké , ve smyslu definovaném formálně v Narayanan and Shmatikov (2008) . To znamená, že pro každý záznam neexistují žádné záznamy, které by byly stejné a ve skutečnosti neexistují žádné záznamy, které by byly velmi podobné: každá osoba je v datovém souboru daleko od nejbližšího souseda. Je možné si představit, že data Netflixu mohou být řídká, protože s asi 20 000 filmy v pětihvězdicové škále existuje asi \(6^{20,000}\) možné hodnoty, které by každá osoba mohla mít (6 protože kromě 1 5 hvězdiček, někdo by nemusel hodnotit film vůbec). Toto číslo je tak velké, že je těžké pochopit.
Sparsity má dva hlavní důsledky. Za prvé to znamená, že pokus o "anonymizaci" datové sady na základě náhodného selhání pravděpodobně selže. To znamená, že i kdyby Netflix náhodně upravil některé hodnocení (což udělali), nebylo by to dostačující, protože narušený záznam je stále nejbližší možný záznam informací, které má útočník. Zadruhé to znamená, že re-identifikace je možná i v případě, že útočník má nedokonalé nebo nestranné znalosti. Například v datách Netflix si představte, že útočník zná vaše hodnocení dvou filmů a data, která jste provedli tyto hodnocení \(\pm\) 3 dny; tyto informace samy o sobě stačí k jednoznačné identifikaci 68% lidí v datech společnosti Netflix. Pokud útočník zná osm filmů, které jste hodnocili \(\pm\) 14 dní, pak i když jsou dvě z těchto známých hodnocení zcela nesprávné, 99% záznamů může být jednoznačně identifikováno v datovém souboru. Jinými slovy, sparťanost je základním problémem při snaze "anonymizovat" data, což je nešťastné, protože většina moderních sociálních datových souborů je řídká. Další informace o "anonymizaci" řídkých dat viz Narayanan and Shmatikov (2008) .
Metadata dat telefonu mohou být také "anonymní" a nejsou citlivá, ale není tomu tak. Telefonní data jsou identifikovatelná a citlivá (Mayer, Mutchler, and Mitchell 2016; Landau 2016) .
Na obrázku 6.6 jsem načrtl kompromis mezi rizikem pro účastníky a přínosem pro společnost z propuštění dat. Pro srovnání přístupů s omezeným přístupem (např. Zděnou zahradou) a omezených datových přístupů (např. Nějaká forma "anonymizace") viz Reiter and Kinney (2011) . Pro navrhovaný systém kategorizace rizikových úrovní dat viz Sweeney, Crosas, and Bar-Sinai (2015) . Pro více obecnou diskusi o sdílení dat viz Yakowitz (2011) .
Pro podrobnější analýzu tohoto kompromisu mezi rizikem a užitečností údajů viz Brickell and Shmatikov (2008) , Ohm (2010) , Reiter (2012) , Wu (2013) a Goroff (2015) . Abyste viděli tento kompromis aplikovaný na reálná data z masově otevřených on-line kurzů (MOOC), viz Daries et al. (2014) a Angiuli, Blitzstein, and Waldo (2015) .
Diferenciální soukromí nabízí také alternativní přístup, který může pro účastníky kombinovat jak nízké riziko, tak i prospěch společnosti; viz Dwork and Roth (2014) a Narayanan, Huey, and Felten (2016) .
Další informace o koncepci osobní identifikace (PII), která je základem mnoha pravidel pro etiku výzkumu, viz Narayanan and Shmatikov (2010) a Schwartz and Solove (2011) . Více informací o potenciálně citlivých datech naleznete v článku Ohm (2015) .
V této části jsem zobrazil propojení různých datových sad jako něco, co může vést k informačním rizikům. Může však také vytvářet nové příležitosti pro výzkum, jak je uvedeno v Currie (2013) .
Další informace o pěti bezpečnostních Desai, Ritchie, and Welpton (2016) naleznete v Desai, Ritchie, and Welpton (2016) . Jako příklad toho, jak lze identifikovat výstupy, viz Brownstein, Cassa, and Mandl (2006) , který ukazuje, jak lze identifikovat mapy výskytu onemocnění. Dwork et al. (2017) také zvažují útoky na souhrnné údaje, jako jsou statistiky o tom, kolik jedinců má určitou nemoc.
Otázky týkající se využívání dat a propouštění dat také vyvolávají otázky týkající se vlastnictví dat. Další informace o vlastnictví dat naleznete v článku Evans (2011) a Pentland (2012) .
Warren and Brandeis (1890) jsou významným právním článkem o ochraně osobních údajů a jsou nejvíce spojeny s myšlenkou, že soukromí je právo být ponechán sám. Délka knih na soukromí, kterou bych doporučil, patří Solove (2010) a Nissenbaum (2010) .
Pro přezkum empirického výzkumu o tom, jak lidé myslí o soukromí, viz Acquisti, Brandimarte, and Loewenstein (2015) . Phelan, Lampe, and Resnick (2016) navrhují teorii o dvou systémech - že lidé se někdy soustředí na intuitivní zájmy a někdy se soustřeďují na zvažované obavy - aby vysvětlili, jak mohou lidé dělat zdánlivě protichůdná prohlášení o soukromí. Více informací o myšlence soukromí v online nastaveních, jako je Twitter, viz Neuhaus and Webmoor (2012) .
Časopis Science publikoval zvláštní část s názvem "Konec soukromí", který se zabývá otázkami soukromí a informačními riziky z různých hledisek; pro souhrn naleznete v tématu Enserink and Chin (2015) . Calo (2011) nabízí rámec pro přemýšlení o škodách, které přicházejí z porušování soukromí. Prvním příkladem obav o soukromí v samém počátku digitálního věku je Packard (1964) .
Jednou z problémů při uplatňování minimálního standardu rizika je to, že není jasné, komu by měl být každodenní život používán pro benchmarking (National Research Council 2014) . Například bezdomovci mají ve svém každodenním životě vyšší nepohodlí. To však neznamená, že je eticky přípustné vystavit osoby bez domova výzkumu s vyšším rizikem. Z tohoto důvodu se zdá, že existuje rostoucí shoda, že minimální riziko by mělo být srovnáno s normou obecného obyvatelstva , nikoliv s normou pro konkrétní populaci . Zatímco obecně souhlasím s myšlenkou obecného populačního standardu, domnívám se, že pro velké online platformy, jako je Facebook, je standard pro konkrétní populaci rozumný. Takže když zvažuji emoční nákazu, myslím si, že je rozumné měřit každodenní riziko na Facebooku. Norma specifického obyvatelstva v tomto případě je mnohem snazší vyhodnotit a je nepravděpodobné, že by byla v rozporu se zásadou spravedlnosti, která se snaží zabránit nespravedlivému zatížení výzkumu znevýhodněným skupinám (např. Vězňům a sirotkům).
Jiní učenci také vyzývají k tomu, aby obsahovaly etické přílohy (Schultze and Mason 2012; Kosinski et al. 2015; Partridge and Allman 2016) . King and Sands (2015) také nabízí praktické tipy. Zook a kolegové (2017) nabízejí "deset jednoduchých pravidel pro zodpovědný velký výzkum dat".