Aquesta secció està dissenyada per a ser utilitzada com una referència, en lloc de ser llegit com un relat.
Ètica de la investigació ha inclòs tradicionalment també temes com el frau científic i assignació del crèdit. Aquests temes es discuteixen en més detall en Engineering (2009) .
Aquest capítol està fortament determinada per la situació als Estats Units. Per a més informació sobre els procediments de revisió ètica en altres països, vegeu els capítols 6, 7, 8, i 9 de la Desposato (2016b) . Per a un argument que els principis ètics biomèdics que han influït en aquest capítol són excessivament nord-americà, vegeu Holm (1995) . Per obtenir més revisió històrica de Juntes de Revisió Institucional als EUA, vegeu Stark (2012) .
L'Informe Belmont i la normativa de desenvolupament en els EUA han fet una distinció entre la investigació i la pràctica. Aquesta distinció ha estat criticat posteriorment (Beauchamp and Saghai 2012; boyd 2016; Metcalf and Crawford 2016; Meyer 2015) . No faig aquesta distinció en aquest capítol perquè crec que els principis ètics i els marcs s'apliquen tant als ajustos. Per a més informació sobre la supervisió d'investigació a Facebook, veure Jackman and Kanerva (2016) . Per a una proposta de supervisió de la investigació en les empreses i organitzacions no governamentals, veure Polonetsky, Tene, and Jerome (2015) i Tene and Polonetsky (2016) .
Per a més informació sobre el cas del brot de Ébola en 2014, vegeu McDonald (2016) , i per a més informació sobre els riscos de privacitat de les dades del telèfon mòbil, consulteu Mayer, Mutchler, and Mitchell (2016) . Per a un exemple de la recerca relacionada amb la crisi a partir de dades de telefonia mòbil, veure Bengtsson et al. (2011) i Lu, Bengtsson, and Holme (2012) .
Moltes persones han escrit sobre el contagi emocional. La revista d'Ètica d'Investigació va dedicar tota la seva problema gener de 2016 per discutir l'experiment; veure Hunter and Evans (2016) per a una visió general. Les Actes dels Acadèmics Nacionals de Ciències van publicar dues peces sobre l'experiment: Kahn, Vayena, and Mastroianni (2014) i Fiske and Hauser (2014) . Altres peces sobre l'experiment són: Puschmann and Bozdag (2014) ; Meyer (2014) ; Grimmelmann (2015) ; Meyer (2015) ; Selinger and Hartzog (2015) ; Kleinsman and Buckley (2015) ; Shaw (2015) ; Flick (2015) .
Per a més informació sobre Encore, vegeu Jones and Feamster (2015) .
Pel que fa a la vigilància de masses, àmplies descripcions es proporcionen en Mayer-Schönberger (2009) i Marx (2016) . Per a un exemple concret dels costos canviants de vigilància, Bankston and Soltani (2013) estima que el seguiment d'un presumpte delinqüent ús de telèfons mòbils és aproximadament 50 vegades més barat que l'ús de la vigilància física. Bell and Gemmell (2009) ofereix una perspectiva més optimista sobre l'acte vigilància. A més de ser capaç de rastrejar el comportament observable que és públic o parcialment pública (per exemple, el gust, els llaços, i l'hora), els investigadors poden inferir cada vegada més coses que molts dels participants consideren que és privat. Per exemple, Michal Kosinski i els seus col·legues van demostrar que podien inferir informació sensible sobre les persones, com l'orientació sexual i el consum de substàncies addictives de dades aparentment ordinàries de traces digitals (m'agrada de Facebook) (Kosinski, Stillwell, and Graepel 2013) . Això pot semblar màgic, però l'enfocament Kosinski i els seus col·legues van utilitzar-que combina empremtes digitals, enquestes i aprenentatge supervisat, és en realitat una cosa que ja t'he parlat. Recordem que en el capítol 3 (Fer preguntes) T'he dit el Josh Blumenstock i els seus col·legues (2015) de dades de l'enquesta combinats amb dades del telèfon mòbil per estimar la pobresa a Rwanda. Aquest mateix enfocament exacte, que pot ser utilitzat per mesurar de manera eficient la pobresa en països en desenvolupament, també es pot utilitzar per a les inferències potencialment privacitat viola.
Lleis i normes incompatibles poden donar lloc a la investigació que no respecta els desitjos dels participants, i es pot portar a "anar de compres reguladora" pels investigadors (Grimmelmann 2015; Nickerson and Hyde 2016) . En particular, alguns investigadors que volen evitar la supervisió IRB socis que no estan coberts per les IRB tenen (per exemple, les persones en les empreses o organitzacions no governamentals) recollir i de-identificar dades. Després, els investigadors poden analitzar aquestes dades sense identificació i sense la supervisió de l'IRB, almenys segons algunes interpretacions de les normes actuals. Aquest tipus d'evasió IRB sembla ser incompatible amb un enfocament basat en principis.
Per a més informació sobre les idees inconsistents i heterogenis que tenen les persones sobre les dades de salut, consulteu Fiore-Gartland and Neff (2015) . Per a més informació sobre el problema que l'heterogeneïtat crea per a la ètica d'investigació decisions veure Meyer (2013) .
Una diferència entre l'edat analògica i la recerca era digital és que en l'era digital interacció amb els participants la investigació és més distant. Aquestes interaccions tenen lloc sovint a través d'un intermediari, com una empresa, i hi ha normalment una gran distància social-física-i entre els investigadors i els participants. Aquesta interacció a distància fa que algunes coses que són fàcils en la investigació era analògica difícil en la recerca era digital, com descartar els participants que requereixin una protecció addicional, la detecció d'esdeveniments adversos, i posar remei al mal si es produeix. Per exemple, anem a contrastar contagi emocional amb un experiment de laboratori hipotètic sobre el mateix tema. En l'experiment de laboratori, els investigadors van poder detectar a qualsevol persona que arriba al laboratori que mostren signes evidents d'angoixa emocional. A més, si l'experiment de laboratori creat un esdeveniment advers, els investigadors ho veurien, proporcionar serveis per a remeiar el mal, i després realitzar ajustos en el protocol experimental per a previndre danys futurs. La naturalesa de la interacció distant en l'experiment real contagi emocional fa que cada un d'aquests passos simples i sensibles extremadament difícil. A més, sospito que la distància entre els investigadors i els participants fa que els investigadors menys sensible a les preocupacions dels seus participants.
Altres fonts de normes i lleis inconsistents. Algunes d'aquesta inconsistència prové del fet que aquesta investigació està succeint a tot el món. Per exemple, Encore involucrada gent de tot el món, i per tant pot estar subjecte a la protecció de dades i les lleis de privacitat de molts països diferents. Què passa si les normes que regeixen les peticions web de tercers (el que estava fent Encore) són diferents a Alemanya, els Estats Units, Kenya i la Xina? Què passa si les normes no són ni tan sols coherent dins d'un sol país? Una segona font d'inconsistència prové de la col·laboració entre els investigadors de les universitats i les empreses; per exemple, emocional contagi va ser una col·laboració entre un científic de dades a Facebook i un estudiant graduat i professor de la Universitat de Cornell. A Facebook corrent grans experiments és de rutina i, en aquest moment, no es requereix cap revisió ètica de tercers. En Cornell les normes i regles són molt diferents; pràcticament tots els experiments han de ser revisades per l'IRB de Cornell. Per tant, quin conjunt de normes han de regular emocional contagi de Facebook o de Cornell?
Per a més informació sobre els esforços per revisar la Regla Comú, vegeu Evans (2013) , Council (2014) , Metcalf (2016) , i Hudson and Collins (2015) .
L'enfocament basat en els principis clàssics d'ètica biomèdica és Beauchamp and Childress (2012) . Proposen que quatre grans principis han de guiar l'ètica biomèdica: respecte a l'autonomia, no maleficència, beneficència i justícia. El principi de no maleficència insta un a abstenir-se de fer mal a altres persones. Aquest concepte està íntimament lligat a la idea d'Hipòcrates de "no fer mal". En l'ètica d'investigació, aquest principi es combina sovint amb el principi de Beneficència, però veure Beauchamp and Childress (2012) (capítol 5) per a més informació sobre la distinció entre els dos . Per a una crítica que aquests principis són excessivament nord-americà, vegeu Holm (1995) . Per a més informació sobre l'equilibri quan el conflicte principis, veure Gillon (2015) .
També s'han proposat els quatre principis d'aquest capítol per guiar la supervisió ètica per a la investigació succeint en les empreses i organitzacions no governamentals (Polonetsky, Tene, and Jerome 2015) a través d'organismes anomenats "Juntes de Revisió del Consumidor subjecte" (CSRBs) (Calo 2013) .
A més de respectar l'autonomia, l'Informe Belmont també reconeix que no tots els éssers humans és capaç d'una veritable autodeterminació. Per exemple, els nens, les persones que pateixen d'una malaltia, o les persones que viuen en situació de llibertat severament restringides poden no ser capaços d'actuar com a individus totalment autònomes, i aquestes persones són, per tant, subjectes a protecció addicional.
Aplicant el principi de Respecte per les persones en l'era digital pot ser un repte. Per exemple, en la investigació era digital, que pot ser difícil per proporcionar protecció addicional per a les persones amb disminució de la capacitat d'autodeterminació perquè els investigadors sovint saben molt poc sobre els seus participants. A més, el consentiment informat en la investigació social era digital és un desafiament enorme. En alguns casos, el consentiment informat realment pot patir de la paradoxa de la transparència (Nissenbaum 2011) , on la informació i la comprensió estan en conflicte. Més o menys, si els investigadors proporcionen informació completa sobre la naturalesa de la recopilació de dades, anàlisi de dades i les pràctiques de seguretat de dades, serà difícil per a molts dels participants de comprendre. Però, si els investigadors proporcionen informació comprensible, pot no tenir informació tècnica important. En la investigació mèdica en l'anàleg d'edat dominen l'escenari considerat per l'Informe Belmont-un podria imaginar un metge parlant individualment amb cada participant per ajudar a resoldre la paradoxa de la transparència. En estudis en línia amb milers o milions de persones, un enfocament d'aquest tipus cara a cara és impossible. Un segon problema amb el consentiment en l'era digital és que en alguns estudis, com l'anàlisi dels repositoris de dades massius, no seria pràctic per obtenir el consentiment informat de tots els participants. Discuteixo aquestes i altres preguntes sobre el consentiment informat amb més detall a la Secció 6.6.1. Malgrat aquestes dificultats, però, hem de recordar que el consentiment informat no és ni necessària ni suficient per Respecte per les persones.
Per a més informació sobre la investigació mèdica abans de consentiment informat, vegeu Miller (2014) . Per a un tractament de longitud del llibre de consentiment informat, veure Manson and O'Neill (2007) . Veure també les lectures suggerides sobre el consentiment informat a continuació.
Harms a context és el dany que pot causar la investigació no a persones específiques, sinó als entorns socials. Aquest concepte és una mica abstracte, però vaig a il·lustrar amb dos exemples: un analògic i un digital.
Un exemple clàssic dels danys al context prové del Jurat Wichita Estudi [ Vaughan (1967) ; Katz, Capron, and Glass (1972) ; Ch 2] -. També de vegades anomenat el Projecte Jurat Chicago (Cornwell 2010) . En aquest estudi els investigadors de la Universitat de Chicago, com a part d'un estudi més ampli sobre els aspectes socials del sistema legal, gravades en secret 06:00 deliberacions del jurat a Wichita, Kansas. Els jutges i advocats en els casos havien aprovat els enregistraments, i no hi havia una estricta supervisió del procés. No obstant això, els membres del jurat tenien coneixement que s'estaven produint enregistraments. Una vegada que es va descobrir l'estudi, no hi va haver ultratge públic. El Departament de Justícia va iniciar una investigació sobre l'estudi, i els investigadors han cridat a declarar davant el Congrés. Al final, el Congrés va aprovar una nova llei que fa il·legal per gravar en secret deliberació del jurat.
La preocupació dels crítics de l'Estudi Wichita jurat no li mal als participants; més aviat, era danys per al context de la deliberació del jurat. És a dir, la gent creia que si els membres del jurat no van creure que estaven tenint discussions en un espai segur i protegit, seria més difícil per a les deliberacions del jurat per a procedir en el futur. A més de deliberació del jurat, hi ha altres contextos socials específics que la societat proporciona una protecció addicional, com les relacions entre advocat i client i l'atenció psicològica (MacCarthy 2015) .
El risc de danys per al context i la interrupció dels sistemes socials també apareix en alguns experiments de camp en Ciències Polítiques (Desposato 2016b) . Per veure un exemple d'un càlcul de cost-benefici més sensible al context per a un experiment de camp en Ciències Polítiques, veure Zimmerman (2016) .
Compensació per als participants ha estat discutit en una sèrie d'ajustos relacionats amb la investigació era digital. Lanier (2014) va proposar el pagament dels participants a la recerca de rastres digitals que generen. Bederson and Quinn (2011) analitza els pagaments en els mercats de treball en línia. Finalment, Desposato (2016a) proposa el pagament dels participants en experiments de camp. S'assenyala que fins i tot si els participants no poden ser pagats directament, una donació podria ser feta a un grup de treball en el seu nom. Per exemple, en Encore els investigadors podrien haver fet una donació a un grup de treball per donar suport l'accés a Internet.
Termes de servei acords han de tenir menys pes que els contractes negociats entre les parts i les lleis creades pels governs legítims iguals. Situacions en les que els investigadors han violat els acords de la relació de servei en el passat generalment impliquen l'ús de consultes automatitzades per auditar el comportament de les empreses (de la mateixa manera que els experiments de camp per mesurar la discriminació). Per a una discussió addicional vegi Vaccaro et al. (2015) , Bruckman (2016a) , Bruckman (2016b) . Per a un exemple d'investigació empírica que analitza els termes de servei, consulteu Soeller et al. (2016) . Per a més informació sobre els possibles problemes legals que enfronten els investigadors si violen els termes de servei veure Sandvig and Karahalios (2016) .
Òbviament, enormes quantitats s'han escrit sobre el consecuencialismo i la deontologia. Per veure un exemple de com aquests marcs ètics, i altres, poden ser utilitzats per raonar sobre la investigació era digital, veure Zevenbergen et al. (2015) . Per a un exemple de com aquests marcs ètics poden aplicar-se als experiments de camp en el desenvolupament de l'economia, vegeu Baele (2013) .
Per a més informació sobre estudis d'auditoria de discriminació, vegeu Pager (2007) i Riach and Rich (2004) . No només aquests estudis no tenen el consentiment informat, que també impliquen l'engany sense interrogatori.
Tant Desposato (2016a) i Humphreys (2015) ofereixen consells sobre els experiments de camp sense consentiment.
Sommers and Miller (2013) opinions dels molts arguments a favor de no debrífing els participants després de la decepció, i argumenta que els investigadors han de renunciar "debrífing sota un conjunt molt limitat de circumstàncies, a saber, en la investigació de camp en el qual interrogatori planteja considerables obstacles pràctics, però els investigadors haurien inconvenients a debrífing si poguessin. Els investigadors no s'ha de permetre de renunciar a interrogatori a fi de preservar una piscina participant ingenu, protegir-se de la ira participant, o protegir els participants de qualsevol mal. "Altres argumenten que si interrogatori causa més mal que bé s'ha d'evitar. Per reflexionar és un cas en el qual alguns investigadors donen prioritat Respecte per les persones més de Beneficència, i alguns investigadors fan el contrari. Una possible solució seria la de trobar maneres de fer debriefing una experiència d'aprenentatge per als participants. És a dir, en lloc de pensar d'interrogatori com una cosa que pot fer mal, potser debrífing també pot ser una cosa que beneficia els participants. Per veure un exemple d'aquest tipus d'interrogatori educació, vegeu Jagatic et al. (2007) en debrífing estudiants després d'un experiment de suplantació d'identitat social. Els psicòlegs han desenvolupat tècniques per informar els (DS Holmes 1976a; DS Holmes 1976b; Mills 1976; Baumrind 1985; Oczak and Niedźwieńska 2007) i alguns d'ells pot ser útil aplicar a la investigació era digital. Humphreys (2015) ofereix idees interessants sobre el consentiment diferit, que està estretament relacionat amb l'estratègia informativa que he descrit.
La idea de demanar una mostra de participants el seu consentiment està relacionada amb el Humphreys (2015) anomena consentiment inferit.
Una altra idea que s'ha proposat en relació amb el consentiment informat és la construcció d'un grup de persones que estan d'acord per estar en experiments en línia (Crawford 2014) . Alguns han argumentat que aquest panell seria una mostra no aleatòria de persones. No obstant això, el capítol 3 (Fer preguntes) mostra que aquests problemes són potencialment direccionable usant posterior a l'estratificació i la coincidència de la mostra. A més, el consentiment sigui en el panell podria cobrir una varietat d'experiments. En altres paraules, els participants poden no necessitar de donar el seu consentiment per a cada experiment individual, un concepte anomenat consentiment ampli (Sheehan 2011) .
Lluny de ser únic, el Premi Netflix il·lustra una propietat important tècnica dels conjunts de dades que contenen informació detallada sobre les persones, i per tant ofereix lliçons importants sobre la possibilitat de "anonimització" de conjunts de dades socials modernes. Els arxius amb moltes peces d'informació sobre cada persona és probable que siguin escasses, en el sentit definit formalment en Narayanan and Shmatikov (2008) . És a dir, per a cada registre que no hi ha registres que són els mateixos, i de fet no hi ha registres que són molt similars: cada persona està molt lluny del seu veí més proper en el conjunt de dades. Un pot imaginar que les dades de Netflix podrien ser escassa, ja que amb prop de 20.000 pel·lícules en una escala de 5 estrelles, hi ha prop de \ (6 ^ {20.000} \) valors possibles que cada persona pugui tenir (6, ja que, a més d'un a 5 estrelles , algú podria no haver avaluat la pel·lícula en absolut). Aquest nombre és tan gran, és difícil fins i tot comprendre.
Escassesa té dues conseqüències principals. En primer lloc, vol dir que l'intent de "anonimitzar" el conjunt de dades sobre la base de pertorbació aleatòria probablement fallarà. És a dir, fins i tot si eren Netflix per ajustar l'atzar algunes de les qualificacions (el que van fer), això no seria suficient, ja que el registre segueix sent pertorbat el registre més proper possible a la informació que l'atacant té. En segon lloc, l'escassetat vol dir que de-forma anònima és possible fins i tot si l'atacant té coneixement imperfecte o imparcial. Per exemple, en les dades de Netflix, imaginem que l'atacant coneix les seves qualificacions per a dues pel·lícules i la data que va fer perquè les classificacions de +/- 3 dies; només que la informació per si sola és suficient per identificar de forma exclusiva el 68% de les persones en les dades de Netflix. Si els atacants sap 8 pel·lícules que hi hagi nominals +/- 14 dies, a continuació, fins i tot si dues d'aquestes classificacions conegudes són completament equivocat, el 99% dels registres pot identificar en el conjunt de dades. En altres paraules, escassetat és un problema fonamental per als esforços per "anonimitzar" de dades, la qual cosa és lamentable perquè el conjunt de dades socials més moderns són escassos.
metadades de telèfon també podria semblar "anònim" i no és sensible, però això no és el cas. Metadades de telèfon és identificable i sensible (Mayer, Mutchler, and Mitchell 2016; Landau 2016) .
A la Figura 6.6, vaig esbossar un equilibri entre el risc per als participants i els beneficis a la investigació de l'alliberament de dades. Per a una comparació entre els enfocaments restringits d'accés (per exemple, un jardí emmurallat) i enfocaments de dades restringida (per exemple, algun tipus de forma anònima) veure Reiter and Kinney (2011) . Per a un sistema de categorització proposta dels nivells de risc de les dades, veure Sweeney, Crosas, and Bar-Sinai (2015) . Finalment, per a una discussió més general d'intercanvi de dades, veure Yakowitz (2011) .
Per una anàlisi més detallada d'aquest compromís entre el risc i la utilitat de les dades, consulteu Brickell and Shmatikov (2008) , Ohm (2010) , Wu (2013) , Reiter (2012) , i Goroff (2015) . Per veure aquesta disjuntiva aplicada a les dades reals dels cursos oberts de forma massiva en línia (MOOCs), veure Daries et al. (2014) i Angiuli, Blitzstein, and Waldo (2015) .
Privacitat diferencial també ofereix un enfocament alternatiu que es pot combinar tant d'alt benefici per a la societat i de baix risc per als participants, veure Dwork and Roth (2014) i Narayanan, Huey, and Felten (2016) .
Per a més informació sobre el concepte d'informació d'identificació personal (PII), que és fonamental per a moltes de les normes sobre ètica de la investigació, vegeu Narayanan and Shmatikov (2010) i Schwartz and Solove (2011) . Per a més informació sobre totes les dades potencialment sensibles, veure Ohm (2015) .
En aquesta secció, he retratat la vinculació de diferents conjunts de dades com una cosa que pot donar lloc a riscos informatiu. No obstant això, també pot crear noves oportunitats per a la investigació, com s'argumenta en Currie (2013) .
Per a més informació sobre les cinc caixes fortes, veure Desai, Ritchie, and Welpton (2016) . Per a un exemple de com els productes es poden identificar, veure Brownstein, Cassa, and Mandl (2006) , que mostra com els mapes de prevalença de la malaltia poden ser la identificació. Dwork et al. (2017) també considera els atacs contra les dades agregades, com ara estadístiques sobre quantes persones tenen una certa malaltia.
Warren and Brandeis (1890) és un article legal senyal sobre la privacitat, i l'article és el més associat amb la idea que la privacitat és un dret a ser deixat sol. Més recentment, els tractaments de longitud llibre de privacitat que recomano inclouen Solove (2010) i Nissenbaum (2010) .
Per a una revisió de la investigació empírica sobre com la gent pensa sobre la privacitat, consulteu Acquisti, Brandimarte, and Loewenstein (2015) . La revista Science va publicar un número especial titulat "La fi de la privacitat", que aborda les qüestions de privacitat i riscos de la informació d'una varietat de diferents perspectives; per a un resum veure Enserink and Chin (2015) . Calo (2011) ofereix un marc per pensar sobre els danys que vénen de violacions de privacitat. Un exemple primerenc de les preocupacions sobre la privacitat en els inicis de l'era digital és Packard (1964) .
Un dels reptes en tractar d'aplicar l'estàndard mínim risc és que no està clar la vida diària es va a utilitzar per a l'avaluació comparativa (Council 2014) . Per exemple, les persones sense llar tenen majors nivells de malestar en la seva vida diària. No obstant això, això no implica que és èticament permissible per exposar a les persones sense llar per a la recerca d'alt risc. Per aquesta raó, sembla que hi ha un consens creixent que un risc mínim hauria de valorar-se a partir d'un estàndard de la població en general, no és un estàndard de la població específica. Si bé en general d'acord amb la idea d'un estàndard de la població en general, crec que per a les grans plataformes en línia com Facebook, un estàndard específic de la població és raonable. És a dir, quan es considera el contagi emocional, crec que és raonable punt de referència contra els riscos quotidians a Facebook. Un estàndard de la població específica en aquest cas és molt més fàcil d'avaluar i és poc probable que entrin en conflicte amb el principi de Justícia, que busca prevenir les càrregues de la investigació si no injustament en els grups desfavorits (per exemple, els presos i els orfes).
Altres investigadors també han demanat més documents per incloure apèndixs ètics (Schultze and Mason 2012; Kosinski et al. 2015) . King and Sands (2015) també ofereix consells pràctics.