Navorsingsetiek het tradisioneel ook onderwerpe soos wetenskaplike bedrog en toekenning van krediet ingesluit. Hierdie word in meer besonderhede bespreek in On Being Scientist by Institute of Medicine and National Academy of Sciences and National Academy of Engineering (2009) .
Hierdie hoofstuk word sterk beïnvloed deur die situasie in die Verenigde State. Vir meer oor die etiese hersieningsprosedures in ander lande, sien hoofstukke 6-9 van Desposato (2016b) . Vir 'n argument dat die biomediese etiese beginsels wat hierdie hoofstuk beïnvloed het, oormatig Amerikaanse is, sien Holm (1995) . Vir 'n verdere historiese oorsig van Institusionele Review Boards in die Verenigde State, sien Stark (2012) . Die tydskrif PS: Politieke Wetenskap en Politiek het 'n professionele simposium oor die verhouding tussen politieke wetenskaplikes en IRB's gehou; sien Martinez-Ebers (2016) vir 'n opsomming.
Die Belmont-verslag en daaropvolgende regulasies in die Verenigde State is geneig om 'n onderskeid te maak tussen navorsing en praktyk. Ek het nie so 'n onderskeid gemaak in hierdie hoofstuk nie, omdat ek dink dat die etiese beginsels en raamwerke op beide instellings van toepassing is. Vir meer oor hierdie onderskeid en die probleme wat dit stel, sien Beauchamp and Saghai (2012) , MN Meyer (2015) , boyd (2016) en Metcalf and Crawford (2016) .
Vir meer oor navorsing oorsig op Facebook, sien Jackman and Kanerva (2016) . Vir idees oor navorsingsoorsig by maatskappye en NRO's, sien Calo (2013) , Polonetsky, Tene, and Jerome (2015) , en Tene and Polonetsky (2016) .
Met betrekking tot die gebruik van selfoondata om die 2014 Ebola-uitbraak in Wes-Afrika (Wesolowski et al. 2014; McDonald 2016) , vir meer inligting oor die privaatheidsrisiko's van selfoondata, sien Mayer, Mutchler, and Mitchell (2016) . Vir voorbeelde van vroeër krisisverwante navorsing met behulp van selfoondata, sien Bengtsson et al. (2011) en Lu, Bengtsson, and Holme (2012) , en vir meer oor die etiek van krisisverwante navorsing, sien ( ??? ) .
Baie mense het oor emosionele besmetting geskryf. Die joernaal Navorsingsetiek het hul hele probleem in Januarie 2016 toegewy om die eksperiment te bespreek; sien Hunter and Evans (2016) vir 'n oorsig. Die Proceedings of the National Academies of Science het twee stukke oor die eksperiment gepubliseer: Kahn, Vayena, and Mastroianni (2014) en Fiske and Hauser (2014) . Ander stukke oor die eksperiment sluit in: Puschmann and Bozdag (2014) , Meyer (2014) , Grimmelmann (2015) , MN Meyer (2015) , ( ??? ) , Kleinsman and Buckley (2015) , Shaw (2015) , en ( ??? ) .
In terme van massa-waarneming word breë oorsigte verskaf in Mayer-Schönberger (2009) en Marx (2016) . Vir 'n konkreet voorbeeld van die veranderende koste van toesig, Bankston and Soltani (2013) dat die opsporing van 'n kriminele verdagte met behulp van selfone ongeveer 50 keer goedkoper is as die gebruik van fisiese toesig. Sien ook Ajunwa, Crawford, and Schultz (2016) vir 'n bespreking van toesig by die werk. Bell and Gemmell (2009) bied 'n meer optimistiese perspektief op selfbewaking.
Benewens die waarneming van waarneembare gedrag wat publiek of gedeeltelik openbaar is (bv. Smaak, Ties en Tyd), kan navorsers toenemend dinge aflei wat baie deelnemers as privaat beskou. Byvoorbeeld, Michal Kosinski en kollegas (2013) het getoon dat hulle sensitiewe inligting oor mense, soos seksuele oriëntasie en gebruik van verslawende stowwe, van skynbaar gewone digitale spoordata (Facebook Likes) kan aflei. Dit mag dalk magies klink, maar die benadering Kosinski en kollegas wat gebruik word - wat digitale spore, opnames, en onderrig onder toesig gekombineer het - is eintlik iets waaroor ek jou al vertel het. Onthou dit in hoofstuk 3 (Vra vrae). Ek het jou vertel hoe Joshua Blumenstock en kollegas (2015) gekombineer opname data met selfoon data armoede in Rwanda te skat. Hierdie presies dieselfde benadering, wat gebruik kan word om armoede doeltreffend in 'n ontwikkelende land te meet, kan ook gebruik word vir moontlike afwykings van privaatheid.
Vir meer inligting oor die moontlike onbedoelde sekondêre gebruik van gesondheidsdata, sien O'Doherty et al. (2016) . Benewens die potensiaal vir onbedoelde sekondêre gebruike, kan die skep van selfs 'n onvolledige meesterdatabasis 'n verkillende effek hê op die sosiale en politieke lewe as mense nie bereid was om sekere materiaal te lees of sekere onderwerpe te bespreek nie; sien Schauer (1978) en Penney (2016) .
In situasies met oorvleuelende reëls betrek navorsers soms "regulerende inkopies" (Grimmelmann 2015; Nickerson and Hyde 2016) . In die besonder, sommige navorsers wat IRB-toesig wil vermy, kan vennootskappe vorm met navorsers wat nie deur IRB's gedek word nie (bv. Mense by maatskappye of nie-regeringsorganisasies) en daardie kollegas versamel en ontken data. Dan kan die IRB-gedekte navorser hierdie gedeïdentifiseerde data sonder IRB-oorsig analiseer omdat die navorsing nie meer as "menslike vakke-navorsing" beskou word nie, volgens sommige interpretasies van huidige reëls. Hierdie soort IRB-ontduiking is waarskynlik nie in ooreenstemming met 'n beginselgebaseerde benadering tot navorsingsetiek nie.
In 2011 het 'n poging begin om die Algemene Reël op te dateer. Hierdie proses is uiteindelik in 2017 voltooi ( ??? ) . Vir meer inligting oor hierdie pogings om die Algemene Reglement by te werk, sien Evans (2013) , National Research Council (2014) , Hudson and Collins (2015) en Metcalf (2016) .
Die klassieke beginselgebaseerde benadering tot biomediese etiek is dié van Beauchamp and Childress (2012) . Hulle stel voor dat vier hoof beginsels biomediese etiek moet rig: respek vir outonomie, nonmaleficence, beneficence en justice. Die beginsel van nonmaleficence dring daarop aan om te onthou van skade aan ander mense. Hierdie konsep is diep verbind met die Hippokratiese idee van "Moenie kwaad wees nie." In die navorsingsetiek word hierdie beginsel dikwels met die beginsel van Voordeel gekombineer, maar sien hoofstuk 5 van @ beauchamp_principles_2012 vir meer oor die onderskeid tussen die twee. Vir 'n kritiek dat hierdie beginsels te Amerikaanse is, sien Holm (1995) . Vir meer oor balansering wanneer die beginsels strydig is, sien Gillon (2015) .
Die vier beginsels in hierdie hoofstuk is ook voorgestel om etiese toesig te rig op navorsing wat gedoen word by maatskappye en nie-regeringsorganisasies (Polonetsky, Tene, and Jerome 2015) deur liggame genaamd "Consumer Subject Review Boards" (CSRBs) (Calo 2013) .
Behalwe vir outonomie, erken die Belmont-verslag ook dat nie elke mens in staat is om ware selfbeskikking te gee nie. Byvoorbeeld, kinders, mense wat ly aan siekte of mense wat in situasies van swaarbeperkte vryheid leef, kan nie as volkome outonome individue optree nie, en hierdie mense is dus onderhewig aan ekstra beskerming.
Die toepassing van die beginsel van respek vir persone in die digitale era kan uitdagend wees. Byvoorbeeld, in digitale ouderdomnavorsing kan dit moeilik wees om ekstra beskerming te bied vir mense met verminderde vermoë om selfbeskikking te gee, omdat navorsers dikwels min van hul deelnemers weet. Verder, ingeligte toestemming in digitale-jarige sosiale navorsing is 'n groot uitdaging. In sommige gevalle kan werklik ingeligte toestemming ly aan die transparant paradox (Nissenbaum 2011) , waar inligting en begrip in konflik is. Byna, as navorsers volledige inligting verskaf oor die aard van die data-insameling, data-analise en data-sekuriteitspraktyke, sal dit vir baie deelnemers moeilik wees om te verstaan. Maar as navorsers omvattende inligting verskaf, kan dit dalk nie belangrike tegniese besonderhede ontbreek nie. In mediese navorsing in die analoog ouderdom - die oorheersing wat deur die Belmont-verslag oorweeg word - kan 'n mens dink dat 'n dokter individueel met elke deelnemer praat om die transparantparadox te help oplos. In aanlyn studies waarby duisende of miljoene mense betrokke is, is so 'n gesig-tot-aangesig-benadering onmoontlik. 'N Tweede probleem met toestemming in die digitale era is dat dit in sommige studies, soos ontledings van massiewe data repositories, onprakties is om ingeligte toestemming van alle deelnemers te verkry. Ek bespreek hierdie en ander vrae oor ingeligte toestemming meer in detail in afdeling 6.6.1. Ten spyte van hierdie probleme, moet ons egter onthou dat ingeligte toestemming nie nodig is of voldoende is vir respek vir persone nie.
Vir meer inligting oor mediese navorsing voor ingeligte toestemming, sien Miller (2014) . Vir 'n boeklengte behandeling van ingeligte toestemming, sien Manson and O'Neill (2007) . Sien ook die voorgestelde lesings oor ingeligte toestemming hieronder.
Harms vir konteks is die nadele wat navorsing kan veroorsaak nie aan spesifieke mense nie maar aan sosiale instellings. Hierdie konsep is 'n bietjie abstrak, maar ek sal met 'n klassieke voorbeeld illustreer: die Wichita-jurystudie (Vaughan 1967; Katz, Capron, and Glass 1972, chap. 2) ook soms die Chicago Jury Project (Cornwell 2010) . In hierdie studie het navorsers van die Universiteit van Chicago, as deel van 'n groter studie van sosiale aspekte van die regstelsel, in die geheim ses jury beraadslagings in Wichita, Kansas, aangeteken. Die beoordelaars en prokureurs in die gevalle het die opnames goedgekeur, en daar was streng toesig oor die proses. Die regters was egter nie bewus daarvan dat opnames plaasgevind het nie. Sodra die studie ontdek is, was daar openbare verontwaardiging. Die departement van justisie het 'n ondersoek van die studie begin, en die navorsers is geroep om voor die Kongres te getuig. Uiteindelik het die kongres 'n nuwe wet geslaag wat dit onwettig maak om die oordeel van die jurie in die geheim aan te teken.
Die bekommernis van kritici van die Wichita Jury Study was nie die risiko van skade aan die deelnemers nie; eerder, dit was die risiko van skade aan die konteks van jurie beraadslaging. Dit is, mense het gedink dat indien jurylede nie glo dat hulle gesprekke in 'n veilige en beskermde ruimte het nie, sal dit moeiliker wees om jury beraadslagings in die toekoms voort te sit. Benewens die jurie-beraadslaging, is daar ander spesifieke sosiale kontekste wat die samelewing bied met ekstra beskerming, soos prokureur-kliënt verhoudings en sielkundige sorg (MacCarthy 2015) .
Die risiko van skade aan konteks en die ontwrigting van sosiale stelsels kom ook voor in sommige veldeksperimente in die politieke wetenskap (Desposato 2016b) . Vir 'n voorbeeld van 'n meer konteks-sensitiewe koste-voordeel berekening vir 'n veld eksperiment in die politieke wetenskap, sien Zimmerman (2016) .
Vergoeding vir deelnemers is bespreek in 'n aantal instellings wat verband hou met digitale-ouderdomnavorsing. Lanier (2014) stel voor dat deelnemers betaal word vir digitale spore wat hulle genereer. Bederson and Quinn (2011) bespreek betalings in aanlyn arbeidsmarkte. Ten slotte stel Desposato (2016a) voor om deelnemers in veldeksperimente te betaal. Hy wys daarop dat selfs indien deelnemers nie direk betaal kan word nie, 'n skenking gemaak kan word aan 'n groep wat namens hulle werk. Byvoorbeeld, in Encore kon die navorsers 'n skenking aan 'n groep gedoen het om toegang tot die internet te ondersteun.
Diensvoorwaardes moet minder gewig hê as kontrakte wat tussen gelyke partye onderhandeld word en as wette wat deur regmatige regerings geskep word. Situasies waar navorsers in die verlede terme van diensbepalingsooreenkomste oortree het, het oor die algemeen betrokke geraak by outomatiese navrae om die gedrag van maatskappye te monitor (soos veldeksperimente om diskriminasie te meet). Vir verdere besprekings, sien Vaccaro et al. (2015) , Bruckman (2016a) en Bruckman (2016b) . Vir 'n voorbeeld van empiriese navorsing wat die diensbepalings bespreek, sien Soeller et al. (2016) . Vir meer oor die moontlike regsprobleme wat navorsers in die gesig staar as hulle diensvoorwaardes oortree, sien Sandvig and Karahalios (2016) .
Dit is duidelik dat daar 'n enorme hoeveelheid oor konsekwentialisme en deontologie geskryf is. Vir 'n voorbeeld van hoe hierdie etiese raamwerke, en ander, gebruik kan word om te redeneer oor digitale-jarige navorsing, sien Zevenbergen et al. (2015) . Vir 'n voorbeeld van hoe dit toegepas kan word op veldeksperimente in ontwikkelingsekonomie, sien Baele (2013) .
Vir meer oor ouditstudies van diskriminasie, sien Pager (2007) en Riach and Rich (2004) . Nie alleen het hierdie studies nie ingeligte toestemming nie, maar ook misleiding sonder debriefing.
Beide Desposato (2016a) en Humphreys (2015) bied advies oor veld eksperimente sonder toestemming.
Sommers and Miller (2013) hersien baie argumente ten gunste om nie die deelnemers na bedrog te debrief nie, en argumenteer dat navorsers verwerping moet aflê
"Onder 'n baie nou stel omstandighede, naamlik in veldnavorsing waarin ontlonting aansienlike praktiese hindernisse inhou, maar navorsers sal nie bekommerd wees oor ontbinding as hulle kan nie. Navorsers moet nie toegelaat word om debriefing te verwerp om 'n naïef deelnemende swembad te bewaar nie, hulself te beskerm teen deelnemers se woede, of om deelnemers te beskerm teen skade. "
Ander argumenteer dat in sommige gevalle as debriefing meer skade as goed veroorsaak, dit vermy moet word (Finn and Jakobsson 2007) . Opsomming is 'n geval waar sommige navorsers Prioriteit vir Persone oor Voordeel prioritiseer, terwyl sommige navorsers die teenoorgestelde doen. Een moontlike oplossing sou wees om maniere te vind om 'n leerervaring vir die deelnemers te ontleed. Dit is eerder as om te dink aan debriefing as iets wat skade kan veroorsaak, miskien is debriefing ook iets wat deelnemers bevoordeel. Vir 'n voorbeeld van hierdie soort opvoedkundige debriefing, sien Jagatic et al. (2007) . Sielkundiges het tegnieke ontwikkel vir debriefing (DS Holmes 1976a, 1976b; Mills 1976; Baumrind 1985; Oczak and Niedźwieńska 2007) , en sommige van hierdie kan nuttig aangewend word vir digitale navorsing. Humphreys (2015) bied interessante gedagtes oor uitgestelde toestemming , wat nou verband hou met die ontledingsstrategie wat ek beskryf het.
Die idee om 'n steekproef van deelnemers vir hul toestemming te vra, hou verband met wat Humphreys (2015) afgeleide toestemming vra .
'N Verdere idee wat verband hou met ingeligte toestemming wat voorgestel is, is om 'n paneel van mense wat in aanlyn-eksperimente (Crawford 2014) . Sommige het aangevoer dat hierdie paneel 'n voorbeeld van mense sal wees. Maar hoofstuk 3 (Vra vrae) toon dat hierdie probleme potensieel aanspreeklik kan wees met behulp van post-stratifikasie. Ook toestemming om op die paneel te wees, kan 'n verskeidenheid eksperimente dek. Met ander woorde, deelnemers mag nie individueel aan elke eksperiment toestem nie, 'n konsep wat breë toestemming genoem word (Sheehan 2011) . Vir meer inligting oor die verskille tussen eenmalige toestemming en toestemming vir elke studie, asook 'n moontlike baster, sien Hutton and Henderson (2015) .
Die Netflix-prys illustreer 'n belangrike tegniese eienskap van datastelle wat gedetailleerde inligting oor mense bevat, en bied dus belangrike lesse oor die moontlikheid van "anonymisering" van moderne sosiale datastelle. Lêers met baie inligting oor elke persoon sal waarskynlik yl wees , in die sin wat formeel in Narayanan and Shmatikov (2008) gedefinieer word. Dit is, vir elke rekord, is daar geen rekords wat dieselfde is nie, en in werklikheid is daar geen rekords wat baie dieselfde is nie: elke persoon is ver van hul naaste buurman in die datastel. 'N Mens kan dink dat die Netflix-data skaars kan wees, want met ongeveer 20 000 films op 'n vyfsterskaal is daar ongeveer \(6^{20,000}\) moontlike waardes wat elke persoon kan hê (6 omdat, bykomend tot 1 tot 5 sterre, iemand het dalk glad nie die fliek geassesseer nie). Hierdie nommer is so groot, dit is moeilik om selfs te verstaan.
Sparsiteit het twee hoof implikasies. Eerstens beteken dit dat die poging om die datastel gebaseer op willekeurige verwarring te "anonymiseer" waarskynlik sal misluk. Dit is, selfs al sou Netflix ewekansig sommige van die graderings (wat hulle gedoen het) willekeurig aanpas, sou dit nie voldoende wees nie, want die versteurde rekord is steeds die naaste moontlike rekord vir die inligting wat die aanvaller het. Tweedens beteken die ylheid dat heridentifikasie moontlik is, selfs al het die aanvaller onvolmaakte of onpartydige kennis. Byvoorbeeld, in die Netflix-data, kom ons voor dat die aanvaller jou graderings vir twee flieks ken en die datums wat jy daardie graderings gemaak het \(\pm\) 3 dae; Net daardie inligting alleen is voldoende om 68% van die mense in die Netflix-data uniek te identifiseer. As die aanvaller weet agt films wat u gegradeer \(\pm\) 14 dae, dan selfs al twee van hierdie bekende graderings is heeltemal verkeerd, 99% van rekords uniek geïdentifiseer kan word in die datastel. Met ander woorde, ylheid is 'n fundamentele probleem vir pogings om data te "anonymiseer", wat ongelukkig is omdat die meeste moderne sosiale datastelle yl is. Vir meer inligting oor "anonymisering" van yl data, sien Narayanan and Shmatikov (2008) .
Telefoon meta-data lyk ook as 'anoniem' en nie sensitief nie, maar dit is nie die geval nie. Telefoon meta-data is identifiseerbaar en sensitief (Mayer, Mutchler, and Mitchell 2016; Landau 2016) .
In figuur 6.6 het ek 'n afweging tussen risiko vir deelnemers en voordele vir die samelewing uit data-vrystelling geskets. Vir 'n vergelyking tussen beperkte toegangsbenaderings (bv. 'N ommuurde tuin) en beperkte data-benaderings (bv.' N vorm van "anonimisering"), sien Reiter and Kinney (2011) . Vir 'n voorgestelde kategorisiestelsel van risiko-vlakke van data, sien Sweeney, Crosas, and Bar-Sinai (2015) . Vir 'n meer algemene bespreking van data-sharing, sien Yakowitz (2011) .
Vir meer gedetailleerde analise van hierdie verrekening tussen die risiko en nut van data, sien Brickell and Shmatikov (2008) , Ohm (2010) , Reiter (2012) , Wu (2013) en Goroff (2015) . Om te sien hoe hierdie afhandeling toegepas word op werklike data van massiewe oop aanlyn kursusse, sien Daries et al. (2014) en Angiuli, Blitzstein, and Waldo (2015) .
Differensiële privaatheid bied ook 'n alternatiewe benadering wat beide lae risiko vir deelnemers en hoë voordeel vir die samelewing kan kombineer; sien Dwork and Roth (2014) en Narayanan, Huey, and Felten (2016) .
Vir meer oor die konsep van persoonlike identifiserende inligting (PII), wat sentraal staan in baie van die reëls oor navorsingsetiek, sien Narayanan and Shmatikov (2010) en Schwartz and Solove (2011) . Vir meer inligting oor alle data wat moontlik sensitief is, sien Ohm (2015) .
In hierdie afdeling het ek die verband van verskillende datastelle uitgebeeld as iets wat tot informatiewe risiko kan lei. Dit kan egter ook nuwe geleenthede vir navorsing skep, soos beweer in Currie (2013) .
Vir meer inligting oor die vyf kluise, sien Desai, Ritchie, and Welpton (2016) . Vir 'n voorbeeld van hoe uitsette geïdentifiseer kan word, sien Brownstein, Cassa, and Mandl (2006) , wat wys hoe kaarte van siektes voorkom kan identifiseer. Dwork et al. (2017) oorweeg ook aanvalle teen totale data, soos statistieke oor hoeveel individue 'n sekere siekte het.
Vrae oor data gebruik en data vrylating verhoog ook vrae oor data eienaarskap. Vir meer, oor data-eienaarskap, sien Evans (2011) en Pentland (2012) .
Warren and Brandeis (1890) is 'n landmerklike wetlike artikel oor privaatheid en is die meeste geassosieer met die idee dat privaatheid 'n reg is om alleen gelaat te word. Solove (2010) behandelings van privaatheid wat ek sou aanbeveel, sluit in Solove (2010) en Nissenbaum (2010) .
Vir 'n oorsig van empiriese navorsing oor hoe mense oor privaatheid dink, sien Acquisti, Brandimarte, and Loewenstein (2015) . Phelan, Lampe, and Resnick (2016) stel 'n dual-system theory voor - dat mense soms fokus op intuïtiewe bekommernisse en soms fokus op oordeelde besorgdhede - om te verduidelik hoe mense oënskynlik teenstrydige uitsprake oor privaatheid kan maak. Vir meer inligting oor die idee van privaatheid in aanlyninstellings soos Twitter, sien Neuhaus and Webmoor (2012) .
Die tydskrif Science publiseer 'n spesiale afdeling getiteld "The End of Privacy", wat die kwessies van privaatheid en inligtingsrisiko vanuit 'n verskeidenheid verskillende perspektiewe aanspreek; Vir 'n opsomming, sien Enserink and Chin (2015) . Calo (2011) bied 'n raamwerk om te dink oor die skade wat voortspruit uit privaatheidsoortredings. 'N Vroeë voorbeeld van kommer oor privaatheid in die begin van die digitale era is Packard (1964) .
Een uitdaging wanneer die minimum risiko standaard toegepas word, is dat dit nie duidelik is wie se daaglikse lewe gebruik gaan word vir benchmarking (National Research Council 2014) . Byvoorbeeld, daklozen het hoër vlakke van ongemak in hul daaglikse lewe. Maar dit impliseer nie dat dit eties toelaatbaar is om hawelose mense bloot te stel aan hoërrisiko-navorsing nie. Om hierdie rede lyk dit of daar 'n toenemende konsensus bestaan dat minimale risiko op grond van 'n algemene populasie standaard, nie 'n spesifieke populasie standaard, gekorrigeer moet word nie. Terwyl ek in die algemeen saamstem met die idee van 'n algemene bevolking standaard, dink ek dat vir 'n groot aanlyn platforms soos Facebook, 'n spesifieke populasie standaard redelik is. Dus, as ek Emosionele Besmetting oorweeg, dink ek dit is redelik om te benchmark teen alledaagse risiko op Facebook. 'N Spesifieke bevolkingstandaard is in hierdie geval baie makliker om te evalueer en is onwaarskynlik dat dit in stryd is met die beginsel van geregtigheid, wat daarop gemik is om die las van navorsing onbillik op minderbevoorregte groepe te verhoed (bv. Gevangenes en weeskinders).
Ander geleerdes het ook gevra vir meer referate om etiese aanhangsels (Schultze and Mason 2012; Kosinski et al. 2015; Partridge and Allman 2016) . King and Sands (2015) bied ook praktiese wenke. Zook en kollegas (2017) bied "tien eenvoudige reëls vir verantwoordelike groot data-navorsing."