Etica în domeniul cercetării a inclus în mod tradițional și subiecte precum fraudarea științifică și alocarea creditelor. Acestea sunt discutate mai detaliat în revista On Being Scientist de către Institute of Medicine and National Academy of Sciences and National Academy of Engineering (2009) .
Acest capitol este puternic influențat de situația din Statele Unite. Pentru mai multe despre procedurile de evaluare etică din alte țări, consultați capitolele 6-9 din Desposato (2016b) . Pentru un argument că principiile etice biomedicale care au influențat acest capitol sunt excesiv de americane, a se vedea Holm (1995) . Pentru o altă analiză istorică a consiliilor de revizuire instituțională din Statele Unite, a se vedea Stark (2012) . Jurnalul PS: Științe Politice și Politică a organizat un simpozion profesional privind relația dintre oamenii de știință politică și IRB; vezi Martinez-Ebers (2016) pentru un rezumat.
Raportul Belmont și regulamentele ulterioare din Statele Unite tind să facă o distincție între cercetare și practică. Nu am făcut o astfel de distincție în acest capitol deoarece cred că principiile și cadrele etice se aplică ambelor setări. Pentru mai multe detalii despre această distincție și despre problemele pe care le prezintă, a se vedea Beauchamp and Saghai (2012) , MN Meyer (2015) , boyd (2016) și Metcalf and Crawford (2016) .
Pentru mai multe informații despre supravegherea cercetării de pe Facebook, consultați Jackman and Kanerva (2016) . Pentru idei despre supravegherea cercetării la companii și ONG-uri, a se vedea Calo (2013) , Polonetsky, Tene, and Jerome (2015) , și Tene and Polonetsky (2016) .
În ceea ce privește utilizarea datelor de pe telefonul mobil pentru a contribui la soluționarea epidemiei Ebola 2014 în Africa de Vest (Wesolowski et al. 2014; McDonald 2016) , pentru mai multe informații despre riscurile legate de confidențialitatea datelor telefonului mobil, a se vedea Mayer, Mutchler, and Mitchell (2016) . Pentru exemple de cercetări anterioare legate de crize care utilizează date despre telefoanele mobile, a se vedea Bengtsson et al. (2011) și Lu, Bengtsson, and Holme (2012) , și pentru mai multe despre etica cercetării legate de criză, a se vedea ( ??? ) .
Mulți oameni au scris despre contagiunea emoțională. Jurnalul de Cercetare Etică și-a dedicat întreaga problemă în ianuarie 2016 pentru a discuta despre experiment; vezi Hunter and Evans (2016) pentru o prezentare generală. Lucrările Academiei Naționale de Știință au publicat două lucrări despre experimentul: Kahn, Vayena, and Mastroianni (2014) și Fiske and Hauser (2014) . Alte piese despre experiment includ: Puschmann and Bozdag (2014) , Meyer (2014) , Grimmelmann (2015) , MN Meyer (2015) , ( ??? ) , Kleinsman and Buckley (2015) , Shaw (2015) , și ( ??? ) .
În ceea ce privește supravegherea în masă, prezentările generale sunt furnizate în Mayer-Schönberger (2009) și în Marx (2016) . Pentru un exemplu concret de costuri în schimbare ale supravegherii, Bankston and Soltani (2013) estimează că urmărirea unui suspect criminal care utilizează telefoanele mobile este de aproximativ 50 de ori mai ieftină decât utilizarea supravegherii fizice. A se vedea, de asemenea Ajunwa, Crawford, and Schultz (2016) pentru o discuție de supraveghere la locul de muncă. Bell and Gemmell (2009) oferă o perspectivă mai optimistă asupra auto-supravegherii.
Pe lângă faptul că pot urmări un comportament observabil public sau parțial public (de exemplu, gusturi, legături și timp), cercetătorii pot deduce din ce în ce mai multe lucruri pe care mulți participanți le consideră private. De exemplu, Michal Kosinski și colegii săi (2013) au arătat că ar putea deduce informații sensibile despre persoane, cum ar fi orientarea sexuală și utilizarea de substanțe dependente, de la date trasate obișnuite (traseul Facebook Likes). Acest lucru ar putea suna magic, dar abordarea utilizată de Kosinski și colegii - care a combinat urme digitale, sondaje și învățare supravegheată - este de fapt ceva despre care v-am spus deja. Amintiți-vă că în capitolul 3 (Întrebări adresate). Ți-am spus cum Joshua Blumenstock și colegii (2015) combinat datele din sondaj cu datele din telefonul mobil pentru a estima sărăcia în Rwanda. Această abordare exactă, care poate fi utilizată pentru măsurarea eficientă a sărăciei într-o țară în curs de dezvoltare, poate fi utilizată, de asemenea, pentru inferențe care încalcă viața privată.
Pentru mai multe despre posibilele utilizări secundare neintenționate ale datelor de sănătate, a se vedea O'Doherty et al. (2016) . Pe lângă potențialul utilizărilor secundare neintenționate, crearea chiar a unei baze de date incomplete master ar putea avea un efect de răcire asupra vieții sociale și politice dacă oamenii nu vor să citească anumite materiale sau să discute anumite subiecte; vezi Schauer (1978) și Penney (2016) .
În situațiile în care normele se suprapun, cercetătorul se implică uneori în "cumpărături reglementare" (Grimmelmann 2015; Nickerson and Hyde 2016) . În special, unii cercetători care doresc să evite supravegherea IRB pot forma parteneriate cu cercetători care nu sunt vizați de IRB (de exemplu, persoane din companii sau ONG-uri) și colegii respectivi colectează și dezinstalează datele. Apoi, cercetătorul acoperit de IRB poate analiza aceste date dezidentificate fără supravegherea IRB, deoarece cercetarea nu mai este considerată "cercetare a subiecților umani", cel puțin conform unor interpretări ale regulilor actuale. Acest tip de evaziune IRB nu este, probabil, în concordanță cu o abordare bazată pe principii asupra eticii cercetării.
În 2011, un efort a început să actualizeze regula comună, iar acest proces a fost finalizat în 2017 ( ??? ) . Pentru mai multe despre aceste eforturi de actualizare a Regulamentului comun, a se vedea Evans (2013) , National Research Council (2014) , Hudson and Collins (2015) și Metcalf (2016) .
Abordarea clasică bazată pe principii de etică biomedicală este aceea a lui Beauchamp and Childress (2012) . Ei propun ca patru principii principale să conducă etica biomedicală: Respectul pentru autonomie, nonmaleficență, beneficii și justiție. Principiul nonmaleficenței îndeamnă pe cineva să se abțină de la a face rău altor persoane. Acest concept este strâns legat de ideea hipocratică a "Nu dăunează". În etica cercetării, acest principiu este adesea combinat cu principiul Beneficiului, dar vezi capitolul 5 al lui @ beauchamp_principles_2012 pentru mai multe despre distincția dintre cele două. Pentru o critică conform căreia aceste principii sunt excesiv de americane, a se vedea Holm (1995) . Pentru mai multe despre echilibrarea conflictului de principii, a se vedea Gillon (2015) .
Cele patru principii din acest capitol au fost de asemenea propuse pentru a ghida supravegherea etică a cercetărilor făcute la companii și ONG-uri (Polonetsky, Tene, and Jerome 2015) prin intermediul organismelor denumite "Consumer Review Boards" (CSRB) (Calo 2013) .
Pe lângă respectarea autonomiei, raportul Belmont recunoaște de asemenea că nu fiecare om este capabil de autodeterminare adevărată. De exemplu, copiii, persoanele care suferă de boli sau persoanele care trăiesc în situații de libertate severă poate să nu poată acționa ca indivizi complet autonomi și, prin urmare, acești oameni sunt supuși unei protecții suplimentare.
Aplicarea principiului respectului pentru persoane în era digitală poate fi o provocare. De exemplu, în cercetarea privind vârsta digitală, poate fi dificil să se acorde protecții suplimentare persoanelor cu capacitate redusă de autodeterminare, deoarece cercetătorii știu adesea foarte puțin despre participanții lor. În plus, consimțământul informat privind cercetarea socială a vârstei digitale reprezintă o provocare imensă. În unele cazuri, consimțământul cu adevărat informat poate suferi de paradoxul de transparență (Nissenbaum 2011) , în care informațiile și înțelegerea sunt în conflict. Aproximativ, dacă cercetătorii furnizează informații complete despre natura colectării de date, analiza datelor și practicile de securitate a datelor, va fi dificil pentru mulți participanți să înțeleagă. Dar, dacă cercetătorii furnizează informații inteligibile, pot lipsi detalii tehnice importante. În cercetarea medicală din epoca analogică - contextul dominat considerat de Raportul Belmont - se poate imagina un doctor vorbind individual cu fiecare participant pentru a ajuta la rezolvarea paradoxului de transparență. În studiile online care implică mii sau milioane de oameni, o astfel de abordare față-în-față este imposibilă. O a doua problemă cu consimțământul în era digitală constă în faptul că, în unele studii, cum ar fi analizele depozitelor de date masive, ar fi impractic să obțineți un consimțământ informat de la toți participanții. Am discutat aceste și alte întrebări despre consimțământul informat în detaliu în secțiunea 6.6.1. În ciuda acestor dificultăți, trebuie să ne amintim că acest consimțământ informat nu este nici necesar, nici suficient pentru Respectarea Persoanelor.
Pentru mai multe informații despre cercetarea medicală înainte de consimțământul informat, a se vedea Miller (2014) . Pentru tratamentul de lungă durată al consimțământului informat, a se vedea Manson and O'Neill (2007) . Consultați și citirile sugerate despre consimțământul informat de mai jos.
Rănile la context sunt pagubele pe care cercetarea le poate provoca nu unor persoane specifice, ci unor setări sociale. Acest concept este un pic abstract, dar voi exemplifica cu un exemplu clasic: Studiul Juriului din Wichita (Vaughan 1967; Katz, Capron, and Glass 1972, chap. 2) , uneori numit si Proiectul Jury din Chicago (Cornwell 2010) . În acest studiu, cercetătorii de la Universitatea din Chicago, în cadrul unui studiu mai amplu al aspectelor sociale ale sistemului juridic, au înregistrat în secret șase deliberări ale juriului din Wichita, Kansas. Judecătorii și avocații din cauze au aprobat înregistrările și a fost supravegheat strict procesul. Cu toate acestea, jurații nu știau că s-au produs înregistrări. Odată ce studiul a fost descoperit, a existat o revoltă publică. Departamentul de Justiție a început o investigație a studiului, iar cercetătorii au fost chemați să depună mărturie în fața Congresului. În cele din urmă, Congresul a adoptat o nouă lege care face ilegală înregistrarea în secret a deliberărilor juriului.
Preocuparea criticilor din studiul juriului din Wichita nu a fost riscul de rău pentru participanți; mai degrabă, a fost riscul de a aduce atingere contextului deliberării juriului. Adică, oamenii au crezut că, dacă membrii juriului nu credeau că discutau într-un spațiu sigur și protejat, ar fi mai greu pentru deliberările juriului să se desfășoare în viitor. Pe lângă deliberarea juriului, există și alte contexte sociale specifice pe care societatea le oferă o protecție suplimentară, cum ar fi relațiile avocat-client și îngrijirea psihologică (MacCarthy 2015) .
Riscul de a aduce prejudicii contextului și perturbarea sistemelor sociale apare și în unele experimente de teren din științele politice (Desposato 2016b) . Pentru un exemplu de calcul mai cost-beneficiu mai contextual pentru un experiment în teren în științele politice, a se vedea Zimmerman (2016) .
Compensarea pentru participanți a fost discutată într-o serie de setări referitoare la cercetarea privind vârsta digitală. Lanier (2014) propune participanților plătiți pentru urme digitale pe care le generează. Bederson and Quinn (2011) discută plățile pe piețele forței de muncă online. În cele din urmă, Desposato (2016a) propune plătirea participanților la experimentele pe teren. El subliniază că, chiar dacă participanții nu pot fi plătiți direct, o donație ar putea fi făcută unui grup care lucrează în numele lor. De exemplu, în Encore, cercetătorii ar fi putut face o donație unui grup care lucrează pentru a sprijini accesul la Internet.
Acordurile privind contractele de servicii trebuie să aibă o importanță mai mică decât contractele negociate între părți egale și decât legile create de guvernele legitime. Situațiile în care cercetătorii au încălcat în trecut acordurile privind clauzele de serviciu au implicat, în general, utilizarea de interogări automate pentru a controla comportamentul companiilor (la fel ca experimentele pe teren pentru a măsura discriminarea). Pentru discuții suplimentare, consultați Vaccaro et al. (2015) , Bruckman (2016a) și Bruckman (2016b) . Pentru un exemplu de cercetare empirică care discută termenii de serviciu, a se vedea Soeller et al. (2016) . Pentru mai multe despre posibilele probleme juridice cu care se confruntă cercetătorii în cazul în care încalcă termenii și condițiile serviciului, consultați Sandvig and Karahalios (2016) .
Evident, o cantitate enormă a fost scrisă despre consecințialism și deontologie. Pentru un exemplu despre modul în care aceste cadre etice și altele pot fi folosite pentru a raționa cu privire la cercetarea privind vârsta digitală, a se vedea Zevenbergen et al. (2015) . Pentru un exemplu de modul în care acestea pot fi aplicate la experimentele pe teren în economia dezvoltării, a se vedea Baele (2013) .
Pentru mai multe informații despre studiile de audit privind discriminarea, a se vedea Pager (2007) și Riach and Rich (2004) . Nu numai că aceste studii nu au consimțit în cunoștință de cauză, ci implică și înșelăciunea fără a fi informate.
Atât Desposato (2016a) și Humphreys (2015) oferă sfaturi despre experimentele pe teren fără consimțământ.
Sommers and Miller (2013) revizuiesc multe argumente în favoarea lipsei de informare a participanților după înșelăciune și susțin că cercetătorii ar trebui să renunțe la dezbateri
"Într-un set foarte restrâns de împrejurări, și anume în cercetarea pe teren, în care dezbaterile reprezintă bariere practice considerabile, dar cercetătorii nu ar avea nici o îndoială cu privire la dezbateri dacă ar putea. Cercetătorilor nu ar trebui să li se permită să renunțe la dezbateri pentru a păstra un grup de participanți naivi, să se ferească de furia participantului sau să protejeze participanții de rău ".
Alții susțin că, în anumite situații, dacă dezbaterile dau mai mult rău decât bine, ar trebui evitate (Finn and Jakobsson 2007) . Debriefingul este un caz în care unii cercetători acordă prioritate Respectului pentru Persoane peste Beneficiență, în timp ce unii cercetători fac contrariul. O posibilă soluție ar fi găsirea unor modalități de a face debriefing o experiență de învățare pentru participanți. Asta este, mai degrabă decât să ne gândim la dezbateri ca ceva care poate dăuna, poate că și dezbaterea poate fi ceva care îi ajută pe participanți. Pentru un exemplu de astfel de dezbateri educaționale, a se vedea Jagatic et al. (2007) . Psihologii au dezvoltat tehnici de (DS Holmes 1976a, 1976b; Mills 1976; Baumrind 1985; Oczak and Niedźwieńska 2007) , iar unele dintre acestea pot fi aplicate în mod util cercetării pentru vârstă digitală. Humphreys (2015) oferă gânduri interesante despre acordul amânat , care este strâns legat de strategia de dezbatere pe care am descris-o.
Ideea de a solicita un eșantion de participanți pentru consimțământul lor este legată de ceea ce Humphreys (2015) numește consimțământul dedus .
O altă idee legată de consimțământul informat care a fost propusă este construirea unui grup de persoane care acceptă să fie în experimente online (Crawford 2014) . Unii au susținut că acest panel ar fi un eșantion de oameni. Dar capitolul 3 (Întrebări adresate) arată că aceste probleme sunt adresabile potențial prin post-stratificare. De asemenea, consimțământul pentru a fi pe panel ar putea acoperi o varietate de experimente. Cu alte cuvinte, participanții ar putea să nu fie nevoiți să consimtă la fiecare experiment individual, un concept numit consimțământ general (Sheehan 2011) . Pentru mai multe despre diferențele dintre consimțământul unic și consimțământul pentru fiecare studiu, precum și un posibil hibrid, a se vedea Hutton and Henderson (2015) .
Departe de unic, premiul Netflix ilustrează o proprietate tehnică importantă a seturilor de date care conțin informații detaliate despre oameni și, astfel, oferă lecții importante despre posibilitatea anonimizării seturilor de date sociale moderne. Fișiere cu multe informații despre fiecare persoană sunt susceptibile de a fi rare , în sensul definit formal în Narayanan and Shmatikov (2008) . Adică, pentru fiecare înregistrare, nu există înregistrări care să fie identice și, de fapt, nu există înregistrări foarte asemănătoare: fiecare persoană este departe de cel mai apropiat vecin din setul de date. Se poate imagina că datele Netflix ar putea fi rare , deoarece , cu aproximativ 20.000 de filme pe o scară de cinci stele, există aproximativ \(6^{20,000}\) valori posibile pe care fiecare persoană ar putea avea (6 deoarece, în plus față de 1 5 stele, cineva nu ar fi evaluat deloc filmul). Acest număr este atât de mare, este greu de înțeles.
Sparseitatea are două implicații principale. În primul rând, înseamnă că încercarea de a "anonima" setul de date bazat pe perturbații aleatorii va eșua probabil. Adică, chiar dacă Netflix ar regla la întâmplare unele dintre ratinguri (pe care le-au făcut), acest lucru nu ar fi suficient pentru că înregistrarea perturbată este încă cea mai apropiată înregistrare posibilă a informațiilor pe care le are atacatorul. În al doilea rând, sparsea înseamnă că re-identificarea este posibilă chiar dacă atacatorul are cunoștințe imperfecte sau imparțiale. De exemplu, în datele Netflix, să presupunem că atacatorul știe evaluările dvs. pentru două filme și datele pe care le-ați făcut acele evaluări \(\pm\) 3 zile; doar aceste informații sunt suficiente pentru a identifica în mod unic 68% dintre persoanele din datele Netflix. Dacă atacatorul știe opt filme pe care le-ați evaluat \(\pm\) 14 zile, atunci chiar dacă două dintre aceste ratinguri cunoscute sunt complet greșite, 99% din înregistrări pot fi identificate în mod unic în setul de date. Cu alte cuvinte, sparsitatea este o problemă fundamentală pentru eforturile de "anonimizare" a datelor, ceea ce este nefericit deoarece cele mai multe seturi de date sociale moderne sunt rare. Pentru mai multe informații despre "anonimizarea" datelor rare, a se vedea Narayanan and Shmatikov (2008) .
Metadatele de telefon pot apărea, de asemenea, "anonime" și nu sensibile, dar nu este cazul. Metadatele de telefon sunt identificabile și sensibile (Mayer, Mutchler, and Mitchell 2016; Landau 2016) .
În figura 6.6, am schițat un compromis între riscuri pentru participanți și beneficii pentru societate de la data de eliberare. Pentru o comparație între abordările privind accesul restricționat (de exemplu, o grădină cu pereți) și abordările restricționate privind datele (de exemplu, o anumită formă de "anonimizare"), a se vedea Reiter and Kinney (2011) . Pentru un sistem propus de clasificare a nivelurilor de risc ale datelor, a se vedea Sweeney, Crosas, and Bar-Sinai (2015) . Pentru o discuție mai generală despre schimbul de date, a se vedea Yakowitz (2011) .
Pentru o analiză mai detaliată a acestui compromis între risc și utilitatea datelor, a se vedea Brickell and Shmatikov (2008) , Ohm (2010) , Reiter (2012) , Wu (2013) și Goroff (2015) . Pentru a vedea că acest compromis se aplică datelor reale din cursurile online deschise masiv (MOOC), a se vedea Daries et al. (2014) și Angiuli, Blitzstein, and Waldo (2015) .
Confidențialitatea diferențiată oferă, de asemenea, o abordare alternativă care poate combina atît riscul redus pentru participanți, cît și beneficiile ridicate pentru societate; a se vedea Dwork and Roth (2014) și Narayanan, Huey, and Felten (2016) .
Pentru mai multe informații despre conceptul de identificare personală (PII), care este esențial pentru multe dintre regulile privind etica cercetării, a se vedea Narayanan and Shmatikov (2010) și Schwartz and Solove (2011) . Pentru mai multe despre toate datele potențial sensibile, a se vedea Ohm (2015) .
În această secțiune, am reprezentat legătura diferitelor seturi de date ca fiind ceva care poate duce la risc informațional. Cu toate acestea, aceasta poate crea noi oportunități de cercetare, așa cum sa argumentat în Currie (2013) .
Pentru mai multe informații despre cele cinci seifuri, consultați Desai, Ritchie, and Welpton (2016) . Pentru un exemplu al modului în care pot fi identificate rezultatele, a se vedea Brownstein, Cassa, and Mandl (2006) , care arată modul în care hărțile prevalenței bolii pot fi identificate. Dwork et al. (2017) ia în considerare și atacurile împotriva datelor agregate, cum ar fi statisticile privind numărul de persoane care au o anumită boală.
Întrebările legate de utilizarea datelor și de punerea la dispoziție a datelor ridică, de asemenea, întrebări cu privire la proprietatea asupra datelor. Pentru mai multe informații privind proprietatea datelor, a se vedea Evans (2011) și Pentland (2012) .
Warren and Brandeis (1890) este un articol legal referitor la intimitate și este cel mai asociat cu ideea că viața privată este un drept de a rămâne singur. Tratamentele de lungă durată ale confidențialității pe care le-aș recomanda includ Solove (2010) și Nissenbaum (2010) .
Pentru o analiză a cercetării empirice despre modul în care oamenii se gândesc la viața privată, a se vedea Acquisti, Brandimarte, and Loewenstein (2015) . Phelan, Lampe, and Resnick (2016) propun o teorie cu două sisteme - că oamenii se concentrează uneori pe preocupări intuitive și uneori se concentrează asupra preocupărilor considerate - pentru a explica modul în care oamenii pot face declarații aparent contradictorii despre viața privată. Pentru mai multe informații despre ideea de confidențialitate în setările online, cum ar fi Twitter, consultați Neuhaus and Webmoor (2012) .
Jurnalul Știință a publicat o secțiune specială intitulată "Sfârșitul confidențialității", care abordează problemele legate de confidențialitate și riscul informațional dintr-o varietate de perspective diferite; pentru un rezumat, consultați Enserink and Chin (2015) . Calo (2011) oferă un cadru pentru a gândi la pagubele produse de încălcarea confidențialității. Un exemplu timpuriu de îngrijorare privitor la intimitatea de la începutul erei digitale este Packard (1964) .
O provocare în încercarea de a aplica standardul de risc minim este că nu este clar a cărui viață de zi cu zi va fi utilizată pentru benchmarking (National Research Council 2014) . De exemplu, persoanele fără adăpost au un nivel mai ridicat de disconfort în viața lor de zi cu zi. Dar acest lucru nu implică faptul că este permis din punct de vedere etic să expuneți persoanele fără adăpost la cercetări cu risc sporit. Din acest motiv, se pare că există un consens în creștere că riscul minim trebuie să fie comparat cu un standard al populației generale , și nu cu un standard specific populației . Deși în general sunt de acord cu ideea unui standard de populație generală, cred că pentru platformele online de mari dimensiuni, cum ar fi Facebook, un standard specific populației este rezonabil. Astfel, atunci când iau în considerare contagiunea emoțională, cred că este rezonabil să facem o comparație cu riscul de zi cu zi pe Facebook. Un standard specific populației în acest caz este mult mai ușor de evaluat și este puțin probabil să fie în conflict cu principiul justiției, care urmărește să prevină împovărarea nedreaptă a sarcinilor de cercetare asupra grupurilor dezavantajate (de exemplu, deținuți și orfani).
Alți cercetători au solicitat, de asemenea, ca mai multe lucrări să includă anexe etice (Schultze and Mason 2012; Kosinski et al. 2015; Partridge and Allman 2016) . King and Sands (2015) oferă de asemenea sfaturi practice. Zook și colegii săi (2017) oferă "zece reguli simple pentru o cercetare de mare responsabilitate a datelor".