Научната етика традиционно включва и теми като научна измама и разпределение на кредити. Те се обсъждат по-подробно в " Като научен сътрудник от Institute of Medicine and National Academy of Sciences and National Academy of Engineering (2009) .
Тази глава е силно повлияна от ситуацията в Съединените щати. За повече информация относно процедурите за етичен преглед в други държави, вижте глави 6-9 от Desposato (2016b) . За аргумент, че биомедицинските етични принципи, които са повлияли на тази глава, са прекалено американски, виж Holm (1995) . За допълнителен исторически преглед на институционалните прегледи в САЩ, вижте Stark (2012) . Списанието PS: Политически науки и политика проведе професионален симпозиум за връзката между политолозите и IRB; вижте Martinez-Ebers (2016) за резюме.
В доклада "Белмонт" и в следващите регламенти в Съединените щати се прави разлика между изследване и практика. Не съм направил такова разграничение в тази глава, защото мисля, че етичните принципи и рамки се отнасят и за двете настройки. За повече информация относно това разграничение и проблемите, които въвежда, вижте Beauchamp and Saghai (2012) , MN Meyer (2015) , boyd (2016) , и Metcalf and Crawford (2016) .
За повече информация относно изследователския надзор на Facebook, вижте Jackman and Kanerva (2016) . За идеи за научно-изследователски надзор в компании и НПО вижте Calo (2013) , Polonetsky, Tene, and Jerome (2015) , и Tene and Polonetsky (2016) .
Във връзка с използването на данни за мобилни телефони, за да се помогне за отстраняването на епидемията от Ебола през 2014 г. в Западна Африка (Wesolowski et al. 2014; McDonald 2016) , вижте Mayer, Mutchler, and Mitchell (2016) . За примери за по-ранни изследвания, свързани с кризата, използващи данни за мобилни телефони, вижте Bengtsson et al. (2011) и Lu, Bengtsson, and Holme (2012) , а за повече за етиката на изследванията, свързани с кризата, вижте ( ??? ) .
Много хора са написали за емоционална инфекция. Списанието изследователска етика посвети целия си въпрос през януари 2016 г., за да обсъди експеримента; вижте Hunter and Evans (2016) за общ преглед. Сборникът на Националните академични науки публикува две статии за експеримента: Kahn, Vayena, and Mastroianni (2014) и Fiske and Hauser (2014) . Други части за експеримента са: Puschmann and Bozdag (2014) , Meyer (2014) , Grimmelmann (2015) , MN Meyer (2015) , ( ??? ) , Kleinsman and Buckley (2015) , Shaw (2015) , и ( ??? ) .
По отношение на масовото наблюдение, широки обзори са предоставени в Mayer-Schönberger (2009) и Marx (2016) . За конкретен пример за променящите се разходи за наблюдение Bankston and Soltani (2013) изчисляват, че проследяването на заподозрян в престъпление, използващо мобилни телефони, е около 50 пъти по-евтино от използването на физическо наблюдение. Вижте също Ajunwa, Crawford, and Schultz (2016) за обсъждане на наблюдението на работното място. Bell and Gemmell (2009) предлагат по-оптимистична перспектива за самонаблюдение.
Освен че могат да проследяват наблюдателно поведение, което е публично или частично обществено (напр. Вкусове, връзки и време), изследователите могат все повече да заключават неща, които много участници смятат за частни. Например, Михал Косински и колеги (2013) показаха, че могат да извлекат чувствителна информация за хора като сексуална ориентация и употреба на пристрастяващи вещества от привидно обикновени цифрови данни за трасиране (Facebook Likes). Това може да звучи магически, но подходът, използван от Кошински и колеги, който комбинира цифрови следи, проучвания и контролирано обучение, всъщност е нещо, за което вече ви казах. Спомнете си, че в глава 3 (Задаване на въпроси). Казах ви, че Джошуа Блумсток и колеги (2015) съчетават данни от проучвания с данни за мобилни телефони, за да изчислят бедността в Руанда. Този точен подход, който може да се използва за ефективно измерване на бедността в развиваща се страна, може да се използва и за потенциални нарушения на неприкосновеността на личния живот.
За повече информация относно възможното неволно вторично използване на данни за здравето виж O'Doherty et al. (2016) . В допълнение към потенциала за непредвидени вторични употреби създаването на дори непълна основна база данни може да има охладително въздействие върху социалния и политическия живот, ако хората не желаят да четат определени материали или да обсъждат определени теми; виж Schauer (1978) и Penney (2016) .
В ситуации с припокриващи се правила, изследователят понякога се занимава с "регулаторно пазаруване" (Grimmelmann 2015; Nickerson and Hyde 2016) . По-конкретно, някои изследователи, които желаят да избягват IRB надзора, могат да създават партньорства с изследователи, които не са обхванати от IRB (напр. Хора в компании или неправителствени организации) и да събират и деадентифицират данните. След това изследователят, обхванат от IRB, може да анализира тези дефинирани данни без IRB надзор, тъй като изследването вече не се счита за "изследване на човешки субекти", поне според някои тълкувания на настоящите правила. Този вид укриване на IRB вероятно не е в съответствие с подход, основан на принципите на етиката в научните изследвания.
През 2011 г. усилията започнаха да актуализират общото правило и този процес бе окончателно завършен през 2017 г. ( ??? ) . За повече информация относно тези усилия за актуализиране на общото правило, вижте Evans (2013) , National Research Council (2014) , Hudson and Collins (2015) и Metcalf (2016) .
Класическият подход, базиран на принципите на биомедицинската етика, е този на Beauchamp and Childress (2012) . Те предлагат четири основни принципа да ръководят биомедицинската етика: Зачитане на автономията, немалността, ползата и справедливостта. Принципът на немалността принуждава човек да се въздържи да причини вреда на други хора. Тази концепция е дълбоко свързана с хипократическата идея "Да не се навреди". В научната етика този принцип често се комбинира с принципа на ползата, но вижте глава 5 от @ beauchamp_principles_2012 за повече разграничение между двете. За критика, че тези принципи са прекалено американски, виж Holm (1995) . За повече информация относно балансирането, когато принципите са в конфликт, вижте Gillon (2015) .
Четирите принципа в тази глава бяха предложени и за насочване на етичния надзор върху изследванията, извършвани в компании и неправителствени организации (Polonetsky, Tene, and Jerome 2015) чрез органи, наречени "Комитети за преглед на потребителите" (CALO (Calo 2013) .
В допълнение към уважението към автономията, Докладът на Белмонт също признава, че не всеки човек е способен на истинско самоопределение. Например, децата, хората, страдащи от заболяване, или хората, живеещи в ситуации на строго ограничена свобода, може да не могат да действат като напълно автономни лица, поради което тези хора са обект на допълнителна защита.
Прилагането на принципа за зачитане на личността в цифровата ера може да бъде предизвикателство. Например, при изследванията в областта на цифровите технологии може да бъде трудно да се осигурят допълнителни защити за хора с намалена способност за самоопределение, тъй като изследователите често знаят много малко за своите участници. Освен това информираното съгласие в социалните изследвания в областта на цифровите технологии е огромно предизвикателство. В някои случаи наистина информираното съгласие може да страда от парадокса на прозрачността (Nissenbaum 2011) , където информацията и разбирането са в конфликт. Приблизително, ако изследователите предоставят пълна информация за същността на събирането на данни, анализа на данните и практиките за сигурност на данните, за много участници ще бъде трудно да ги разберат. Но ако изследователите предоставят разбираема информация, може да липсват важни технически подробности. В медицинските изследвания в аналогичната епоха - доминиращата ситуация, разгледана в Доклада "Белмонт" - би могло да се предположи, че един лекар говори индивидуално с всеки участник, за да помогне за разрешаването на парадокса за прозрачност. В онлайн проучвания, включващи хиляди или милиони хора, такъв подход "лице в лице" е невъзможен. Вторият проблем със съгласието в цифровата е, че в някои проучвания, като например анализи на масивни хранилища за данни, би било непрактично да се получи информирано съгласие от всички участници. Обсъждам тези и други въпроси относно информираното съгласие по-подробно в раздел 6.6.1. Въпреки тези трудности, трябва да помним, че информираното съгласие не е нито необходимо, нито достатъчно за зачитане на личността.
За повече информация относно медицинските изследвания преди информирано съгласие вижте Miller (2014) . За лечение на информирано съгласие в книгата виж Manson and O'Neill (2007) . Вижте също предложените показания за информираното съгласие по-долу.
Уврежданията в контекста са вредите, които изследването може да причини не на конкретни хора, а на социални настройки. Тази концепция е малко абстрактна, но ще я илюстрирам с класически пример: проучването на журито в Уичита (Vaughan 1967; Katz, Capron, and Glass 1972, chap. 2) понякога се нарича проект за жури в Чикаго (Cornwell 2010) . В това изследване, изследователи от Чикагския университет, като част от по-задълбочено проучване на социалните аспекти на правната система, тайно записаха шест заседания на жури в Уичита, Канзас. Съдиите и адвокатите по делата са одобрили записите и е имало строг надзор над процеса. Въпреки това съдебните заседатели не са знаели, че са настъпили записи. След като изследването беше открито, имаше публично недоволство. Министерството на правосъдието започна проучване на изследването и изследователите бяха призовани да свидетелстват пред Конгреса. В крайна сметка Конгресът прие нов закон, който го прави незаконно да тайно записва съвещанията на журито.
Загрижеността на критиците на проучването на журито в Уичита не е рискът от увреждане на участниците; по-скоро, рискът от вреди е в контекста на обсъждането на журито. Тоест, хората смятат, че ако членовете на журито не вярват, че провеждат дискусии в безопасно и защитено пространство, ще бъде по-трудно дебатите на жури да продължат в бъдеще. В допълнение към дискусията на журито съществуват и други специфични социални контексти, които обществото осигурява с допълнителна защита, като взаимоотношения между адвокати и клиенти и психологически грижи (MacCarthy 2015) .
Рискът от вреди на контекста и разрушаването на социалните системи също възниква в някои полеви експерименти в политическите науки (Desposato 2016b) . За пример за по-чувствително към контекста изчисление на разходите и ползите за полеви експеримент в политическите науки, вижте Zimmerman (2016) .
Обезщетението за участниците е обсъдено в редица настройки, свързани с изследванията в областта на цифровите технологии. Lanier (2014) предлага участниците да плащат за цифрови следи, които генерират. Bederson and Quinn (2011) обсъждат плащанията в онлайн пазарите на труда. Накрая, Desposato (2016a) предлага участниците в платените експерименти. Той посочва, че дори ако участниците не могат да бъдат изплащани директно, може да се направи дарение на група, която работи от тяхно име. Например, в Encore, изследователите биха могли да дадат дарение на група, която работи в подкрепа на достъпа до интернет.
Договорите за сключване на договори трябва да имат по-малка тежест, отколкото договорите, договорени между равните страни, а не законите, създадени от законните правителства. Ситуациите, в които изследователите са нарушили договорите за услуги в миналото, обикновено включват използването на автоматизирани заявки за одит на поведението на компаниите (подобно на полеви експерименти за измерване на дискриминацията). За допълнителни дискусии виж Vaccaro et al. (2015) , Bruckman (2016a) и Bruckman (2016b) . За пример на емпирични изследвания, които обсъждат условията на услугата, вижте Soeller et al. (2016) . За повече информация относно възможните правни проблеми, пред които са изправени изследователите, ако нарушават условията за ползване, вижте Sandvig and Karahalios (2016) .
Очевидно е написано огромно количество за последователността и деонтологията. За пример за това как тези етични рамки и други могат да бъдат използвани за разсъждения за изследвания в областта на цифровите технологии, виж Zevenbergen et al. (2015) . За пример как те могат да бъдат приложени към полеви експерименти в икономиката на развитието, вижте Baele (2013) .
Повече за одитните проучвания на дискриминацията вижте Pager (2007) и Riach and Rich (2004) . Не само, че тези проучвания не са информирали съгласието, те включват и измама без разяснение.
Както Desposato (2016a) и Humphreys (2015) предлагат съвети за полеви експерименти без съгласие.
Sommers and Miller (2013) преразглеждат много аргументи в полза на това да не се обсъждат участниците след измама и да се твърди, че изследователите трябва да се откажат от дискусията
"При много тесни обстоятелства, а именно в областта на изследванията, при които дебатирането създава значителни практически бариери, но изследователите няма да се притесняват да се запитат, ако могат. На изследователите не бива да се позволява да се отказват от дискусията, за да запазят пул от наивни участници, да се предпазват от гнева на участниците или да предпазват участниците от увреждане.
Други твърдят, че в някои ситуации, ако дебатирането причинява повече вреда, отколкото добро, то трябва да се избягва (Finn and Jakobsson 2007) . Обяснението е случай, при който някои изследователи отдава приоритет на Respect for Persons over Beneficience, докато някои изследователи правят обратното. Едно от възможните решения е да се намерят начини да се направи обзор на учебния опит на участниците. Тоест, вместо да мислим, че обсъждането е нещо, което може да причини вреда, може би дебатирането също може да бъде от полза за участниците. За пример за този вид образователна дискусия виж Jagatic et al. (2007) . Психолозите са разработили техники за (DS Holmes 1976a, 1976b; Mills 1976; Baumrind 1985; Oczak and Niedźwieńska 2007) , а някои от тях могат да бъдат полезно прилагани при изследванията в областта на цифровите технологии. Humphreys (2015) предлага интересни мисли за отложеното съгласие , което е тясно свързано с стратегията за оповестяване, която описах.
Идеята за искане на извадка от участници за тяхното съгласие е свързана с това, което Humphreys (2015) нарича изрично съгласие .
Друга идея, свързана с информирано съгласие, която беше предложена, е да се създаде група хора, които да се съгласят да бъдат в онлайн експерименти (Crawford 2014) . Някои твърдят, че този панел ще бъде неразбираема извадка от хора. Но глава 3 (Въпроси за запитване) показва, че тези проблеми са потенциално адресируеми, като се използва пост-стратификация. Също така, съгласието да бъдете в панела може да обхване различни експерименти. С други думи, участниците може да не е необходимо да съгласуват всеки експеримент поотделно - понятие, наречено широко съгласие (Sheehan 2011) . За повече информация относно разликите между еднократното съгласие и съгласието за всяко изследване, както и за възможния хибрид, вижте Hutton and Henderson (2015) .
Изключително уникално, наградата Netflix илюстрира важна техническа собственост на набори от данни, които съдържат подробна информация за хората, и по този начин предлага важни уроци за възможността за "анонимизиране" на модерните социални набори от данни. Файловете с много информация за всеки човек вероятно ще бъдат редки , в смисъла, определен официално в Narayanan and Shmatikov (2008) . Това означава, че за всеки запис няма данни, които да са еднакви, и всъщност няма сходни записи: всеки човек е далече от най-близкия си съсед в набора от данни. Можем да си представим, че данните, Netflix може да са оскъдни, тъй като с около 20 000 филми на петзвезден скала, има около \(6^{20,000}\) възможни стойности, които всеки човек може да има (6, тъй като, в допълнение към 1, за да 5 звезди, някой може да не е оценил филма изобщо). Този номер е толкова голям, че е трудно да се разбере.
Sparsity има две основни последици. Първо, това означава, че опитът да се "анонимизира" наборът от данни въз основа на произволно смущение вероятно ще се провали. Тоест, дори и Netflix да коригира случайно някои от рейтингите (които са го направили), това няма да е достатъчно, защото разрушения запис е все още възможно най-близко до информацията, която нападателят има. Второ, осмислеността означава, че е възможна повторна идентификация, дори ако нападателят има несъвършено или безпристрастно познание. Например, в данните за Netflix, нека си представим, че нападателят знае вашите рейтинги за два филма и датите, на които сте направили тези рейтинги \(\pm\) 3 дни; само тази информация е достатъчна, за да идентифицира уникално 68% от хората в данните на Netflix. Ако атакуващият знае осем филма, които сте оценили \(\pm\) 14 дни, тогава дори ако две от тези известни оценки са напълно грешни, 99% от записите могат да бъдат уникално идентифицирани в масива от данни. С други думи, огромността е основен проблем за усилията за "анонимност" на данните, което е жалко, защото повечето модерни социални набори от данни са редки. За повече информация относно "анонимизирането" на оскъдни данни, вижте Narayanan and Shmatikov (2008) .
Телефонните метаданни също могат да изглеждат "анонимни" и не чувствителни, но това не е така. Телефонните метаданни са идентифицируеми и чувствителни (Mayer, Mutchler, and Mitchell 2016; Landau 2016) .
На фигура 6.6 начертах компромис между риска за участниците и ползите за обществото от предаването на данни. За сравнение между подходи с ограничен достъп (напр. Градина с ограда) и подходи с ограничена информация (например, някаква форма на "анонимизиране"), вижте Reiter and Kinney (2011) . За предложената система за категоризация на нивата на риска от данни вижте Sweeney, Crosas, and Bar-Sinai (2015) . За повече обща дискусия за споделянето на данни, вижте Yakowitz (2011) .
За по-подробен анализ на този компромис между риска и полезността на данните вижте Brickell and Shmatikov (2008) , Ohm (2010) , Reiter (2012) , Wu (2013) и Goroff (2015) . За да видите, че този компромис се прилага към реални данни от масови открити онлайн курсове (MOOCs), вижте Daries et al. (2014) и Angiuli, Blitzstein, and Waldo (2015) .
Диференциалната неприкосновеност на личния живот също предлага алтернативен подход, който може да съчетае както ниския риск за участниците, така и голяма полза за обществото; виж Dwork and Roth (2014) и Narayanan, Huey, and Felten (2016) .
За повече информация относно концепцията за лична идентификация на информацията, която е в основата на много от правилата за етика в научните изследвания, вижте Narayanan and Shmatikov (2010) и Schwartz and Solove (2011) . За повече информация относно всички потенциално чувствителни данни вижте Ohm (2015) .
В този раздел съм описал свързването на различни набори от данни като нещо, което може да доведе до информационен риск. Тя обаче може да създаде нови възможности за научни изследвания, както се твърди в Currie (2013) .
За повече информация относно петте сейфове вижте Desai, Ritchie, and Welpton (2016) . За пример как могат да бъдат идентифицирани резултатите, вижте Brownstein, Cassa, and Mandl (2006) , които показват как могат да се идентифицират картите на разпространението на болестите. Dwork et al. (2017) също разглеждат атаките срещу обобщени данни, като например статистически данни за това колко души имат определена болест.
Въпросите относно използването на данни и разпространението на данни също повдигат въпроси относно собствеността върху данните. За повече информация относно собствеността върху данните вижте Evans (2011) и Pentland (2012) .
Warren and Brandeis (1890) са важна правна статия за неприкосновеността на личния живот и най-често се свързват с идеята, че личната неприкосновеност е право да бъде оставена сама. Solove (2010) третиране на личния живот, което бих препоръчал, включва Solove (2010) и Nissenbaum (2010) .
За преглед на емпиричните изследвания за това как хората мислят за неприкосновеността на личния живот, вижте Acquisti, Brandimarte, and Loewenstein (2015) . Phelan, Lampe, and Resnick (2016) предлагат теория на две системи - че хората понякога се съсредоточават върху интуитивни тревоги и понякога се фокусират върху размисли, за да обяснят как хората могат да направят очевидно противоречиви твърдения за неприкосновеността на личния живот. За повече информация относно идеята за поверителност в онлайн настройки като Twitter, вижте Neuhaus and Webmoor (2012) .
Списанието " Наука" публикува специална секция, озаглавена "Краят на поверителността", която разглежда въпросите за неприкосновеността на личния живот и информационния риск от различни гледни точки; за обобщение вижте Enserink and Chin (2015) . Calo (2011) предлага рамка за мислене за вредите, които идват от нарушенията на неприкосновеността на личния живот. Ранен пример за загриженост за неприкосновеността на личния живот в самото начало на цифровата епоха е " Packard (1964) .
Едно предизвикателство, когато се опитваме да прилагаме стандарта за минимален риск, е, че не е ясно кой ежедневен живот да се използва за сравнителен анализ (National Research Council 2014) . Например бездомните хора имат по-високи нива на дискомфорт в ежедневието си. Но това не означава, че е етично допустимо излагането на хора без дом на изследвания с по-висок риск. Поради тази причина изглежда, че има нарастващ консенсус, че минималният риск трябва да бъде сравняван с стандарта за общата популация , а не със стандарта за конкретен население . Въпреки че като цяло съм съгласен с идеята за стандартите за обща популация, мисля, че за големи онлайн платформи като Facebook, стандартът за конкретен население е разумен. По този начин, когато разглеждаме емоционалната зараза, мисля, че е разумно да се сравнява с ежедневния риск на Facebook. Стандартът за конкретното население в този случай е много по-лесен за оценка и е малко вероятно да противоречи на принципа на правосъдието, който има за цел да попречи на несправедливостта на изследванията върху групите в неравностойно положение (например затворници и сираци).
Други учени също призоваха за повече статии, които да включват етични допълнения (Schultze and Mason 2012; Kosinski et al. 2015; Partridge and Allman 2016) . King and Sands (2015) също предлага практически съвети. Заук и колегите му (2017) предлагат "десет прости правила за отговорно изследване на големи данни".