Axborot xavfi ijtimoiy tadqiqotlarda eng ko'p uchraydigan xavf hisoblanadi; u sezilarli darajada oshdi; va bu tushunishning eng xavfi.
Raqamli yoshdagi tadqiqotlarni o'tkazishning ikkinchi axloqiy muammo axborot xatarlari , axborotni oshkor qilishdan zararlanish salohiyati (National Research Council 2014) . Shaxsiy ma'lumotlarni oshkor qilishdan kelib chiqqan axborot zarari iqtisodiy (masalan, ishni yo'qotish), ijtimoiy (masalan, noqulaylik), psixologik (masalan, depressiya) yoki hatto jinoyatchi (masalan, noqonuniy harakatlar uchun hibs) bo'lishi mumkin. Afsuski, raqamli yosh axborot xavfini sezilarli darajada oshiradi - xatti-harakatlarimiz haqida juda ko'p ma'lumot mavjud. Axborot xavfi, jismoniy xavf kabi analogiy yoshdagi ijtimoiy tadqiqotlar bilan bog'liq bo'lgan xatarlarga nisbatan tushunish va boshqarish juda qiyin.
Ijtimoiy tadqiqotchilar axborot xavfini kamaytirish bir yo'li ma'lumotlar "anonimleştirme" dir. "Anonimleştirme" kabi nomi, manzili va ma'lumotlarni telefon raqami kabi ochiq-oydin shaxsiy identifikatorlari olishdan jarayoni. Biroq chuqur va tubdan cheklangan, bu yondashuv, ko'p odamlar tushunib ancha kam samarali bo'lib, u aslida, deb. Men tasvirlab qachon bu jarayon anonimlik qiyofasini emas, balki haqiqiy anonimlik yaratadi deb Shuning uchun, "anonimleştirme," Men sizni eslatib qo'shtirnoqlar foydalanish olaman.
"Anonimlashtirish" ning muvaffaqiyatsizligining yorqin misollari 1990 yillar oxiridan Massachusetts shtatida (Sweeney 2002) . Guruhni sug'urtalash bo'yicha komissiya (GIC) barcha davlat xizmatchilari uchun tibbiy sug'urta sotib olish uchun mas'ul bo'lgan davlat idorasi bo'ldi. Ushbu ish orqali GIC minglab davlat xizmatchilariga tegishli batafsil ma'lumotni to'playdi. Tadqiqotlarni kuchaytirish maqsadida GIC bu yozuvlarni tadqiqotchilarga topshirishga qaror qildi. Biroq, ular barcha ma'lumotlarini ulashmagan; Aksincha, bu ma'lumotlarni nomlari va manzillari kabi ma'lumotlarni olib tashlash orqali "anonimlashtiradilar". Ammo demografik ma'lumotlar (pochta indeksi, tug'ilgan sanasi, etnik kelib chiqishi va jinsi) va tibbiy ma'lumot (tashrif ma'lumoti, tashxis, protsedura) kabi tadqiqotchilar uchun foydali bo'lishi mumkin bo'lgan boshqa ma'lumotlarni qoldirib ketgan (6.4-rasm) (Ohm 2010) . Afsuski, bu "anonimlashtirish" ma'lumotlarni himoya qilish uchun etarli emas edi.
GICning «anonimlashtirish» kamchiliklarini misol qilib keltirish uchun MITning aspiranti Lataniya Sweeney 20 yil to'ladi. Bu ro'yxatni Massachusets shtatining gubernatori Uilyam Veld shahridan Kembridj shahridan olish mumkin. Ushbu ovoz berish yozuvlari, ism, manzil, pochta indeksi, tug'ilgan sanasi va jinsi kabi ma'lumotlarni o'z ichiga olgan. Tibbiy ma'lumotlar fayli va saylovchilarning fayllari bilan birgalikda foydalanilganligi - zip kodi, tug'ilgan sanasi va jinsi - Sweeney ularni bog'lashi mumkin degan ma'noni anglatadi. Sweeney Weldning tug'ilgan kunining 31 iyul 1945 yilligini bilar edi va ovoz berish yozuvlarida Kembrijda faqatgina olti kishi tug'ilgan. Bundan tashqari, o'sha oltita odamning uchtasi erkak edi. Va bu uch kishidan faqatgina Weldning pochta kodini almashdilar. Shunday qilib, ovoz berish ma'lumotlari Weldning tug'ilgan kun, jins va ZIP kodlari bilan birga tibbiy ma'lumotlarning har birida Uilyam Ueld ekanligini ko'rsatdi. Aslini olganda, bu uchta ma'lumot uning uchun yagona barmoq izini taqdim etdi. Ushbu haqiqatni qo'llash orqali Sweeney Weldning tibbiy yozuvlarini topishga muvaffaq bo'ldi va unga o'z yutuqlari haqida xabar berish uchun unga o'z yozuvlarining bir nusxasini yubordi (Ohm 2010) .
Sweeney ishi qayta identifikatsiya qilish hujumlarining asosiy tarkibiy qismini - kompyuter xavfsizligi jamiyatidan bir so'zni qabul qilishni ko'rsatadi. Ushbu hujumlarda ikkita ma'lumotlar to'plami mavjud bo'lib, ulardan ikkitasi hususiy axborotni oshkor qilmaydi va bu aloqalar orqali sezgir ma'lumotlar oshkor etiladi.
Sweeneyning ishi va boshqa shunga o'xshash ishlarga javoban, tadqiqotchilar, umuman olganda, "shaxsiy identifikatsion ma'lumot" (PAYI) (Narayanan and Shmatikov 2010) - "yashirish" jarayoni haqida ko'proq ma'lumotni olib tashlashmoqda. Bundan tashqari, ko'plab tadqiqotchilar hozirda ma'lum ma'lumotlar, masalan, tibbiy yozuvlar, moliyaviy yozuvlar, noqonuniy xatti-harakatlarga oid so'rovlar savollariga javoblar "anonimlashtirish" dan keyin ham ozodlikka chiqarilishi juda sezgirdir. Biroq, men ijtimoiy tadqiqotchilarga ularning fikrlashlarini o'zgartirish. Birinchi qadam sifatida, barcha ma'lumotlar potentsial identifikatsiyalanadigan va barcha ma'lumotlar potentsial sezgirligini taxmin qilish oqilona. Boshqacha qilib aytadigan bo'lsak, axborot xavfi loyihalarning kichik hajmiga to'g'ri kelmaydi, deb o'ylashdan ko'ra, biz uni bir darajaga qadar - barcha loyihalarga nisbatan qo'llashi kerak.
Ushbu yo'nalishni ikki jihati ham Netflix mukofoti bilan tasvirlangan. 5-bobda aytib o'tilganidek, Netflix deyarli 500,000 a'zo tomonidan taqdim etilgan 100 million kino reytingini e'lon qildi va butun dunyodagi odamlar Netflixning filmlarni tavsiya etish qobiliyatini yaxshilash algoritmlarini taqdim etgan ochiq muloqotga kirishdi. Ma'lumotlar chiqarilishidan avval, Netflix ismlar kabi aniq shaxslarni aniqlaydigan har qanday ma'lumotlarni o'chirib tashladi. Bundan tashqari, ular qo'shimcha qadam tashladilar va ayrim yozuvlarda (misol uchun, 4-yulduzdan 3-yulduzgacha bo'lgan ba'zi baholarni o'zgartiradilar) ozgina chayqalishlar kiritdi. Tez orada ular o'zlarining sa'y-harakatlariga qaramasdan, ma'lumotlar hali ham anonim tarzda topilmadi.
Arvind Narayanan va Vitaliy Shmatikov (2008) ma'lumotlarning nashr etilganidan atigi ikki hafta o'tgach, muayyan odamlarning kino afzal ko'rganlarini o'rganish mumkinligini ko'rsatdi. Ularning identifikatsiyalash hujumiga aldov yo'li Sweeneyga o'xshardi: ikkita axborot manbasini birlashtira oladigan, potensial sezgir ma'lumotga ega va hech kim aniqlanmagan ma'lumot va odamlarning identifikatorlarini o'z ichiga olgan. Ushbu ma'lumot manbalarining har biri alohida xavfsiz bo'lishi mumkin, lekin birlashtirilganda, birlashtirilgan ma'lumotlar to'plami axborot xavfini yuzaga keltirishi mumkin. Netflix ma'lumotlariga ko'ra, bu qanday sodir bo'lishi mumkin. Tasavvur qiling, mening aktyorlarim bilan operatsiya va komediya filmlari haqidagi fikrlarni o'rtoqlashni tanladim, lekin men diniy va siyosiy filmlar haqida fikr almashishni afzal ko'raman. Mening hamkorlarim Netflix ma'lumotlarimdagi yozuvlarni topish uchun ular bilan birgalikda bergan ma'lumotlardan foydalanishi mumkin; Uilyam Ueldning tug'ilgan sanasi, pochta indeksi va jinsiy aloqa kabi yagona barmoq izi bo'lishi mumkin. Keyinchalik, agar ular mening noyob barmoq izim ma'lumotlarini topsalar, ular barcha filmlar, jumladan, filmlarni baham ko'rishni istamagan filmlar haqida ma'lumot olishlari mumkin. Narayanan va Shmatikov bir kishiga qaratilgan bunday hujumga qo'shimcha ravishda, ko'p odamlar ishtirokidagi keng hujumni amalga oshirish mumkinligini ko'rsatdi - bu Netflix ma'lumotlarini shaxsiy va kino reytinglari bilan birlashtirib, ayrim kishilar tanlagan Internet-kino bazasiga (IMDb) joylashtirish. Juda oddiygina, muayyan shaxsga xos bo'lgan barmoq izi, hatto kino baholari ham mavjud bo'lgan har qanday ma'lumot ularni aniqlash uchun ishlatilishi mumkin.
Netflix ma'lumotlarini maqsadli yoki keng ko'lamda hujumda qayta aniqlash mumkin bo'lsa-da, u hali ham past xavfga ega bo'lishi mumkin. Axir, filmlar reytinglari juda sezgir ko'rinmaydi. Umuman olganda, bu ma'lumotlar to'plamidagi 500.000 kishidan ba'zilari kino baholari juda sezgir bo'lishi mumkin. Aslida, qayta identifikatsiyalashga javoban, yopiq lezbiyen ayol Netflixga qarshi sinfda ishlaydigan kostyumga qo'shildi. Muammoni ularning da'vosida qanday ifodalangani (Singel 2009) :
"[M] ovie va reyting ma'lumotlari ... juda shaxsiy va nozik tabiat haqidagi ma'lumotlarni o'z ichiga oladi. A'zoning kino ma'lumotlari Netflix a'zosi shaxsiy qiziqish va / yoki jismoniy, jismoniy kasallik, alkogolizmdan qutulish va jabr-zulm, jismoniy zo'ravonlik, uy ichidagi zo'ravonlik, zino va zo'rlash kabi turli xil shaxsiy muammolar bilan kurashadi. "
Netflix mukofoti ma'lumotlarini qayta identifikatsiya qilish barcha ma'lumotlarning potentsial identifikatsiyalash mumkinligini va barcha ma'lumotlar potensial sezgirligini ko'rsatadi. Shu nuqtada, bu faqat odamlar haqida bo'lishi kerak bo'lgan ma'lumotlarga tegishli deb o'ylashingiz mumkin. Ajablanarlisi shundaki, bunday emas. Nyu-York shahar hukumati 2013 yil Nyu-Yorkdagi har bir taksi safari yozuvlarini, shu jumladan, qabul qilish va chiqish vaqtlarini, joylarni va narxlarni o'z ichiga olgan ma'lumotni e'lon qildi ( Farber (2015) mehnat iqtisodiyotida muhim nazariyani test qilish uchun o'xshash ma'lumotlar ishlatilgan). Taksi taksilariga tegishli bu ma'lumotlar odamlarga o'xshab ko'rinadi, chunki ular odamlar haqida ma'lumot bermayapti, ammo Antoni Toxar ushbu taksi ma'lumotlarining aslida odamlar haqida ko'plab nozik ma'lumotlarga ega ekanligini angladi. Misol uchun, u Nyu-Yorkdagi "Hustler" klubida boshlangan barcha sayohatlarni tomosha qilib, yarim tun yarmigacha soat 6 larda tomosha qilib, so'ngra ularning yopiq joylarini topdi. Ushbu qidiruv mohiyati - Hustler klubi bilan tanish bo'lgan ba'zi kishilarning ro'yxatlari (Tockar 2014) . Shahar ma'muriyatining ma'lumotni e'lon qilganida buni yodda tutishini tasavvur qilish qiyin. Aslida, bu usulni shaharning har qanday joyiga tashrif buyuradigan kishilarning uy manzillarini - tibbiy klinikani, hukumat binolarini yoki diniy muassasani topish uchun ishlatish mumkin.
Netflix mukofoti va Nyu-York shahridagi taksi ma'lumotlarining ushbu ikki holati nisbatan yuqori malakali kishilar ular chiqargan ma'lumotlar bo'yicha axborot xavfini to'g'ri baholashga imkon bermasligini ko'rsatmoqda (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Bundan tashqari, ko'plab holatlarda muammoli ma'lumotlar onlayn rejimida mavjud bo'lib, bu ma'lumotlar uzatishni bekor qilishning qiyinchiliklarini ko'rsatmoqda. Umuman olganda, bu misollar, shuningdek, shaxsiy kompyuterlar haqidagi shaxsiy tadqiqotlar muhim xulosaga olib keladi. Tadqiqotchilar barcha ma'lumotlar potentsial identifikatsiyalanuvchi va barcha ma'lumotlar potensial sezgir bo'lishi mumkin deb hisoblashlari kerak.
Afsuski, barcha ma'lumotlarning potentsial identifikatsiyalanishi va barcha ma'lumotlar potensial sezgir bo'lishi uchun faktlar bo'yicha oddiy echim yo'q. Shu bilan birga, ma'lumotlar bilan ishlayotganingizda axborot xavfini kamaytirishning bir usuli ma'lumotlarni himoya qilish rejasini yaratish va unga rioya qilishdir. Ushbu reja, sizning ma'lumotingiz oqish ehtimolini pasaytiradi va agar qochqinning paydo bo'lishi bo'lsa zararni kamaytiradi. Shifrlashning qaysi shakli ishlatilishi kabi ma'lumotlarni muhofaza qilish rejalari xususiyati vaqt o'tishi bilan o'zgaradi, biroq UK Data Services beshta kassa deb ataladigan beshta toifaga kiradi: ishonchli loyihalar, xavfsiz odamlar , xavfsiz sozlash, xavfsiz ma'lumotlar va xavfsiz chiqimlar (6.2-jadval) (Desai, Ritchie, and Welpton 2016) . Besh safardan hech biri mukammal himoya bilan ta'minlamaydi. Ammo ular birgalikda axborot xavfini kamaytiradigan kuchli omillarni to'playdilar.
Xavfsiz | Harakat |
---|---|
Xavfsiz loyihalar | Ma'lumotlar bilan loyihalarni axloqiy jihatdan cheklaydi |
Xavfsiz odamlar | Kirish ma'lumotlarga ishonish mumkin bo'lgan odamlar bilan cheklangan (masalan, axloqiy ta'lim olganlar) |
Xavfsiz ma'lumotlar | Ma'lumotlar aniqlangan va imkon qadar ilova qilingan |
Xavfsiz sozlamalar | Ma'lumotlar jismoniy (masalan, qulflangan xona) va dasturiy ta'minot (masalan, parolni himoyalash, shifrlangan) bilan himoyalangan kompyuterlarda saqlanadi |
Xavfsiz chiqish | Tadqiqot natijalari tasodifiy maxfiylikning buzilishiga yo'l qo'ymaslik uchun ko'rib chiqiladi |
Ma'lumotlardan foydalanish paytida sizning ma'lumotlaringizni himoya qilish bilan bir qatorda, axborot xavfi ayniqsa muhim bo'lgan tadqiqot jarayonida bir qadam boshqa tadqiqotchilar bilan ma'lumot almashishdir. Olimlar o'rtasida ma'lumotlar almashinuvi ilmiy ishning asosiy jihati hisoblanadi va u axborotni rivojlantirishga katta yordam beradi. Buyuk Britaniya Uylari palatasi ma'lumot almashishning muhimligini (Molloy 2011) quyidagicha bayon (Molloy 2011) :
"Tadqiqotchilar adabiyotda e'lon qilingan natijalarga ko'paytirish, tekshirish va qurish kerak bo'lsa, ma'lumotlarga kirish juda muhim. Prezumptsiya boshqacha sabab bo'lmasa, ma'lumotlar to'liq oshkor qilinishi va ommaviy ravishda e'lon qilinishi kerak ".
Shunga qaramay, ma'lumotingizni boshqa tadqiqotchilar bilan baham ko'rish orqali ishtirokchilaringiz uchun axborot xavfini ko'tarishingiz mumkin. Shunday qilib, ma'lumotlar almashinuvi boshqa olimlar bilan ma'lumotlar almashish va ishtirokchilarga axborot xavfini minimallashtirish majburiyati o'rtasida asosiy zo'riqish yaratadi. Yaxshiyamki, bu dilemma paydo bo'lgandek jiddiy emas. Aksincha, ma'lumotlar almashinuvini doimo davom etayotganligi haqida o'ylash yaxshiroqdir, bu jamiyat uchun har xil foyda keltiradigan va ishtirokchilar uchun xavf tug'diradigan har bir nuqtada (6.6-rasm).
Agar o'ta xavfli bo'lsa, ma'lumotlaringizni hech kimga taqdim eta olmaysiz, bu esa ishtirokchilarga xavfni kamaytiradi, shuningdek, jamiyatga kiradigan daromadlarni kamaytiradi. Boshqa ekstremal vaziyatda, ma'lumotlaringizni "anonimlash" va hamma uchun joylashtirilgan ma'lumotlarni qoldirib, unutib qo'yishingiz mumkin. Ma'lumotni tarqatmaslik, ozod qilish va unutib qo'yish jamiyatga yuqori foyda keltirishi va ishtirokchilarga nisbatan yuqori xavflarni taklif qiladi. Bu ikki o'ta hodisa o'rtasida gibridlar qatori mavjud, shu jumladan, devor bilan bog'langan yondashuv deb atayman. Ushbu yondashuvda ma'lumotlar muayyan mezonlarga mos keladigan va muayyan qoidalarga (masalan, IRB nazorati va ma'lumotlar muhofazasi rejasi) bog'liq bo'lishga rozi bo'lgan shaxslar bilan taqsimlanadi. Devorli bog 'yondashuvi ozod qilinishning ko'plab afzalliklarini ta'minlaydi va kamroq xavf bilan unutadi. Albatta, bunday yondoshuv ko'plab savollar tug'diradi: kimga ruxsat berish kerak, qaysi sharoitda va qanchadan qancha muddat davomida pul to'lashi kerak? Aslida, tadqiqotchilar hozirgi kunda Michigan universitetida Siyosiy va ijtimoiy tadqiqotlar bo'yicha Universitetlararo konsortsiumning ma'lumotlar arxivi kabi foydalanishlari mumkin bo'lgan devorli bog'lar mavjud.
Xo'sh, sizning tadqiqotingiz ma'lumotlarini almashish, devor bog 'bo'lmasligi va ozod qilishni unutmaslik kerak? Bu sizning ma'lumotlaringizning tafsilotlariga bog'liq: tadqiqotchilar insonlarni hurmat qilish, mehr-oqibat, adolat va qonun va jamoat manfaatlarini hurmat qilishlari kerak. Ushbu nuqtai nazardan qaraladigan bo'lsak, ma'lumotlar almashinuvi o'ziga xos axloqiy muammo emas; tadqiqotchilarning axloqiy muvozanatni to'g'ri topishlari kerak bo'lgan tadqiqotning ko'pgina jihatlaridan biridir.
Ba'zi tanqidchilar odatda ma'lumot almashishga qarshidir, chunki, mening fikrimcha, ular o'zlarining xavf-xatarlariga yo'naltirilgan bo'lib, ular shubhasiz haqiqiydir va uning foydalarini hisobga olmaydilar. Shunday qilib, ikkala xavf va foyda haqida o'ylashni rag'batlantirish uchun men o'xshashlik taklif qilmoqchiman. Har yili avtomobillar minglab o'limlar uchun mas'uldir, lekin biz avtoulovni ta'qiqlamaymiz. Aslida, haydashni taqiqlash chaqirig'i bema'nilik bo'lar edi, chunki haydovchilik ko'p ajoyib narsalarni beradi. Aksincha, jamiyat kimni boshqarishi mumkin bo'lgan cheklovlarni (masalan, muayyan yoshga ega bo'lish va muayyan testlarni o'tkazib borish) va ular qanday tezlikda harakat qilishni taqiqlaydi (masalan, tezlik chegarasi ostida). Jamiyatda ham ushbu qoidalarni bajarish vazifasi yuklangan (masalan, militsiya) va biz ularni buzayotgan odamlar jazolanadi. Jamiyatni tartibga soluvchi haydash uchun qo'llashi mumkin bo'lgan bunday muvozanatli fikrlash ma'lumot almashish uchun ham qo'llanilishi mumkin. Ya'ni, ma'lumotlarning almashinuviga qarshi yoki mutlaqo argumentlarni qo'yishdan ko'ra, biz risklarni kamaytirishga va ma'lumotlarni almashishdan qanday foyda olishimizga e'tibor qaratib, eng yuqori o'sishni ta'minlaymiz deb o'ylayman.
Xulosa qilish kerakki, axborot xavfi sezilarli darajada oshdi va taxmin qilish va miqdori juda qiyin. Shuning uchun, barcha ma'lumotlar potentsial aniqlanishi va potentsial sezgirligini taxmin qilish yaxshidir. Tadqiqot davomida axborot xavfini kamaytirish uchun tadqiqotchilar ma'lumotlarni himoya qilish rejasini yaratishi va kuzatishi mumkin. Bundan tashqari, axborot xavfi tadqiqotchilarning boshqa olimlar bilan ma'lumot almashishlariga to'sqinlik qilmaydi.