საინფორმაციო რისკი სოციალური კვლევის ყველაზე გავრცელებული რისკია; გაიზარდა დრამატულად; და ეს არის უმძიმესი რისკის გაგება.
ციფრული ასაკის კვლევის მეორე ეთიკური გამოწვევა ინფორმაციული რისკია , ინფორმაციის გამჟღავნების საშიშროების პოტენციალი (National Research Council 2014) . პერსონალური ინფორმაციის გამჟღავნებისგან მიღებული ინფორმაცია ზიანის ანაზღაურება შეიძლება იყოს ეკონომიკური (მაგალითად, სამსახურიდან დაკარგვა), სოციალური (მაგალითად, არეულობის), ფსიქოლოგიური (მაგალითად, დეპრესია) ან თუნდაც კრიმინალური (მაგალითად, უკანონო ქცევისთვის დაპატიმრება). სამწუხაროდ, ციფრული ასაკი იზრდება საინფორმაციო რისკის დრამატულად - მხოლოდ ქცევის შესახებ უფრო მეტი ინფორმაცია არსებობს. ინფორმაციულმა რისკმა დაამტკიცა ძალიან რთული გაუაზრებელი და მართოს რისკებთან შედარებით, რომლებიც დაკავშირებულია ანალოგიურ ასაკობრივ სოციალურ კვლევაში, როგორიცაა ფიზიკური რისკი.
ერთი გზა, რომ სოციალური მკვლევარები შემცირდება საინფორმაციო რისკი "anonymization" მონაცემები. "ანონიმიზების" არის პროცესი მოხსნის აშკარა საიდენტიფიკაციო როგორიცაა სახელი, მისამართი და ტელეფონის ნომერი მონაცემები. თუმცა, ეს მიდგომა ბევრად ნაკლებად ეფექტურია, ვიდრე ბევრს შეიძლება, და ეს არის, ფაქტობრივად, ღრმად და საფუძვლიანად შეზღუდულია. ამის გამო, როდესაც მე აღწერს "anonymization," მე, ბრჭყალების შეგახსენოთ, რომ ეს პროცესი ქმნის გამოჩენა ანონიმურობის მაგრამ არა ნამდვილი ანონიმურობა.
ნათელი მაგალითია "ანონიმიზაციის" მარცხი 1990-იანი წლებიდან მასაჩუსეტში (Sweeney 2002) . ჯგუფი სადაზღვევო კომისია (GIC) იყო სახელმწიფო დაწესებულება, რომელიც პასუხისმგებელია ჯანმრთელობის დაზღვევის ყველა სახელმწიფო მოხელისთვის. ამ სამუშაოს მეშვეობით, GIC- მა დეტალურად შეიმუშავა ჯანმრთელობის მდგომარეობის შესახებ ათასობით სახელმწიფო მოხელე. კვლევის გაღრმავების მიზნით, GIC- მა გადაწყვიტა მკვლევარებისთვის ამ ჩანაწერების გათავისუფლება. თუმცა, ისინი არ იზიარებენ ყველა მათ მონაცემს; უფრო მეტიც, ისინი "ანონიმებენ" ამ მონაცემებს ინფორმაციის მოხსნის გზით, როგორიცაა სახელები და მისამართები. თუმცა, მათ დატოვეს სხვა ინფორმაცია, რომ მათი აზრით, სასარგებლო იქნებოდა ისეთი მკვლევარებისთვის, როგორებიცაა დემოგრაფიული ინფორმაცია (საფოსტო კოდი, დაბადების თარიღი, ეთნიკური და სქესობრივი) და სამედიცინო ინფორმაცია (მონახულება მონაცემები, დიაგნოზი, პროცედურა) (ფიგურა 6.4) (Ohm 2010) . სამწუხაროდ, "ანონიმიზაცია" არ იყო საკმარისი იმისათვის, რომ დავიცვათ მონაცემები.
იმის გათვალისწინებით, რომ GIC- ის "ანონიმურობის" ხარვეზები, ლატანია შვეიცმა, მაშინ MIT- ის კურსდამთავრებულმა $ 20-მა გადაიხადა კემბრიჯის ქალაქ კემბრიჯის შტატის ქალაქ ვაშინგტონში მცხოვრები კენჭისყრის ჩანაწერების შეძენა. ეს კენჭისყრის ჩანაწერები მოიცავდა ინფორმაციას, როგორიცაა სახელი, მისამართი, საფოსტო კოდი, დაბადების თარიღი და სქესი. ის ფაქტი, რომ სამედიცინო მონაცემების ფაილი და ამომრჩეველი ფაილი გაიზიარა სფეროები- zip კოდი, დაბადების თარიღი, და სქესის ნიშნავდა, რომ Sweeney შეიძლება დაუკავშირონ მათ. შვეიცმა იცოდა, რომ უელდის დაბადების დღე იყო 1945 წლის 31 ივლისი, ხოლო კენჭისყრის ჩანაწერებში კემბრიჯში მხოლოდ ექვსი ადამიანი იყო, რომ დაბადების დღე. ამ ექვსივე ადამიანისგან მხოლოდ სამი მამაკაცი იყო. და, იმ სამი კაცის, მხოლოდ ერთი გაიზიარა Weld ის საფოსტო კოდი. ამრიგად, კენჭისყრის მონაცემებით, უელსის სამედიცინო მონაცემებში ვინმეს დაბადების თარიღი, სქესი და საფოსტო კოდი კომბინაცია იყო უილიამ ვედდი. არსებითად, ეს სამი ცალი ინფორმაცია მისთვის უნიკალური თითის ანაბეჭდი იყო. ამ ფაქტმა, შვეიცმა შეძლო ვერდის სამედიცინო ჩანაწერების განთავსება და მისი შეჯიბრის ინფორმირება, მან გაუგზავნა მას ჩანაწერების ასლი (Ohm 2010) .
Sweeney- ის ნაწარმოები გვიჩვენებს, რომ ხელახალი საიდენტიფიკაციო თავდასხმების ძირითადი სტრუქტურაა - კომპიუტერული უსაფრთხოების საზოგადოებიდან მიღებული ვადა. ამ თავდასხმებს, ორი მონაცემების კომპლექტი, რომელთაგან არც თავად გამოხატავს მგრძნობიარე ინფორმაციას, უკავშირდება და ამ კავშირის მეშვეობით მგრძნობიარე ინფორმაცია იკვეთება.
Sweeney- ის მუშაობისა და მასთან დაკავშირებული სხვა სამუშაოების საპასუხოდ, ზოგადად, ზოგადად, (Narayanan and Shmatikov 2010) - "ანონიმურობის" პროცესის ყველა ე.წ. "პერსონალური საიდენტიფიკაციო ინფორმაცია" (PII) (Narayanan and Shmatikov 2010) . მიხვდებიან, რომ გარკვეული მონაცემები, როგორიცაა სამედიცინო ჩანაწერები, ფინანსური ჩანაწერები, უკანონო ქცევის შესახებ კითხვების დასმის პასუხები - ალბათ ძალიან მგრძნობიარეა "ანონიმიზაციის" შემდეგაც კი გათავისუფლება. თუმცა, მაგალითები, რომელიც მე ვაძლევ იმის საშუალებას, რომ სოციალური მკვლევარები შეცვალოს მათი აზროვნება. როგორც პირველი ნაბიჯი, გონივრულია ვივარაუდოთ, რომ ყველა მონაცემები პოტენციურად იდენტიფიცირებულია და ყველა მონაცემები პოტენციურად მგრძნობიარეა. სხვა სიტყვებით რომ ვთქვათ, ინფორმაციული რისკი ვრცელდება პროექტების მცირე ნაწილად, უნდა ვივარაუდოთ, რომ ეს ეხება გარკვეულწილად - ყველა პროექტს.
ამ რეორგანიზაციის ორივე ასპექტი ილფლის პრიზითაა წარმოდგენილი. როგორც მე -5 თავშია აღწერილი, Netflix- მა გამოაქვეყნა 500 მილიონიანი ფილმების რეიტინგი, რომელიც 500 000-ზე მეტ წევრს გაუტოლდა და ღია ზარი ჰქონდა, სადაც მთელი მსოფლიოს მასშტაბით წარმოდგენილ ალგორითებს წარმოადგენდნენ, რომლებმაც შეიძლება გააუმჯობესონ Netflix- ის რეკომენდაციები. მონაცემთა გათავისუფლების დაწყებამდე Netflix ამოიღეს რაიმე აშკარა პირადობის საიდენტიფიკაციო ინფორმაცია, როგორიცაა სახელები. გარდა ამისა, ისინი დამატებით ნაბიჯს გადადიოდნენ და ზოგიერთ ჩანაწერში (მაგ., 4 რეიტინგიდან 3 ვარსკვლავს გადადიან). მალევე აღმოაჩინეს, რომ მიუხედავად მცდელობისა, მონაცემები ჯერ კიდევ არ არის ანონიმური.
მონაცემების გამოქვეყნებიდან ორი კვირის შემდეგ, არვინდ ნარკოიანმა და ვიტალი შმატიკოვმა (2008) აჩვენეს, რომ შესაძლებელი იყო კონკრეტული ადამიანების ფილმის პრეფერენციების შესახებ. მათი ხელახლა საიდენტიფიკაციო თავდასხმის ტრიუკი იყო შვეიცარიის მსგავსი: შერწყმა ორი საინფორმაციო წყარო, ერთი პოტენციურად მგრძნობიარე ინფორმაცია და აშკარად არ იდენტიფიცირებადი ინფორმაცია და ერთი, რომელიც შეიცავს ადამიანების იდენტობას. თითოეული ეს მონაცემები შეიძლება ინდივიდუალურად იყოს უსაფრთხო, მაგრამ როდესაც ისინი კომბინირებულნი არიან, შერწყმული მონაცემთა ნაკრებს შეუძლია შექმნას საინფორმაციო რისკი. იმ შემთხვევაში, თუ Netflix მონაცემები, აქ არის, თუ როგორ შეიძლება მოხდეს. წარმოიდგინეთ, რომ ჩემი აზრების გაზიარება ჩემი ქმედებებისა და კომედიების შესახებ ჩემს თანამშრომლებთან ერთად, მაგრამ მე არ მიმაჩნია, რომ ჩემი მოსაზრება რელიგიურ და პოლიტიკურ ფილმებზე არ გაიზიაროს. ჩემს თანამშრომელს შეეძლო მათთან დაკავშირებული ინფორმაცია, რომლითაც მე მქონდა გაზიარება ჩემი ჩანაწერების მოძიება Netflix მონაცემებში; ინფორმაცია, რომელიც მე ვიზიარებ, შეიძლება უნიკალური თითის ანაბეჭდი, ისევე როგორც უილიამ უდდის დაბადების თარიღი, საფოსტო კოდი და სექსი. შემდეგ, თუ ისინი ჩემს უნიკალურ ანაბეჭდიში აღმოჩენილიყვნენ, მათ შეეძლოთ ყველა რეიტინგის შესახებ ვისწავლოთ ჩემი ფილმები, მათ შორის ფილმები, რომელთა არჩევა არ შემიძლია. ამ ტიპის მიზანშეწონილ თავდასხმასთან ერთად, ერთი ადამიანის მიმართ განხორციელებული თავდასხმის გარდა , ნარიანაანმა და შმატიკოვმა ასევე აჩვენეს, რომ შესაძლებელი იყო ფართომასშტაბიანი თავდასხმის გაკეთება, რაც ბევრ ადამიანს მოიცავს - Netflix- ის მონაცემებით პერსონალური და კინემატოგრაფიული მონაცემების შერწყმით, გამოაგზავნოთ ინტერნეტ კინოს მონაცემთა ბაზაში (IMDb). უბრალოდ, ნებისმიერი ინფორმაცია, რომელიც უნიკალურია თითის ანაბეჭდის სპეციფიკური პიროვნება, შეიძლება მათი ფილმის რეიტინგებიც კი გამოვიყენოთ.
მიუხედავად იმისა, რომ Netflix მონაცემები შეიძლება განისაზღვროს ან მიზანმიმართულად ან ფართომასშტაბიანი თავდასხმით, ის მაინც დაბალი რისკის ქვეშ აღმოჩნდება. ყოველივე ამის შემდეგ, ფილმის რეიტინგები ძალიან მგრძნობიარე არ არის. მიუხედავად იმისა, რომ ეს შეიძლება იყოს ჭეშმარიტი ზოგადად, ზოგიერთი 500,000 ადამიანი მონაცემთა ნაკრებს, ფილმის რეიტინგები შეიძლება იყოს საკმაოდ მგრძნობიარე. სინამდვილეში, ხელახალი იდენტიფიკაციის საპასუხოდ, დახურულ ლესბოსელ ქალბატონს შეუერთდა კლას-მოქმედების სარჩელი Netflix- ის წინააღმდეგ. აი, როგორ გამოიკვეთა პრობლემა მათი სარჩელით (Singel 2009) :
"[M] ovie და სარეიტინგო მონაცემები შეიცავს ინფორმაციას ... უაღრესად პირადი და მგრძნობიარე ბუნება. წევრი ფილმის მონაცემები ასახავს Netflix- ის პირად ინტერესს და / ან ებრძვის სხვადასხვა უაღრესად პერსონალურ საკითხებს, მათ შორის სექსუალობას, ფსიქიკურ ავადმყოფობას, ალკოჰოლიზმისგან აღდგენას და ინვალიდობის, ფიზიკური შეურაცხყოფის, ოჯახური ძალადობის, მრუშობისა და გაუპატიურების მსხვერპლს.
Netflix Prize- ის მონაცემების ხელახალი იდენტიფიკაცია გვიჩვენებს, რომ ყველა მონაცემები პოტენციურად იდენტიფიცირებულია და ყველა მონაცემები პოტენციურად მგრძნობიარეა. ამ ეტაპზე შეიძლება ფიქრობთ, რომ ეს მხოლოდ იმ მონაცემებს ეხება, რომლებიც ხალხზეა დამოკიდებული. გასაკვირი არ არის, რომ ეს ასე არ არის. ინფორმაციის თავისუფლების მოთხოვნის საპასუხოდ ნიუ იორკის მთავრობამ 2013 წელს ნიუ-იორკში ყველა ტაქსის რეისი გაათავისუფლა, მათ შორის პიკაპის და ჩამოსაშლელი დროები, ადგილები და მგზავრობის თანხები (გავიხსენოთ თავი 2, რომ Farber (2015) გამოიყენა მსგავსი მონაცემები შრომის ეკონომიკაში მნიშვნელოვანი თეორიების შესამოწმებლად). ეს მონაცემები ტაქსით მოგზაურობის შესახებ შესაძლოა, როგორც ჩანს, კეთილგანწყობილია, რადგან ისინი არ იძლევიან ხალხის შესახებ ინფორმაციის მიწოდებას, მაგრამ ენტონი თოკარი მიხვდა, რომ ამ ტაქსის მონაცემებით რეალურად შეიცავდა უამრავი პოტენციურად მგრძნობიარე ინფორმაცია ხალხის შესახებ. ილუსტრაციის მიზნით, ის ჰუსტლერ კლუბის დაწყებამდე იმოგზაურა ნიუ-იორკში დიდი ზოლებიანი კლუბის შუაღამისას და შუაღამისას 6 საათზე და შემდეგ იპოვა მათი ჩამოსაშლელი ადგილები. ამ ძიებამ გამოავლინა - არსებითად - ზოგიერთი ადამიანების მისამართები, რომლებიც ხშირად იყვნენ ჰუსტლერი კლუბის (Tockar 2014) . ძნელი წარმოსადგენია, რომ ქალაქის მთავრობამ ეს მხედველობაში მიიღო, როდესაც მონაცემები გაათავისუფლეს. სინამდვილეში, ამ მეთოდის გამოყენება შეიძლება გამოყენებულ იქნეს იმ ადამიანების მისამართებზე, რომლებიც ქალაქის ნებისმიერ ადგილას იმყოფებიან-სამედიცინო კლინიკა, სამთავრობო შენობა ან რელიგიური დაწესებულება.
ნეტფქსის პრიზისა და ნიუ-იორკის ტაქსების მონაცემების ორი შემთხვევა აჩვენებს, რომ შედარებით გამოცდილი ადამიანები ვერ ახერხებენ სათანადოდ შეაფასონ ინფორმაციული რისკი იმ მონაცემებში, რომლებიც გათავისუფლდებიან და ეს შემთხვევები არ არის უნიკალური (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . გარდა ამისა, ბევრ ასეთ შემთხვევაში, პრობლემატური მონაცემები კვლავაც თავისუფლად ხელმისაწვდომია ინტერნეტში, რაც გვიჩვენებს მონაცემების გათავისუფლების გაუქმებას. კოლექტიურად, ეს მაგალითები, ისევე როგორც კომპიუტერულ მეცნიერებათა კვლევა კონფიდენციალურობის შესახებ მნიშვნელოვან დასკვნამდე. მკვლევარებმა უნდა იფიქრონ, რომ ყველა მონაცემები პოტენციურად იდენტიფიცირებულია და ყველა მონაცემები პოტენციურად მგრძნობიარეა.
სამწუხაროდ, არ არსებობს მარტივი გამოსავალი იმისა, რომ ყველა მონაცემები პოტენციურად იდენტიფიცირებულია და ყველა მონაცემები პოტენციურად მგრძნობიარეა. თუმცა, ერთი გზა, რათა შეამცირონ ინფორმაციული რისკი, როდესაც თქვენ მუშაობთ მონაცემთა ბაზაში, არის მონაცემთა დაცვის გეგმის შემუშავება და დაცვა . ეს გეგმა შეამცირებს შანსს, რომ თქვენი მონაცემები გაჟონვა და ზიანის შემცირება, თუ გაჟონვა ხდება. მონაცემების დაცვის გეგმების სპეციფიკა, როგორებიცაა გამოყენებული დაშიფვრის ფორმა, დროთა განმავლობაში შეიცვლება, მაგრამ ბრიტანეთის მონაცემთა სერვისი სასარგებლოდ აწვდის მონაცემთა დაცვის გეგმის ელემენტებს ხუთ კატეგორიად, რომლითაც ისინი ხუთ სეიფებს უწოდებენ: უსაფრთხო პროექტებს, უსაფრთხო ადამიანებს უსაფრთხოებები, უსაფრთხო მონაცემები და უსაფრთხო შედეგები (ცხრილი 6.2) (Desai, Ritchie, and Welpton 2016) . არც ერთ იმ 5 სეიფს არ აქვს სრულყოფილი დაცვა. მაგრამ ერთად ისინი ქმნიან ძლიერ კომპლექსურ ფაქტორებს, რომლებიც შეიძლება შემცირდეს საინფორმაციო რისკი.
Უსაფრთხო | მოქმედება |
---|---|
უსაფრთხო პროექტები | შეზღუდულია პროექტები მონაცემებით, რომლებიც ეთიკურია |
უსაფრთხო ხალხი | ხელმისაწვდომობა შეზღუდულია იმ ადამიანებისთვის, რომლებსაც ენდობიან მონაცემები (მაგალითად, ადამიანები, რომლებმაც გაიარეს ეთიკური სწავლება) |
უსაფრთხო მონაცემები | მონაცემები იდენტიფიცირებულია და მაქსიმალურად შეჯერებულია |
უსაფრთხო პარამეტრები | მონაცემები ინახება კომპიუტერში შესაბამისი ფიზიკური (მაგალითად, ჩაკეტილი ოთახი) და პროგრამული უზრუნველყოფა (მაგალითად, პაროლი დაცვა, დაშიფრული) დაცვა |
უსაფრთხო გამომავალი | კვლევის შედეგები განიხილება შემთხვევითი კონფიდენციალურობის დარღვევების თავიდან ასაცილებლად |
გარდა იმისა, რომ იყენებთ მათ მონაცემებს, კვლევის პროცესში ერთი ნაბიჯი, სადაც ინფორმაციული რისკი განსაკუთრებით მნიშვნელოვანია, სხვა მკვლევარებთან მონაცემების გაზიარებაა. მეცნიერთა შორის მონაცემთა გაზიარება სამეცნიერო მიზნის ძირითადი ღირებულებაა და ეს ხელს უწყობს ცოდნის ამაღლებას. აი, როგორ აღწერს გაერთიანებული სამეფოს თემთა ნაწილს მონაცემთა გაზიარების მნიშვნელობა (Molloy 2011) :
"მონაცემთა ხელმისაწვდომობა ფუნდამენტურია, თუ მკვლევარებმა გამოაქვეყნონ, შეამოწმონ და ააშენონ ლიტერატურის შედეგები. პრეზუმპცია უნდა იყოს, რომ თუ არ არსებობს ძლიერი მიზეზი სხვაგვარად, მონაცემთა სრულად უნდა იყოს გამჟღავნებული და საჯაროდ ხელმისაწვდომი. "
თუმცა, თქვენი მონაცემების სხვა მკვლევართან გაზიარებით, შეიძლება მონაწილეობდეს ინფორმაციული რისკი. ამრიგად, შეიძლება ითქვას, რომ მონაცემთა გაზიარება ქმნის ფუნდამენტურ დაძაბულობას სხვა მეცნიერებთან მონაცემების გაზიარების ვალდებულებასა და მონაწილეთათვის ინფორმაციული რისკის მინიმიზაციის ვალდებულებას შორის. საბედნიეროდ, ეს დილემა არ არის ისეთივე მწვავე, როგორც ჩანს. უფრო მეტიც, უმჯობესია განიხილოს მონაცემების გაზიარება, როგორც კონტინუუმის დაცვით, თითოეული პუნქტით, რომელიც უზრუნველყოფს უპირატესობის სხვადასხვა ნაზავს საზოგადოებისათვის და რისკის მონაწილეებს (ფიგურა 6.6).
ერთ უკიდურესად, შეგიძლიათ გაუზიაროთ თქვენი მონაცემები არავის, რომელიც მინიმუმამდე მიაქვს მონაწილეებს, მაგრამ ამცირებს საზოგადოებას. სხვა უკიდურეს შემთხვევაში, შეგიძლიათ გაათავისუფლონ და დაივიწყოთ , სადაც მონაცემები "ანონიმურია" და გამოქვეყნდება ყველასთვის. შედარებით არ გამოაქვეყნებს მონაცემებს, გაათავისუფლებს და დაივიწყებს როგორც საზოგადოებისთვის უფრო მაღალ შეღავათებს და უფრო მაღალი რისკის მქონე მონაწილეებს. ამ ორ უკიდურეს შემთხვევას შორისაა ჰიბრიდები, მათ შორის რა მოვუწოდებ walled ბაღის მიდგომა. ამ მიდგომით, მონაცემები იზიარებს ადამიანებს, რომლებიც აკმაყოფილებენ გარკვეულ კრიტერიუმებს და რომლებიც თანხმდებიან გარკვეული წესებით (მაგალითად, IRB და მონაცემთა დაცვის გეგმის მონიტორინგი). კედლის ბაღის მიდგომა უზრუნველყოფს გათავისუფლების ბევრ სარგებელს და დაივიწყოს ნაკლები რისკი. რა თქმა უნდა, ასეთი მიდგომა ქმნის ბევრ კითხვას - ვის უნდა ჰქონდეს ხელმისაწვდომობა, რა პირობებში, და რამდენი ხნის განმავლობაში ვინ უნდა გადაიხადოს კედლების დაცვა და დაცვა, მაგრამ ეს არ არის გადაულახავი. სინამდვილეში, უკვე არსებობს სამუშაო კედლები, რომ მკვლევარებს შეუძლიათ გამოიყენონ ახლავე, მაგალითად მიჩიგანის უნივერსიტეტის პოლიტიკურ და სოციალურ კვლევებთან დაკავშირებული ინტერ-უნივერსალური კონსორციუმის მონაცემთა არქივი.
ასე რომ, სად უნდა გაეცნოთ თქვენი კვლევის მონაცემები გაზიარების, კედლის ბაღის, გათავისუფლებისა და გათავისუფლების გაგრძელებას? ეს დამოკიდებულია თქვენს მონაცემებზე დაყრდნობით: მკვლევარებმა უნდა დაადასტურონ პირთა, კეთილდღეობის, სამართლიანობის და კანონისა და საზოგადოებრივი ინტერესის პატივისცემა. ამ თვალსაზრისიდან გამომდინარე, მონაცემთა გაზიარება არ არის განმასხვავებელი ეთიკური კორუნება; ეს არის კვლევის მრავალი ასპექტი, რომელშიც მკვლევარებმა უნდა იპოვონ შესაბამისი ეთიკური ბალანსი.
ზოგიერთი კრიტიკოსი ზოგადად ეწინააღმდეგება მონაცემების გაზიარებას, რადგან, ჩემი აზრით, ისინი მიმართულია მის რისკებზე, რაც უდავოდ რეალურია და უგულებელყოფს თავის შეღავათებს. ასე რომ, იმისათვის, რომ ხელი შეუწყოს ორივე რისკსა და სარგებელს, მე მინდა შემოგთავაზოთ ანალოგია. ყოველ წელს, მანქანები პასუხისმგებელია ათასობით სიკვდილისთვის, მაგრამ ჩვენ არ ვცდილობთ აკრძალონ მამოძრავებელი. სინამდვილეში, ზარის აკრძალვის მოწოდება აბსურდული იქნება, რადგან მამოძრავებელი ბევრ მშვენიერ რამეს ქმნის. პირიქით, საზოგადოება ადგენს შეზღუდვებს, ვისაც შეუძლია მართოს (მაგალითად, გარკვეული ასაკის არსებობა და გარკვეული ტესტები ჩააბარა) და როგორ შეიძლება მართოს (მაგალითად, სიჩქარის ზღვარზე). საზოგადოებას ასევე აქვს ამ წესების აღსრულება (მაგ., პოლიცია), და ჩვენ დავსჯებით ის ადამიანები, რომლებიც დაარღვევენ მათ. მსგავსი ტიპის დაბალანსებული აზროვნება, რომ საზოგადოება ეხება მამოძრავებელ მარეგულირებელ წესებს, შეიძლება გამოყენებულ იქნეს მონაცემთა გაზიარებისთვის. ეს არის ის, ვიდრე აბსოლუტურ არგუმენტებს მონაცემთა გაზიარებისთვის ან მის წინააღმდეგ, მე ვფიქრობ, რომ ყველაზე პროგრესს მივაღწევთ იმაზე, თუ როგორ შეგვიძლია რისკის შემცირება და სარგებლის გაზრდა მონაცემთა გაზიარებისგან.
დაასკვნას, ინფორმაციული რისკი მკვეთრად გაიზარდა და ძნელია პროგნოზირება და გაზომვა. აქედან გამომდინარე, უმჯობესია ვივარაუდოთ, რომ ყველა მონაცემები პოტენციურად იდენტიფიცირებულია და პოტენციურად მგრძნობიარეა. მკვლევარებმა შეიძლება შექმნან და დაიცვან მონაცემთა დაცვის გეგმა. გარდა ამისა, საინფორმაციო რისკი ხელს არ უშლის მკვლევარებს სხვა მეცნიერებთან მონაცემთა გაზიარებისგან.