2.3.2.2 inaccessible

Data dicekel ku usaha jeung pamaréntah anu hésé pikeun panalungtik pikeun ngakses.

Dina Méi 2014, AS Nasional Agenda Kaamanan dibuka puseur data dina désa Utah nu boga ngaran kagok, nu AKAL Community komprehensif Nasional Cybersecurity prakarsa Data Center. Tapi, ieu puseur data, nu geus datang ka katelah Utah Data Center, kacarita boga kamampuhan astounding. Hiji laporan alleges yen Utah Data Center sanggup pikeun nyimpen jeung ngolah sagala bentuk komunikasi kaasup "eusi lengkep surelek swasta, Telepon sél, sarta maluruh Google, kitu ogé sagala sorts data pribadi kuitansi trails-parkir, itineraries travel , purchases toko buku, jeung digital `litter séjén kantong '" (Bamford 2012) . Sajaba ka masalah raising ngeunaan alam sensitip tina loba informasi kawengku dina data gedé, nu bakal digambarkeun nu leuwih handap, nu Utah Data Center ieu conto ekstrim tina sumber data beunghar nu inaccessible ka panalungtik. More umum, loba sumber data gedé nu bakal mangpaat pikeun panalungtik nu dikawasa jeung diwatesan ku pamaréntah (misalna data pajeg jeung data atikan) jeung pausahaan (misalna queries ka mesin jeung telepon meta-data sungsi). Ku alatan éta, data ieu moal langsung sadia pikeun panalungtik di paguron luhur, sarta lolobana malah moal sadia pikeun panalungtik dina pamaréntah atawa pausahaan.

Dina pangalaman mah, loba panalungtik dumasar di paguron luhur salah harti sumber inaccessibility ieu. data ieu teu inaccessible sabab urang di pausahaan jeung pamaréntah nu bodo, teu puguh, atawa uncaring. Rada, aya serius hukum, téhnis, bisnis, jeung halangan etika nu nyegah aksés data. Contona, sababaraha istilah-of-service pasatujuan for jaba ngan ngidinan data bisa dipaké ku pagawé atawa pikeun ngaronjatkeun layanan. Jadi bentuk tangtu babagi data bisa ngalaan pausahaan ka lawsuits sah ti konsumén. Aya ogé resiko bisnis penting pikeun pausahaan aub dina babagi data. Coba dibayangkeun kumaha umum bakal ngabales lamun data search pribadi ngahaja bocor kaluar ti Google salaku bagian tina proyék panalungtikan universitas. Saperti breach data, lamun ekstrim, komo bisa jadi résiko existential pikeun pausahaan. Jadi Google-jeung paling badag pausahaan-pisan resiko-averse ngeunaan babagi data jeung panalungtik.

Dina kanyataan, ampir dulur anu aya di posisi ka nyadiakeun aksés ka nu jumlahna ageung data weruh carita Abdur Chowdhury. Dina taun 2006, nalika manéhna kapala panalungtikan Kaol, manéhna intentionally dileupaskeun naon ceuk pikir anu anonymized queries search ti 650.000 pamaké Kaol ka masarakat panalungtikan. Salaku sajauh kuring bisa nyaritakeun, Chowdhury jeung panalungtik di Kaol geus niat alus sarta ngira yén maranéhanana geus anonymized data. Tapi, maranéhanana éta salah. Ieu gancang kapanggih yén data éta teu jadi anonim salaku panalungtik pikiran, jeung wartawan ti New York Times éta bisa pikeun ngaidentipikasi jalma di dataset jeung betah (Barbaro and Zeller Jr 2006) . Sakali masalah kasebut kapanggih, Chowdhury dihapus data ti website Kaol urang, tapi ieu telat. Data geus reposted dina situs web lianna, sarta meureun baris masih sadia sawaktos Anjeun keur maca buku ieu. Kusabab usaha pikeun babagi data jeung masarakat panalungtikan, Chowdhury ieu dipecat, sarta perwira téknologi kapala Kaol urang pasrah (Hafner 2006) . Salaku conto ieu nembongkeun, nu mangpaat pikeun individu tangtu di jero pausahaan pikeun mempermudah aksés data nu geulis leutik jeung skenario awon-hal anu dahsyat.

Panalungtikan bisa kitu, mangtaun aksés ka data anu inaccessible ka masarakat umum. Pamaréntah geus prosedur nu panalungtik bisa nuturkeun panawaran pikeun akses, jeung sabagé conto saterusna dina bab pintonan ieu, panalungtik aya kalana bisa meunangkeun aksés ka data perusahaan. Contona, Einav et al. (2015) partnered jeung panalungtik di eBay pikeun diajar nu ngambah digital ti auctions online. Abdi gé ngobrol leuwih ngeunaan panalungtikan nu datang ti kolaborasi ieu saterusna dina bab (Bagéan 2.4.3.2), tapi kuring nyebut ayeuna sabab geus sadaya opat bahan mah tempo di partnerships suksés: interest panalungtik, kamampuhan panalungtik, interest pausahaan, sarta kamampuhan pausahaan. Dina basa sejen, Einav sareng kolega éta kabetot dina jeung sanggup nalungtik auctions online. Jeung, eBay oge. Tapi, Kuring geus katempo loba kolaborasi mungkin gagal sabab boh panalungtik atawa pausahaan lacked salah sahiji bahan ieu.

Komo lamun bisa ngamekarkeun partnership kalayan usaha, kumaha oge, aya sababaraha downsides pikeun anjeun. Kahiji, patarosan nu bisa nanya jeung data jeung dipikaresep jadi diwatesan; pausahaan anu saperti teu mirip pikeun ngidinan panalungtikan anu bisa nyieun eta kasampak bad. Kadua, anjeun bakal meureun teu bisa ngabagikeun data Anjeun sareng panalungtik séjén, nu hartina panalungtik séjén moal bisa pariksa jeung ngalegaan hasil Anjeun. Salajengna, partnerships ieu bisa nyieun sahenteuna penampilan a konflik of interest, di mana urang bisa mikir yén hasil Anjeun anu dipangaruhan ku partnerships Anjeun. Sakabéh downsides ieu bisa kajawab, tapi hal anu penting pikeun jadi jelas yen gawe jeung data nu teu bisa diasupan ka dulur geus boh upsides jeung downsides.

Dina kasimpulan, kavling data gedé téh inaccessible ka panalungtik. Aya serius hukum, téhnis, bisnis, jeung halangan etika nu nyegah aksés data, jeung halangan ieu moal balik jauh. pamaréntah Nasional umumna geus ngadegkeun prosedur pikeun sangkan aksés data, tapi prosés bisa leuwih ad hoc dina tingkat nagara jeung lokal. Oge, dina sababaraha kasus, panalungtik bisa pasangan jeung pausahaan pikeun ménta aksés data, tapi ieu bisa nyieun rupa-rupa masalah pikeun panalungtik.