Data dicekel ku pausahaan jeung pamaréntah nu hésé pikeun panalungtik pikeun ngakses.
Dina Méi 2014, Badan Kaamanan Nasional AS dibuka pusat data di désa Utah kalawan ngaran kagok, nu AKAL Komunitas komprehensif Nasional Cybersecurity prakarsa Data Center. Sanajan kitu, ieu puseur data, nu geus datang ka jadi katelah Utah Data Center, geus dilaporkeun ka gaduh kamampuhan astounding. Hiji laporan alleges yén éta téh bisa nyimpen jeung ngolah sagala bentuk komunikasi kaasup "eusi lengkep surelek swasta, Telepon sél, sarta maluruh Google, sakumaha ogé sagala sorts data pribadi kuitansi trails-parkir, itineraries perjalanan, purchases toko buku , sarta digital 'litter saku' lianna " (Bamford 2012) . Salian raising kasalempang alam sénsitip of jauh tina informasi direbut dina data badag, anu bakal dijelaskeun salajengna handap, ti Utah Data Center mangrupa conto ekstrim tina hiji sumber data euyeub éta téh inaccessible mun peneliti. Leuwih umum, loba sumber data badag nu bakal mangpaat keur dikawasa jeung diwatesan ku pamaréntah (misalna data pajeg sarta data pendidikan) atanapi pausahaan (misalna queries kana mesin jeung panggero telepon meta-data milarian). Kituna, sanajan ieu sumber data aya, aranjeunna aya gunana pikeun kaperluan panalungtikan sosial sabab inaccessible.
Dina pangalaman kuring, loba peneliti dumasar di paguron luhur salah harti sumber inaccessibility ieu. data ieu inaccessible moal sabab jalma di pausahaan sarta pamaréntah anu bodo, geus puguh, atawa uncaring. Rada, aya serius légal, bisnis, jeung halangan etika nu nyegah aksés data. Contona, sababaraha istilah-of-jasa pasatujuan for jaba ngan ngijinan data pikeun dipaké ku pagawé atawa ningkatkeun dilayanan. Ku kituna wangun tangtu babagi data bisa ngalaan pausahaan keur lawsuits sah ti nasabah. Aya ogé resiko bisnis penting pikeun pausahaan aub dina babagi data. Coba mun ngabayangkeun kumaha publik nu bakal ngabales lamun data pilarian pribadi ngahaja bocor kaluar ti Google salaku bagian tina hiji proyek panalungtikan universitas. Saperti breach data, upami ekstrim, malah bisa jadi hiji résiko existential pikeun pausahaan. Ku kituna Google-na paling badag pausahaan-pisan resiko-averse tentang ngabagikeun data sareng peneliti.
Nyatana, ampir dulur anu aya dina posisi nu nyadiakeun aksés ka jumlahna ageung data weruh carita Abdur Chowdhury. Dina taun 2006, nalika anjeunna kapala panalungtikan di Kaol, anjeunna ngahaja dikaluarkeun ka komunitas panalungtikan naon ceuk pikir anu anonymized queries pilarian tina 650.000 pamaké Kaol. Sajauh abdi tiasa ngabejaan, Chowdhury sarta peneliti di Kaol kagungan karsa alus, sarta aranjeunna ngira yén maranéhna kungsi anonymized data. Tapi maranéhanana éta salah. Ieu ieu gancang manggihan yén data éta teu jadi anonim salaku peneliti sangka, jeung wartawan ti New York Times éta bisa nangtukeun batur di dataset sareng betah (Barbaro and Zeller 2006) . Sakali masalah ieu munggaran kapanggih, Chowdhury dihapus data ti ramatloka Kaol urang, tapi ieu telat. Data geus reposted on jaba lianna, sarta eta meureun bakal tetep jadi sadia sawaktos Anjeun keur maca buku. Chowdhury dipecat, sarta perwira téhnologi lulugu Kaol urang pasrah (Hafner 2006) . Salaku conto ieu nembongkeun, pedah keur individu husus jero pausahaan pikeun mempermudah aksés data téh geulis leutik jeung skenario awon-hal anu dahsyat.
Peneliti bisa kitu, kadang mangtaun aksés ka data anu mangrupa inaccessible ka masarakat umum. Sababaraha pamaréntah gaduh prosedur anu peneliti bisa nuturkeun keur panawaran pikeun aksés, sarta salaku conto engké dina bab acara ieu, peneliti kalana bisa mangtaun aksés ka data perusahaan. Contona, Einav et al. (2015) partnered ku panalungtik dina eBay keur diajar auctions online. Kuring gé ngobrol ngeunaan hasil panalungtikan nu sumping ti kolaborasi kieu engké dina bab, tapi kuring nyebut ayeuna sabab tadi kabeh opat tina bahan anu kuring tingali di partnerships suksés: dipikaresep panalungtik, kamampuhan panalungtik, suku parusahaan, sarta kamampuan parusahaan . Kuring geus katempo loba collaborations poténsi gagal kusabab boh panalungtik atawa pasangan-jadi hiji parusahaan atawa salah sahiji bahan ieu-lacked pamaréntah.
Malah lamun anjeun bisa ngamekarkeun partnership kalayan bisnis atawa mangtaun aksés ka data pamaréntah diwatesan, kumaha oge, aya sababaraha downsides pikeun anjeun. Kahiji, anjeun bakal meureun moal bisa babagi data anjeun kalawan peneliti lianna, nu hartina peneliti sejenna moal bisa pariksa jeung manjangkeun hasil Anjeun. Kadua, patarosan anu tiasa ménta bisa jadi diwatesan; Pausahaan anu saperti teu mirip ngawenangkeun panalungtikan anu bisa nyieun éta kasampak goréng. Tungtungna, partnerships ieu bisa nyieun sahenteuna penampilan konflik dipikaresep, dimana urang bisa mikir yén hasil anjeun anu dipangaruhan ku partnerships Anjeun. Sakabéh downsides ieu bisa kajawab, tapi hal anu penting pikeun jadi jelas yén gawé bareng data nu teu bisa diasupan ka dulur boga duanana upsides na downsides.
Dina kasimpulan, kavling data badag nyaéta inaccessible mun peneliti. Aya serius légal, bisnis, jeung halangan etika nu nyegah aksés data, sarta halangan ieu moal dileungitkeun sakumaha ngaronjatkeun téhnologi ku sabab henteu halangan teknis. Sababaraha pamaréntah nasional geus ngadegkeun prosedur pikeun ngamungkinkeun para aksés data pikeun sababaraha datasets, tapi prosesna téh hususna ad hoc dina tingkat kaayaan jeung lokal. Ogé, dina sababaraha kasus, peneliti tiasa pasangan kalayan pausahaan pikeun ménta aksés data, tapi ieu bisa nyieun rupa-rupa masalah keur peneliti jeung pausahaan.