Data dianakaké dening bisnis lan pemerintah sing angel kanggo riset ngakses.
Ing Mei 2014, AS National Agenda Keamanan kabuka pusat data ing deso Utah sing duwe jeneng kikuk, Intelligence Community Comprehensive National cybersecurity Initiative Data Center. Nanging, iki tengah data, kang wis teka bakal dikenal minangka Utah Data Center, kacarita wis Kapabilitas astounding. Salah laporan alleges sing Utah Data Center bisa kanggo nyimpen lan proses kabeh formulir komunikasi kalebu "isi lengkap email pribadi, telpon, lan nelusur Google, uga kabeh limo data pribadi kuitansi tilase-parking, itineraries travel , tumbas toko buku, lan digital: rereged liyane kanthong ' " (Bamford 2012) . Saliyane uneg-uneg mundhakaken bab alam sensitif kang akeh saka informasi dijupuk ing data amba, kang bakal diterangake luwih ngisor, ing Utah Data Center punika conto nemen saka sumber data sugih sing ora bisa diliwati peneliti. More umum, akeh sumber data amba sing bakal migunani kanggo para paneliti lagi kontrol lan diwatesi dening pemerintah (eg, data tax lan data pendidikan) lan perusahaan (eg, pitakon kanggo mesin lan telpon meta-data nelusuri). Mulane, data iki ora bakal langsung kasedhiya kanggo riset ing universitas, lan paling malah ora kasedhiya kanggo peneliti ing pemerintah utawa perusahaan.
Ing pengalaman, akeh riset wonten ing universitas pangerti sumber inaccessibility iki. Iki data ora bisa diliwati amarga wong ing perusahaan lan pemerintah bodho, puguh, utawa uncaring. Luwih, ana serius legal, technical, bisnis, lan alangan sopan sing nyegah akses data. Contone, sawetara istilah-saka-layanan perjanjian kanggo situs mung ngidini data kanggo digunakake dening karyawan utawa kanggo nambah layanan. Dadi formulir tartamtu saka fungsi enggo bareng data bisa mbabarake perusahaan kanggo tuntutan hukum sah saka pelanggan. Ana uga risiko bisnis substansial perusahaan melu ing enggo bareng data. Coba mbayangno carane masyarakat bakal nanggapi yen data search pribadi sengaja trocoh metu saka Google minangka bagéan saka riset project universitas. Kuwi nerbitake data, yen nemen, malah bisa dadi resiko eksistensial kanggo perusahaan. Dadi Google-lan paling gedhe perusahaan-banget resiko-averse babagan enggo bareng data karo peneliti.
Ing kasunyatan, meh saben wong kang ana ing posisi kanggo nyedhiyani akses kanggo jumlah gedhe saka data mangerténi crita Abdur Chowdhury. Ing taun 2006, nalika iku ana kepala riset AOL, piyambakipun sengaja dirilis apa panginten padha anonymized pitakon search saka 650.000 pangguna AOL kanggo masyarakat riset. Minangka adoh kaya aku bisa ngomong, Chowdhury lan peneliti ing AOL wis maksud apik lan padha nggagas wong wis anonymized data. Nanging, padha salah. Sampeyan iki cepet sing ditemokake ing data padha ora anonim minangka peneliti panginten, lan wartawan saka New York Times padha bisa kanggo ngenali wong ing perlengkapan data karo ease (Barbaro and Zeller Jr 2006) . Sawise masalah iki ditemokaké, Chowdhury dibusak data saka situs AOL kang, nanging kasep. The data wis reposted ing situs liyane, lan iku mbokmenawa isih dadi kasedhiya yen sampeyan maca buku iki. Amarga nyoba kanggo enggo bareng data karo masyarakat riset, Chowdhury dipecat, lan pangareping teknologi pejabat AOL kang metu (Hafner 2006) . Minangka conto iki nuduhake, keuntungan kanggo individu tartamtu nang perusahaan kanggo nggampangake akses data sing cantik cilik lan skenario paling awon-cilik iku elek.
Research bisa, Nanging, gain akses kanggo data sing bisa diliwati kanggo masyarakat umum. Pemerintah duwe tata cara sing peneliti bisa tindakake kanggo aplikasi kanggo akses, lan minangka conto mengko ing bab gambar iki, peneliti sok-sok bisa gain akses kanggo data perusahaan. Contone, Einav et al. (2015) partnered karo peneliti ing eBay kanggo sinau ngambah digital saka Lelang online. Aku bakal pirembagan liyane babagan riset sing teka saka collaboration iki mengko ing bab (Section 2.4.3.2), nanging jalaran Aku kepéngin saiki amarga kabeh papat saka úa aku ndeleng ing kekancan sukses: kapentingan peneliti, kemampuan peneliti, kapentingan perusahaan, lan kemampuan perusahaan. Ing tembung liyane, Einav lan kolega padha kasengsem lan saged sinau Lelang online. Lan, eBay uga. Nanging, aku wis katon akeh collaboration bisa gagal amarga salah siji peneliti utawa perusahaan kurang siji saka úa iki.
Malah yen bisa berkembang kemitraan karo bisnis, Nanging, ana sawetara downsides kanggo sampeyan. First, pitakonan sing bisa takon karo data karo kamungkinan diwatesi; perusahaan sing dipercaya kanggo ngidini riset sing bisa nggawe wong katon ala. Kapindho, sampeyan bakal mbokmenawa ora bisa kanggo nuduhake data karo peneliti liyane, kang tegese panliti liya ora bakal bisa kanggo verifikasi lan ngluwihi asil. Luwih, kekancan iki bisa nggawe paling katon saka konflik kapentingan, ngendi wong bisa mikir sing asil padha dipengaruhi dening kekancan Panjenengan. Kabeh downsides iki bisa ono, nanging iku penting kanggo dadi cetha sing nggarap data sing ora diakses kanggo wong wis loro upsides lan downsides.
Ing ringkesan, persil saka data amba diaksès peneliti. Ana serius legal, technical, bisnis, lan alangan sopan sing nyegah akses data, lan alangan iki ora lunga. pemerintah National umume wis mantep cara mbisakake akses data, nanging proses bisa luwih ad-hoc ing tingkat negara lan lokal. Uga, ing sawetara kasus, peneliti bisa partner karo perusahaan diwenehi akses data, nanging iki bisa nggawe macem-macem masalah kanggo peneliti.