Done ki te fèt pa konpayi yo ak gouvènman yo difisil pou chèchè yo gen aksè a.
Nan mwa me 2014, US Ajans Sekirite Nasyonal la te louvri yon sant done nan riral Utah ak yon non gòch, Intelligence Community Comprehensive National Cybersecurity Initiative Data Center. Sepandan, sant sa a done, ki te vini yo dwe li te ye tankou Utah Done Sant la, yo rapòte yo gen kapasite etone. Yon rapò akize ke li se kapab nan magazen ak pwosesis tout fòm kominikasyon ki gen ladan "sa ki konplè nan Imèl prive, apèl telefòn selilè, ak Google rechèch, menm jan tou tout kalite done pèsonèl santye-resi pakin, itinerè vwayaj, acha libreri , ak lòt dijital 'pòch lityè' " (Bamford 2012) . Anplis de sa nan ogmante enkyetid sou nati a sansib nan anpil nan enfòmasyon ki te kaptire nan done gwo, ki pral dekri pi ba pi ba a, Utah Done Sant la se yon egzanp ekstrèm nan yon sous done rich ki se aksesib a chèchè yo. Plis jeneralman, anpil sous gwo done ki ta itil yo kontwole ak restriksyon pa gouvènman (egzanp, done taks ak done edikasyonèl) oswa konpayi (egzanp, demann pou motè rechèch ak rele meta done done). Se poutèt sa, menm si done sa yo egziste, yo initil pou rezon ki nan rechèch sosyal yo paske yo te aksesib.
Nan eksperyans mwen, chèchè anpil ki baze nan inivèsite mal konprann sous la nan sa a inaksesibilite. Done sa yo inaccessible pa paske moun nan konpayi yo ak gouvènman yo se estipid, parese, oswa uncaring. Olye de sa, gen grav legal, biznis, ak baryè etik ki anpeche aksè done. Pou egzanp, kèk akò sèvis-pou-sèvis pou sit entènèt sèlman pèmèt done yo dwe itilize pa anplwaye oswa amelyore sèvis la. Se konsa, sèten fòm done pataje te kapab ekspoze konpayi yo lejitim pwose nan kliyan yo. Genyen tou gwo risk biznis nan konpayi ki enplike nan pataje done. Eseye imajine ki jan piblik la ta reponn si done rechèch pèsonèl aksidantèlman fwi soti nan Google kòm yon pati nan yon pwojè rechèch inivèsite. Tankou yon vyolasyon done, si ekstrèm, ta ka menm gen yon risk ekzistans pou konpayi an. Se konsa, Google-yo ak pi gwo konpayi-yo trè risk-advèrsèr sou pataje done ak chèchè yo.
An reyalite, prèske tout moun ki nan yon pozisyon pou bay aksè a gwo kantite done konnen istwa a nan Abdur Chowdhury. An 2006, lè li te tèt la nan rechèch nan AOL, li entansyonèlman lage nan kominote rechèch la sa li te panse yo te demann rechèch anonymised soti nan 650,000 itilizatè AOL. Osi lwen ke mwen ka di, Chowdhury ak chèchè yo nan AOL te gen bon entansyon, epi yo te panse ke yo te anonymize done yo. Men, yo te mal. Li te byen vit dekouvri ke done yo pa t 'tankou anonim kòm chèchè yo te panse, ak repòtè yo nan New York Times yo te kapab idantifye yon moun nan dataset la avèk fasilite (Barbaro and Zeller 2006) . Yon fwa ke pwoblèm sa yo te dekouvri, Chowdhury retire done yo nan sit entènèt AOL a, men li te twò ta. Done yo te reposted sou lòt sit wèb, epi li pral pwobableman toujou disponib lè w ap li liv sa a. Chowdhury te revoke, ak chèf ofisye teknoloji AOL a demisyone (Hafner 2006) . Kòm egzanp sa a montre, benefis yo pou moun espesifik andedan nan konpayi yo fasilite aksè done yo trè piti ak senaryo ki pi mal la ka terib.
Chèchè yo kapab, sepandan, pafwa jwenn aksè nan done ki aksesib a piblik la an jeneral. Gen kèk gouvènman ki gen pwosedi ke chèchè yo ka swiv pou aplike pou aksè, ak kòm egzanp yo pita nan chapit sa a montre, chèchè ka detanzantan jwenn aksè nan done antrepriz. Pa egzanp, Einav et al. (2015) patenarya ak yon chèchè nan eBay yo etidye sou entènèt launcher. Mwen pral pale plis sou rechèch la ki te soti nan kolaborasyon sa a pita nan chapit la, men mwen mansyone li kounye a paske li te gen tout kat nan engredyan yo ke mwen wè nan patenarya siksè: enterè chèchè, kapasite chèchè, enterè konpayi, ak kapasite konpayi . Mwen te wè anpil kolaborasyon potansyèl fail paske swa chèchè a oswa patnè-se pou li yon konpayi oswa gouvènman an-manke youn nan sa yo engredyan.
Menm si ou kapab devlope yon patenarya ak yon biznis oswa jwenn aksè nan done gouvènman an restriksyon, sepandan, gen kèk enkonvenyans pou ou. Premyèman, ou pwobableman pa kapab pataje done ou a ak chèchè lòt, ki vle di ke lòt chèchè pa yo pral kapab verifye ak pwolonje rezilta ou. Dezyèmman, kesyon ou ka mande yo kapab limite; konpayi yo se fasil yo ki pèmèt rechèch ki ta ka fè yo gade move. Finalman, patenarya sa yo ka kreye omwen aparans yon konfli enterè, kote moun ka panse ke rezilta ou yo te enfliyanse pa patenarya ou. Tout enkonvenyans sa yo ka adrese, men li enpòtan pou w klè ke travay ak done ki pa aksesib a tout moun ki gen tou de upsides ak enkonvenyans.
An rezime, anpil gwo done ki pa aksesib pou chèchè yo. Gen grav legal, biznis, ak baryè etik ki anpeche aksè done, ak baryè sa yo pa pral ale lwen tankou teknoloji amelyore paske yo pa baryè teknik. Gen kèk gouvènman nasyonal ki etabli pwosedi pou pèmèt aksè done pou kèk ansanb, men pwosesis la se espesyalman ad hoc nan nivo leta ak lokal yo. Epitou, nan kèk ka, chèchè yo ka patnè ak konpayi yo jwenn aksè done, men sa ka kreye yon varyete de pwoblèm pou chèchè yo ak konpayi yo.