Takwimu zilizofanywa na makampuni na serikali ni vigumu kwa watafiti kufikia.
Mnamo Mei 2014, Shirika la Usalama la Taifa la Marekani lilifungua kituo cha data katika Utah ya vijijini kwa jina lisilo la kawaida, Kituo cha Takwimu cha Jumuiya ya Upelelezi wa Upelelezi wa Upelelezi wa Upelelezi wa Upelelezi wa Umma. Hata hivyo, kituo hiki cha data, kilichojulikana kama Utah Data Center, kinaripotiwa kuwa na uwezo wa kushangaza. Ripoti moja inasema kwamba ina uwezo wa kuhifadhi na kusindika aina zote za mawasiliano ikiwa ni pamoja na "yaliyomo kamili ya barua pepe za faragha, simu za mkononi, na utafutaji wa Google, pamoja na kila aina ya mapato ya barabara ya kibinafsi, maagizo ya maegesho ya barabara, safari ya safari, ununuzi wa vitabu , na takataka nyingine ya 'digital mfukoni' " (Bamford 2012) . Mbali na kuongeza wasiwasi kuhusu hali nyeti ya habari nyingi zilizopatikana katika data kubwa, ambayo itaelezea zaidi chini, Utah Data Centre ni mfano mkubwa wa chanzo cha tajiri ambacho hakikiwezekani kwa watafiti. Kwa ujumla, vyanzo vingi vya data kubwa ambazo zitakuwa vyenye kudhibitiwa na vikwazo na serikali (kwa mfano, takwimu za kodi na data za elimu) au makampuni (kwa mfano, maswali ya injini za utafutaji na data ya simu ya simu). Kwa hiyo, ingawa hizi vyanzo vya data zipo, hazina maana kwa madhumuni ya utafiti wa kijamii kwa sababu hazipatikani.
Katika uzoefu wangu, watafiti wengi wanaoishi katika vyuo vikuu hawaelewi vizuri chanzo cha upatikanaji huu. Takwimu hizi hazipatikani kwa sababu watu katika makampuni na serikali ni wajinga, wavivu, au hawajali. Badala yake, kuna vikwazo vya kisheria, biashara, na maadili ambayo huzuia upatikanaji wa data. Kwa mfano, makubaliano mengine ya masharti ya huduma ya tovuti huruhusu data tu kutumika na wafanyakazi au kuboresha huduma. Kwa hivyo aina fulani za ushirikiano wa data zinaweza kufungua makampuni kwa lawsuits halali kutoka kwa wateja. Pia kuna hatari kubwa za biashara kwa makampuni yaliyohusika kushirikiana data. Jaribu kufikiria jinsi umma itajibu kama data ya utafutaji wa kibinafsi ilipotoka kutoka Google kama sehemu ya mradi wa utafiti wa chuo kikuu. Uvunjaji wa data kama, kama uliokithiri, huenda hata kuwa hatari ya kuwepo kwa kampuni. Kwa hivyo Google-na makampuni makubwa zaidi-ni hatari sana kwa kugawa data pamoja na watafiti.
Kwa kweli, karibu kila mtu aliye katika nafasi ya kutoa upatikanaji wa kiasi kikubwa cha data anajua hadithi ya Abdur Chowdhury. Mnamo 2006, wakati alikuwa mkuu wa utafiti katika AOL, alitoa kwa makusudi jumuiya ya utafiti kile alichofikiria kuwa haijulikani maswali ya utafutaji kutoka kwa watumiaji 650,000 wa AOL. Kwa kadiri nilivyoweza kumwambia, Chowdhury na watafiti wa AOL walikuwa na nia njema, na walidhani kwamba walikuwa wameonyesha data. Lakini walikuwa na makosa. Ilikugundua haraka kwamba data hazikujulikana kama watafiti walidhani, na waandishi wa habari kutoka New York Times waliweza kutambua mtu katika dataset kwa urahisi (Barbaro and Zeller 2006) . Mara matatizo haya yalipogunduliwa, Chowdhury aliondoa data kutoka kwenye tovuti ya AOL, lakini ilikuwa imechelewa. Takwimu zilirejeshwa kwenye tovuti zingine, na labda bado zinapatikana wakati unasoma kitabu hiki. Chowdhury alifukuzwa, na afisa wa teknolojia ya AOL alijiuzulu (Hafner 2006) . Kama mfano huu unaonyesha, faida kwa watu maalum ndani ya makampuni ili kuwezesha upatikanaji wa data ni ndogo sana na hali mbaya zaidi ni ya kutisha.
Watafiti wanaweza, hata hivyo, wakati mwingine kupata upatikanaji wa data ambayo haipatikani kwa umma. Serikali zingine zina taratibu ambazo watafiti wanaweza kufuata kuomba kupata, na kama mifano baadaye katika sura hii inaonyeshwa, watafiti wanaweza mara kwa mara kupata upatikanaji wa data za kampuni. Kwa mfano, Einav et al. (2015) walipatanishwa na mtafiti wa eBay kujifunza minada ya mtandaoni. Mimi nitazungumza zaidi kuhusu utafiti uliotokana na ushirikiano huu baadaye katika sura, lakini naitaja sasa kwa sababu ilikuwa na viungo vinne ambavyo ninaona katika ushirikiano wa mafanikio: mtafiti maslahi, uwezo wa watafiti, riba ya kampuni, na uwezo wa kampuni . Nimeona ushirikiano wengi wa kushindwa kwa sababu mtafiti au mpenzi-kuwa kampuni au serikali-hakuwa na viungo hivi.
Hata kama una uwezo wa kuendeleza ushirikiano na biashara au kupata upatikanaji wa takwimu za serikali vikwazo, hata hivyo, kuna baadhi ya kushuka kwa wewe. Kwanza, labda hautaweza kushiriki data zako na watafiti wengine, ambayo ina maana kwamba watafiti wengine hawataweza kuthibitisha na kupanua matokeo yako. Pili, maswali ambayo unaweza kuuliza yanaweza kupunguzwa; makampuni haipaswi kuruhusu utafiti ambao unaweza kuwafanya uonekane kuwa mbaya. Hatimaye, ushirikiano huu unaweza kuunda angalau kuonekana kwa mgongano wa maslahi, ambapo watu wanaweza kufikiri kuwa matokeo yako yameathiriwa na ushirikiano wako. Vikwazo vyote hivi vinaweza kushughulikiwa, lakini ni muhimu kuwa wazi kwamba kufanya kazi na data ambayo haipatikani kwa kila mtu ina upsides na downsides.
Kwa muhtasari, kura nyingi za data hazipatikani kwa watafiti. Kuna vikwazo vya kisheria, biashara, na kimaadili ambavyo vinazuia upatikanaji wa data, na vikwazo hivi hazitakwenda kama teknolojia inaboresha kwa sababu sio vikwazo vya kiufundi. Baadhi ya serikali za kitaifa zimeanzisha taratibu za kuwezesha upatikanaji wa data kwa baadhi ya data, lakini mchakato huu ni maalum kwa ngazi za serikali na za mitaa. Pia, wakati mwingine, watafiti wanaweza kushirikiana na makampuni ili kupata upatikanaji wa data, lakini hii inaweza kuunda matatizo mbalimbali kwa watafiti na makampuni.