Daten déi vu Firmen a Regierungen gehal ginn, sinn schwéier fir d'Fuerscher ze kréien.
Am Mee 2014 huet d'US National Security Agency en Data Center am ländleche Utah eröffnegt mat engem klengen Numm, dem Intelligence Community Comprehensive National Cybersecurity Initiative Data Center. Allerdéngs ass dat Datencenter, deen als Utah Data Center bekannt ass, gemellt mat erstaunlecher Fäegkeet. Een Report seet datt et all Formen vun Kommunikatioun ze späicheren a veraarbecht ze hunn, wéi "de komplette Contenu vu privaten Emails, Telefonsoalratiounen an Google Recherche, wéi och all Form vu perséinleche Datenweeër Parkplazen, Reesreseauen, Librairie kaaft , an aner digital 'Taschestritter' " (Bamford 2012) . Zousätzlech fir d'Besuergniss iwwert d'sensibel Natur vun villen vun der Informatioun ze kréien, déi an de groussen Daten agefouert ginn, wat méi weider beschriwwe gëtt, ass d'Utah Data Center e extremt Beispill vun enger räicher Datenquelle, déi fir Fuerscher net zougänglech ass. Am allgemengen gi vill Quelle vu grouss Daten, déi nëtzlech sinn, kontrolléiert a limitéiert duerch Regierungen (zB Steiersignal an Edukatiounsdaten) oder Firmen (zB Ufroën fir Sichmaschinn an Teletapp mam Metadaten). Dofir, obwuel dës Datenquellen existéieren, sinn se nëtzlech fir d'Sozialopäescher Fuerschung, well se net accessibel sinn.
A menger Erfahrung, vill Untersucher déi op Universitéite baséieren, missten d'Quell vun dësem Inaccessibilitéitsverständnis sinn. Dës Donnéeën sinn net accessibel, well Leit op Firmen a Regierungen sinn domadder, faul oder onerkaréierend. Et gi seriéis legal, geschäftlech an ethesch Barrièren, déi den Datenzugriff verhënneren. Zum Beispill, verschidde Konditioune vun Ofwécklungsverträg fir Websäiten erlaaben nëmmen Daten duerch d'Personal benotzt oder den Service verbessert ginn. Also verschidden Formen vun der Datenverléisung kéint Firmen ausleeden fir legitim Kloen vu Cliente auszeleeën. Et sinn och wesentlech Geschäftsrisiken fir Gesellschaften, déi an der Vergaangenheet Daten ginn. Préift Iech virstellen, wéi d'Publikum géing reagéieren wann Dir perséinlech Donnéeën zoufälleg aus Google als Deel vun engem Universitéitsfuerschungprojet leeft. Wéi eng Datenverletzung, wann extrem, ass souguer e existenzielle Risiko fir d'Firma. Google an déi meescht grouss Entreprisen hu sech och ganz geféierlech datt et Daten mat Forscher zesummen ginn.
Tatsächlech weess et bal jiddereen, deen an enger Positioun ass fir Zougang zu grousser Mengen vu Daten ze kréien, kennt d'Geschicht vum Abdur Chowdhury. 2006, als hien de Chef vun der Recherche am AOL war, huet hien intent fir d'Fuerschung verëffentlecht wat hien geduecht huet anonymiséiert Sichresultë vun 650.000 AOL Benotzer. Wat ech kann soen, Chowdhury an d'Forscher bei AOL haten e gudden Intentiounen, a si hunn geduecht datt si d'Daten anonym gemaach hunn. Awer si waren falsch. Et gouf séier entdeckt datt d'Daten net als anonym wéi d'Fuerscher geduecht hunn an d'Reporter aus der New York Times konnten jemanden an der Datebank mat Barrièren identifizéieren (Barbaro and Zeller 2006) . Wéi dës Problemer fonnt goufen, huet Chowdhury d'Daten aus der AOLs Websäit entfernt, awer et war ze spéit. D'Donnéeë goufen op anere Websäite repostéiert an et gëtt ëmmer nach ëmmer disponibel wann Dir dëst Buch liest. De Chowdhury gouf gebrannt, an den AOL Chef-Technologie Offizéier (Hafner 2006) . Wéi dësen Exemplar weist, sinn d'Virdeeler fir spezifesch Individuen innerhalb vu Firmen fir den Datenzugriff ze erlaaben sinn zimlech kleng an d'schlëmmste Fall Szenario ass schrecklech.
D'Fuerscher kënnen awer heiansdo Zougang zu Daten kréien, déi fir déi allgemeng Public net zougänglech sinn. Verschidde Regierungen hu Prozeduren déi d'Fuerscher verlaangen no dem Zougang zouloossen, an als Beispiller méi spéit an dësem Kapitel Show, kënnen d'Fuerscher deelweis zougänglech Zougang zu Korrespondenzdaten kréien. Zum Beispill, Einav et al. (2015) zesumme mat engem Fuerscher bei eBay fir online Auktionen ze studéieren. Ech soen méi iwwer d'Recherche, déi aus dëser Zesummenaarbecht spéit am Kapitel gezeechent gëtt, awer ech soen et elo well all déi véier Ingredienten hunn déi ech an erfollegräichen Partnerschaften hunn: Forscherinteressie, Fuerscher Kapazitéit, Entreprisezuel an Firma . Ech hunn vill potenziell Collaboratioune gesinn gesinn, well entweder de Fuerscher oder de Partner - et ass eng Firma oder Regierung - eng vun dësen Zutaten.
Och wann Dir en Partnerschaft matt engem Geschäft kaaft oder d'Zougang zu beschränkt Regierungsdaten erliewen, sinn et awer e puer Downsides fir Iech. Als éischt, Dir wäert Iech wahrscheinlech net Är Daten mat aner Fuerscher te bréngen, wat heescht datt aner Fuerscher net kënnen Är Resultater verifizéieren an ausdehnen. Zweetens, d'Froen, déi Dir froen kënnt, kann limitéiert sinn; D'Entreprisen hu wahrscheinlech keng Fuerscher erlaabt datt si sou schlecht sinn. Schlussendlech kënnen dës Partnerschaften zumindest d'Erscheinung vun engem Interessekonflikter geschafe ginn, wou Leit mengen datt Är Resultater vun Äre Partnerschaften beaflosst ginn. All dës Downsides kënnen adresséiert ginn, awer et ass wichteg ze wëssen, datt d'Aarbecht mat Daten, déi net fir jiddereen zougänglech ass, onbedingt an Downsides.
Zesummegefaasst sinn vill grouss Daten net fir d'Fuerscher zou. Et sinn seriéis legal, geschäftlech an ethesch Barrièren, déi den Datenzugriff verhënneren, an dës Barrièren net méi wäit wéi d'Technologie verbessert, well se net technesch Barrièren sinn. Verschidden national Regierungen hu Prozeduren etabléiert fir den Zougang vun Daten fir e puer Datebank z'integréieren, mä de Prozess ass besonnesch ad hoc am staatlechen a lokalen Niveau. Och an verschiddene Fäll kënnen d'Fuerscher mat Firmen zesummen Partner fir den Zougang vun Daten erreechen, awer dëst kann eng Rei vun Probleemer fir Fuerscher an Firmen hunn.