דאַטע געהאלטן דורך קאָמפּאַניעס און גאַווערמאַנץ זענען שווער פֿאַר ריסערטשערז צו צוטריט.
אין מאי 2014, די יו. עס. נאַשאַנאַל זיכערהייַט אַגענטור געעפנט אַ דאַטן צענטער אין דאָרעמדיק יוטאָ מיט אַ ומגעלומפּערט נאָמען, די ינטעלליגענסע קאַמיוניטי קאָמפּרעהענסיווע נאַשאַנאַל סיבערסעקוריטי יניטיאַטיווע דאַטע צענטער. אָבער, דאָס דאַטן צענטער וואָס איז גערופן די יוטאַ דאַטאַ צענטער, איז געמאלדן צו האָבן אַ גרויס פיייקייַט. איין באַריכט אַלאַוז אַז עס קען פאַרדינען און פּראָצעס אַלע פארמען פון קאָמוניקאַציע אַרייַנגערעכנט "דער גאַנץ אינהאַלט פון פּריוואַט ימיילז, מאָביל טעלעפאָן רופט, און Google זוך, , און אנדערע דיגיטאַל 'קעשענע אָנוואַרפן' " (Bamford 2012) . אין דערצו צו רייזינג קאַנסערנז וועגן די שפּירעוודיק נאַטור פון פיל פון די אינפֿאָרמאַציע קאַפּטשערד אין גרויס דאַטן, וואָס וועט זיין דיסקרייבד ווייַטער אונטן, די Utah Data Center איז אַ עקסטרעם בייַשפּיל פון אַ רייַך דאַטע מקור וואָס איז ינאַקסעסאַבאַל צו ריסערטשערז. מער בכלל, פילע מקורים פון גרויס דאַטן וואָס וואָלט זיין נוציק זענען קאַנטראָולד און ריסטריקטיד דורך רעגירונגס (למשל, שטייער דאַטן און בילדונגקרייז דאַטן) אָדער קאָמפּאַניעס (למשל, קוואָטעס צו זוכן ענדזשאַנז און טעלעפאָן רופן מעטאַ-דאַטן). דעריבער, כאָטש די דאַטן קוואלן עקסיסטירן, זיי זענען אַרויסגעוואָרפן פֿאַר די סיבות פון געזעלשאַפטלעך פאָרשונג ווייַל זיי זענען ינאַקסעסאַבאַל.
אין מיין דערפאַרונג, פילע ריסערטשערז באזירט אין אוניווערסיטעטן מיסאַנדערסטאַנד די מקור פון דעם ינאַקסעסאַביליטי. די דאַטן זענען ינאַקסעסאַבאַל נישט ווייַל מענטשן בייַ קאָמפּאַניעס און רעגירונגס זענען נאַריש, פויל, אָדער ינקאַרינג. אלא, עס זענען ערנסט לעגאַל, געשעפט, און עטישע באַריערז אַז פאַרמייַדן דאַטן צוטריט. פֿאַר בייַשפּיל, עטלעכע תּנאָים-פון-סערוויס אַגרימאַנץ פֿאַר וועבסיטעס בלויז לאָזן דאַטע צו זיין געוויינט דורך עמפּלוייז אָדער צו פֿאַרבעסערן די דינסט. אזוי זיכער פארמען פון דאַטן ייַנטיילונג קען ויסשטעלן קאָמפּאַניעס צו לאַדזשיטאַמאַט לאָסוץ פון קאַסטאַמערז. עס זענען אויך היפּש געשעפט ריסקס צו קאָמפּאַניעס ינוואַלווד אין ייַנטיילונג דאַטן. פּרוּווט צו ימאַדזשאַן ווי דאָס ציבור וואָלט זיך אָפּרעדן אויב פערזענליכע זוכן דאַטן אַקסאַדענטלי ליקט אויס פון Google ווי אַ אוניווערסיטעט פאָרשונג פּרויעקט. אַזאַ אַ דאַטן ברעכן, אויב עקסטרעם, קען אַפֿילו זיין אַן עקסיסטענטשאַל ריזיקירן פֿאַר די פירמע. אַזוי גוגל-און רובֿ גרויס קאָמפּאַניעס-זענען זייער ריזיקירן-אַדווערס וועגן ייַנטיילונג דאַטן מיט פאָרשער.
אין פאַקט, כּמעט אַלעמען וואס איז אין אַ שטעלע צו צושטעלן צוטריט צו גרויס אַמאַונץ פון דאַטן ווייסט די געשיכטע פון אַבדור טשאָוודהורי. אין 2006, ווען ער איז געווען די קאָפּ פון פאָרשונג אין אַאָל, ער ינטענאַלי באפרייט צו דער פאָרשונג קהל וואָס ער געדאַנק זענען אַנאָנימיזעד זוכן קוויריז פון 650.000 אַאָל ניצערס. ווי ווייַט איך קען זאָגן, טשאָאָדהורי און די ריסערטשערז בייַ אַאָל האָבן גוט ינטענטשאַנז, און זיי טראַכטן אַז זיי האבן אַנאַמאַניזד די דאַטן. אבער זיי זענען פאַלש. עס איז געווען שנעל דיסקאַווערד אַז די דאַטן זענען נישט אַנאָנימאָוס ווי די ריסערטשערז געדאַנק, און רעפּאָרטערס פון די ניו יארק טיימס זענען ביכולת צו ידענטיפיצירן עמעצער אין דעם דאַטאַסעט מיט יז (Barbaro and Zeller 2006) . אַמאָל די פּראָבלעמס זענען דיסקאַווערד, Chowdhury האט אראפגענומען די דאַטן פון אַאָל ס וועבזייַטל, אָבער עס איז אויך שפּעט. די דאַטן איז געווען ריפּאָסטעד אויף אנדערע וועבסיטעס, און עס וועט נאָך זיין בארעכטיגט ווען איר לייענען דעם בוך. טשאָאַדהורי איז געווען פייערד, און AOL ס הויפּט טעכנאָלאָגיע באַפרייַער ריסיינד (Hafner 2006) . ווי דעם בייַשפּיל ווייזט, די בענעפיץ פֿאַר ספּעציפיש מענטשן ין פון קאָמפּאַניעס צו פאַסילאַטייט די דאַטע צוטריט זענען שיין קליין און די ערגסט-פאַל סצענאַר איז שרעקלעך.
אָבער, ריסערטשערז קענען מאל באַקומען צוטריט צו די דאַטע וואָס איז ינאַקסעסאַבאַל צו די אַלגעמיינע ציבור. עטלעכע גאַווערמאַנץ האָבן פּראָוסידזשערז אַז ריסערטשערז קען נאָכפאָלגן צו צוטריט צו צוטריט, און ווי די ביישפּילן שפּעטער אין דעם קאַפּיטל ווייַזן, ריסערטשערז קענען טייל מאָל באַקומען צוטריט צו פֿירמע דאַטע. למשל, Einav et al. (2015) partnered with a researcher at eBay to study online auctions. איך וועל רעדן מער וועגן דער פאָרשונג וואָס איז געקומען פון דעם מיטאַרבעט שפּעטער אין דעם קאַפּיטל, אָבער איך זאָג עס איצט, ווייַל עס איז געווען אַלע פיר פון די ינגרידיאַנץ וואָס איך זען אין די סאַקסעסדיק פּאַרטנערשיפּס: פאָרשער אינטערעס, פאָרשער פיייקייַט, געזעלשאַפט אינטערעס און פירמע פיייקייַט . איך ווע געזען פילע פּאָטענציעל קאַלאַבעריישאַנז דורכפאַל ווייַל אָדער דער פאָרשער אָדער די שוטעף-זיין עס אַ פירמע אָדער רעגירונג-פעלנדיק איינער פון די ינגרידיאַנץ.
אפילו אויב איר זענט ביכולת צו אַנטוויקלען אַ שוטפעס מיט אַ געשעפט אָדער געווינען צוטריט צו ריסטריקטאַד רעגירונג דאַטן, אָבער, עס זענען עטלעכע דאַונסיידז פֿאַר איר. ערשטער, איר וועט מיסטאָמע ניט קענען צו טיילן דיין דאַטן מיט אנדערע ריסערטשערז, וואָס מיטל אַז אנדערע ריסערטשערז וועט נישט קענען צו באַשטעטיקן און פאַרברייטערן דיין רעזולטאַטן. רגע, די פראגעס וואָס איר קענען פרעגן קען זיין באגרענעצט; קאָמפּאַניעס זענען אַנלייקלי צו לאָזן פאָרשונג וואָס קען מאַכן זיי קוקן שלעכט. סוף, די פּאַרטנערשיפּס קענען מאַכן בייַ מינדסטער די אויסזען פון אַ קאָנפליקט פון אינטערעס, ווו מענטשן זאל טראַכטן אַז דיין רעזולטאַטן זענען געווען ינפלואַנסט דורך דיין פּאַרטנערשיפּס. אַלע פון די דאַונסיידז קענען זיין אַדרעסד, אָבער עס איז וויכטיק צו זיין קלאָר אַז ארבעטן מיט דאַטן וואָס איז ניט צוטריטלעך צו אַלעמען האט ביידע ופּסידעס און דאַונסיידז.
אין קיצער, גורל פון גרויס דאַטע איז ינאַקסעסאַבאַל צו ריסערטשערז. עס זענען ערנסט לעגאַל, געשעפט, און עטישע באַריערז אַז פאַרמייַדן דאַטע צוטריט, און די באַריערז וועלן נישט גיין אַוועק ווי טעכנאָלאָגיע ימפּרוווז ווייַל זיי זענען נישט טעכניש באַריערז. עטלעכע נאציאנאלע רעגירונגס האָבן געגרינדעט פּראָוסידזשערז פֿאַר דיטיילד דאַטן צוטריט פֿאַר עטלעכע דאַטאַסעץ, אָבער דער פּראָצעס איז ספּעציעל אַדהאָס אין די שטאַט און היגע לעוועלס. אויך, אין עטלעכע קאַסעס, ריסערטשערז קענען שוטעף מיט קאָמפּאַניעס צו באַקומען דאַטן אַקסעס, אָבער דאָס קענען מאַכן אַ פאַרשיידנקייַט פון פראבלעמען פֿאַר ריסערטשערז און קאָמפּאַניעס.