Şirkətlər və hökumətlər tərəfindən aparılmış məlumatlar tədqiqatçıların əldə olunması üçün çətindir.
2014-cü ilin may ayında ABŞ Milli Təhlükəsizlik Agentliyi Utah şəhərində məlumat mərkəzini qeyri-adi bir ad olan Intelligence Community Comprehensive National Cybersecurity Initiative Data Center ilə açdı. Lakin Utah Data Center kimi tanınan bu məlumat mərkəzi, şaşırtıcı imkanlara malik olduğu bildirilir. Bir hesabatda "şəxsi e-poçtların, mobil telefon zənglərinin və Google axtarışlarının tam məzmunu, eləcə də hər cür fərdi məlumat yollarının - parka daxilolmaları, səyahət marşrutları, kitab mağazaları satınalmaları da daxil olmaqla, bütün kommunikasiya formalarını saxlaya və işə sala biləcəyini iddia edir. , və digər rəqəmsal 'cib zibil' " (Bamford 2012) . Aşağıdakı şəkildə təsvir ediləcək böyük məlumatlardakı məlumatların həssas təbiəti ilə əlaqədar narahatlıqların artırılmasına əlavə olaraq, Utah Məlumat Mərkəzi tədqiqatçılara çatışmazlıq verən zəngin bir məlumat mənbəyinin ekstremal bir nümunəsidir. Daha ümumiyyətlə, faydalı ola biləcək bir çox böyük məlumat mənbəyi hökumət tərəfindən nəzarət edilir və məhdudlaşdırılır (məsələn, vergi məlumatları və təhsil məlumatları) və ya şirkətlər (məsələn, axtarış motorlarına və telefon çağırış meta-məlumatlarına sorgular). Buna görə də, bu məlumat mənbələri olsa da, sosial tədqiqat məqsədləri üçün faydasızdır, çünki onlar əlçatmazdırlar.
Təcrübəmdə universitetlərdəki bir çox tədqiqatçı bu əlçatmazlığın mənbəyini səhv anlayır. Bu məlumatlar şirkətlər və hökumətlərdəki insanlar axmaq, tənbəl və ya uncaring deyil, çünki əlçatmazdır. Əksinə, məlumatların əldə olunmasına mane olan ciddi hüquqi, biznes və etik maneələr var. Məsələn, veb-saytlar üçün bəzi xidmət şərtləri yalnız işçilərin istifadə etdiyi məlumatlara və ya xidməti təkmilləşdirməyə imkan verir. Belə ki, məlumatların mübadiləsinin müəyyən formaları şirkətləri müştərilərdən qanuni iddia aça bilər. Məlumatların paylaşılmasında iştirak edən şirkətlər üçün də ciddi iş riskləri var. Şəxsi araşdırma məlumatları təsadüfən Google-dan bir universitet tədqiqat layihəsi çərçivəsində sızdırıldığında ictimaiyyətin necə cavab verəcəyini təsəvvür etməyə çalışın. Belə bir məlumat pozuntusu, həddindən artıq olduqda, şirkət üçün də mövcud bir risk ola bilər. Beləliklə, Google və ən böyük şirkətlər - məlumatları tədqiqatçılarla bölüşmək üçün çox təhlükəlidirlər.
Əslində, Abdur Chowdhury'nin hekayəsini böyük miqdarda məlumatlara çatmağı təmin edən bir vəziyyətdə olan hər kəs bilir. 2006-cı ildə AOL-də tədqiqat rəhbəri olduğu zaman, o, 650.000 AOL istifadəçisindən anonimləşdirilmiş axtarış sorğuları olduğunu düşündüklərini araşdırma ictimaiyyətinə qəsdən buraxdı. Mən deyə bilərik ki, Chowdhury və AOL-dakı tədqiqatçılar yaxşı niyyətlər əldə etmişdilər və onlar məlumatların anonimləşdirildiyini düşünürdülər. Lakin onlar yanlış idi. Tezliklə tədqiqatçılar düşündüyü kimi məlumatların anonim olmadığı, New York Times qəzetinin müxbiri isə (Barbaro and Zeller 2006) asanlıqla birinin (Barbaro and Zeller 2006) müəyyənləşdirildiyini aşkar etdi. Bu problemlər aşkar edildikdən sonra, Chowdhury AOL saytının məlumatlarını çıxardı, lakin çox gec idi. Məlumatlar digər veb saytlarda yerləşdirilib və bu kitab oxuduğunuz halda hələ də mövcud ola bilər. Chowdhury işdən atıldı və AOL-in baş texnologiya vəzifəlisi istefa etdi (Hafner 2006) . Bu nümunə göstərdi ki, şirkətlər içərisində olan şəxslərin məlumatların əldə edilməsini asanlaşdırmaq üçün faydaları çox azdır və ən pis vəziyyət ssenarisi qorxudur.
Lakin tədqiqatçılar bəzən ümumi ictimaiyyət üçün əlçatmaz olan məlumatlara çıxış əldə edə bilərlər. Bəzi hökumətlərdə tədqiqatçılar çıxış üçün müraciət edə biləcək prosedurlar var və bu fəsildə daha sonra göstərilən nümunələrə görə tədqiqatçılar bəzən korporativ məlumatlara çıxış əldə edə bilərlər. Məsələn, Einav et al. (2015) online auksionları öyrənmək üçün eBay-də tədqiqatçı ilə əməkdaşlıq etdi. Daha sonra fəsildə bu əməkdaşlıqdan gələn araşdırma haqqında daha çox söhbət edəcəyəm, amma indi bunu qeyd edirəm, çünki uğurlu əməkdaşlıqda gördüyüm bütün dörd maddələr var idi: tədqiqatçı maraq, tədqiqat qabiliyyəti, şirkətin marağı və şirkətin qabiliyyəti . Bir çox potensial əməkdaşlığın uğursuz olduğunu gördüm, çünki tədqiqatçı ya da tərəfdaş - bir şirkət və ya hökumət olmadığı üçün bu maddələrdən biri yox idi.
Bir iş ilə bir ortaqlıq inkişaf etdirə və ya məhdud hökumət məlumatlarına giriş əldə edə bilsən belə olsa da, sizin üçün bir neçə eniş var. Birincisi, məlumatlarınızı digər tədqiqatçılarla bölüşmək mümkün olmayacaqdır, yəni digər tədqiqatçılar sizin nəticələri doğrulayacaq və genişləndirə bilməyəcəkdir. İkincisi, soruşa biləcəyiniz suallar məhdud ola bilər; şirkətlər onlara pis görünməyə səbəb ola biləcək tədqiqatlara imkan vermirlər. Nəhayət, bu tərəfdaşlıqlar, ən azından insanlar sizin nəticələrinizin tərəfdaşlıqlarınızdan təsirləndiyini düşünə biləcəyi maraqların toqquşmasının görünüşünü yarada bilərlər. Bütün bu downsides həll edilə bilər, lakin aydın olmaq vacibdir ki, hər kəs üçün əlçatan olmayan məlumatlar ilə iş upsides və downsides var.
Xülasə olaraq, tədqiqatçılar üçün böyük məlumatların çoxu əlçatmazdır. Məlumatların əldə edilməsinə mane olan ciddi hüquqi, biznes və etik maneələr mövcuddur və texniki maneələr olmadığı üçün texnologiya yaxşılaşdıqca bu maneələr aradan qalxmaz. Bəzi milli hökumətlər bəzi məlumatlar üçün məlumatların əldə edilməsini təmin etmək üçün prosedurlar müəyyən etmişdir, lakin proses xüsusilə dövlət və yerli səviyyədədir. Bundan əlavə, bəzi hallarda tədqiqatçılar şirkətlərlə məlumat əldə etmək üçün tərəfdaş ola bilər, lakin bu tədqiqatçılar və şirkətlər üçün müxtəlif problemlər yarada bilər.