Tadqiqotchilarga kirish uchun kompaniyalar va hukumatlarning ma'lumotlarini olish qiyin.
2014 yil may oyida AQSh Milliy Xavfsizlik Agentligi qishloq Utah shahrida axborot markazi ochdi, bu noma'lum nom, Intelligence Community Comprehensive National Cybersecurity Initiative Data Center. Shu bilan birga, Utah Data Centre deb nomlanuvchi ushbu ma'lumot markazi shubhasiz qobiliyatlarga ega. Bir xabarda barcha aloqa turlarini saqlash va qayta ishlash mumkin, jumladan "shaxsiy elektron pochtalarning to'liq tarkibi, uyali telefon qo'ng'iroqlari va Google qidiruvlari, shuningdek shaxsiy ma'lumotlar yo'llarining har qanday turlari - mashinalar uchun to'lovlar, sayohat yo'nalishlari, kitob do'koni xaridlari , va boshqa raqamli "mobil axlat" " (Bamford 2012) . Yuqorida keltirilgan katta ma'lumotlarda nozik tabiat haqidagi xavotirlarni oshirishdan tashqari Utah Data Center tadqiqotchilarga etib bo'lmaydigan boy ma'lumotlar manbasining o'ta namunasi hisoblanadi. Ko'proq ma'lumotlarga ega bo'lgan katta ma'lumot manbalari hukumatlar tomonidan (masalan, soliq ma'lumotlari va ta'lim ma'lumotlari) yoki kompaniyalar tomonidan nazorat qilinadigan va cheklangan (masalan, qidiruv tizimlariga so'rovlar va qo'ng'iroqlar metadata-ma'lumotlari). Shu sababli, ushbu ma'lumot manbalari mavjud bo'lsa ham, ijtimoiy tadqiqot maqsadlari uchun foydasiz, chunki ular to'siqsiz.
Mening tajribamga qaraganda, universitetlarda joylashgan tadqiqotchilarning ko'pchiligi bu noqulaylik manbasini noto'g'ri tushunishadi. Ushbu ma'lumotlar kompaniya va hukumatlardagi odamlar axmoqlik, dangasa yoki befarq bo'lgani uchun emas. Aksincha, jiddiy huquqiy, biznes va axloqiy to'siqlar mavjud bo'lib, ular ma'lumotlar uzilishiga yo'l qo'ymaydi. Misol uchun, veb-saytlar uchun ba'zi xizmat shartlari faqatgina xodimlar tomonidan ishlatilishi yoki xizmatni yaxshilashga imkon beradi. Shunday qilib, ma'lumot almashishning ayrim shakllari kompaniyalarni mijozlardan qonuniy da'volarga sabab bo'lishi mumkin. Ma'lumot almashish bilan shug'ullanadigan kompaniyalar uchun jiddiy biznes xavfi mavjud. Agar shaxsiy tadqiqot ma'lumotlari tasodifan Google'dan ilmiy tadqiqot loyihasi doirasida tashqariga chiqsa, jamoatchilik qanday javob berishi mumkinligini tasavvur qilib ko'ring. Bunday ma'lumotlarning haddan tashqari buzilganligi, hatto kompaniya uchun mavjud bo'lgan xavf bo'lishi mumkin. Shunday qilib, Google va eng yirik kompaniyalar tadqiqotchilar bilan ma'lumot almashish uchun juda xavfli.
Darhaqiqat, Abdur Chowdhury haqidagi hikoyani bilish uchun deyarli har bir kishi katta hajmdagi ma'lumotlarga ega bo'lish imkoniyatiga ega. 2006-yilda, AOL-da tadqiqot olib borganida, u 650 ming AOL foydalanuvchilaridan qidiruv so'rovlarini anonimlashtirganini bilish uchun tadqiqot jamoasiga nom qozondi. Men Chowdhury va AOL tadqiqotchilarining yaxshi niyatlari borligini aytishim mumkin, ular ma'lumotni anonimlashtirishni o'ylashgan. Lekin ular noto'g'ri edilar. Tadqiqotchilar fikricha, ma'lumotlar " Nyu-York Tayms" gazetasi muxbirlari datasetdagi birovni osonlikcha aniqlay olishgan (Barbaro and Zeller 2006) . Ushbu muammolarni aniqlagandan so'ng, Chowdhury AOL veb-saytidagi ma'lumotlarni o'chirib tashladi, ammo bu juda kech edi. Ma'lumotlar boshqa veb-saytlarda joylashtirildi va bu kitobni o'qiyotganda siz hali ham mavjud bo'lasiz. Chowdhury ishdan chiqarildi va AOLning bosh texnologiya xodimi iste'foga chiqdi (Hafner 2006) . Ushbu misoldan ko'rinib turibdiki, kompaniyalar ichidagi muayyan shaxslar uchun ma'lumotlarga kirishni osonlashtiradigan foydalar juda kichikdir va eng yomon vaziyat senaryosidir.
Holbuki, tadqiqotchilar, ba'zan keng jamoatchilikka kirish mumkin bo'lmagan ma'lumotlarga kirishlari mumkin. Ayrim hukumatlar tadqiqotchilar izlanishlari uchun murojaat qilishlari mumkin bo'lgan tartibga ega va bu bobda keltirilgan misollarda tadqiqotchilar vaqti-vaqti bilan korporativ ma'lumotlarga kirish imkoniyatiga ega bo'lishlari mumkin. Misol uchun, Einav et al. (2015) eBayda onlayn auksionlarni o'rganish bo'yicha tadqiqotchi bilan hamkorlik qildi. Keyinchalik bobda ushbu hamkorlikdan kelib chiqqan tadqiqot haqida ko'proq gapiraman, ammo men buni hozir aytib o'tmoqchiman, chunki u muvaffaqiyatli hamkorlikda ko'rgan barcha to'rtta tarkibiy qismga ega edi: tadqiqotchi qiziqishi, tadqiqotchi qobiliyati, kompaniya manfaati va kompaniya imkoniyati . Ko'plab potentsial hamkorlik muvaffaqiyatsizlikka uchraydi, chunki tadqiqotchi yoki sherik - kompaniya yoki hukumat bo'ladimi, bu tarkibiy qismlardan biri yo'q edi.
Agar siz biznes bilan sheriklikni rivojlantirsangiz yoki cheklangan hukumat ma'lumotlariga kirishga qodir bo'lsangiz ham, siz uchun ba'zi bir kamchiliklar mavjud. Birinchidan, siz ma'lumotingizni boshqa tadqiqotchilar bilan baham ko'rish imkoniga ega bo'lmay qolasiz, ya'ni boshqa tadqiqotchilar sizning natijalaringizni tasdiqlashlari va kengaytirishlari mumkin emas degan ma'noni anglatadi. Ikkinchidan, siz so'rashingiz mumkin bo'lgan savollar cheklangan bo'lishi mumkin; kompaniyalar ularni yomon ko'rishga olib keladigan tadqiqotlarni amalga oshirishga imkon bermaydi. Va nihoyat, bu hamkorliklar hech bo'lmaganda manfaatlar to'qnashuvining ko'rinishini yaratishi mumkin, odamlar sizning natijalaringizni sheriklaringiz tomonidan ta'sirlangan deb o'ylashlari mumkin. Ushbu barcha inqirozlarni hal qilish mumkin, ammo aniq bo'lishi kerakki, har bir kishi uchun ochiq bo'lmagan ma'lumotlar bilan ishlash ham yuqoriga va ham pastga tushishi mumkin.
Xulosa qilib, tadqiqotchilarga katta hajmdagi ma'lumotlar ulanmagan. Ma'lumotlarga kirishni cheklovchi jiddiy huquqiy, ishchan va axloqiy to'siq mavjud va bu to'siqlar texnologik jihatdan yaxshilanadi, chunki ular texnik to'siq emas. Ba'zi milliy hukumatlar ba'zi ma'lumotlar to'plamlari uchun ma'lumotlardan foydalanishga ruxsat berish tartib-taomillarini o'rnatgan, biroq bu jarayon ayniqsa davlat va mahalliy darajalarda maxsus. Bundan tashqari, ba'zi hollarda tadqiqotchilar kompaniyalar bilan ma'lumot olish uchun sherik bo'lishlari mumkin, ammo bu tadqiqotchilar va kompaniyalar uchun turli xil muammolarni keltirib chiqarishi mumkin.