მკვლევართა წვდომისთვის კომპანიებისა და მთავრობების მიერ ჩატარებული მონაცემები რთულია.
2014 წლის მაისში, აშშ-ს ეროვნული უშიშროების სააგენტომ სოფელ იუტაში მონაცემთა ცენტრის გახსნა უხერხულ სახელით, სადაზვერვო საზოგადოების ყოვლისმომცველი ეროვნული კიბერ ინიციატივის მონაცემთა ცენტრის მეშვეობით. თუმცა, ამ მონაცემთა ცენტრში, რომელიც ცნობილია როგორც Utah მონაცემთა ცენტრის, იტყობინება, რომ აქვს astounding შესაძლებლობები. ერთ-ერთ ანგარიშში ნათქვამია, რომ მას შეუძლია შეინახოს და განახორციელოს ყველა სახის კომუნიკაციის ჩათვლით, მათ შორის, "კერძო ელ-ფოსტის, მობილური ტელეფონის ზარებისა და Google ძიების სრული შინაარსი, ისევე როგორც ყველა სახის პერსონალური მონაცემების ბილიკები-პარკირების ქვითრები, მოგზაურობის მარშრუტები, წიგნის მაღაზიების შესყიდვები , და სხვა ციფრული ჯიბეების ნარჩენები " (Bamford 2012) . გარდა ამისა, დიდი მონაცემებით გადაღებული ინფორმაციის დიდი ნაწილის მგრძნობიარე ხასიათის ზრდის გამო, რომელიც შემდგომში აღწერილია, იუტა მონაცემთა ცენტრი მდიდარი მონაცემთა წყაროა, რომელიც მკვლევარებისთვის მიუწვდომელია. უფრო ზოგადად, დიდი მონაცემების მრავალი წყაროა, რომელიც სასარგებლო იქნება კონტროლირებადი და შეზღუდულია მთავრობების მიერ (მაგალითად, საგადასახადო მონაცემები და საგანმანათლებლო მონაცემები) ან კომპანიები (მაგალითად, საძიებო სისტემებთან და სატელეფონო ზარის მეტა-მონაცემებთან). აქედან გამომდინარე, მიუხედავად იმისა, რომ ეს მონაცემები არსებობს, ისინი სოციალურ კვლევებში მიზანშეწონილია, რადგან ისინი მიუწვდომელია.
ჩემი გამოცდილებით, უნივერსიტეტებზე დაფუძნებული მრავალი მკვლევარი გაუგებარია ამ მიუწვდომლობის წყაროზე. ეს მონაცემები მიუწვდომელია არა იმიტომ, რომ კომპანიებსა და მთავრობებს შორის ხალხი სულელური, ზარმაცი და გაღიზიანებაა. უფრო მეტიც, არსებობს სერიოზული იურიდიული, ბიზნეს და ეთიკური ბარიერები, რომლებიც ხელს უშლის მონაცემთა ხელმისაწვდომობას. მაგალითად, ვებ-გვერდების ზოგიერთი ტერმინთა მომსახურების ხელშეკრულება მხოლოდ თანამშრომლების მიერ გამოყენებული მონაცემების და სერვისის გაუმჯობესების საშუალებას იძლევა. ამდენად, მონაცემთა გაცვლის გარკვეულმა ფორმებმა შეიძლება კომპანიებს გამოაცხადონ კომპანიების ლეგიტიმური სარჩელები. არსებობს მნიშვნელოვანი ბიზნეს რისკები კომპანიების ჩართული მონაცემების გაზიარება. შეეცადეთ წარმოიდგინოთ, როგორ პასუხობდა საზოგადოებას, თუ უნივერსიტეტში კვლევითი პროექტის ნაწილი Google- ისგან შემთხვევით გაჟღერდა. ასეთი მონაცემების დარღვევა, თუ უკიდურესი, შეიძლება იყოს ეგზისტენციალური რისკი კომპანიისთვის. ასე რომ, Google და ყველაზე მსხვილი კომპანიები ძალიან რისკის ქვეშ არიან, მკვლევარებთან მონაცემების გაზიარების შესახებ.
სინამდვილეში, თითქმის ყველას, ვისაც აქვს დიდი რაოდენობით მონაცემთა ხელმისაწვდომობა, იცის ამბავი აბდურ ჩოვჰარი. 2006 წელს, როდესაც ის AOL- ის კვლევის ხელმძღვანელი იყო, ის განზრახ გამოუცხადა კვლევით საზოგადოებას, რასაც ის ფიქრობდა, რომ ანონიმური ძებნა შეკითხვებს 650,000 AOL- ის მომხმარებელთაგან ჰქონდა. რამდენადაც შემიძლია ვთქვა, შუჰურმა და მკვლევარებმა AOL- ს ჰქონდათ კარგი განზრახვა, და მიაჩნიათ, რომ მათ ჰქონდათ ანონიმიზაცია მონაცემები. მაგრამ ისინი არასწორი იყვნენ. ეს სწრაფად აღმოჩნდა, რომ მონაცემები არ იყო ანონიმური, როგორც მკვლევარები ფიქრობდნენ, და ნიუ-იორკ ტაიმსის რეპორტიორებმა შეძლეს მონაცემთა ბაზაში ვინმეს იდენტიფიცირება (Barbaro and Zeller 2006) . ამ პრობლემების აღმოჩენის შემდეგ, შუახურმა ამოიღო მონაცემები AOL- ის ვებ-გვერდიდან, მაგრამ ეს ძალიან გვიან იყო. მონაცემები სხვა ვებ-გვერდებზე იყო გადანაწილებული და ის მაინც ხელმისაწვდომი გახდება მაშინ, როდესაც ეს წიგნი კითხულობთ. შუახური გაათავისუფლეს და AOL- ის მთავარი ტექნოლოგიების ოფიცერი გადადგა (Hafner 2006) . როგორც ეს მაგალითი გვიჩვენებს, კონკრეტული ფიზიკური პირების შიგნით კომპანიების შიგნით ხელმისაწვდომობის უზრუნველყოფა საკმაოდ პატარაა და ყველაზე ცუდი სცენარი საშინელია.
თუმცა მკვლევარებს შეუძლიათ ზოგჯერ ზოგადად ხელმისაწვდომი იყოს მონაცემთა ხელმისაწვდომობა, რაც მიუწვდომელია საზოგადოებისათვის. ზოგიერთ მთავრობას აქვს პროცედურები, რომლებიც მკვლევარებს შეუძლიათ დაიცვან წვდომისთვის და, როგორც ამ თავში მოცემული მაგალითების მიხედვით, მკვლევარებმა ზოგჯერ შეიძლება მოიპოვონ კორპორატიული მონაცემები. მაგალითად, Einav et al. (2015) პარტნიორთან ერთად მკვლევართა eBay შესასწავლად ონლაინ აუქციონის. უფრო მეტს ვესაუბრებით იმ კვლევის შესახებ, რომელიც მოგვიანებით თავი შეიკავა, მაგრამ მე ახლა ვამბობ, რადგან ის ოთხი ინგრედიენტია, რომ მე ვხედავ წარმატებულ პარტნიორებში: მკვლევარის ინტერესი, მკვლევარი შესაძლებლობები, კომპანიის ინტერესი და კომპანიის შესაძლებლობები . მე ვნახე ბევრი პოტენციური თანამშრომლობა, რადგან მკვლევარი ან პარტნიორი - ეს კომპანია ან მთავრობა - ამ ინგრედიენტებს არ აკლდა.
მაშინაც კი, თუ თქვენ შეძლებთ ბიზნესის განვითარებასთან დაკავშირებულ პარტნიორობას ან შეზღუდული მთავრობის მონაცემების ხელმისაწვდომობას, თუმცა არსებობს გარკვეული დაქვეითება თქვენთვის. პირველ რიგში, თქვენ ალბათ ვერ შეძლებთ თქვენი მონაცემების გაზიარებას სხვა მკვლევარებთან, რაც იმას ნიშნავს, რომ სხვა მკვლევარები ვერ შეძლებენ გადაამოწმონ და გააფართოვონ შედეგები. მეორე, კითხვები, რომლებიც შეიძლება ითხოვოთ შეიძლება შეზღუდული იყოს; კომპანიები ნაკლებად სავარაუდოა, რომ შესაძლებელი გახადონ კვლევა, რაც შეიძლება ცუდად გამოიყურებოდეს. საბოლოო ჯამში, ამ პარტნიორულ ურთიერთობებს შეუძლია შექმნას მინიმუმ ინტერესთა კონფლიქტი, სადაც შეიძლება ფიქრობთ, რომ თქვენს შედეგებს თქვენი პარტნიორული გავლენა მოახდინა. ყველა ამ უარყოფითს შეიძლება მივმართოთ, მაგრამ მნიშვნელოვანია, რომ გასაგები იყოს, რომ იმ მონაცემებთან მუშაობა, რომლებიც ყველასთვის ხელმისაწვდომი არ არის, ორივე მხარეს დაქვეითებულია.
მოკლედ, უამრავი დიდი მონაცემები მკვლევარებისთვის მიუწვდომელია. არსებობს სერიოზული იურიდიული, ბიზნეს და ეთიკური ბარიერები, რომლებიც ხელს უშლის მონაცემთა ხელმისაწვდომობას და ეს ბარიერები არ მიდიან, რადგან ტექნოლოგია გაუმჯობესდება, რადგან ისინი არ არიან ტექნიკური ბარიერები. ზოგიერთი ეროვნულმა მთავრობამ შეიმუშავა მონაცემთა დამუშავების პროცედურები ზოგიერთი მონაცემებისთვის, თუმცა ეს პროცესი განსაკუთრებულად ადის სახელმწიფო და ადგილობრივ დონეზე. გარდა ამისა, ზოგიერთ შემთხვევაში მკვლევარებს შეუძლიათ კომპანიებთან პარტნიორებთან მონაცემთა ხელმისაწვდომობა მიიღონ, მაგრამ მათ შეუძლიათ შექმნან სხვადასხვა სახის პრობლემები მკვლევართა და კომპანიებისთვის.