Ընկերությունների եւ կառավարությունների կողմից կատարված տվյալները դժվար են հետազոտողների համար:
2014 թ. Մայիսին ԱՄՆ ազգային անվտանգության գործակալությունը տվյալների բազա է բացել գյուղական Յուտա քաղաքում, որը անհարմար անուն է `« Ինտելեկտիալ Համայնք »ազգային կիբերկուսակցական նախաձեռնության տվյալների կենտրոն: Այնուամենայնիվ, այս տվյալների կենտրոնը, որը հայտնի է դարձել որպես Յուտա Տվյալների կենտրոն, հաղորդվում է զարմանալի հնարավորություններ: Մի զեկույցում պնդում են, որ այն կարող է պահպանել եւ մշակել հաղորդակցության բոլոր ձեւերը, ներառյալ «մասնավոր նամակների ամբողջական բովանդակությունը, բջջային հեռախոսազանգերը եւ Google- ի որոնումները, ինչպես նաեւ անձնական տվյալների արահետների բոլոր տեսակները, կայանատեղերի մուտքերը, ճանապարհորդական երթուղիները, գրախանութների գնումը , եւ այլ թվային «գրպանի ծին» (Bamford 2012) : Բացի մեծ տվյալների վրա գրված տեղեկատվության մեծամասնության զգայուն բնույթի մտահոգությունների առաջացումից, Յուտա Տվյալների կենտրոնը հարուստ տվյալների աղբյուրի ծայրահեղ օրինակ է, որը անհասանելի է հետազոտողների համար: Ընդհանուր առմամբ, մեծ տվյալների մեծ աղբյուրները, որոնք օգտակար կլիներ, վերահսկվում եւ սահմանափակվում են կառավարությունների կողմից (օրինակ `հարկային տվյալներ եւ կրթական տվյալներ) կամ ընկերությունների կողմից (օրինակ` որոնման համակարգերի եւ հեռախոսային զանգերի մեթատվյալների հարցումներ): Հետեւաբար, չնայած այդ տվյալների աղբյուրները գոյություն ունեն, դրանք անիմաստ են սոցիալական հետազոտության նպատակների համար, քանի որ դրանք անհասանելի են:
Իմ փորձով, համալսարաններում հիմնված շատ հետազոտողներ սխալ են հասկանում այդ անթույլատրելիության աղբյուրը: Այս տվյալները անհասանելի են, քանի որ ընկերությունների եւ կառավարությունների մարդիկ հիմար են, ծույլ կամ անտարբեր են: Փոխարենը, կան լուրջ իրավական, գործարար եւ բարոյական խոչընդոտներ, որոնք թույլ չեն տալիս տվյալների մուտք գործել: Օրինակ, վեբ-կայքերում որոշ պայմանների ծառայություն մատուցող պայմանագրերը թույլ են տալիս աշխատակիցների կողմից օգտագործվող տվյալները կամ ծառայության բարելավումը: Այսպիսով, տվյալների փոխանակման որոշ ձեւեր կարող են ընկերություններին բացահայտել հաճախորդների օրինական պահանջները: Տվյալների փոխանակման մեջ ներգրավված ընկերությունների համար կան նաեւ գործարար ռիսկեր: Փորձեք պատկերացնել, թե ինչպես հասարակությունը կպատասխանի, եթե անհատական որոնման տվյալները պատահաբար հեռանան Google- ից որպես համալսարանի հետազոտական ծրագրի մի մաս: Նման տվյալների խախտումը, եթե ծայրահեղ, կարող է նույնիսկ լինել էկզիստենցիալ ռիսկ: Այսպիսով, Google- ը եւ խոշորագույն ընկերությունները շատ ռիսկային են համարում հետազոտողների հետ տվյալների փոխանակման մասին:
Փաստորեն, գրեթե բոլորը, ովքեր գտնվում են մեծ քանակությամբ տվյալների մատչելի վիճակում, գիտեն Աբդուր Չավդհարիի պատմությունը: 2006 թ.-ին, երբ նա AOL- ի հետազոտության ղեկավարն էր, միտումնավոր կերպով ազատ է արձակվել հետազոտական հանրությանը, այն, ինչ նա կարծում էր, 650,000 AOL օգտվողներից անոնսացված որոնման հարցումներ է իրականացնում: Քանի որ ես կարող եմ ասել, Chowdhury- ը եւ AOL- ի հետազոտողները լավ մտադրություններ ունեին, եւ նրանք մտածում էին, որ իրենք անոնիմացված են տվյալներ: Բայց նրանք սխալ էին: Այն արագ հայտնաբերվեց, որ տվյալներն անանուն չեն եղել, քանի որ հետազոտողները կարծում են, եւ « Նյու Յորք թայմս» թերթի լրագրողները կարողացան պարզել տվյալների հավաքածուի մեկի հետ հեշտությամբ (Barbaro and Zeller 2006) : Երբ այս խնդիրները հայտնաբերվեցին, Chowdhury- ը հեռացրեց AOL- ի կայքից ստացված տվյալները, բայց դա չափազանց ուշ էր: Տվյալները վերահրատարակվել են այլ կայքերում, եւ դա, հավանաբար, դեռ մատչելի կլինի, երբ դուք կարդում եք այս գիրքը: Chowdhury- ն հեռացվել է, եւ AOL- ի գլխավոր տեխնոլոգիաների պաշտոնյան հրաժարական է տվել (Hafner 2006) : Քանի որ այս օրինակը ցույց է տալիս, ընկերությունների ներսում որոշակի անհատների օգուտները հեշտացնելու համար տվյալները բավականին փոքր են, եւ ամենավատ դեպքերի սցենարը սարսափելի է:
Հետազոտողները, այնուամենայնիվ, կարող են երբեմն օգտվել այնպիսի տվյալներից, որոնք անհասանելի են հանրությանը: Որոշ կառավարություններ ունեն ընթացակարգեր, որոնք կարող են հետեւել հետազոտողներին դիմելու համար մուտքի հնարավորություն, եւ քանի որ հետագայում այս գլխի օրինակները ցույց են տալիս, հետազոտողները երբեմն կարող են օգտվել կորպորատիվ տվյալների հետ: Օրինակ, Einav et al. (2015) համագործակցում է eBay- ի հետ, որը ուսումնասիրում է առցանց աուդիտորները: Ես ավելի շատ խոսելու եմ այս համագործակցությունից հետո գլխի ուսումնասիրության մասին, բայց հիմա նշում եմ այն պատճառով, որ այն ունեցել է բոլոր չորս բաղադրիչները, որոնք ես տեսնում եմ հաջող համագործակցության մեջ. Գիտաշխատողի հետաքրքրությունը, հետազոտող կարողությունը, ընկերության շահերը եւ ընկերության հնարավորությունները: . Ես տեսա, որ շատ հնարավոր համագործակցությունները ձախողվել են, քանի որ հետազոտողը կամ գործընկերը, լինի դա ընկերության կամ կառավարության, այդ բաղադրիչներից որեւէ մեկը չկար:
Նույնիսկ եթե դուք ի վիճակի եք համագործակցել բիզնեսի հետ կամ ձեռք եք բերել կառավարության սահմանափակ տվյալներ, այնուամենայնիվ, կան որոշ անկումներ: Նախ, դուք, հավանաբար, չեք կարողանա ձեր տվյալները կիսել այլ հետազոտողների հետ, ինչը նշանակում է, որ այլ հետազոտողները չեն կարողանա ստուգել եւ ընդլայնել ձեր արդյունքները: Երկրորդ, այն հարցերը, որ դուք կարող եք հարցնել, կարող է սահմանափակվել. ընկերությունները հազիվ թե թույլ տան հետազոտություն, ինչը կարող է վատ լինել: Վերջապես, այդ համագործակցությունները կարող են ստեղծել գոնե շահերի բախման հայտնվելը, որտեղ մարդիկ կարող են մտածել, որ ձեր արդյունքները ազդում են ձեր գործընկերության վրա: Այս բոլոր downsides կարող է անդրադառնալ, բայց կարեւոր է պարզ լինել, որ տվյալների հետ աշխատելու, որը մատչելի չէ բոլորի համար, այնպես էլ upsides եւ downsides.
Ամփոփելով, շատ մեծ տվյալներ անհասանելի են հետազոտողների համար: Կան լուրջ իրավական, գործարար եւ բարոյական խոչընդոտներ, որոնք կանխում են տվյալների հասանելիությունը, եւ այդ խոչընդոտները չեն հեռանա, քանի որ տեխնոլոգիան բարելավվում է, քանի որ դրանք տեխնիկական խոչընդոտներ չեն: Որոշ ազգային կառավարություններ որոշակի տվյալների հավաքման համար տվյալների հասանելիության ապահովման ընթացակարգեր են սահմանել, սակայն գործընթացը հատկապես տեղական է եւ տեղական մակարդակներում: Բացի այդ, որոշ դեպքերում հետազոտողները կարող են համագործակցել ընկերությունների հետ, տվյալների ձեռքբերման համար, սակայն դա կարող է առաջացնել հետազոտողների եւ ընկերությունների համար բազմաթիվ խնդիրներ: