Մեծ տվյալներ են ստեղծվում եւ գանձվում է կառավարությունների այլ նպատակներով, քան հետազոտության. Օգտագործելով այս տվյալները հետազոտության համար, հետեւաբար, պահանջում repurposing.
An idealized տեսք սոցիալական հետազոտությունների պատկերացնում գիտնական ունեցող մի գաղափար, եւ ապա տվյալների հավաքագրման փորձարկել այդ գաղափարը: Այս ոճը հետազոտությունների հանգեցնում է մի բարակ տեղավորել միջեւ հետազոտական հարց ու տվյալները, բայց դա սահմանափակ է, քանի որ անհատը հետազոտող հաճախ չեն ունենա ռեսուրսները, որոնք անհրաժեշտ է հավաքել տվյալներ, որ նրանք պետք է, ինչպես, օրինակ, խոշոր, հարուստ, եւ ազգային-ներկայացուցչական տվյալները. Հետեւաբար, շատ սոցիալական հետազոտությունների նախկինում օգտագործվող լայնամասշտաբ սոցիալական հարցումները, ինչպիսիք են ընդհանուր սոցիալական հետազոտության (GSS), ամերիկյան ազգային ընտրական ուսումնասիրության (anes), եւ վահանակը ուսումնասիրության եկամտի Dynamics (PSID). Սրանք լայնածավալ հետազոտությունը են, ընդհանուր առմամբ առաջադրվել է թիմի հետազոտողների, եւ նրանք, որոնք նախատեսված են ստեղծել տվյալներ, որոնք կարող են օգտագործվել բազմաթիվ հետազոտողների. Քանի որ նպատակներից այդ լայնածավալ հարցումների, մեծ խնամք է դրվում են նախագծման տվյալների հավաքագրումը եւ պատրաստվում արդյունքում տվյալները օգտագործման համար, ըստ հետազոտողների. Այս տվյալներն են, ըստ հետազոտողների եւ հետազոտողների համար:
Most սոցիալական հետազոտությունների օգտագործելով թվային դարաշրջանում աղբյուրների, սակայն, սկզբունքորեն տարբերվում է: Փոխարեն օգտագործելով տվյալները հավաքված են հետազոտողների համար հետազոտողների, այն օգտագործում է տվյալների աղբյուրները, որոնք ստեղծվել եւ հավաքած բիզնեսների եւ կառավարությունների իրենց սեփական նպատակների համար, ինչպիսիք են շահույթ, որը տրամադրում է ծառայություն, կամ տնօրինելու է օրենք. Այս գործարար եւ կառավարական տվյալների աղբյուրները գալիս կոչվելու մեծ տվյալներ: Փնտրտուքներ մեծ տվյալների տարբեր է, քան անում հետազոտություններ տվյալները, որոնք ի սկզբանե ստեղծված է հետազոտության. Համեմատեք, օրինակ, սոցիալական լրատվամիջոցների կայքը, ինչպես, օրինակ, Twitter, մի ավանդական հասարակական կարծիքի հարցման, ինչպիսիք են ընդհանուր սոցիալական հետազոտության (GSS). Twitter - ի հիմնական նպատակներն են `ապահովել մի ծառայություն իր օգտագործողների եւ կատարել շահույթ. Այդ գործընթացում հասնելու այդ նպատակներին, Twitter ստեղծում տվյալները, որոնք կարող են լինել օգտակար ուսումնասիրելու որոշակի ասպեկտների հասարակական կարծիքի: Բայց, ի տարբերություն ընդհանուր սոցիալական հետազոտության (GSS), Twitter չէ հիմնականում կենտրոնացած է սոցիալական հետազոտությունների:
Տերմինը Մեծ տվյալները frustratingly մշուշոտ է, եւ ՏՏ խմբերը միասին շատ տարբեր բաներ են. Նպատակների համար սոցիալական հետազոտությունների, ես կարծում եմ, որ դա օգտակար է տարբերակել երկու տեսակի խոշոր տվյալների աղբյուրների `կառավարության վարչական գրանցումների եւ բիզնես վարչական գրանցումների: Կառավարության վարչական արձանագրություններ են, տվյալները, որոնք ստեղծվում են կառավարությունների որպես իրենց առօրյա գործունեության մեջ: Այս տեսակի գրառումների արդեն օգտագործվում է հետազոտողների է անցյալում, օրինակ, որպես ժողովրդագիրների սովորող ծննդյան, ամուսնության, եւ մահացության գրառումները, բայց կառավարությունները ավելի ու ավելի են հավաքում եւ ազատելու մանրամասն գրառումները analyzable ձեւերով. Օրինակ, New York City կառավարությունը տեղադրվել թվային մետր ներսում յուրաքանչյուր տաքսի քաղաքի. Այս մետր արձանագրել բոլոր տեսակի տվյալների յուրաքանչյուր տաքսի լողալ ներառյալ վարորդը, մեկնարկային ժամանակի եւ գտնվելու վայրը, կանգնեցնել ժամանակը եւ վայրը, եւ ուղեվարձը: Մի ուսումնասիրության, որ ես կասեմ ավելի ուշ այս գլխում, Հենրի Farber (2015) Repurposed այդ տվյալները պետք է անդրադառնալ մի հիմնարար բանավեճ `աշխատանքի էկոնոմիկա մասին միջեւ հարաբերությունների ժամային աշխատավարձի եւ ժամաքանակին աշխատել:
Երկրորդ հիմնական տեսակը մեծ տվյալների սոցիալական հետազոտությունների բիզնես վարչական արձանագրություններ: Սրանք տվյալներ, որ բիզնեսը ստեղծում եւ հավաքել, ինչպես մասը իրենց առօրյա գործունեության մեջ: Այս բիզնես վարչական արձանագրություններ, որոնք հաճախ կոչվում թվային հետքեր, եւ ներառում բաներ նման որոնման հարցման գերանների, Սոցիալական Մեդիա հաղորդագրությունների, եւ կոչ ենք անում գրառումները բջջային հեռախոսները. Քննադատորեն, այդ գործարար վարչական արձանագրություններ են ոչ միայն այն մասին, առցանց վարքագծի համար. Օրինակ, խանութներ, որոնք օգտագործում եք ստուգում դուրս սքաներներ են ստեղծել իրական ժամանակի միջոցառումների գործիչ արտադրողականության. Մի ուսումնասիրության, որ ես կասեմ քեզ մոտ ավելի ուշ այս գլխում, Ալեքսանդր Mas եւ Էնրիկո Մորետտին (2009) repurposed այս սուպերմարկետների Մեկնում տվյալներ է ուսումնասիրել, թե ինչպես է աշխատողների արտադրողականությունը ազդեցություն է արտադրողականության իրենց հասակակիցների հետ:
Ինչ վերաբերում է այդ երկու օրինակները ցույց են տալիս, որ գաղափարը repurposing է հիմնարար սովորելով մեծ տվյալների. Իմ փորձից, հասարակագետները ու տվյալների գիտնականները մոտենալ այս repurposing շատ տարբեր ձեւերով. Հասարակագետները, ովքեր սովոր են աշխատում տվյալների հետ նախագծված են հետազոտության, կարող են արագ մատնանշել խնդիրները repurposed տվյալների անտեսելով իր ուժերը: Բայց, մյուս կողմից, տվյալների գիտնականները արագ մատնանշել օգուտները repurposed տվյալների անտեսելով իր թույլ կողմերը: Բնականաբար, լավագույն մոտեցումը կլիներ հիբրիդային: Այսինքն, հետազոտողները պետք է հասկանալ, թե բնութագրերը այդ նոր աղբյուրների տվյալների, այնպես էլ լավ ու վատ, եւ ապա պարզել, թե ինչպես պետք է սովորել նրանցից: Եվ, այն է, որ ծրագիրը մնացած այս գլխում: Հաջորդը, ես նկարագրել տասը ընդհանուր բնութագիրը բիզնեսի եւ կառավարության վարչական տվյալները. Դրանից հետո, ես նկարագրել երեք հետազոտական մոտեցումներ, որոնք կարող են օգտագործվել այդ տվյալների, մոտեցումների, որոնք նաեւ պիտանի բնութագրերի այս տվյալները.