In die analoog ouderdom, data in te samel oor gedrag-wie doen wat wanneer-is duur, en dus relatief skaars. Nou, in die digitale era, die gedrag van biljoene mense aangeteken, gestoor, en analyzable. Byvoorbeeld, elke keer as jy op 'n webwerf, maak 'n oproep op jou selfoon, of betaal vir iets met jou kredietkaart, is 'n digitale rekord van jou gedrag geskep en gestoor deur 'n besigheid. Omdat hierdie data is 'n byproduk van mense se daaglikse optrede, word hulle dikwels genoem digitale spore. Benewens hierdie spore wat deur besighede, regerings het ook ongelooflik ryk data oor beide mense en besighede, data wat dikwels gedigitaliseerde en analyzable. Saam maak hierdie besigheid en die regering rekords is dikwels genoem groot data.
Die immer-stygende vloed van groot data beteken dat ons van 'n wêreld beweeg het waar gedrag data was skaars 'n wêreld waar gedrag data is volop. Maar, omdat hierdie tipe data is relatief nuut, 'n ongelukkige bedrag van navorsing met behulp van hulle lyk soos wetenskaplikes blindelings jaag beskikbare data. Hierdie hoofstuk, in plaas daarvan, bied 'n Sistematiese benadering tot begrip van die verskillende bronne van data en hoe dit gebruik kan word. Dit ryker begrip behoort te help om beter te voldoen aan jou navorsingsvrae om toepaslike bronne van data. Of, indien so 'n bestaande bronne ontbreek, oortuig dat jy jou eie data in te samel met behulp van die idees in die toekoms hoofstukke.
Die eerste stap om te leer van die groot data is om te besef dat dit deel van 'n breër kategorie van data wat gebruik is vir sosiale navorsing vir baie jare: waarneming data. Sowat, waarneming data is enige data wat uit die waarneming van 'n sosiale stelsel sonder gryp in een of ander manier. A ru manier om daaroor te dink, is dat waarneming data is alles wat nie betrek praat met mense (bv, opnames, die onderwerp van Hoofstuk 3) of veranderende omgewings mense se (bv, eksperimente, die onderwerp van Hoofstuk 4). So, bykomend tot besigheid en die regering rekords, waarneming data sluit ook dinge soos die teks van koerantberigte en satellietfoto's.
Hierdie hoofstuk bestaan uit drie dele. In die eerste plek in Afdeling 2.2, ek beskryf groot data in meer detail en verduidelik 'n fundamentele verskil tussen dit en die data wat oor die algemeen is gebruik vir sosiale navorsing in die verlede. Dan, in Afdeling 2.3, ek beskryf tien algemene kenmerke van die groot data bronne. Verstaan hierdie eienskappe maak dit vir ons om die sterk- en swakpunte van bestaande bronne vinnig erken en sal ons help om in te span die nuwe bronne wat geskep sal word in die toekoms. Ten slotte, in Afdeling 2.4, ek beskryf drie belangrikste navorsing strategieë wat jy kan gebruik om te leer uit waarneming data: tel dinge, vooruitskatting dinge, en benader 'n eksperiment.