In die analoog ouderdom, versamel data oor gedrag-wie doen wat, en wanneer-was duur, en daarom relatief skaars. Nou, in die digitale era, word die gedrag van miljarde mense aangeteken, gestoor en ontleedbaar. Byvoorbeeld, elke keer as jy op 'n webwerf klik, bel op jou selfoon of betaal vir iets met jou kredietkaart, word 'n digitale rekord van jou gedrag geskep en gestoor deur 'n besigheid. Omdat hierdie tipe data 'n byproduk is van mense se daaglikse aksies, word hulle dikwels digitale spore genoem . Benewens hierdie spore wat deur besighede gehou word, het regerings ook ongelooflike ryk data oor mense en besighede. Saam word hierdie sake- en regeringsrekords dikwels groot data genoem .
Die toenemende vloed van groot data beteken dat ons van 'n wêreld beweeg het waar gedragsdata skaars was in 'n wêreld waar gedragsgegewens oorvloedig is. 'N eerste stap om te leer van groot data is besef dat dit deel is van 'n breër kategorie data wat vir baie jare vir sosiale navorsing gebruik is: waarnemingsdata . Roughly, waarneming data is enige data wat voortspruit uit die waarneming van 'n sosiale stelsel sonder om op een of ander manier in te gryp. 'N Ruwe manier om daaroor te dink, is dat waarneming data alles wat nie met mense praat nie (bv. Opnames, die onderwerp van hoofstuk 3) of die verandering van mense se omgewings (bv. Eksperimente, die onderwerp van hoofstuk 4). So, bykomend tot sake- en regeringsrekords, bevat waarnemingsdata ook dinge soos die teks van koerantberigte en satellietfoto's.
Hierdie hoofstuk het drie dele. Eerstens, in afdeling 2.2, beskryf ek groot databronne in meer detail en verduidelik 'n fundamentele verskil tussen hulle en die data wat tipies vir sosiale navorsing gebruik is in die verlede. Dan beskryf ek in afdeling 2.3 tien algemene kenmerke van groot databronne. Deur hierdie eienskappe te verstaan, kan u die sterkte en swakpunte van bestaande bronne vinnig herken en u help om die nuwe bronne wat in die toekoms beskikbaar sal wees, te benut. Ten slotte beskryf ek in afdeling 2.4 drie hoofnavorsingstrategieë wat u kan gebruik om van waarneming data te leer: dinge tel, dinge voorspel en 'n eksperiment benader.