V analogickom veku zhromažďovanie údajov o správaní - kto robí čo a kedy bolo - drahé a preto pomerne zriedkavé. Teraz v digitálnom veku sa správanie miliárd ľudí zaznamenáva, ukladá a analyzuje. Napríklad, zakaždým, keď kliknete na webovú lokalitu, zavoláte na svoj mobilný telefón alebo zaplatíte niečo s vašou kreditnou kartou, digitálny záznam o vašom správaní vytvorí a uloží podnik. Pretože tieto typy údajov sú vedľajším produktom každodenných činností ľudí, často sa nazývajú digitálne stopy . Okrem týchto stôp, ktoré majú podniky, vlády majú neuveriteľne bohaté údaje o ľuďoch a podnikoch. Spoločne sa tieto obchodné a vládne záznamy často nazývajú veľké údaje .
Stále narastajúca záplava veľkých dát znamená, že sme sa presťahovali zo sveta, kde boli údaje o správaní vzácne do sveta, kde sú dostatočné údaje o správaní. Prvým krokom k učeniu sa z veľkých údajov je uvedomenie si, že je súčasťou širšej kategórie údajov, ktoré sa už roky používajú na sociálny výskum: pozorovacie údaje . Zhruba pozorovacie údaje sú všetky údaje, ktoré vyplývajú z pozorovania sociálneho systému bez nejakého zásahu. Jednoduchý spôsob, ako o tom myslieť, je, že pozorovacie údaje sú všetko, čo nezahŕňa rozhovory s ľuďmi (napr. Prieskumy, téma kapitoly 3) alebo zmena prostredia človeka (napr. Experimenty, téma 4). Takže okrem obchodných a vládnych záznamov observačné údaje obsahujú aj text novinových článkov a satelitných fotografií.
Táto kapitola má tri časti. Najskôr v časti 2.2 opisujem veľké zdroje údajov podrobnejšie a objasňujem zásadný rozdiel medzi nimi a údajmi, ktoré sa v minulosti zvyčajne používali na sociálny výskum. Potom v oddiele 2.3 opisujem desať spoločných charakteristík veľkých zdrojov údajov. Pochopenie týchto vlastností umožňuje rýchlo rozpoznať silné a slabé stránky existujúcich zdrojov a pomôže vám využiť nové zdroje, ktoré budú k dispozícii v budúcnosti. Napokon, v časti 2.4 opisujem tri hlavné výskumné stratégie, ktoré môžete použiť na získanie poznatkov z pozorovacích údajov: počítať veci, predpovedať veci a približovať experiment.