Անալոգային տարիքում վարքագծի մասին տվյալներ հավաքելը, ով ինչ է անում, եւ երբ, թանկ, եւ, հետեւաբար, համեմատաբար հազվադեպ: Հիմա, թվային դարում, միլիարդավոր մարդկանց վարքագիծը արձանագրվում է, պահվում եւ վերլուծվում: Օրինակ, երբ դուք սեղմում եք կայքում, զանգահարեք ձեր բջջային հեռախոսին կամ վճարեք ձեր վարկային քարտի հետ որեւէ բան, ձեր վարքի թվային ձայնագրությունը ստեղծվում եւ պահվում է բիզնեսով: Քանի որ տվյալ տիպի տվյալները հանդիսանում են մարդկանց ամենօրյա գործողությունների արտադրանք, դրանք հաճախ թվային հետքեր են կոչվում: Ի լրումն գործարարների ձեռնարկած այդ հետքերի, կառավարությունները նույնպես ունեն աներեւակայելի հարուստ տվյալներ ինչպես մարդկանց, այնպես էլ բիզնեսի մասին: Այս բիզնեսի եւ կառավարության գրառումները միասին մեծ տվյալներ են անվանում :
Մեծ տվյալների մեծացող ջրհեղեղը նշանակում է, որ մենք տեղափոխվել ենք այնպիսի աշխարհից, որտեղ վարքային տվյալները հազվադեպ են այնպիսի մի աշխարհում, որտեղ վարքային տվյալները բավականաչափ են: Առաջին քայլը պետք է դասեր քաղելով մեծ տվյալների հասկանալով, որ դա մի մասն է ավելի լայն կատեգորիայի տվյալների, որ արդեն օգտագործվել է սոցիալական հետազոտությունների երկար տարիների դիտողական տվյալների: Խստորեն, դիտողական տվյալները ցանկացած տվյալն է, որը հանգեցնում է սոցիալական համակարգի դիտարկմանը `առանց որեւէ կերպ միջամտելու: Այս մասին մտածելու հոյակապ ձեւն այն է, որ դիտողական տվյալները այն ամենն է, որը չի ներառում մարդկանց հետ զրուցելը (օրինակ, հարցումներ, գլուխ 3-ի թեման) կամ փոխելով մարդկանց միջավայրը (օրինակ, փորձեր, թեման գլուխ 4): Այսպիսով, բացի բիզնեսի եւ կառավարության գրառումներից, դիտողական տվյալները ներառում են նաեւ այնպիսի բաներ, ինչպիսիք են թերթերի հոդվածները եւ արբանյակային լուսանկարները:
Այս գլուխն ունի երեք մաս: Նախ, բաժինը 2.2-ում ես նկարագրում եմ մեծ տվյալների աղբյուրները եւ պարզեցնում նրանց միջեւ հիմնարար տարբերությունը եւ սովորաբար նախկինում օգտագործված տվյալները սոցիալական հետազոտության համար: Այնուհետեւ 2.3 բաժնում ես նկարագրում եմ մեծ տվյալների աղբյուրների տասը ընդհանուր առանձնահատկությունները: Հասկանալով այդ հատկանիշները հնարավորություն են տալիս արագորեն ճանաչել գոյություն ունեցող աղբյուրների ուժեղ եւ թույլ կողմերը եւ կօգնի ձեզ օգտագործել նոր աղբյուրները, որոնք հասանելի կլինեն ապագայում: Վերջապես, 2.4-ում ես բնութագրում եմ երեք հիմնական հետազոտական ռազմավարություն, որը կարող եք օգտագործել սովորական տվյալների վերաբերյալ `սովորելու, բաներ կանխելու եւ փորձերի մոտեցման համար: