Analogajā laikmetā, vācot datus par uzvedību, kas ko dara, kad-bija dārgi, un tāpēc samērā reti. Tagad digitālajā laikmetā, par uzvedību miljardu cilvēku ievada, glabā, un analizējamā. Piemēram, katru reizi, kad jūs noklikšķiniet uz tīmekļa vietni, lai piezvanītu uz jūsu mobilo tālruni, vai maksāt par kaut ko ar savu kredītkarti, digitālais ieraksts savu uzvedību ir izveidota un uzglabā ar uzņēmējdarbību. Tā kā šie dati ir blakusprodukts cilvēku ikdienas darbību, tās bieži sauc par digitālo pēdas. Papildus šiem pēdas rīcībā uzņēmumiem, valdībām ir arī neticami bagāts datus par cilvēkiem un uzņēmumiem, datus, kas bieži vien ir digitalizētas un analizējamā. Kopā šie biznesa un valdības ieraksti bieži sauc lielie dati.
Arvien pieaug plūdu lielo datu nozīmē, ka mēs esam pārgājuši no pasaulē, kur uzvedības dati ir nepietiekami, lai pasaulē, kur uzvedības dati ir bagātīgs. Bet, jo šie veidi dati ir salīdzinoši jauna, žēl daudzums pētījumu, izmantojot tos izskatās zinātniekiem akli pakaļdzīšanās pieejamos datus. Šajā nodaļā, tā vietā, piedāvā principiālu pieeju, lai izprastu dažādu avotu datiem un kā tos var izmantot. Tas bagātāka izpratne palīdzēs jums labāk atbilst jūsu pētniecības jautājumus atbilstošiem datu avotiem. Vai, ja šādas esošie avoti trūkst, pārliecināt jums apkopot savus datus, izmantojot idejas nākotnes nodaļās.
Pirmais solis, lai mācīties no lielas datiem ir saprast, ka tā ir daļa no plašākas datu kategorija, kas ir izmantots sociālo pētījumu daudzus gadus: Novērojumu dati. Aptuveni novērojuma dati ir jebkāda informācija, kas izriet no novērošanas sociālu sistēmu bez iejaukties kaut kādā veidā. Ļoti aptuvenas veids, kā domāt par to, ka novērojuma dati ir viss, kas nav saistīts runāt ar cilvēkiem (piemēram, aptaujas, tēmu 3. nodaļā) vai maina cilvēku vidē (piemēram, eksperimenti, tēmu 4. nodaļā). Tādējādi, papildus biznesa un valdības reģistru novērojuma dati ietver arī lietas, piemēram, tekstu laikraksta rakstu un satelīta fotogrāfijas.
Šajā nodaļā ir trīs daļas. Pirmkārt, 2.2, es aprakstīt lielie dati sīkāk un precizēt būtiska atšķirība starp to un datiem, kas parasti tiek izmantots sociālo pētījumu pagātnē. Tad, 2.3, es aprakstīt desmit kopīgas īpašības lielo datu avotiem. Izpratne šīs īpašības ļauj mums ātri atpazīt stiprās un vājās puses esošajiem avotiem un palīdzēs mums izmantotu jaunos avotus, kas tiks izveidotas nākotnē. Visbeidzot, 2.4, es aprakstīt trīs galvenie pētniecības stratēģiju, ko varat izmantot, lai mācīties no Novērojumu dati: skaitot lietām, prognozēšanas lietām, un tuvinot eksperimentu.