Az analóg korban, gyűjt adatokat a viselkedés-ki mit csinál, mikor-drága volt, és ezért viszonylag ritka. Most, a digitális korban, a viselkedés milliárd ember rögzíti, tárolja, és elemezhető. Például, minden alkalommal, amikor rákattint egy honlap, hogy a hívás a mobiltelefon, vagy fizet valamit a hitelkártya, digitális nyilván a viselkedés jön létre, és tárolja az üzleti. Mivel ezek az adatok egy mellékterméke az emberek minden nap akciók, gyakran nevezik a digitális nyomokat. Amellett, hogy ezek a nyomok birtokában a vállalkozások, önkormányzatok is hihetetlenül gazdag adatokat mind az emberek és a vállalkozások, adat, amely gyakran digitalizált és elemezhető. Együttesen ezek az üzleti és a kormányzati nyilvántartások gyakran nevezik nagy adat.
Az egyre emelkedő árvíz nagy adat azt jelenti, hogy eltávolodtunk a világban, ahol a viselkedési adatok kevés volt, hogy egy olyan világban, ahol a viselkedési adatok bőséges. De, mivel az ilyen típusú adatok viszonylag újak, egy szerencsétlen mennyiségű kutatást használja őket külleme tudósok vakon üldöz a rendelkezésre álló adatok. Ez a fejezet helyett kínál elvi megközelítés megértéséhez különféle forrásokból származó adatokat, és hogyan lehet őket használni. Ez gazdagabb megértése segíthet jobban megfelelő kutatási kérdések megfelelő adatforrásokat. Vagy, ha az ilyen meglévő források hiányoznak, meggyőzni, hogy gyűjtsön a saját adatait használja az ötleteket a jövőben fejezetekben.
Az első lépés, hogy a tanulás a nagy adatok észre, hogy ez része egy tágabb értelemben vett adatok, hogy már használt társadalomkutatás évek: megfigyelési adatok. Nagyjából megfigyelési adat minden adat, hogy az eredmények megfigyelése a társadalmi rendszer beavatkozás nélkül valamilyen módon. A nyers módon gondolni, hogy a megfigyelési adatokat minden, ami nem jár beszél az emberekkel (például: felmérések, a téma a 3. fejezet), vagy megváltoztatja az emberek környezetben (pl kísérletek, a téma a 4. fejezet). Így amellett, hogy az üzleti és a kormányzati nyilvántartások, megfigyelési adatokat is magában foglalja a dolgok, mint a szöveg újságcikkek és műholdas képeket.
Ez a fejezet három részből áll. Először is, a 2.2 fejezetben leírom nagy adatmennyiség részletesebben és tisztázni egy alapvető különbség, és az adatokat, amelyeket általában használt szociális kutatás a múltban. Aztán, 2.3, leírom tíz közös jellemzői a nagy adatforrás. Megértése ezek a jellemzők lehetővé teszi számunkra, hogy gyorsan felismerni az erősségek és gyengeségek a meglévő források, és segít nekünk kiaknázni az új forrásokat hoz létre a jövőben. Végül, a 2.4 pontban leírom három fő kutatási stratégiák, amelyek segítségével tanulni megfigyeléses adatok: számolás dolgokat, előrejelzés a dolgokat, és közelíteni egy kísérlet.