Vuonna analoginen ikä, keräämällä tietoja käyttäytymiseen, kuka tekee mitä, kun-oli kallista, ja siksi suhteellisen harvinaisia. Nyt digitaalisella aikakaudella, käyttäytymistä miljardien ihmisten kirjataan, varastoidaan, ja analysoitavissa. Esimerkiksi joka kerta kun klikkaa verkkosivuilla, soittaa kännykälläsi tai maksaa jotain luottokortilla, digitaalisen kirjaa käyttäytyminen luodaan ja tallennetaan yrityksen. Koska nämä tiedot ovat sivutuote ihmisten päivittäin toimia, ne ovat usein kutsutaan digitaalinen jälkiä. Näiden lisäksi jälkiä hallussa yritysten, hallitusten on myös uskomattoman rikas tietoja sekä ihmisten ja yritysten tietoja, jotka on usein digitoidaan ja analysoitavissa. Yhdessä näiden yritysten ja viranomaisten rekistereihin kutsutaan usein suuria data.
Alati kasvava tulva iso tietojen tarkoittaa, että olemme siirtyneet maailmassa, jossa käyttäytymistietoja oli niukasti maailmaan, jossa käyttäytymiseen data on runsaasti. Mutta, koska nämä tyypit tiedot ovat suhteellisen uusia, valitettava määrä tutkimusta käyttää niitä näyttää tutkijat sokeasti jahtaavat saatavilla tietoja. Tämä luku, sen sijaan, tarjoaa periaatteellisen lähestymistavan ymmärtämiseksi eri tietolähteet ja miten niitä voidaan käyttää. Tämä rikkaampi ymmärrys pitäisi auttaa paremmin vastaamaan tutkimuksen kysymyksiin asianmukaista tietolähteitä. Tai, jos tällaisia olemassa olevia lähteitä ovat puutteelliset, vakuuttaa voit kerätä omat tiedot käyttämällä ajatuksia tulevaisuudessa luvuissa.
Ensimmäinen askel oppiminen iso data on ymmärrettävä, että se on osa laajempaa luokan tietoja on käytetty sosiaalisen tutkimuksen monien vuosien ajan: havaintoaineistoon. Karkeasti havaintoaineistoa on tietoja, jotka johtuu tarkkailemalla sosiaalinen järjestelmä puuttumatta jollakin tavalla. Karkea tapa ajatella on, että havaintoaineistoa on kaikki mikä ei liity juttelee ihmisten (esim tutkimuksia, aihe luvun 3) tai muuttamalla ihmisten ympäristöissä (esimerkiksi, kokeita, aihe luku 4). Niinpä, lisäksi yritysten ja viranomaisten rekistereihin, havaintoaineistoa myös asioita, kuten tekstin lehtiartikkeleita ja satelliitin kuvia.
Tässä luvussa on kolme osaa. Ensiksi kohdassa 2.2 kuvaan iso data tarkemmin ja selventää perustavanlaatuinen ero sen ja tiedot, jotka on yleisesti käytetty yhteiskunnan tutkimuksen aiemmin. Sitten, kohdassa 2.3, kuvaan kymmenen yhteisiä ominaisuuksia iso tietolähteistä. Ymmärtäminen nämä ominaisuudet auttaa meitä nopeasti tunnistamaan vahvuudet ja heikkoudet olemassa olevia lähteitä auttaa meitä hyödyntämään uusia lähteitä, jotka luodaan tulevaisuudessa. Lopuksi jaksossa 2.4, kuvaan kolme tutkimusta strategioita, joita voit oppia havaintoaineistosta: laskenta muassa ennustaminen asioita, ja lähentämällä kokeilu.