Yn it analoere leeftyd sammele gegevens oer gedrach - wa't wat, en wannear - djoer wie, en dêrom relatyf seldsume. No, yn 'e digitale leeftyd wurde de gedrach fan mjitkundigen minsken opnommen, opslein en analysearber. Bygelyks, elke kear as jo klikke op in webside, meitsje in oprop oan jo mobyl tillefoan, of betelje foar wat mei jo kredytkaart, in digitale rekord fan jo gedrach is makke en bewarre troch in bedriuw. Om't dizze soarten gegevens in byprodukt binne fan allerhande aksjes fan minsken, wurde se faak wol digitale spoaren neamd . Neist dizze spoaren dy't troch bedriuwen hâlden wurde, hawwe oerheden ek geweldige rike gegevens oer sawol minsken as bedriuwen. Mei - inoar binne bedriuwen en regearingsrekten faak grutte data neamd .
De ivige opfallende oerstreaming fan grutte gegevens betsjut dat wy út in wrâld ferhuze binne wêr't gedrachsgegevens minder wurden binne nei in wrâld dêr't gedrachsgegevens oer ree binne. In earste stap om it learen fan grutte gegevens te realisearjen dat it in diel is fan in breedere kategory fan gegevens dy't in soad jierren brûkt hat foar sosjale ûndersyks: observative data . Rûchwei observaasjegegevens binne allegear gegevens dy't resultaat fan it beoardieljen fan in sosjale systeem sûnder yndividu op ien inkeld wize. In rude manier om it te tinken is dat beoardielingsgegevens alles wat net giet om petearen mei minsken (bygelyks omfragen, it ûnderwerp fan haadstik 3) of it feroarjen fan minsken 's omjouwing (bygelyks eksperiminten, it ûnderwerp fan haadstik 4). Sa binne, neist bedriuwen en regearingsrekkingen, observative gegevens ek dingen lykas de tekst fan kranteartikelen en satellytfotos.
Dit haadstik hat trije dielen. Earst yn haadstik 2.2 beskriuwe ik grutte gegevensboarnen yn mear detail en ferklearje in fûnemintele ferskil tusken har en de gegevens dy't typysk brûkt binne foar sosjale ûndersiken yn it ferline. Dêrnei beskriuwe ik yn haadstik 2.3 tsien mienskiplike skaaimerken fan grutte data boarnen. Understeande dy skaaimerken jout jo de krêft en swakke fan besteande boarnen rapper te erkennen en sil jo de nije boarnen helpe, dy't yn 'e takomst beskikber binne. Uteinlik, yn haadstik 2.4 beskriuwe ik trije wichtige ûndersyksstrategyen dy't jo brûke kinne om te learen fan beoardielingsgegevens: dingen dingen, prestiizearjen fan dingen, en anneksearjend in eksperimint.