Gitt disse ti karakteristikker av store datakilder og de iboende begrensningene selv helt observerte data, hva slags forskningsstrategier er nyttige? Det er, hvordan kan vi lære når vi ikke stille spørsmål og ikke kjøre eksperimenter? Det kan virke som bare ser folk ikke kan føre til interessant forskning, men det er ikke tilfelle.
Jeg ser tre hovedstrategier for å lære av observasjonsdata: telle ting, prognoser ting, og tilnærmet eksperimenter. Jeg vil beskrive hver av disse tilnærmingene-som kan kalles "forskningsstrategier" eller "forsknings oppskrifter" -og jeg skal illustrere dem med eksempler. Disse strategiene er verken gjensidig utelukkende eller uttømmende, men de fanger mye forskning med observasjonsdata.
Å forbilde kravene som følger, telle ting er viktigst når vi er empirisk dømmende mellom spådommer fra ulike teorier. Prognoser, og spesielt nowcasting, kan være nyttig for beslutningstakere. Til slutt, øker big data vår evne til å gjøre årsaks estimater fra observasjonsdata.