Glede teh deset značilnosti velikih podatkovnih virov in naravnih omejitev tudi popolnoma opazovanih podatkov, kakšne raziskovalne strategije so uporabne? To je, kako se lahko naučimo, ko ne sprašuj in ne poskuse? Morda se zdi, da samo gledajo ljudje ne bi privedlo do zanimive raziskave, vendar to ne drži.
Vidim tri glavne strategije za učenje iz opazovalne podatkov: štetje stvari, napovedovanje stvari, in približevanje poskusov. Bom opisati vsako od teh pristopov-, ki bi jih lahko imenujemo "raziskovalne strategije" ali "raziskovalni recepti" -in jih bom ponazarjajo s primeri. Te strategije niso niti medsebojno izključujoči ali izčrpen, vendar pa zajame veliko raziskav s opazovalnih podatkov.
Za Nagovijestiti terjatve, ki sledijo, štetje stvari je najbolj pomembno, ko smo empirično odloča med napovedmi različnih teorij. Napovedovanje in predvsem kratkoročnega napovedovanja, je lahko koristno za oblikovalce politik. Končno, veliko podatkov povečuje našo sposobnost, da vzročno ocene iz opazovalnih podatkov.