Donades aquestes deu característiques de les fonts de dades grans i les limitacions inherents de les dades fins i tot perfectament observats, quin tipus d'estratègies de recerca són útils? És a dir, com podem aprendre quan no preguntes i no s'executen experiments? Podria semblar que la gent simplement veient no podien donar lloc a una investigació interessant, però aquest no és el cas.
Veig tres estratègies principals per a l'aprenentatge a partir de les dades d'observació: explicant coses, coses de predicció, i aproximant els experiments. Vaig a descriure cadascun d'aquests enfocaments que podria dir-se "estratègies d'investigació" o "receptes" d'investigació -i vaig a il·lustrar-los amb exemples. Aquestes estratègies no són ni mútuament excloents ni exhaustives, però ho fan capturar una gran quantitat d'investigació amb les dades d'observació.
Presagiar les reivindicacions que segueixen, comptant les coses és més important quan estem pronunciándonos empíricament entre les prediccions de diferents teories. Pronosticar, i especialment la predicció immediata, pot ser útil per als responsables polítics. Finalment, els grans dades augmenta la nostra capacitat per fer estimacions causals de les dades d'observació.