Dadas estas diez características de las fuentes de datos grandes y las limitaciones inherentes de los datos incluso perfectamente observados, qué tipo de estrategias de investigación son útiles? Es decir, ¿cómo podemos aprender cuando no preguntas y no se ejecutan experimentos? Podría parecer que la gente simplemente viendo no podían dar lugar a una investigación interesante, pero ese no es el caso.
Veo tres estrategias principales para el aprendizaje a partir de los datos de observación: contando cosas, cosas de predicción, y aproximando los experimentos. Voy a describir cada uno de estos enfoques que podría llamarse "estrategias de investigación" o "recetas" de investigación -y voy a ilustrarlos con ejemplos. Estas estrategias no son ni mutuamente excluyentes ni exhaustivas, pero lo hacen capturar una gran cantidad de investigación con los datos de observación.
Presagiar las reivindicaciones que siguen, contando las cosas es más importante cuando estamos pronunciándonos empíricamente entre las predicciones de diferentes teorías. Pronosticar, y especialmente la predicción inmediata, puede ser útil para los responsables políticos. Por último, los grandes datos aumenta nuestra capacidad para hacer estimaciones causales de los datos de observación.