Compte tenu de ces dix caractéristiques des sources de données grandes et les limites inhérentes aux données même parfaitement observées, quel genre de stratégies de recherche sont utiles? Autrement dit, comment pouvons-nous apprendre quand nous ne posons pas de questions et ne courons pas des expériences? Il peut sembler que les gens qui regardent ne pouvaient pas conduire à des recherches intéressantes, mais ce n'est pas le cas.
Je vois trois principales stratégies pour l'apprentissage à partir des données d'observation: comptage des choses, des choses de prévision, et le rapprochement des expériences. Je vais vous décrire chacune de ces approches-ce qui pourrait être appelé «stratégies de recherche» ou «recettes de recherche» -et je vais les illustrer par des exemples. Ces stratégies ne sont ni mutuellement exclusives ou exhaustives, mais elles font capturer beaucoup de recherche avec les données d'observation.
Pour préfigurer les revendications qui suivent, le comptage des choses est plus important lorsque nous empiriquement juridictionnels entre les prédictions de différentes théories. Prévisions, et surtout nowcasting, peut être utile pour les décideurs politiques. Enfin, grande données augmente notre capacité à faire des estimations causales à partir des données d'observation.