Med tanke på dessa tio egenskaper stora datakällor och de inneboende begränsningar även perfekt observerade data, vilken typ av forskningsstrategier är användbara? Det är, hur kan vi lära oss när vi inte ställa frågor och inte köra experiment? Det kan tyckas att bara titta på folk kunde inte leda till intressant forskning, men det är inte fallet.
Jag ser tre huvudstrategier för att lära från observationsdata: Räkna saker, prognos saker, och approximera experiment. Jag ska beskriva vart och ett av dessa angreppssätt-som skulle kunna kallas "forskningsstrategier" eller "forsknings recept" -och jag ska illustrera dem med exempel. Dessa strategier är varken utesluter varandra eller uttömmande, men de gör fånga en hel del forskning med observationsdata.
Att förebådar kraven som följer, räkna saker är viktigast när vi empiriskt dömer mellan förutsägelser från olika teorier. Prognos, och i synnerhet Nowcasting kan vara användbar för beslutsfattare. Slutligen ökar stor uppgifter vår förmåga att göra kausala uppskattningar från observationsdata.