Având în vedere aceste zece caracteristici ale surselor de date mari și limitările inerente ale datelor observate chiar perfect, ce fel de strategii de cercetare sunt utile? Asta este, cum putem învăța când nu pune întrebări și nu a alerga experimente? S-ar putea părea că oamenii pur și simplu nu uitam ar putea duce la cercetarea interesantă, dar asta nu e cazul.
Eu văd trei strategii principale pentru a învăța din datele de observație: lucruri de numărare, lucrurile de prognoză, și compatibilizarea experimente. Voi descrie fiecare dintre aceste abordari, care ar putea fi numite "strategii de cercetare" sau "rețete de cercetare" -și le voi ilustra cu exemple. Aceste strategii nu sunt nici reciproc exclusive sau exhaustive, dar ele fac captura o mulțime de cercetare cu date de observatie.
Pentru a prevesti revendicările care urmează, de numărare lucruri este cel mai important atunci când suntem în mod empiric între predicții pronunțându din diferite teorii. Previzionarea, și mai ales nowcasting, poate fi util pentru factorii de decizie. În cele din urmă, date de mare mărește capacitatea noastră de a face estimări cauzale din datele de observatie.