З огляду на ці десять характеристик великих джерел даних і обмежень, властивих навіть зовсім спостережуваних даних, якого роду стратегії досліджень корисні? Тобто, як ми можемо дізнатися, коли ми не ставити питання і не проводити експерименти? Здавалося б, просто спостерігаючи за людьми, не може привести до цікавих досліджень, але це не так.
Я бачу три основні стратегії для навчання з даних спостережень: підрахунок речей, прогнозування речей, і аппроксимирующих експерименти. Я буду описувати кожен з цих підходів, які -можна було б назвати "стратегії досліджень" або "дослідження рецептів" -І я їх ілюструють з прикладами. Ці стратегії не є ні взаємовиключними або вичерпними, але вони дійсно захопити багато досліджень з даними спостережень.
Для того, щоб провіщати вимоги, які слідують, вважаючи речі є найбільш важливим, коли ми емпірично предікцій розгляді різних теорій. Прогнозування і особливо поточної погоди, може бути корисним для осіб, що визначають політику. І, нарешті, великі дані збільшує нашу здатність робити причинні оцінки за даними спостережень.