Учитывая эти десять характеристик больших источников данных и ограничений, присущих даже совершенно наблюдаемых данных, какого рода стратегии исследований полезны? То есть, как мы можем узнать, когда мы не задавать вопросы и не проводить эксперименты? Казалось бы, просто наблюдая за людьми, не может привести к интересным исследованиям, но это не так.
Я вижу три основные стратегии для обучения из данных наблюдений: подсчет вещей, прогнозирование вещей, и аппроксимирующих эксперименты. Я буду описывать каждый из этих подходов, которые-можно было бы назвать "стратегии исследований" или "исследования рецептов" -И я их иллюстрирующих с примерами. Эти стратегии не являются ни взаимоисключающими или исчерпывающими, но они действительно захватить много исследований с данными наблюдений.
Для того, чтобы предвещать требования, которые следуют, считая вещи является наиболее важным, когда мы эмпирически предикций рассмотрении различных теорий. Прогнозирование и особенно текущей погоды, может быть полезным для лиц, определяющих политику. И, наконец, большие данные увеличивает нашу способность делать причинные оценки по данным наблюдений.