ونظرا لهذه الخصائص عشر من مصادر البيانات الكبيرة والقيود المتأصلة في البيانات حتى لوحظ تماما، أي نوع من الاستراتيجيات البحثية هي مفيدة؟ وهذا هو، كيف يمكننا أن نتعلم أننا عندما لا تسأل الأسئلة ولا تعمل التجارب؟ قد يبدو أن الناس مجرد الفرجة لا يمكن أن يؤدي إلى الأبحاث مثيرة للاهتمام، ولكن هذا ليس هو الحال.
أرى أن هناك ثلاثة استراتيجيات رئيسية للتعلم من البيانات الرصدية: أشياء العد، أشياء التنبؤ، وتقريب التجارب. أنا أصف كل من هذه الطرق والتي يمكن أن يطلق عليه "استراتيجيات البحث" أو "وصفات البحوث" -و أنا توضيحهم مع الأمثلة. هذه الاستراتيجيات لا يستبعد بعضها بعضا أو شاملة، وإنما يفعلون التقاط الكثير من الأبحاث مع بيانات الرصد.
لينذر المطالبات التي تتبع، عد الأشياء هو أهم عندما نكون الفصل تجريبيا بين التوقعات من نظريات مختلفة. التنبؤ، وخصوصا التنبؤ الآني، يمكن أن تكون مفيدة لصانعي السياسات. وأخيرا، بيانات كبيرة يزيد من قدرتنا على تقديم تقديرات السببية من بيانات الرصد.