Memandangkan sepuluh ciri-ciri sumber data yang besar dan terdapat had tertentu dalam data walaupun sempurna diperhatikan, apa jenis strategi penyelidikan yang berguna kepada anda? Iaitu, bagaimana kita boleh belajar apabila kita tidak bertanya dan tidak menjalankan eksperimen tersebut? Ia mungkin kelihatan bahawa orang hanya menonton tidak dapat membawa kepada penyelidikan yang menarik, tetapi itu bukan kes itu.
Saya melihat tiga strategi utama untuk belajar dari data pemerhatian: perkara-perkara kiraan, perkara ramalan, dan yang hampir eksperimen. Saya akan menerangkan setiap satu daripada pendekatan-yang boleh dipanggil "strategi penyelidikan" atau "resipi penyelidikan" -dan saya akan menggambarkan mereka dengan contoh-contoh. Strategi ini adalah tidak saling eksklusif atau menyeluruh, tetapi mereka menangkap banyak kajian dengan data pemerhatian.
Untuk menjadi bayangan kepada tuntutan yang mengikuti, mengira perkara yang paling penting apabila kita secara empirik menghakimi antara ramalan dari teori yang berbeza. Ramalan, dan terutamanya nowcasting, boleh berguna untuk pembuat dasar. Akhir sekali, data yang besar meningkatkan keupayaan kita untuk membuat anggaran sebab dan akibat daripada data pemerhatian.