Di era analog, mengumpulkan data tentang perilaku — siapa yang melakukan apa, dan kapan — mahal, dan karena itu relatif jarang. Sekarang, di era digital, perilaku miliaran orang dicatat, disimpan, dan dapat dianalisis. Misalnya, setiap kali Anda mengklik situs web, melakukan panggilan di ponsel Anda, atau membayar sesuatu dengan kartu kredit Anda, catatan digital perilaku Anda dibuat dan disimpan oleh bisnis. Karena jenis data ini adalah produk sampingan dari tindakan sehari-hari orang, mereka sering disebut jejak digital . Selain jejak-jejak yang dipegang oleh bisnis, pemerintah juga memiliki data yang sangat kaya tentang orang dan bisnis. Catatan bisnis dan pemerintah ini sering disebut data besar .
Banjir data besar yang terus meningkat berarti kita telah pindah dari dunia di mana data perilaku langka ke dunia di mana data perilaku berlimpah. Langkah pertama untuk belajar dari big data adalah menyadari bahwa itu adalah bagian dari kategori data yang lebih luas yang telah digunakan untuk penelitian sosial selama bertahun-tahun: data observasi . Secara kasar, data observasi adalah data apa pun yang dihasilkan dari mengamati sistem sosial tanpa campur tangan dalam beberapa cara. Cara kasar untuk memikirkannya adalah bahwa data observasi adalah segala sesuatu yang tidak melibatkan berbicara dengan orang (misalnya survei, topik bab 3) atau mengubah lingkungan orang (misalnya, eksperimen, topik bab 4). Jadi, selain catatan bisnis dan pemerintahan, data observasi juga mencakup hal-hal seperti teks artikel surat kabar dan foto satelit.
Bab ini memiliki tiga bagian. Pertama, di bagian 2.2, saya menggambarkan sumber data besar secara lebih terperinci dan memperjelas perbedaan mendasar di antara mereka dan data yang biasanya digunakan untuk penelitian sosial di masa lalu. Kemudian, di bagian 2.3, saya menggambarkan sepuluh karakteristik umum dari sumber data besar. Memahami karakteristik ini memungkinkan Anda mengenali kekuatan dan kelemahan sumber-sumber yang ada dengan cepat dan akan membantu Anda memanfaatkan sumber-sumber baru yang akan tersedia di masa depan. Akhirnya, di bagian 2.4, saya menjelaskan tiga strategi penelitian utama yang dapat Anda gunakan untuk belajar dari data observasi: menghitung hal-hal, meramalkan sesuatu, dan memperkirakan suatu eksperimen.