Analog çağda, davranışla ilgili veri toplama - kim ne yapar, ne zaman - pahalıydı ve bu nedenle nispeten azdı. Şimdi, dijital çağda milyarlarca insanın davranışları kaydedilir, saklanır ve analiz edilebilir. Örneğin, bir web sitesini tıklattığınızda, cep telefonunuzda bir arama yapın ya da kredi kartınızla bir şey için ödeme yapın, davranışlarınızın bir dijital kaydı bir iş tarafından oluşturulur ve saklanır. Bu tür veriler insanların günlük eylemlerinin bir yan ürünü olduğu için, genellikle dijital izler olarak adlandırılır. İşletmeler tarafından tutulan bu izlere ek olarak, hükümetler ayrıca hem insanlar hem de işletmeler hakkında inanılmaz derecede zengin verilere sahiptir. Bu iş ve hükümet kayıtları birlikte genellikle büyük veri olarak adlandırılır.
Büyük veriyi sürekli yükselten sel, davranışsal verilerin bol olduğu davranışsal verilerin çok az olduğu bir dünyadan geçtiğimiz anlamına gelir. Büyük veriden öğrenmenin ilk adımı, uzun yıllardır sosyal araştırma için kullanılan daha geniş bir veri kategorisinin parçası olduğunun fark edilmesidir: gözlemsel veriler . Kabaca, gözlemsel veriler, bir şekilde müdahale etmeden bir sosyal sistemi gözlemlemekten kaynaklanan herhangi bir veridir. Bunu düşünmenin kaba bir yolu, gözlemsel verilerin, insanlarla konuşmayı içermeyen (örneğin, anketler, bölüm 3'ün konusu) veya insanların çevrelerini değiştiren (örneğin, deneyler, bölüm 4'ün konusu) her şeydir. Böylece, iş ve devlet kayıtlarına ek olarak, gözlemsel veriler ayrıca gazete makaleleri ve uydu fotoğrafları metni gibi şeyleri içerir.
Bu bölüm üç bölümden oluşmaktadır. İlk olarak, bölüm 2.2'de, büyük veri kaynaklarını daha ayrıntılı olarak açıklarım ve bunlar ile geçmişte sosyal araştırma için tipik olarak kullanılan veriler arasındaki temel farkı açıklığa kavuşturuyorum. Daha sonra, bölüm 2.3'te, büyük veri kaynaklarının on ortak özelliğini açıklarım. Bu özellikleri anlamak, varolan kaynakların güçlü ve zayıf yanlarını hızlı bir şekilde tanımanızı sağlar ve gelecekte mevcut olacak yeni kaynaklardan yararlanmanıza yardımcı olur. Son olarak, bölüm 2.4'te gözlemsel verilerden öğrenmek için kullanabileceğiniz üç ana araştırma stratejisini açıklarım: şeyleri saymak, bir şeyi tahmin etmek ve bir deneye yaklaşmak.