در عصر آنالوگ، جمع آوری داده ها در مورد رفتار که هر چه گران است، و در نتیجه، نسبتا نادر است که بود. در حال حاضر، در عصر دیجیتال، رفتارهای میلیاردها نفر از مردم ثبت شده است، ذخیره می شود، و تحلیل. به عنوان مثال، هر زمانی که شما در یک وب سایت کلیک کنید، ایجاد یک تماس بر روی گوشی تلفن همراه خود را، و یا پرداخت برای چیزی با کارت اعتباری خود، یک رکورد دیجیتال از رفتار شما ایجاد می شود و ذخیره شده توسط یک کسب و کار. از آنجا که این داده ها می باشد یک محصول از هر اقدام روز مردم، آنها اغلب آثار دیجیتال به نام. علاوه بر این آثار برگزار شده توسط شرکت ها، دولت نیز داده فوق العاده غنی در مورد هر دو نفر و کسب و کار دارند، داده است که اغلب دیجیتالی و تحلیل. با هم این کسب و کار و دولت سوابق اغلب داده های بزرگ نامیده می شود.
سیل در حال افزایش از داده های بزرگ معنی است که ما از یک جهان رفت، جایی که داده های رفتاری کمیاب به یک جهان که در آن داده های رفتاری فراوان است بود. اما، به دلیل این نوع داده ها نسبتا جدید هستند، یک مقدار تاسف از پژوهش با استفاده از آنها به نظر می رسد مانند دانشمندان کورکورانه تعقیب داده های در دسترس. در این فصل، به جای آن، ارائه می دهد یک رویکرد اصولی برای درک منابع مختلف از داده ها و چگونه می توان آنها استفاده می شود. درک غنیتر باید به شما کمک بهتر مطابقت سوالات تحقیق خود را به منابع مناسب از داده ها. یا، اگر چنین منابع موجود وجود ندارد، متقاعد کردن شما برای جمع آوری داده های خود را با استفاده از ایده ها در فصل آینده است.
اولین گام برای یادگیری از داده های بزرگ به درک که آن بخشی از یک طبقه کلی داده است که برای تحقیقات اجتماعی برای سالهای زیادی استفاده است: داده های مشاهده ای. تقریبا، داده های مشاهده هر گونه اطلاعات است که از مشاهده یک سیستم اجتماعی بدون دخالت در برخی از راه است. یک راه خام در مورد آن فکر می کنم این است که داده های مشاهده ای همه چیز را که شامل نیست صحبت کردن با مردم (به عنوان مثال، نظرسنجی، موضوع فصل 3) و یا تغییر محیط مردم (به عنوان مثال، آزمایش، موضوع فصل 4) است. بنابراین، علاوه بر کسب و کار و دولت سوابق، داده های مشاهده ای نیز شامل چیزهایی مانند متن مقالات روزنامه ها و عکس های ماهواره ای.
این فصل دارای سه بخش است. اول، در بخش 2.2، من داده های بزرگ با جزئیات بیشتر شرح و مشخصات یک تفاوت اساسی بین آن و داده هایی را که به طور عمومی برای تحقیقات اجتماعی در گذشته استفاده می شود. سپس در بخش 2.3، من ده ویژگی های مشترک از منابع داده های بزرگ توصیف می کنند. درک این ویژگیها ما را قادر به سرعت تشخیص نقاط ضعف و قوت از منابع موجود و کمک خواهد کرد که منابع جدید که در آینده ایجاد خواهد شد مهار. همه چیز شمارش، همه چیز پیش بینی و تخمین آزمایش: در نهایت در بخش 2.4، من سه استراتژی اصلی پژوهش که شما می توانید استفاده کنید از داده های مشاهده ای یاد بگیرند توصیف می کنند.