بيانات الكبير هو في كل مكان، ولكن استخدامه وغيرها من البيانات الرصدية للبحث الاجتماعي أشكال أمر صعب. في تجربتي هناك شيء مثل أي ممتلكات غداء مجانية للأبحاث: إذا كنت لا تضع في الكثير من العمل وجمع البيانات، فأنت على الأرجح ستكون لدينا لوضع الكثير من العمل تحليل البيانات الخاصة بك أو في التفكير ما هو في مسألة مثيرة للاهتمام أن نسأل من البيانات. على أساس الأفكار في هذا الفصل، وأعتقد أن هناك ثلاثة طرق رئيسية أن مصادر البيانات الكبيرة ستكون الأكثر قيمة للبحوث الاجتماعية:
يمكن التعبير عن العديد من الأسئلة الهامة في مجال البحث الاجتماعي واحدا من هؤلاء الثلاثة. ومع ذلك، تتطلب هذه النهج عموما الباحثين لتحقيق الكثير من البيانات. ما الذي يجعل Farber (2015) إثارة للاهتمام هو الدافع النظري للقياس. هذا الدافع النظري يأتي من خارج البيانات. وهكذا، بالنسبة لأولئك الذين جيدة في السعر المطلوب أنواع معينة من الأسئلة البحثية، يمكن لمصادر البيانات الكبيرة يكون مثمرا جدا.
وأخيرا، وليس يحركها نظرية البحوث التجريبية (التي كانت تركز على هذا الفصل)، ونحن يمكن أن الوجه السيناريو وخلق التنظير مدفوعة تجريبيا. وهذا هو، من خلال تراكم حذرا من الحقائق التجريبية، وأنماط، والألغاز، ونتمكن من بناء نظريات جديدة.
هذا البديل، نهج البيانات الأولى لنظرية ليست جديدة، وكانت مفصلية إليها بالقوة Glaser and Strauss (1967) مع دعوتهم لنظرية الارض. هذا النهج البيانات الأولى، ومع ذلك، لا يعني "نهاية نظرية" كما قيل من قبل الكثير من الصحافة حول البحث العلمي في العصر الرقمي (Anderson 2008) . بدلا من ذلك، والتغيرات في بيئة البيانات، يجب علينا أن نتوقع إعادة التوازن في العلاقة بين النظرية والبيانات. في عالم حيث تم جمع البيانات مكلفة، فمن المنطقي أن يجمع فقط البيانات التي تشير النظريات سوف يكون أكثر فائدة. ولكن، في عالم أصبحت فيه كميات هائلة من البيانات متاحة مجانا بالفعل، فمن المنطقي أيضا لمحاولة مقاربة البيانات الأولى (Goldberg 2015) .
كما بينت في هذا الفصل، يمكن للباحثين تعلم الكثير من خلال مشاهدة الناس. في الفصول الثلاثة المقبلة، أنا أصف كيف يمكننا أن نتعلم أشياء كثيرة مختلفة إذا نحن خياط جمع البيانات لدينا والتفاعل مع الناس بشكل مباشر عن طريق طرح الأسئلة عليهم (الفصل 3)، تجارب تشغيل (الفصل 4)، وحتى إشراكهم في عملية البحث مباشرة (الفصل 5).