سنجیدہ عمر میں، رویے کے بارے میں اعداد و شمار جمع کرنے والے، اور کیا مہنگا تھا، اور اس وجہ سے نسبتا نایاب. اب، ڈیجیٹل عمر میں، اربوں افراد کے طرز عمل ریکارڈ، محفوظ، اور تجزیہ دار ہیں. مثال کے طور پر، ہر بار جب آپ کسی ویب سائٹ پر کلک کرتے ہیں، اپنے موبائل فون پر کال کریں یا اپنے کریڈٹ کارڈ کے ساتھ کسی چیز کے لئے ادائیگی کریں، آپ کے رویے کا ایک ڈیجیٹل ریکارڈ تخلیق ہوجائے اور کاروبار کے ذریعہ محفوظ ہوجائے. کیونکہ ان قسم کے اعداد و شمار لوگوں کے ہر روز کے اعمال کی طرف اشارہ کرتے ہیں، انہیں اکثر ڈیجیٹل نشان کہا جاتا ہے . کاروباری اداروں کے زیر اہتمام ان نشانوں کے علاوہ، حکومتوں کو لوگوں اور کاروباری اداروں کے بارے میں ناقابل یقین حد تک امیر معلومات بھی شامل ہیں. ساتھ ساتھ یہ کاروبار اور سرکاری ریکارڈز کو اکثر بڑے ڈیٹا کہا جاتا ہے.
بڑے اعداد و شمار کی ہمیشہ سے بڑھتی ہوئی سیلاب کا مطلب یہ ہے کہ ہم ایسی ایسی دنیا میں منتقل ہو چکے ہیں جہاں دنیا میں رویے کے اعداد و شمار سے کوئی تعلق نہیں تھا جہاں رویے کے اعداد و شمار بہت زیادہ ہیں. پریکشتاتمک ڈیٹا: بگ ڈیٹا سے سیکھنے کے لیے ایک پہلا قدم یہ کئی سالوں کے لئے سماجی تحقیق کے لیے استعمال کیا گیا ہے کہ اعداد و شمار کے ایک وسیع تر زمرے کا حصہ ہے کہ میں سمجھتا ہے. تقریبا، مشاہداتی اعداد و شمار کسی بھی اعداد و شمار کا حامل ہے جو بغیر کسی طرح مداخلت کے بغیر سماجی نظام کو دیکھتا ہے. اس کے بارے میں سوچنے کے لئے خام انداز یہ ہے کہ مشاہداتی اعداد و شمار سب کچھ ہے جو لوگوں کے ساتھ گفتگو نہیں کرتا (مثال کے طور پر، سروے، باب 3 کے موضوع) یا لوگوں کے ماحول میں تبدیلی (مثال کے طور پر، تجربات، باب 4 کے موضوع). اس طرح، کاروباری اور حکومتی ریکارڈز کے علاوہ، مشاہداتی اعداد و شمار اخبارات کے مضامین اور سیٹلائٹ کی تصاویر کے متن جیسے موضوعات میں شامل ہیں.
یہ باب تین حصوں میں ہے. سب سے پہلے، سیکشن 2.2 میں، میں زیادہ سے زیادہ اعداد و شمار کے بڑے اعداد و شمار کی وضاحت کرتا ہوں اور ماضی میں سماجی تحقیق کے لئے عام طور پر استعمال کیا جاتا ہے ان کے اعداد و شمار کے درمیان بنیادی فرق کی وضاحت. اس کے بعد، سیکشن 2.3 میں، میں بڑے ڈیٹا ذرائع کے دس عام خصوصیات بیان کرتا ہوں. ان خصوصیات کو سمجھنے کے قابل بناتا ہے کہ آپ کو فوری طور پر موجودہ ذرائع کی طاقت اور کمزوریوں کو تسلیم کرنا اور مستقبل میں دستیاب ہو گا نئے ذرائع کو استعمال کرنے میں مدد ملے گی. آخر میں، سیکشن 2.4 میں، میں تین بنیادی ریسرچ کی حکمت عملی بیان کرتا ہوں کہ آپ مشاہداتی اعداد و شمار سے سیکھنے کے لئے استعمال کر سکتے ہیں: گنتی چیزیں، پیشن گوئی کی چیزیں، اور ایک تجربے کے قریب لگتے ہیں.