এনালগ যুগে, আচরণ সম্পর্কিত তথ্য সংগ্রহ করে - কে কি, এবং কখন-ব্যয়বহুল ছিল, এবং সেইজন্য অপেক্ষাকৃত দুর্লভ। এখন, ডিজিটাল যুগে, কোটি কোটি মানুষের আচরণ রেকর্ড করা, সংরক্ষিত এবং বিশ্লেষণযোগ্য। উদাহরণস্বরূপ, প্রত্যেকবার আপনি কোনও ওয়েবসাইটে ক্লিক করুন, আপনার মোবাইল ফোনে কল করুন, বা আপনার ক্রেডিট কার্ডের মাধ্যমে কিছু অর্থ প্রদান করুন, আপনার আচরণের একটি ডিজিটাল রেকর্ড ব্যবসার দ্বারা তৈরি এবং সংরক্ষণ করা হয়। যেহেতু এই ধরনের তথ্যগুলি মানুষের দৈনন্দিন কর্মের প্রতিফলন হয়, সেগুলিকে প্রায়ই ডিজিটাল ট্রেস বলা হয়। ব্যবসার দ্বারা অনুষ্ঠিত এই ট্রেস ছাড়াও, সরকার উভয় মানুষ এবং ব্যবসা সম্পর্কে অবিশ্বাস্যভাবে সমৃদ্ধ তথ্য আছে একসঙ্গে এই ব্যবসা এবং সরকারি রেকর্ড প্রায়ই বড় তথ্য বলা হয়।
বড় ডেটার চির-বন্যা বন্যা মানে আমরা এমন একটি বিশ্ব থেকে সরানো যেখানে বৈষম্যমূলক তথ্য এমন একটি পৃথিবীর তুলনায় অপ্রতুল ছিল যেখানে আচরণগত তথ্য প্রশস্ত। বড় বড় তথ্য থেকে শেখার প্রথম ধাপটি উপলব্ধি করছে যে এটি একটি বিস্তৃত শ্রেণীর তথ্য যা অনেক বছর ধরে সামাজিক গবেষণার জন্য ব্যবহৃত হয়েছে: পর্যবেক্ষণমূলক তথ্য । মোটামুটিভাবে পর্যবেক্ষণমূলক তথ্য এমন কোন তথ্য যা কোনও পদ্ধতিতে হস্তক্ষেপ ছাড়াই সামাজিক ব্যবস্থা পর্যবেক্ষণের ফলে হয়। এটি সম্পর্কে একটি অশোধিত উপায় হল পর্যবেক্ষণগত তথ্য যা মানুষের সাথে কথা বলা (উদাহরণস্বরূপ, সার্ভেগুলি, অধ্যায় 3-এর বিষয়) বা মানুষের পরিবেশ পরিবর্তন (উদাহরণস্বরূপ, অধ্যায় 4 অধ্যায়ের) পরিবর্তন করা হয় না। এইভাবে, ব্যবসা ও সরকারি রেকর্ড ছাড়াও, নিরীক্ষণের তথ্যগুলিতে সংবাদপত্রের প্রবন্ধ এবং উপগ্রহের ফটোগুলির মতামতও রয়েছে।
এই অধ্যায়ে তিনটি অংশ আছে। প্রথমত, সেকশন ২২-এ, আমি আরও বিস্তারিতভাবে বড় তথ্য উত্স বর্ণনা করি এবং অতীতের সামাজিক গবেষণার জন্য সাধারণত যেগুলি ব্যবহার করা হয়েছে তাদের মধ্যে মৌলিক পার্থক্যকে স্পষ্ট করে তুলে ধরুন। তারপর, সেকশন 2.3 এ, আমি দশটি বড় তথ্য উৎসের সাধারণ বৈশিষ্ট্যগুলি বর্ণনা করি। এই বৈশিষ্ট্যগুলি বোঝার ফলে আপনি বিদ্যমান উত্সগুলির শক্তিসমূহ এবং দুর্বলতাগুলিকে দ্রুত সনাক্ত করতে সক্ষম হবেন এবং আপনাকে ভবিষ্যতে পাওয়া যাবে এমন নতুন উৎসগুলি ব্যবহার করতে সহায়তা করবে। অবশেষে, সেকশন ২.4 এ, আমি তিনটি মূল গবেষণা কৌশলগুলি বর্ণনা করি যা আপনি পর্যবেক্ষণ সংক্রান্ত তথ্য থেকে শিখতে পারেন: বিষয়গুলি গণনা করা, পূর্বাভাসের বিষয় এবং একটি পরীক্ষামূলক পরিমাপ।