मोठ्या डेटा स्त्रोतांकडे सर्वेक्षण करणे आपल्याला डेटा स्त्रोताशी वैयक्तिकरित्या अशक्य असणारे अंदाज तयार करण्यास सक्षम करते.
बहुतेक सर्वेक्षण एकटेच, आत्मनिर्धारित प्रयत्न असतात. ते एकमेकांवर बांधकाम करत नाहीत, आणि ते जगातील इतर सर्व डेटाचा लाभ घेत नाहीत. हे बदलेल. धडा 2 मधील चर्चेतील मोठ्या डेटा स्त्रोतांना सर्वेक्षणाचा डेटा जोडून मिळविण्यावर बरेच काही आहे. या दोन प्रकारांच्या डेटाच्या एकत्रित करून, शक्यतो काहीतरी करणे शक्य आहे जे एकतर वैयक्तिकरित्या अशक्य होते.
मोठ्या प्रमाणात डेटा स्त्रोतांसह सर्वेक्षण डेटा एकत्रित करण्यासाठी विविध प्रकारचे विविध प्रकार आहेत. या विभागात, मी दोन उपयुक्त आणि भिन्न आहेत की पध्दती वर्णन करू, आणि मी समृद्ध विचारून त्यांना कॉल आणि विचारत (आकृती 3.12) अभाव करू. मी प्रत्येक दृष्टिकोनास सविस्तर उदाहरणासह स्पष्ट करू इच्छित असलो तरी, आपण असे ओळखले पाहिजे की हे सर्वसाधारण पाककृती आहेत जे विविध प्रकारचे सर्वेक्षण डेटा आणि विविध प्रकारचे मोठ्या डेटासह वापरले जाऊ शकते. पुढे, आपण लक्षात घ्यावे की यातील प्रत्येक उदाहरणे दोन वेगवेगळ्या प्रकारे पाहिली जाऊ शकतात. अध्याय 1 मध्ये दिलेल्या कल्पनांवर विचार करताना, काही लोक या अभ्यासांना "रेडीमेड" मोठे डेटा वाढविणारे "सानुकूल" सर्वेक्षणाचे डेटा आणि "रेडीमेड" मोठ्या डेटाचे "कस्टमाइडेड" सर्वेक्षण डेटा सुधारण्यासाठी उदाहरणे म्हणून पाहतील. आपण दोन्ही दृश्ये पाहू शकणार पाहिजे. सरतेशेवटी, या उदाहरणे स्पष्ट करतात की सर्वेक्षणे आणि मोठे डेटा स्रोत पूरक आहेत आणि त्याऐवजी वापरलेले नाहीत.