प्रस्तावना

यह पुस्तक 2005 में कोलंबिया विश्वविद्यालय के बेसमेंट में शुरू हुई थी। उस समय, मैं स्नातक छात्र था, और मैं एक ऑनलाइन प्रयोग चला रहा था जो अंततः मेरा शोध प्रबंध बन जाएगा। मैं आपको अध्याय 4 में उस प्रयोग के वैज्ञानिक भागों के बारे में बता दूंगा, लेकिन अब मैं आपको कुछ ऐसे बारे में बताने जा रहा हूं जो मेरे शोध प्रबंध में नहीं है या मेरे किसी भी कागजात में नहीं है। और यह ऐसा कुछ है जो मूलभूत रूप से बदल गया है कि मैं शोध के बारे में कैसे सोचता हूं। एक सुबह, जब मैं अपने बेसमेंट कार्यालय में आया, तो मैंने पाया कि ब्राजील के लगभग 100 लोगों ने मेरे प्रयोग में भाग लिया था। इस सरल अनुभव पर मुझ पर गहरा असर पड़ा। उस समय, मेरे पास ऐसे दोस्त थे जो पारंपरिक प्रयोगशाला प्रयोग चला रहे थे, और मुझे पता था कि इन प्रयोगों में भाग लेने के लिए लोगों को भर्ती, पर्यवेक्षण और भुगतान करने के लिए उन्हें कितना मुश्किल करना पड़ा; अगर वे एक दिन में 10 लोगों को चला सकते हैं, तो यह अच्छी प्रगति थी। हालांकि, मेरे ऑनलाइन प्रयोग के साथ, मैं सो रहा था, जबकि 100 लोगों ने भाग लिया। जब आप सो रहे हों तो अपने शोध करना सच होने के लिए बहुत अच्छा लग सकता है, लेकिन ऐसा नहीं है। प्रौद्योगिकी में परिवर्तन-विशेष रूप से एनालॉग आयु से लेकर डिजिटल युग तक संक्रमण का मतलब है कि अब हम नए तरीकों से सामाजिक डेटा एकत्र और विश्लेषण कर सकते हैं। यह पुस्तक इन नए तरीकों से सामाजिक शोध करने के बारे में है।

यह पुस्तक उन सामाजिक वैज्ञानिकों के लिए है जो अधिक डेटा विज्ञान, डेटा वैज्ञानिक जो अधिक सामाजिक विज्ञान करना चाहते हैं, और इन दोनों क्षेत्रों के संकर में दिलचस्पी रखने वाले किसी भी व्यक्ति को करना चाहते हैं। यह देखते हुए कि यह पुस्तक किसके लिए है, इसे बिना कहने के जाना चाहिए कि यह केवल छात्रों और प्रोफेसरों के लिए नहीं है। हालांकि, मैं वर्तमान में एक विश्वविद्यालय (प्रिंसटन) में काम करता हूं, मैंने सरकार (यूएस जनगणना ब्यूरो में) और तकनीकी उद्योग (माइक्रोसॉफ्ट रिसर्च में) में भी काम किया है, इसलिए मुझे पता है कि वहां बहुत सारे रोमांचक शोध हो रहे हैं विश्वविद्यालयों। यदि आप सोशल रिसर्च के रूप में क्या कर रहे हैं, तो यह पुस्तक आपके लिए है, इससे कोई फर्क नहीं पड़ता कि आप कहां काम करते हैं या आप किस प्रकार की तकनीकों का उपयोग करते हैं।

जैसा कि आपने पहले ही देखा होगा, इस पुस्तक का स्वर कई अन्य अकादमिक किताबों से थोड़ा अलग है। यह जानबूझकर है। यह पुस्तक कम्प्यूटेशनल सोशल साइंस पर स्नातक सेमिनार से उभरी है जिसे मैंने 2007 से समाजशास्त्र विभाग में प्रिंसटन में पढ़ाया है, और मैं इसे सेमिनार से कुछ ऊर्जा और उत्तेजना को पकड़ना चाहता हूं। विशेष रूप से, मैं चाहता हूं कि इस पुस्तक में तीन विशेषताएं हों: मैं चाहता हूं कि यह सहायक, भविष्य उन्मुख और आशावादी हो।

सहायक : मेरा लक्ष्य एक पुस्तक लिखना है जो आपके लिए उपयोगी है। इसलिए, मैं एक खुली, अनौपचारिक, और उदाहरण संचालित शैली में लिखने जा रहा हूं। ऐसा इसलिए है क्योंकि मैं सबसे महत्वपूर्ण बात जो व्यक्त करना चाहता हूं वह सामाजिक शोध के बारे में सोचने का एक निश्चित तरीका है। और, मेरा अनुभव बताता है कि सोचने के इस तरीके को व्यक्त करने का सबसे अच्छा तरीका अनौपचारिक रूप से और कई उदाहरणों के साथ है। साथ ही, प्रत्येक अध्याय के अंत में, मेरे पास "अगला पढ़ने के लिए क्या" नामक एक अनुभाग है जो आपके द्वारा पेश किए जाने वाले कई विषयों पर अधिक विस्तृत और तकनीकी रीडिंग में बदलाव करने में आपकी सहायता करेगा। अंत में, मुझे आशा है कि यह पुस्तक आपको अनुसंधान और दूसरों के शोध का मूल्यांकन करने में मदद करेगी।

भविष्य उन्मुख : यह पुस्तक आपको आज मौजूद डिजिटल सिस्टम का उपयोग करके सामाजिक शोध करने में मदद करेगी और जो भविष्य में बनाई जाएंगी। मैंने 2004 में इस तरह के शोध करना शुरू कर दिया, और तब से मैंने कई बदलाव देखे हैं, और मुझे यकीन है कि आपके करियर के दौरान आपको कई बदलाव भी दिखाई देंगे। परिवर्तन के चेहरे में प्रासंगिक रहने की चाल अमूर्त है । उदाहरण के लिए, यह एक ऐसी पुस्तक नहीं होगी जो आपको बिल्कुल बताती है कि ट्विटर एपीआई का उपयोग कैसे किया जाए क्योंकि यह आज मौजूद है; इसके बजाए, यह आपको सिखाएगा कि बड़े डेटा स्रोतों से कैसे सीखना है (अध्याय 2)। यह एक ऐसी पुस्तक नहीं होगी जो आपको अमेज़ॅन मैकेनिकल तुर्क पर प्रयोग चलाने के लिए चरण-दर-चरण निर्देश प्रदान करेगी; इसके बजाए, यह आपको डिजिटल युग आधारभूत संरचना (अध्याय 4) पर निर्भर प्रयोगों को डिजाइन और व्याख्या करने के तरीके के बारे में सिखाएगा। अमूर्तता के उपयोग के माध्यम से, मुझे आशा है कि यह समय पर विषय पर एक कालातीत पुस्तक होगी।

आशावादी : दोनों समुदाय जो इस पुस्तक को संलग्न करते हैं-सामाजिक वैज्ञानिकों और डेटा वैज्ञानिकों के पास बहुत अलग पृष्ठभूमि और रुचियां हैं। इन विज्ञान से संबंधित मतभेदों के अलावा, जो मैं पुस्तक में बात करता हूं, मैंने यह भी देखा है कि इन दोनों समुदायों में अलग-अलग शैलियों हैं। डेटा वैज्ञानिक आमतौर पर उत्साहित होते हैं; वे गिलास को आधा भरा देखते हैं। दूसरी तरफ, सामाजिक वैज्ञानिक आमतौर पर अधिक महत्वपूर्ण होते हैं; वे ग्लास को आधे खाली के रूप में देखते हैं। इस पुस्तक में, मैं एक डेटा वैज्ञानिक के आशावादी स्वर को अपनाने जा रहा हूं। इसलिए, जब मैं उदाहरण प्रस्तुत करता हूं, तो मैं आपको यह बताने जा रहा हूं कि मुझे इन उदाहरणों के बारे में क्या पसंद है। और, जब मैं उदाहरणों के साथ समस्याओं को इंगित करता हूं- और मैं ऐसा करूँगा क्योंकि कोई शोध सही नहीं है- मैं इन समस्याओं को सकारात्मक और आशावादी तरीके से इंगित करने की कोशिश करने जा रहा हूं। मैं आलोचनात्मक होने के लिए महत्वपूर्ण नहीं होने वाला हूं- मैं महत्वपूर्ण होने जा रहा हूं ताकि मैं बेहतर शोध तैयार करने में आपकी सहायता कर सकूं।

हम अभी भी डिजिटल युग में सामाजिक शोध के शुरुआती दिनों में हैं, लेकिन मैंने कुछ गलतफहमी देखी हैं जो इतनी आम हैं कि मेरे लिए प्रस्तावना में उन्हें संबोधित करना मेरे लिए समझ में आता है। डेटा वैज्ञानिकों से, मैंने दो आम गलतफहमी देखी हैं। पहला यह सोच रहा है कि अधिक डेटा स्वचालित रूप से समस्याओं को हल करता है। हालांकि, सामाजिक शोध के लिए, यह मेरा अनुभव नहीं रहा है। असल में, सामाजिक शोध के लिए, अधिक डेटा के विपरीत बेहतर डेटा-अधिक उपयोगी लगता है। डेटा वैज्ञानिकों से मैंने जो दूसरी गलतफहमी देखी है, वह सोच रहा है कि सामाजिक विज्ञान सामान्य ज्ञान के चारों ओर फैंसी फैंसी बात का एक गुच्छा है। बेशक, एक सामाजिक वैज्ञानिक के रूप में - विशेष रूप से एक समाजशास्त्री के रूप में- मैं इससे सहमत नहीं हूं। स्मार्ट लोग लंबे समय से मानव व्यवहार को समझने के लिए कड़ी मेहनत कर रहे हैं, और इस प्रयास से एकत्रित ज्ञान को अनदेखा करना मूर्खतापूर्ण लगता है। मेरी आशा यह है कि यह पुस्तक आपको उस ज्ञान में से कुछ को ऐसे तरीके से पेश करेगी जो समझने में आसान हो।

सामाजिक वैज्ञानिकों से, मैंने दो आम गलतफहमी भी देखी हैं। सबसे पहले, मैंने देखा है कि कुछ लोग कुछ बुरे कागजात के कारण डिजिटल युग के औजारों का उपयोग करके सामाजिक शोध के पूरे विचार को लिखते हैं। यदि आप इस पुस्तक को पढ़ रहे हैं, तो संभवतः आप पहले से ही कागजात का एक समूह पढ़ चुके हैं जो सोशल मीडिया डेटा का उपयोग उन तरीकों से करते हैं जो गलत या गलत हैं (या दोनों)। मैरे पास भी है। हालांकि, इन उदाहरणों से निष्कर्ष निकालना एक गंभीर गलती होगी कि सभी डिजिटल आयु सामाजिक शोध खराब है। असल में, आपने शायद उन कागजात का एक समूह भी पढ़ा है जो सर्वेक्षण डेटा का उपयोग उन तरीकों से करते हैं जो गलत या गलत हैं, लेकिन आप सर्वे का उपयोग करके सभी शोध नहीं लिखते हैं। ऐसा इसलिए है क्योंकि आप जानते हैं कि सर्वेक्षण डेटा के साथ बहुत अच्छा शोध किया गया है, और इस पुस्तक में मैं आपको दिखा रहा हूं कि डिजिटल युग के उपकरणों के साथ भी बहुत अच्छा शोध किया गया है।

सामाजिक वैज्ञानिकों से मैंने जो दूसरी आम गलतफहमी देखी है वह भविष्य के साथ वर्तमान को भ्रमित करना है। जब हम डिजिटल युग में सामाजिक शोध का आकलन करते हैं- अनुसंधान जो मैं वर्णन करने जा रहा हूं- यह महत्वपूर्ण है कि हम दो अलग-अलग प्रश्न पूछें: "शोध की यह शैली अभी कितनी अच्छी तरह से काम करती है?" और "यह शैली कितनी अच्छी तरह से होगी भविष्य में अनुसंधान कार्य? "शोधकर्ताओं को पहले प्रश्न का उत्तर देने के लिए प्रशिक्षित किया जाता है, लेकिन इस पुस्तक के लिए मुझे लगता है कि दूसरा प्रश्न अधिक महत्वपूर्ण है। यही है, भले ही डिजिटल युग में सामाजिक शोध ने अभी तक बड़े पैमाने पर, प्रतिमान-परिवर्तनकारी बौद्धिक योगदान नहीं दिए हैं, डिजिटल आयु अनुसंधान में सुधार की दर अविश्वसनीय रूप से तेज़ है। यह परिवर्तन की यह दर है- वर्तमान स्तर से अधिक - जो डिजिटल-आयु शोध को मेरे लिए इतना रोमांचक बनाता है।

भले ही वह अंतिम पैराग्राफ आपको भविष्य में कुछ अनिर्दिष्ट समय पर संभावित धन की पेशकश कर रहा है, मेरा लक्ष्य आपको किसी विशेष प्रकार के शोध पर नहीं बेचना है। मेरे पास ट्विटर, फेसबुक, Google, माइक्रोसॉफ्ट, ऐप्पल या किसी अन्य तकनीकी कंपनी में व्यक्तिगत रूप से शेयर नहीं हैं (हालांकि, पूर्ण प्रकटीकरण के लिए, मुझे यह उल्लेख करना चाहिए कि मैंने माइक्रोसॉफ्ट से शोध निधि में काम किया है या प्राप्त किया है, गूगल, और फेसबुक)। इसलिए, पुस्तक के दौरान, मेरा लक्ष्य एक विश्वसनीय कथाकार बने रहना है, जो आपको संभवतः सभी रोमांचक नई चीजों के बारे में बता रहा है, जबकि आपको उन कुछ जाल से दूर मार्गदर्शन करते हुए जिन्हें मैंने दूसरों को देखा है (और कभी-कभी खुद में गिर गया) ।

सामाजिक विज्ञान और डेटा विज्ञान के चौराहे को कभी-कभी कम्प्यूटेशनल सोशल साइंस कहा जाता है। कुछ लोग इसे तकनीकी क्षेत्र मानते हैं, लेकिन यह पारंपरिक अर्थ में तकनीकी पुस्तक नहीं होगी। उदाहरण के लिए, मुख्य पाठ में कोई समीकरण नहीं हैं। मैंने पुस्तक को इस तरह लिखना चुना क्योंकि मैं डिजिटल डेटा में सामाजिक शोध का व्यापक दृष्टिकोण प्रदान करना चाहता था, जिसमें बड़े डेटा स्रोत, सर्वेक्षण, प्रयोग, जन सहयोग और नैतिकता शामिल थीं। इन सभी विषयों को कवर करना और प्रत्येक के बारे में तकनीकी विवरण प्रदान करना असंभव साबित हुआ। इसके बजाए, प्रत्येक अध्याय के अंत में "आगे पढ़ने के लिए क्या" अनुभाग में अधिक तकनीकी सामग्री के पॉइंटर्स दिए जाते हैं। दूसरे शब्दों में, यह पुस्तक आपको सिखाए जाने के लिए डिज़ाइन नहीं की गई है कि कोई विशिष्ट गणना कैसे करें; बल्कि, यह सामाजिक शोध के बारे में सोचने के तरीके को बदलने के लिए डिज़ाइन किया गया है।

पाठ्यक्रम में इस पुस्तक का उपयोग कैसे करें

जैसा कि मैंने पहले कहा था, यह पुस्तक कम्प्यूटेशनल सोशल साइंस पर स्नातक सेमिनार से उभरी है कि मैं प्रिंसटन में 2007 से पढ़ रहा हूं। चूंकि आप इस पुस्तक का उपयोग करने के लिए इस पाठ्यक्रम का उपयोग करने के बारे में सोच रहे हैं, मैंने सोचा कि यह मेरे लिए उपयोगी हो सकता है कि यह मेरे पाठ्यक्रम से कैसे बढ़ता है और मैं कल्पना करता हूं कि इसे अन्य पाठ्यक्रमों में कैसे इस्तेमाल किया जा रहा है।

कई सालों तक, मैंने बिना किसी पुस्तक के अपना कोर्स पढ़ाया; मैं सिर्फ लेखों का संग्रह असाइन करूंगा। जबकि छात्र इन लेखों से सीखने में सक्षम थे, अकेले लेख वैचारिक परिवर्तनों की ओर अग्रसर नहीं थे जिन्हें मैं बनाने की उम्मीद कर रहा था। तो मैं छात्रों को बड़ी तस्वीर देखने में मदद करने के लिए परिप्रेक्ष्य, संदर्भ और सलाह प्रदान करने वाले वर्ग में अधिकतर समय व्यतीत करूंगा। यह पुस्तक उन सभी परिप्रेक्ष्य, संदर्भ, और सलाह को ऐसे तरीके से लिखने का मेरा प्रयास है, जिनके पास सामाजिक विज्ञान या डेटा विज्ञान के संदर्भ में कोई शर्त नहीं है।

एक सेमेस्टर लंबे पाठ्यक्रम में, मैं इस पुस्तक को विभिन्न प्रकार के अतिरिक्त रीडिंग के साथ जोड़ने की अनुशंसा करता हूं। उदाहरण के लिए, इस तरह का एक कोर्स प्रयोगों पर दो सप्ताह बिता सकता है, और आप प्रयोगों के डिजाइन और विश्लेषण में पूर्व-उपचार की जानकारी जैसे विषयों पर रीडिंग के साथ अध्याय 4 जोड़ सकते हैं; कंपनियों में बड़े पैमाने पर ए / बी परीक्षणों द्वारा उठाए गए सांख्यिकीय और कम्प्यूटेशनल मुद्दे; विशेष रूप से तंत्र पर केंद्रित प्रयोगों का डिजाइन; और अमेज़ॅन मैकेनिकल तुर्क जैसे ऑनलाइन श्रम बाजारों से प्रतिभागियों का उपयोग करने से संबंधित व्यावहारिक, वैज्ञानिक और नैतिक मुद्दों। इसे प्रोग्रामिंग से संबंधित रीडिंग और गतिविधियों के साथ भी जोड़ा जा सकता है। इन कई संभावित जोड़ों के बीच उचित विकल्प आपके पाठ्यक्रम के छात्रों (जैसे, स्नातक, मास्टर, या पीएचडी), उनकी पृष्ठभूमि और उनके लक्ष्यों पर निर्भर करता है।

एक सेमेस्टर-लम्बा कोर्स में साप्ताहिक समस्या सेट भी शामिल हो सकते हैं। प्रत्येक अध्याय में विभिन्न प्रकार की गतिविधियां होती हैं जिन्हें कठिनाई की डिग्री से लेबल किया जाता है: आसान ( आसान ), मध्यम ( मध्यम ), कठिन ( कठिन ), और बहुत कठिन ( बहुत मुश्किल )। इसके अलावा, मैंने प्रत्येक समस्या को उन कौशलों से लेबल किया है जिनकी आवश्यकता है: गणित ( गणित की आवश्यकता है ), कोडिंग ( कोडिंग की आवश्यकता है ), और डेटा संग्रह ( डेटा संग्रहण )। अंत में, मैंने कुछ गतिविधियों को लेबल किया है जो मेरे व्यक्तिगत पसंदीदा हैं ( मेरा मनपसंद )। मुझे आशा है कि गतिविधियों के इस विविध संग्रह के भीतर, आपको कुछ ऐसे छात्र मिलेंगे जो आपके छात्रों के लिए उपयुक्त हैं।

पाठ्यक्रमों में इस पुस्तक का उपयोग करने वाले लोगों की मदद करने के लिए, मैंने प्रत्येक अध्याय के लिए पाठ्यक्रम, स्लाइड, अनुशंसित जोड़ी, और कुछ गतिविधियों के समाधान जैसे शिक्षण सामग्री का संग्रह शुरू कर दिया है। आप इन सामग्रियों को ढूंढ सकते हैं-और उन्हें योगदान दे सकते हैं-http://www.bitbybitbook.com पर।