उपक्रम

  • अडचण पदवी: सोपे सोपे , मध्यम मध्यम , हार्ड कठीण , खुप कठिण खुप कठिण
  • गणित आवश्यक आहे ( गणित आवश्यक आहे )
  • कोडींग आवश्यक आहे ( कोडींग आवश्यक )
  • माहिती मिळवणे ( माहिती मिळवणे )
  • माझे आवडते ( माझे आवडते )
  1. [ मध्यम , माझे आवडते ] Google फ्लू ट्रेन्डसह अल्गोरिदमिक गोंधळामुळे समस्या आली. Lazer et al. (2014) द्वारे कागद वाचा Lazer et al. (2014) , आणि समजावून सांगून समस्येचे स्पष्टीकरण देणार्या Google वर अभियंताला एक संक्षिप्त, स्पष्ट ईमेल लिहा आणि त्याचे निराकरण कसे करावे त्याची कल्पना सादर करा.

  2. [ मध्यम ] Bollen, Mao, and Zeng (2011) दावा आहे की ट्विटरचा डेटा वापरुन स्टॉक मार्केटचा अंदाज लावता येतो. या शोधणामुळे हेज फंड-डेरव्हंट कॅपिटल मार्केट्सची निर्मिती झाली - ट्विटर (Jordan 2010) वरून गोळा केलेल्या डेटावर आधारित शेअर बाजारात गुंतवणूक करणे. त्या निधीमध्ये पैसे घालण्यापूर्वी आपण काय पाहू इच्छिता?

  3. [ सोपे ] काही सार्वजनिक आरोग्य वकिल ई-सिगारेट धूम्रपान बंद होण्याकरिता प्रभावी सहाय्य विचारात घेतात, इतर संभाव्य जोखीम, जसे निकोटीन उच्च पातळी अशी कल्पना करा की संशोधक ई-सिगारेटशी संबंधित ट्विटर पोस्ट्स गोळा करून आणि भावना विश्लेषण आयोजित करून ई-सिगरेटवर जनमत चाळण्याचा निर्णय घेतात.

    1. आपण या अभ्यासात सर्वात जास्त चिंताग्रस्त असलेल्या तीन संभाव्य पार्श्वभूमी काय आहेत?
    2. Clark et al. (2016) फक्त अशा अभ्यास धाव गेला. प्रथम, त्यांनी जानेवारी 2012 ते डिसेंबर 2014 पर्यंत ई-सिगरेट संबंधित कीवर्ड वापरत असलेल्या 850,000 ट्विट्स गोळा केले. जवळच्या तपासणीनंतर त्यांना हे लक्षात आले की यापैकी अनेक ट्वीट स्वयंचलित होते (म्हणजेच, मानवाने तयार केलेले नाही) आणि यातील अनेक स्वयंचलित ट्वीट्स मूलत: होत्या जाहिराती सेंद्रीय ट्वीट्सवरून स्वयंचलित ट्वीट्स विभक्त करण्यासाठी त्यांनी मानवी ओळख अॅल्गोरिदम विकसित केले आहे. या मानवी शोधात अल्गोरिदमचा वापर करुन त्यांना आढळून आले की 80% ट्वीट स्वयंचलित होते. हा शोध आपल्या उत्तरास (ए) मध्ये बदलतो का?
    3. जेव्हा त्यांनी सेंद्रीय आणि स्वयंचलित ट्वीट्सच्या भावनांची तुलना केली तेव्हा त्यांना असे आढळले की स्वयंचलित ट्वीट कार्बनिक ट्वीट्स (6.17 vs 5.84) पेक्षा अधिक सकारात्मक आहेत. हे शोध आपल्या उत्तर (ब) वर बदलते का?
  4. [ सोपे ] नोव्हेंबर 200 9 मध्ये ट्विटने ट्विटमध्ये "तुम्ही काय करीत आहात?" या प्रश्नावर "काय चालले आहे?" असे प्रश्न विचारले. (Https://blog.twitter.com/2009/whats-happening)

    1. आपल्याला असे सूचित होते की सूचनांचे बदल कोण ट्वीट आणि / किंवा ते ट्विट कोण प्रभावित करतील?
    2. कोणत्या प्रकल्पासाठी एक प्रोजेक्ट तयार करा ज्यासाठी आपण "प्रॉब्लेम पसंत करू इच्छिता?" हे स्पष्ट करा.
    3. कोणत्या प्रकल्पासाठी आपण "प्रॉब्लेम" हे प्राधान्य द्यायचे असे नाव शोधू शकता? याचे कारण स्पष्ट करा.
  5. [ सोपे ] "Retweets" चा वापर Twitter वर प्रभाव आणि प्रभाव प्रसारित करण्यासाठी केला जातो. प्रारंभी, वापरकर्त्यांना त्यांनी आवडलेले ट्विट कॉपी आणि पेस्ट केले, मूळ हँडलला त्याच्या / तिच्या हॅँडलवर टॅग केले आणि चिवचिव करणे टाईप करण्याआधी स्वतः "RT" टाईप करा. मग, 200 9 साली ट्विटरने एक "रिटचूक" बटण जोडले. जून 2016 मध्ये, वापरकर्त्यांनी त्यांच्या स्वत: च्या ट्विट्सकरिता (https://twitter.com/twitter/status/742749353689780224) ट्विट करणे शक्य केले. आपल्या संशोधनामध्ये आपण "retweets" कसे वापरता या बदलांवर परिणाम झाला असे आपल्याला वाटते? का किंवा का नाही?

  6. [ खुप कठिण , माहिती मिळवणे , कोडींग आवश्यक , माझे आवडते ] मोठ्या प्रमाणावर निगडित पेपरमध्ये, मिशेल आणि सहकाऱ्यांनी (2011) दीर्घकालीन सांस्कृतिक ट्रेंड ओळखण्याच्या प्रयत्नात पाच लाखांपेक्षा जास्त डिजिटाइझ केलेल्या पुस्तकांची सामग्री विश्लेषित केली आहे. ते वापरलेले डेटा आता Google NGrams डेटासेट म्हणून प्रकाशीत केले गेले आहे, आणि म्हणून आम्ही डेटाचा वापर करुन त्यांचे काम काही बनवू शकतो.

    कागदाच्या अनेक निकालांपैकी एकाने मिशेल आणि सहकाऱ्यांनी असा युक्तिवाद केला की आम्ही जलद आणि जलद विसरत आहोत. एका विशिष्ट वर्षासाठी, "1883" म्हणा, ते 1875 आणि 1 9 75 दरम्यान "1 9 83" होते त्या प्रत्येक वर्षामध्ये प्रकाशित झालेल्या 1-ग्रॅमचे प्रमाण मोजले. ते म्हणाले की या प्रमाणात त्या वर्षातील घडलेल्या घटनांमध्ये स्वारस्य आहे. त्यांच्या 3/3 आकृतीत, त्यांनी तीन वर्षासाठी वापर वारंवारता आखली: 1883, 1 9 10, आणि 1 9 50. या तीन वर्षांनी एक सामान्य नमुना सामायिक केला: त्या वर्षाच्या आधी थोडासा वापर केला, नंतर एक गती वाढली, नंतर क्षणात. त्यानंतर, प्रत्येक वर्षासाठी कस वाढण्याचे प्रमाण मोजण्यासाठी, मिशेल आणि त्यांच्या सहकार्यांनी प्रत्येक वर्षाचा "अर्धी जीवन" 1875 आणि 1 9 75 दरम्यान सर्व वर्षांसाठी मोजला. त्यांच्या आकृती 3a (इनसेट) मध्ये त्यांनी दाखवून दिले की प्रत्येकी अर्ध्या जीवन वर्ष कमी होत आहे, आणि त्यांनी असा युक्तिवाद केला की याचा अर्थ असा होतो की आम्ही भूतकाळातील जलद आणि जलद विसरून जात आहोत. ते इंग्रजी भाषेच्या कॉर्पसच्या आवृत्ती 1 चा वापर करतात, परंतु त्यानंतर Google ने कॉर्पसची दुसरी आवृत्ती रिलीझ केली आहे. आपण कोडींग सुरू करण्यापूर्वी प्रश्नाचे सर्व भाग वाचा.

    ही क्रिया आपल्याला लेखन पुन्हा वापरता येण्याजोगा कोड, परिणाम निष्कर्ष आणि डेटा गुंडाळणे (जसे की अस्ताव्यस्त फाइल्स हाताळणी आणि गहाळ नसलेल्या हाताळणी सारख्या गोष्टी) पाठवेल. हा उपक्रम आपल्याला श्रीमंत आणि मनोरंजक डेटासेटसह उठण्यास व चालू करण्यास मदत करेल.

    1. Google बुक्स NGram व्यूअर वेबसाइटवरील कच्चा डेटा मिळवा विशेषतः, आपण इंग्रजी भाषा कॉर्पसची आवृत्ती 2 वापरावी, जे 1 जुलै 2012 रोजी रिलीझ झाले. असंपुंबित, ही फाईल 1.4 जीबी आहे.

    2. Michel et al. (2011) च्या आकृती 3a चे मुख्य भाग पुन्हा तयार करा Michel et al. (2011) . या आकृतीची पुनर्रचना करण्यासाठी, आपल्याला दोन फाईल्स आवश्यक आहेत: आपण (अ) आणि "एकूण संख्या" फाइलमध्ये डाउनलोड केलेल्या एकास, ज्याचा वापर आपण कच्च्या गणना रुपांतरुसार करू शकता. लक्षात घ्या की एकूण संख्या फाइलमध्ये एक अशी रचना आहे जी वाचण्यात थोडा कठीण बनते. एनजीआरएम डेटाच्या आवृत्ती 2 Michel et al. (2011) , जे आवृत्ती 1 डेटावर आधारित आहेत?

    3. आता एनजीआरएमआरद्वारे बनवलेल्या ग्राफ विरुद्ध आपला आलेख तपासा.

    4. आकृती 3a स्वच्छ करा (मुख्य आकृती), परंतु \(y\) -ax म्हणजे कच्चा उल्लेख गुण (उल्लेख केलेल्या रेटांचा नाही \(y\) बदलणे.

    5. (बी) आणि (डी) मधील फरक आपल्याला मिशेल एट अल यातील कोणत्याही परीणामांचा फेरबदल करण्यास प्रेरित करतो. (2011). का किंवा का नाही?

    6. आता, गुणोत्तरांचा वापर करून, आकृती 3a च्या इन्सॅटची प्रतिलिपी करा. म्हणजेच, 1875 आणि 1 9 75 दरम्यान प्रत्येक वर्षासाठी त्या अर्ध-आयुष्याचे गणन केले जाते. अर्ध-जीवनास परिभाषित केले जाते त्याप्रमाणे गुणोत्तरांचे प्रमाण अर्ध्या ते अधिकापर्यंत पोहचण्यापर्यत किती वर्षे जातात हे निश्चित केले जाते. लक्षात ठेवा Michel et al. (2011) अर्ध्या जीवनाचे अनुमान लावण्याकरता अधिक क्लिष्ट गोष्टी करा - सहायक ऑनलाइन माहितीचा विभाग III.6 पहा- परंतु त्यांनी असा दावा केला आहे की दोन्ही पध्दती समान परिणाम देतात. एनजीआरएम डाटाचे व्हर्जन 2 Michel et al. (2011) मध्ये सादर करणाऱ्यांचे समान परिणाम वापरत आहे का Michel et al. (2011) , जे आवृत्ती 1 डेटावर आधारित आहेत? (इशारा: जर तसे झाले नाही तर आश्चर्यचकित होऊ नका.)

    7. अशा काही वर्षे होते की जसे की वर्ष खूपच वेगाने किंवा विशेषत: मंदपणे विसरलेले होते. थोडक्यात त्या नमुन्याचे संभाव्य कारणांबद्दल तर्क करा आणि आपण कसे सांगू शकतो हे स्पष्ट करा.

    8. आता हा परिणाम चीनी, फ्रेंच, जर्मन, हिब्रू, इटालियन, रशियन आणि स्पॅनिश भाषेतील NGrams डेटाच्या आवृत्ती 2 साठी बनवा.

    9. सर्व भाषांमध्ये तुलना करणे, आऊटलाइअर असणारे कोणतेही वर्ष होते, जसे की वर्ष ज्या विशेषतः लवकर किंवा विशेषतः हळूहळू विसरले होते? थोडक्यात त्या नमुन्याचे संभाव्य कारणांबद्दल तर्क करा.

  7. [ खुप कठिण , माहिती मिळवणे , कोडींग आवश्यक , माझे आवडते ] Penney (2016) जून 2013 मध्ये एनएसए / प्रिझम पाळत ठेवणे (उदा. स्नोडेन साक्षात्कार) याविषयी व्यापक प्रसिद्धी संबंधित विषयांवर विकिपीडिया लेखांवरील रहदारीमध्ये अचानक आणि अचानक घट आली की जी गोपनीयता चिंता वाढवते. तसे असल्यास, वागणुकीत हा बदल द्रुतगती पर्यवेक्षणामुळे परिणामस्वरूप शीतकरण परिणामासह सुसंगत असेल. Penney (2016) च्या दृष्टीकोनातून काहीवेळा खंडित वेळ मालिका डिझाइन म्हटले जाते आणि हे विभाग 2.4.3 मध्ये वर्णन केलेल्या पध्दतीशी संबंधित आहे.

    विषय कीवर्ड निवडण्यासाठी, पेनीने अमेरिकन मीडिया ऑफ होमलैंड सिक्युरिटीने वापरलेल्या सूचीचा संदर्भ दिला ज्यांत सोशल मीडियाचा मागोवा घेणे आणि परीक्षण करणे समाविष्ट आहे. DHS सूची विशिष्ट शोध संज्ञा वेगवेगळ्या विषयांत, जसे "आरोग्यविषयक चिंता," ​​"पायाभूत सुरक्षितता," आणि "दहशतवाद" या श्रेणींमध्ये वर्गीकृत करते. पेनीने "दहशतवाद" संबंधित 48 कीवर्ड वापरले (परिशिष्ट टेबल 8 पहा) ). त्यानंतर त्याने एकूण विकिपीडिया लेखांची संख्या 48 महिन्यांची होती. जानेवारी 2014 च्या सुरुवातीपासून ऑगस्ट 2014 च्या अखेरीपर्यंत विकिपीडियाच्या एकूण 48 विकिपीडियाच्या लेखांची गणना केली जाते. इतर विषयांवर लेख दृश्ये

    आता, आपण Penney (2016) अनुकरण आणि विस्तार करणार आहोत. या क्रियाकलापासाठी आपल्याला आवश्यक असलेला सर्व कच्चा डेटा विकिपीडियावर उपलब्ध आहे. किंवा आपण आर संकुल विकिपीडियाट्रेन्ड (Meissner and R Core Team 2016) मधून मिळवू शकता. जेव्हा आपण आपले प्रतिसाद लिहाल तेव्हा कृपया कोणत्या डेटा स्त्रोत वापरल्या (लक्षात घ्या की हेच कृती अध्याय 6 मध्ये देखील दिसेल.) ही माहिती आपल्याला डेटा रचनेत सराव देईल आणि मोठ्या डेटा स्त्रोतांमधील नैसर्गिक प्रयोगांबद्दल विचार करेल. हे भविष्यातील प्रकल्पांसाठी तुम्हाला संभाव्य मनोरंजक डेटा स्त्रोतांसह देखील कार्यरत करेल.

    1. Penney (2016) वाचा आणि त्याचा आकृती 2 ची प्रतिलिपी करा जे स्नोडेन साक्षात्कारानंतरच्या आणि नंतर "दहशतवाद" संबंधित पृष्ठांसाठी पृष्ठ दृश्ये दर्शविते. निष्कर्षांचा अर्थ लावा.
    2. पुढे, आकृती 4 ए ची प्रतिकृती तयार करा, जी डीएचएस सूची (परिशिष्टे टेबल 10 आणि तळटीप 13 9 पहा) मधील "DHS आणि इतर एजन्सीज" अंतर्गत वर्गीकृत केलेल्या कीवर्डचा वापर करून अभ्यास गट ("दहशतवाद" संबंधित लेखांशी) तुलना करते. निष्कर्षांचा अर्थ लावा.
    3. भाग मध्ये (ब) आपण एक तुरुपक गट सह अभ्यास गट तुलना. पेनी यांनी इतर दोन तुरुंगांची गटांशी तुलना केली: "इन्फ्रास्ट्रक्चर सुरक्षा" संबंधित लेख (परिशिष्ट 11 टेबल) आणि लोकप्रिय विकिपीडिया पृष्ठे (परिशिष्टिका टेबल 12). वैकल्पिक तुरुपक समूहासह आलिंगन करा आणि चाचणी (ब) मधील निष्कर्ष तुम्हासंबधी समूहाच्या निवडीच्या बाबतीत संवेदनशील आहेत किंवा नाही हे तपासा. कोणती निवड सर्वात अर्थपूर्ण आहे? का?
    4. पेनीने असे सांगितले की "दहशतवाद" संबंधित कीवर्ड विकिपीडियाच्या लेखांची निवड करण्यासाठी वापरले गेले कारण यूएस सरकारने ऑनलाइन पाळत ठेवणेच्या पद्धतींसाठी एक महत्वाचे समर्थन म्हणून दहशतवादाचा उल्लेख केला. या 48 "दहशतवाद" संबंधित कीवर्डचा एक चेक म्हणून, Penney (2016) यांनी एमटयूकेक वर एक सर्वेक्षण देखील केले ज्यामध्ये उत्तरदायी व्यक्तींनी सरकारी समस्या, गोपनीयता-संवेदनशील आणि अवधान (एपेंडिशन टेबल 7 आणि 8 ). एमटयूकेकवरील सर्वे्याचे नक्कल करा आणि आपल्या परिणामांची तुलना करा.
    5. भाग (डी) आणि आपल्या लेखाचा वाचन यावर आधारित, आपण पेनीच्या अभ्यास गटातील विषय कीवर्डच्या निवडीशी सहमत आहात? का किंवा का नाही? नसल्यास, त्याऐवजी आपण काय सुचवाल?
  8. [ सोपे ] Efrati (2016) गोपनीय माहितीच्या आधारावर, फेसबुकवरील "एकूण सामायिकरण" वर्षाला 5.5% कमी झाले होते आणि "मूळ प्रसारण सामायिकरण" वर्षाच्या 21% घटले होते. ही घट 30 वर्षांपेक्षा कमी वयाच्या फेसबुक वापरकर्त्यांसह तीव्र होती. अहवालात दोन घटकांची घट झाली आहे. एक म्हणजे "मित्र" लोकांकडे Facebook वर किती संख्येत वाढ आहे दुसरे म्हणजे काही शेअरिंग क्रियाकलाप मेसेजिंगमध्ये आणि चँपचाटसारख्या प्रतिस्पर्धी लोकांकडे हलविण्यात आले आहेत. या अहवालात फेसबुकने नवीन फीड अल्गोरिदम सुधारणेसह शेअरिंग वाढविण्याचा प्रयत्न केला आहे. यामध्ये मूळ पोस्ट्स अधिक महत्त्वाचे आहेत, तसेच "ऑन द डे" वैशिष्ट्यांसह मूळ पोस्टचे नियतकालिक स्मरणपत्रे देखील आहेत. संशोधनासाठी जर काही सापडले असतील तर संशोधकांना फेसबुकचा डाटा स्रोत म्हणून वापर करायचे आहे का?

  9. [ मध्यम ] समाजशास्त्री आणि इतिहासकार यांच्यात काय फरक आहे? गोल्डथोरपे (1991) नुसार, मुख्य फरक डेटा संकलनवर नियंत्रण आहे. इतिहासकारांना अवशेषांचा उपयोग करण्यास भाग पाडले जाते, तर समाजशास्त्रज्ञ विशिष्ट माहितीसाठी त्यांचे डेटा संग्रह तयार करू शकतात. Goldthorpe (1991) वाचा. सानुकूल आणि रेडीमेडच्या संकल्पनेशी संबंधित समाजशास्त्र आणि इतिहासात फरक कसा आहे?

  10. [ कठीण ] हे मागील क्विझटनवर बनते. Goldthorpe (1991) ने निकी हार्ट (1994) Goldthorpe (1991) यांच्यातील एक महत्त्वाचा प्रतिसाद काढला ज्याने गोल्डदर्रॉप्सच्या गरजेनुसार डेटा बनविण्याची आव्हान स्वीकारले. दर्जी-बनलेल्या डेटाची संभाव्य मर्यादा स्पष्ट करण्यासाठी, हर्टने 1 9 60 च्या दशकाच्या मध्यात गोल्डथोरपे आणि सहकार्यांनी आयोजित केलेल्या सामाजिक वर्ग आणि मतदानातील संबंध मोजण्यासाठी एक अफाट वर्क प्रोजेक्टचे वर्णन केले. आढळले डेटा वर डेटा डिझाइन केले कोण विद्वान एक अपेक्षा शकते म्हणून, संपन्न कर्मचारी प्रकल्प गोळा जीवन मानकीकरन वाढत्या युग मध्ये सामाजिक वर्ग भविष्यात बद्दल अलीकडेच प्रस्तावित सिद्धांत संबोधित करण्यासाठी तयार केलेल्या डेटा गोळा होते. पण, गोल्डथोरपे आणि सहकाऱ्यांनी स्त्रियांच्या मतदानाच्या वर्तनाबद्दल माहिती गोळा करण्यासाठी "विसरले". निकी हार्ट (1994) या संपूर्ण प्रसंगीचे सारांश असे:

    "... ही निष्कर्ष काढणे अवघड आहे की स्त्रियांना वगळण्यात आले कारण हे 'दर्जी केले' डेटासेट एक मार्मिक अनुभवाने मर्यादीत होते ज्यामध्ये स्त्री अनुभव वगळण्यात आला होता. वर्गाची जाणीव आणि क्रियाशीलतेचा एक सैद्धांतिक दृष्टिकोन पुरुष पुरातत्त्वाच्या आधारावर चालवला जातो ..., गोल्डथोरपे आणि त्यांच्या सहकाऱ्यांनी प्रायोगिक पुराव्याचा एक संच तयार केला ज्यायोगे त्यांना पुरेशा प्रमाणात वैध चाचणीची माहिती न देता त्यांच्या स्वतःच्या सैद्धांतिक गृहितकांना पोषण व पोषण मिळाले. "

    हार्ट पुढे म्हणाला:

    "समृद्ध कामगार प्रकल्पाचे प्रायोगिक निष्कर्ष मध्यावधी शतकांमधील समाजशास्त्रविषयक मूल्यांबद्दल आम्हाला अधिक सांगतात, त्यापेक्षा ते अधिकाधिक प्रक्रिया, राजकारण आणि भौतिक जीवनाच्या प्रक्रियांना सूचित करतात."

    आपण तयार केलेल्या डेटा कलेक्टरचे पूर्वाभिमुख बनवण्यासाठी इतर उदाहरणे कुठे तयार करता येतील? हे अल्गोरिदमिक विरोधाशी कसे तुलना करते? संशोधकांनी रीडिमेक्सचा वापर करावा आणि कस्टम मॅनेजचा उपयोग करावा लागल्यास त्याचा काय परिणाम होऊ शकतो?

  11. [ मध्यम ] या अध्यायात, संशोधकांद्वारे कंपन्या आणि सरकारद्वारे तयार करण्यात आलेल्या प्रशासकीय नोंदी असलेल्या संशोधकांकडून एकत्रित केलेला डेटा मी विपरित केला आहे. काही लोक या प्रशासकीय नोंदी "डेटा सापडतात" असे म्हणतात, जे ते "डिझाइन केलेले डेटा" शी तुलना करतात. हे खरे आहे की प्रशासकीय रेकॉर्ड संशोधकांद्वारे सापडतात परंतु ते देखील अत्यंत डिझाइन केलेले आहेत. उदाहरणार्थ, आधुनिक तंत्रज्ञान कंपन्या एकत्रित करणे आणि त्यांचा डेटा संकलित करणे खूप कठीण काम करतात. अशाप्रकारे, या प्रशासकीय नोंदी आपल्याला सापडल्या आणि डिझाइन केल्या आहेत, हे फक्त आपल्या दृष्टीकोनावर आधारित आहे (आकृती 2.12).

    आकृती 2.12: हे चित्र बदक आणि ससा दोन्ही आहे; आपण जे पाहता ते आपल्या दृष्टीकोनावर अवलंबून असते. मोठे डेटा स्रोत दोन्ही सापडले आणि डिझाइन केले आहेत; पुन्हा, आपण जे पाहता ते आपल्या दृष्टीकोनवर अवलंबून असते. उदाहरणार्थ, मोबाइल-फोन कंपनीद्वारे गोळा केलेल्या कॉल डेटा रेकॉर्डमध्ये संशोधकांच्या दृष्टिकोनातून डेटा आढळला जातो परंतु, या अचूक समान नोंदी फोन कंपनीच्या बिलिंग विभागामध्ये काम करणार्या व्यक्तीच्या दृष्टीकोनातून डेटा तयार करण्यात आली आहेत. स्त्रोत: पॉप्युलर सायन्स मंथली (18 99) / विकीमिडिया कॉमन्स.

    आकृती 2.12: हे चित्र बदक आणि ससा दोन्ही आहे; आपण जे पाहता ते आपल्या दृष्टीकोनावर अवलंबून असते. मोठे डेटा स्रोत दोन्ही सापडले आणि डिझाइन केले आहेत; पुन्हा, आपण जे पाहता ते आपल्या दृष्टीकोनवर अवलंबून असते. उदाहरणार्थ, मोबाइल-फोन कंपनीद्वारे गोळा केलेल्या कॉल डेटा रेकॉर्डमध्ये संशोधकांच्या दृष्टिकोनातून डेटा आढळला जातो परंतु, या अचूक समान नोंदी फोन कंपनीच्या बिलिंग विभागामध्ये काम करणार्या व्यक्तीच्या दृष्टीकोनातून डेटा तयार करण्यात आली आहेत. स्त्रोत: पॉप्युलर सायन्स मंथली (18 99) / विकीमिडिया कॉमन्स .

    डेटा स्त्रोताचे एक उदाहरण प्रदान करा जे शोधून काढलेले आणि संशोधन केलेले डेटा स्रोत वापरताना उपयुक्त आहे.

  12. [ सोपे ] एक विचारपूर्वक निबंधात, ख्रिश्चन सँडविग आणि एस्झटर हार्गाटाई (2015) डिजिटल सिस्टीम एक "इन्स्ट्रुमेंट" किंवा "ऑब्जेक्ट ऑब्जेक्ट" आहे की नाही यानुसार दोन व्यापक श्रेण्यांमध्ये डिजिटल संशोधन विभाजित केले आहे. इन्स्ट्रुमेंट- हे बोंग्स्सन आणि सहकर्मी (2011) द्वारे संशोधन केले जाते जे 2010 मध्ये हैतीमध्ये भूकंप झाल्यानंतर मायग्रेशनचा मागोवा घेण्यासाठी मोबाईल फोनचा डेटा वापरला गेला. दुसरे प्रकारचे उदाहरण- जिथे अभ्यास हा अभ्यासाचा उद्देश आहे-जेन्सेन (2007) भारतभर केळीच्या मोबाईल फोन्सचा परिचय कसा करावा याविषयी, भारताने माशासाठी बाजारपेठेचे कार्य कसे प्रभावित केले. मला हा फरक उपयुक्त वाटला कारण हे स्पष्ट करते की डिजिटल डेटा स्त्रोतांचा वापर करून अभ्यास वेगवेगळे लक्ष्य देऊ शकतात जरी ते समान प्रकारच्या स्त्रोत वापरत असले तरीही या फरकाने आणखी स्पष्ट करण्यासाठी, आपण पाहिलेल्या चार अभ्यासाचे वर्णन करा: दोन म्हणजे डिजिटल यंत्र एक साधन म्हणून वापर करतात आणि दोन म्हणजे डिजिटल प्रणालीचा अभ्यास अभ्यासाचा वापर करतात. आपण इच्छित असल्यास या प्रकरणाचे उदाहरण वापरू शकता