क्रियाएँ

  • कठिनाई की डिग्री: आसान आसान मध्यम मध्यम , कठिन कठिन , बहुत मुश्किल बहुत मुश्किल
  • गणित की आवश्यकता है गणित की आवश्यकता है )
  • कोडिंग की आवश्यकता है कोडिंग की आवश्यकता है )
  • डेटा संग्रहण ( डेटा संग्रहण )
  • मेरे पसंदीदा ( मेरा मनपसंद )
  1. [ कठिन , गणित की आवश्यकता है ] अध्याय में, मैं पोस्ट-स्तरीकरण के बारे में बहुत सकारात्मक था। हालांकि, यह हमेशा अनुमानों की गुणवत्ता में सुधार नहीं करता है। ऐसी स्थिति का निर्माण करें जहां पोस्ट-स्तरीकरण अनुमानों की गुणवत्ता को कम कर सके। (एक संकेत के लिए, Thomsen (1973) देखें Thomsen (1973) ।)

  2. [ कठिन , डेटा संग्रहण , कोडिंग की आवश्यकता है ] बंदूक नियंत्रण के लिए बंदूक स्वामित्व और दृष्टिकोण के बारे में पूछने के लिए अमेज़ॅन मैकेनिकल तुर्क पर एक गैर-संभावना सर्वेक्षण का डिजाइन और संचालन करें। ताकि आप संभावित अनुमानों से प्राप्त अनुमानों के मुकाबले अपने अनुमानों की तुलना कर सकें, कृपया प्यू रिसर्च सेंटर द्वारा संचालित उच्च गुणवत्ता वाले सर्वेक्षण से सीधे प्रश्न टेक्स्ट और प्रतिक्रिया विकल्प कॉपी करें।

    1. आपका सर्वेक्षण कब तक चलता है? इसकी कीमत कितनी होती है? आपके नमूने की जनसांख्यिकीय जनसंख्या के जनसांख्यिकी के साथ तुलना कैसे करते हैं?
    2. अपने नमूने का उपयोग कर बंदूक स्वामित्व का कच्चा अनुमान क्या है?
    3. पोस्ट-स्तरीकरण या किसी अन्य तकनीक का उपयोग करके अपने नमूने की गैर-प्रस्तुतिकरण के लिए सही। अब बंदूक स्वामित्व का अनुमान क्या है?
    4. संभावित अनुमान-आधारित नमूने से आपके अनुमानों का नवीनतम अनुमान के साथ तुलना कैसे करें? यदि कोई है तो विसंगतियों को बताता है कि आप क्या सोचते हैं?
    5. प्रश्न दोहराएं (बी) - (डी) बंदूक नियंत्रण की ओर रुख के लिए। आपके निष्कर्ष अलग कैसे हैं?
  3. [ बहुत मुश्किल , डेटा संग्रहण , कोडिंग की आवश्यकता है ] गोयल और सहयोगियों (2016) ने जनरल सोशल सर्वे (जीएसएस) से तैयार 49 बहु-विकल्प अनुवांशिक प्रश्नों का प्रबंधन किया और प्यू रिसर्च सेंटर द्वारा अमेज़ॅन मैकेनिकल तुर्क से निकाले गए उत्तरदाताओं के गैर-संभाव्यता नमूने के लिए सर्वेक्षण का चयन किया। फिर मॉडल-आधारित पोस्ट-स्तरीकरण का उपयोग करके डेटा की गैर-प्रतिनिधित्वशीलता के लिए समायोजित किया गया और संभाव्यता-आधारित जीएसएस और प्यू सर्वेक्षणों के साथ उनके समायोजित अनुमानों की तुलना की गई। अमेज़ॅन मैकेनिकल तुर्क पर एक ही सर्वेक्षण का संचालन करें और जीएसएसएस और प्यू सर्वेक्षण के सबसे हाल के दौर से अनुमानों के साथ अपने समायोजित अनुमानों की तुलना करके आकृति 2 ए और आकृति 2 बी को दोहराने का प्रयास करें। (49 प्रश्नों की सूची के लिए परिशिष्ट तालिका ए 2 देखें।)

    1. प्यू और जीएसएस के साथ अपने परिणामों की तुलना करें और तुलना करें।
    2. Goel, Obeng, and Rothschild (2016) में मैकेनिकल तुर्क सर्वेक्षण से अपने परिणामों की तुलना करें और तुलना करें।
  4. [ मध्यम , डेटा संग्रहण , कोडिंग की आवश्यकता है ] कई अध्ययन मोबाइल फोन के उपयोग के आत्म-रिपोर्ट उपायों का उपयोग करते हैं। यह एक दिलचस्प सेटिंग है जिसमें शोधकर्ता लॉग-इन व्यवहार के साथ आत्म-रिपोर्ट किए गए व्यवहार की तुलना कर सकते हैं (उदाहरण के लिए, Boase and Ling (2013) )। कॉल करने और टेक्स्टिंग के बारे में पूछने के दो सामान्य व्यवहार हैं, और दो आम समय फ्रेम "कल" ​​और "पिछले सप्ताह में" हैं।

    1. किसी भी डेटा को इकट्ठा करने से पहले, आत्म-रिपोर्ट उपायों में से कौन सा आपको लगता है कि अधिक सटीक है? क्यूं कर?
    2. अपने सर्वेक्षण में रहने के लिए अपने पांच दोस्तों को भर्ती करें। संक्षेप में सारांशित करें कि इन पांच मित्रों को कैसे नमूना बनाया गया था। क्या यह नमूना प्रक्रिया आपके अनुमानों में विशिष्ट पूर्वाग्रहों को प्रेरित कर सकती है?
    3. उन्हें निम्नलिखित माइक्रोस्कोवे प्रश्न पूछें:
    • "कल आप दूसरों को फोन करने के लिए आपने अपने मोबाइल फोन का कितनी बार उपयोग किया?"
    • "कल आपने कितने पाठ संदेश भेजे थे?"
    • "पिछले सात दिनों में दूसरों को कॉल करने के लिए आपने अपने मोबाइल फोन का कितनी बार उपयोग किया?"
    • "पिछले सात दिनों में टेक्स्ट संदेश / एसएमएस भेजने या प्राप्त करने के लिए आपने अपने मोबाइल फोन का कितनी बार उपयोग किया?"
    1. एक बार यह माइक्रोस्कोर्वे पूरा हो जाने के बाद, अपने उपयोग डेटा को उनके फोन या सेवा प्रदाता द्वारा लॉग इन करने के लिए कहें। आत्म-रिपोर्ट उपयोग लॉग डेटा से तुलना कैसे करता है? कौन सा सटीक है, जो कम से कम सटीक है?
    2. अब अपने वर्ग में अन्य लोगों के डेटा के साथ एकत्र किए गए डेटा को गठबंधन करें (यदि आप कक्षा के लिए यह गतिविधि कर रहे हैं)। इस बड़े डेटासेट के साथ, भाग दोहराएं (डी)।
  5. [ मध्यम , डेटा संग्रहण ] श्यूमन और प्रेसर (1996) तर्क है कि प्रश्न आदेश दो प्रकार के प्रश्नों के लिए मायने रखेंगे: भाग-भाग प्रश्न जहां दो प्रश्न विशिष्टता के समान स्तर पर हैं (उदाहरण के लिए, दो राष्ट्रपति पद के उम्मीदवारों की रेटिंग); और भाग-पूरे प्रश्न जहां एक सामान्य प्रश्न एक और विशिष्ट प्रश्न का पालन करता है (उदाहरण के लिए, "आप अपने काम से कितने संतुष्ट हैं?" के बाद "आप अपने जीवन से कितने संतुष्ट हैं?")।

    वे आगे दो प्रकार के प्रश्न आदेश प्रभाव की विशेषता रखते हैं: स्थिरता प्रभाव तब होते हैं जब बाद के प्रश्नों के जवाब किसी दूसरे प्रश्न के मुताबिक करीब आते हैं (वे अन्यथा होते हैं); विपरीत प्रभाव तब होते हैं जब दो प्रश्नों के जवाबों के बीच अधिक अंतर होते हैं।

    1. भाग-भाग प्रश्नों की एक जोड़ी बनाएं जो आपको लगता है कि एक बड़ा प्रश्न आदेश प्रभाव होगा; पार्ट-पूरे प्रश्नों की एक जोड़ी जो आपको लगता है कि इसका एक बड़ा ऑर्डर प्रभाव होगा; और प्रश्नों की एक जोड़ी जिसका आदेश आपको लगता है इससे कोई फर्क नहीं पड़ता। अपने प्रश्नों का परीक्षण करने के लिए अमेज़ॅन मैकेनिकल तुर्क पर एक सर्वेक्षण प्रयोग चलाएं।
    2. आप कितने भाग-भाग प्रभाव बनाने में सक्षम थे? क्या यह एक स्थिरता या विपरीत प्रभाव था?
    3. आप कितने बड़े हिस्से को बनाने में सक्षम थे? क्या यह एक स्थिरता या विपरीत प्रभाव था?
    4. क्या आपकी जोड़ी में एक प्रश्न आदेश प्रभाव था जहां आपने नहीं सोचा था कि आदेश मायने रखता है?
  6. [ मध्यम , डेटा संग्रहण ] श्यूमन और प्रेसर के काम पर निर्माण, Moore (2002) प्रश्न आदेश प्रभाव के एक अलग आयाम का वर्णन करता है: योजक और घटिया प्रभाव। जबकि विपरीत और स्थिरता प्रभाव एक-दूसरे के संबंध में दो वस्तुओं के उत्तरदाताओं के मूल्यांकन के परिणामस्वरूप उत्पादित होते हैं, जब additive को बड़े ढांचे के प्रति अधिक संवेदनशील बना दिया जाता है, जिसमें प्रश्न उत्पन्न होते हैं, तो additive और घटिया प्रभाव उत्पन्न होते हैं। Moore (2002) पढ़ें, फिर एमटीर्क पर एक सर्वेक्षण प्रयोग को डिजाइन और चलाने के लिए additive या subtractive प्रभाव प्रदर्शित करने के लिए।

  7. [ कठिन , डेटा संग्रहण ] क्रिस्टोफर एंटौन और सहयोगियों (2015) ने चार अलग-अलग ऑनलाइन भर्ती स्रोतों से प्राप्त सुविधा नमूने की तुलना में एक अध्ययन आयोजित किया: एमटीर्क, क्रेगलिस्ट, Google AdWords और फेसबुक। कम से कम दो अलग-अलग ऑनलाइन भर्ती स्रोतों के माध्यम से एक साधारण सर्वेक्षण और भर्ती प्रतिभागियों को डिजाइन करें (ये स्रोत Antoun et al. (2015) में उपयोग किए गए चार स्रोतों से अलग हो सकते हैं)।

    1. विभिन्न स्रोतों के बीच धन और समय के मामले में प्रति भर्ती लागत की तुलना करें।
    2. विभिन्न स्रोतों से प्राप्त नमूनों की संरचना की तुलना करें।
    3. नमूने के बीच डेटा की गुणवत्ता की तुलना करें। उत्तरदाताओं से डेटा गुणवत्ता को मापने के तरीके के बारे में विचारों के लिए, Schober et al. (2015)
    4. आपका पसंदीदा स्रोत क्या है? क्यूं कर?
  8. [ मध्यम ] 2016 ईयू जनमत संग्रह (यानी, ब्रेक्सिट) के परिणामों की भविष्यवाणी करने के प्रयास में, यूगोव - इंटरनेट आधारित बाजार अनुसंधान फर्म ने यूनाइटेड किंगडम में लगभग 800,000 उत्तरदाताओं के पैनल के ऑनलाइन चुनाव आयोजित किए।

    YouGov के सांख्यिकीय मॉडल का एक विस्तृत विवरण https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ पर पाया जा सकता है। असल में बोलते हुए, यूगोव ने 2015 के आम चुनाव वोट विकल्प, आयु, योग्यता, लिंग, और साक्षात्कार की तारीख के साथ-साथ जिस क्षेत्र में रहते थे, के आधार पर मतदाताओं को विभाजित किया। सबसे पहले, उन्होंने यूगोव पैनलिस्टों से एकत्रित आंकड़ों का अनुमान लगाने के लिए उपयोग किया, मतदान करने वालों के बीच, वोट देने का इरादा रखने वाले प्रत्येक मतदाता प्रकार के लोगों का अनुपात। उन्होंने 2015 के ब्रिटिश चुनाव अध्ययन (बीईएस) का उपयोग करके प्रत्येक मतदाता प्रकार के मतदान का अनुमान लगाया, जो चुनाव के बाद आमने-सामने सर्वेक्षण था, जो चुनावी रोल से मतदान को मान्य करता था। आखिरकार, उन्होंने अनुमान लगाया कि नवीनतम जनगणना और वार्षिक जनसंख्या सर्वेक्षण (अन्य डेटा स्रोतों से कुछ अतिरिक्त जानकारी के आधार पर) मतदाताओं में प्रत्येक मतदाता प्रकार के कितने लोग थे।

    वोट से तीन दिन पहले, यूगोव ने छुट्टी के लिए दो-बिंदु का नेतृत्व दिखाया। मतदान की पूर्व संध्या पर, सर्वेक्षण से संकेत मिलता है कि परिणाम कॉल के करीब था (49/51 शेष)। अंतिम दिन के अध्ययन में शेष के पक्ष में 48/52 की भविष्यवाणी की गई (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)। वास्तव में, इस अनुमान ने अंतिम परिणाम (52/48 छोड़ें) को चार प्रतिशत अंक से चूक दिया।

    1. क्या गलत हो सकता है यह आकलन करने के लिए इस अध्याय में चर्चा की गई कुल सर्वेक्षण त्रुटि ढांचे का उपयोग करें।
    2. चुनाव के बाद यूगोव की प्रतिक्रिया (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) ने समझाया: "यह मतदान के कारण एक बड़े हिस्से में लगता है-कुछ हमने कहा है कि साथ ही इस तरह की एक संतुलित संतुलित दौड़ के परिणाम के लिए महत्वपूर्ण होगा। हमारा टर्नआउट मॉडल कुछ हद तक आधारित था कि क्या उत्तरदाताओं ने पिछले आम चुनाव में मतदान किया था और सामान्य चुनावों के ऊपर एक मतदान स्तर मॉडल, विशेष रूप से उत्तर में परेशान था। "क्या यह आपके उत्तर को (ए) में बदल देता है?
  9. [ मध्यम , कोडिंग की आवश्यकता है ] आंकड़ा 3.2 में प्रत्येक प्रतिनिधित्व त्रुटियों को चित्रित करने के लिए एक सिमुलेशन लिखें।

    1. ऐसी स्थिति बनाएं जहां इन त्रुटियों को वास्तव में रद्द कर दिया जाए।
    2. एक ऐसी स्थिति बनाएं जहां त्रुटियां एक-दूसरे को मिलती हैं।
  10. [ बहुत मुश्किल , कोडिंग की आवश्यकता है ] ब्लूमेंस्टॉक और सहयोगियों (2015) शोध में एक मशीन लर्निंग मॉडल का निर्माण शामिल था जो सर्वेक्षण प्रतिक्रियाओं की भविष्यवाणी करने के लिए डिजिटल ट्रेस डेटा का उपयोग कर सकता था। अब, आप एक ही डेटा को एक अलग डेटासेट के साथ करने जा रहे हैं। Kosinski, Stillwell, and Graepel (2013) ने पाया कि फेसबुक पसंद व्यक्तिगत लक्षणों और विशेषताओं की भविष्यवाणी कर सकते हैं। हैरानी की बात है कि ये भविष्यवाणियां मित्रों और सहयोगियों (Youyou, Kosinski, and Stillwell 2015) तुलना में और भी सटीक हो सकती हैं।

    1. Kosinski, Stillwell, and Graepel (2013) पढ़ें, और आकृति 2 Kosinski, Stillwell, and Graepel (2013) । उनका डेटा http://mypersonality.org/ पर उपलब्ध है
    2. अब, आकृति 3 दोहराना।
    3. अंत में, अपने मॉडल को अपने फेसबुक डेटा पर आज़माएं: http://applymagicsauce.com/। यह आपके लिए कितना अच्छा काम करता है?
  11. [ मध्यम ] Toole et al. (2015) कुल बेरोजगारी प्रवृत्तियों की भविष्यवाणी करने के लिए मोबाइल फोन से कॉल विवरण रिकॉर्ड (सीडीआर Toole et al. (2015) इस्तेमाल किया।

    1. Toole et al. (2015) के अध्ययन डिजाइन की तुलना करें और इसके विपरीत करें Toole et al. (2015) Blumenstock, Cadamuro, and On (2015)
    2. क्या आपको लगता है कि सीडीआर को पारंपरिक सर्वेक्षणों को प्रतिस्थापित करना चाहिए, उन्हें पूरक बनाना चाहिए या बेरोजगारी को ट्रैक करने के लिए सरकारी नीति निर्माताओं के लिए बिल्कुल इस्तेमाल नहीं किया जाना चाहिए? क्यूं कर?
    3. क्या सबूत आपको विश्वास दिलाएंगे कि सीडीआर बेरोजगारी दर के पारंपरिक उपायों को पूरी तरह से बदल सकता है?