क्रियाएँ

कुंजी:

  • कठिनाई के डिग्री: आसान आसान , मध्यम मध्यम , कठिन कठिन , बहुत मुश्किल बहुत मुश्किल
  • गणित की आवश्यकता है ( गणित की आवश्यकता है )
  • आवश्यकता है कोडिंग ( कोडिंग )
  • डेटा संग्रहण ( डेटा संग्रहण )
  • मेरे पसंदीदा ( मेरे पसंदीदा )
  1. [ कठिन , गणित की आवश्यकता है ] अध्याय में, मैं पोस्ट स्तरीकरण के बारे में बहुत सकारात्मक था। हालांकि, यह हमेशा अनुमान की गुणवत्ता में सुधार नहीं करता है। जहां एक की स्थिति पोस्ट-स्तरीकरण कर सकते हैं अनुमान की गुणवत्ता में कमी कर सकते हैं का निर्माण। (एक संकेत के लिए, देखें Thomsen (1973) )।

  2. [ कठिन , डेटा संग्रहण , कोडिंग ] डिजाइन और बंदूक स्वामित्व के बारे में पूछने के लिए अमेज़न Mturk पर एक गैर-संभाव्यता सर्वेक्षण ( "तुम करो, या आपके घर में किसी को भी करता है खुद के लिए एक बंदूक, राइफल या पिस्तौल? यह है कि आप या आपके घर में किसी और को?") और बंदूक नियंत्रण के प्रति नजरिए ( "तुम्हें क्या लगता है बंदूकों के मालिक हैं, या बंदूक स्वामित्व को नियंत्रित करने के अमेरिकियों के अधिकार की रक्षा करने के लिए अधिक महत्वपूर्ण है?")।

    1. कब तक अपने सर्वेक्षण ले करता है? इसकी कीमत कितनी होती है? कैसे अपने नमूने की जनसांख्यिकी अमेरिका की आबादी की जनसांख्यिकी के लिए तुलना?
    2. अपने नमूने का उपयोग कर बंदूक स्वामित्व के कच्चे अनुमान क्या है?
    3. अपने नमूना के बाद स्तरीकरण या कुछ अन्य तकनीक का उपयोग कर के गैर प्रातिनिधिकता के लिए सही है। अब बंदूक स्वामित्व के अनुमान क्या है?
    4. कैसे अपने अनुमानों के प्यू रिसर्च सेंटर से नवीनतम अनुमान की तुलना? आप विसंगतियों को समझाने में क्या सोचते हैं, अगर कोई है?
    5. बंदूक नियंत्रण की ओर रुख करने के लिए व्यायाम 2-5 दोहराएँ। अपने निष्कर्षों को कैसे अलग है?
  3. [ बहुत मुश्किल , डेटा संग्रहण , कोडिंग ] गोयल और उनके सहयोगियों (2016) एक गैर संभावना के आधार पर 49 कई विकल्प व्यवहार अमेज़न Mturk पर प्यू रिसर्च सेंटर द्वारा सामान्य सामाजिक सर्वेक्षण (जीएसएस) और चयन सर्वेक्षणों से तैयार सवालों से मिलकर सर्वेक्षण दिलाई। वे तो मॉडल के आधार पर पद-स्तरीकरण (श्री पी) का उपयोग कर डेटा के गैर प्रातिनिधिकता के लिए समायोजित, और संभावना के आधार पर जीएसएस / बेंच सर्वेक्षण का उपयोग अनुमान के अनुसार उन लोगों के साथ समायोजित किया अनुमानों की तुलना करें। Mturk पर एक ही सर्वेक्षण किया और जीएसएस / बेंच का सबसे हाल के दौर से अनुमान के साथ अपने समायोजित अनुमानों की तुलना करके चित्रा 2A और चित्रा 2 बी दोहराने की कोशिश (49 सवालों की सूची के लिए परिशिष्ट टेबल ए 2 देखें)।

    1. तुलना करें और बेंच और जीएसएस से परिणाम के लिए अपने परिणाम इसके विपरीत।
    2. तुलना करें और में Mturk सर्वेक्षण से परिणाम के लिए अपने परिणामों विपरीत Goel, Obeng, and Rothschild (2016)
  4. [ मध्यम , डेटा संग्रहण , कोडिंग ] कई अध्ययनों से मोबाइल फोन गतिविधि डेटा की आत्म रिपोर्ट के उपायों का उपयोग करें। यह एक दिलचस्प सेटिंग जहां शोधकर्ताओं लॉग इन व्यवहार के साथ स्वयं रिपोर्ट व्यवहार की तुलना कर सकते है (देखें उदाहरण के लिए, Boase and Ling (2013) )। दो आम व्यवहार के बारे में बुला और texting रहे हैं, और दो आम समय फ्रेम में पूछने के लिए "पिछले सप्ताह में।" "कल" ​​और कर रहे हैं

    1. किसी भी डेटा है, जो आत्म रिपोर्ट के उपायों तुम्हें क्या लगता है और अधिक सटीक है इकट्ठा करने से पहले? क्यूं कर?
    2. रंगरूट अपने मित्रों के 5 अपने सर्वेक्षण में होना है। कृपया संक्षेप में संक्षेप में कैसे इन 5 दोस्त नमूना थे। इस नमूने प्रक्रिया अपने अनुमानों में विशिष्ट पूर्वाग्रहों पैदा हो सकता है?
    3. उन्हें निम्नलिखित सूक्ष्म सर्वेक्षण पूछना करें:
    • "कितनी बार आप दूसरों कल फोन करने के लिए मोबाइल फोन का इस्तेमाल किया था?"
    • "तुम कल पाठ कितने संदेश भेजा था?"
    • "कितनी बार आप पिछले सात दिनों में अन्य लोगों के फोन करने के लिए अपने मोबाइल फोन का उपयोग किया था?"
    • एक बार सर्वेक्षण पूरा हो गया है "कितनी बार आप अपने मोबाइल फोन का उपयोग कर भेज सकते हैं या पिछले सात दिनों में पाठ संदेश / एसएमएस प्राप्त? करने के लिए किया था", उनके उपयोग डेटा की जाँच करने के रूप में उनके फोन या सेवा प्रदाता द्वारा लॉग पूछना।
    1. कैसे आत्म रिपोर्ट उपयोग डेटा लॉग इन करने की तुलना करता है? जो सबसे सही सटीक जो कम से कम है?
    2. अब डेटा है कि आप अपनी कक्षा में अन्य लोगों से डेटा के साथ एकत्र किया है (यदि आप एक वर्ग के लिए इस गतिविधि कर रहे हैं) गठबंधन। यह बड़ा डाटासेट के साथ, भाग (घ) दोहराएँ।
  5. [ मध्यम , डेटा संग्रहण ] Schuman और कोल्हू (1996) का तर्क है कि सवाल के आदेश सवालों के बीच संबंधों के दो प्रकार के लिए बात करेंगे: भाग-भाग सवाल है, जहां दो सवाल विशिष्टता का एक ही स्तर पर कर रहे हैं (जैसे दो राष्ट्रपति पद के उम्मीदवारों की रेटिंग); और भाग-पूरे प्रश्नों जहां एक सामान्य सवाल एक अधिक विशिष्ट प्रश्न इस प्रकार है (जैसे पूछ "आप अपने काम से कितना संतुष्ट हैं?" के बाद "आप अपने जीवन से कितना संतुष्ट हैं?")।

    वे आगे के प्रश्न के क्रम में प्रभाव के दो प्रकार की विशेषताएँ: स्थिरता प्रभाव होते हैं जब एक बाद में सवाल करने के लिए प्रतिक्रियाओं करीब (तुलना में वे अन्यथा होगा) पहले के एक सवाल के दिए गए उन लोगों के लिए लाया जाता है; इसके विपरीत प्रभाव होते हैं जब वहाँ दो सवालों के जवाब के बीच अधिक से अधिक मतभेद हैं।

    1. भाग-भाग का सवाल आपको लगता है कि एक बड़ा सवाल आदेश प्रभाव, भाग-पूरे सवाल आपको लगता है कि एक बड़ा आदेश असर नहीं होगा की एक जोड़ी, और सवाल जिसका क्रम में आपको लगता है कोई फर्क नहीं होता की एक और जोड़ी होगा की एक जोड़ी बनाने के लिए। आपके सवालों का परीक्षण करने के लिए Mturk पर एक सर्वेक्षण प्रयोग चलाएँ।
    2. भाग-भाग का प्रभाव कैसे बड़े आप बनाने में सक्षम थे? यह एक निरंतरता या विपरीत प्रभाव था?
    3. अंशकालिक पूरे प्रभाव कैसे बड़े आप बनाने में सक्षम थे? यह एक निरंतरता या विपरीत प्रभाव था?
    4. वहाँ अपनी जोड़ी में एक प्रश्न के क्रम में प्रभाव जहां आपको नहीं लगता था क्रम में फर्क होता था?
  6. [ मध्यम , डेटा संग्रहण ] Schuman और कोल्हू, के काम पर बिल्डिंग Moore (2002) additive और subtractive सवाल आदेश प्रभाव का एक अलग आयाम का वर्णन है। इसके विपरीत है और स्थिरता प्रभाव एक दूसरे को, एडिटिव के संबंध में दो मदों के उत्तरदाताओं 'के मूल्यांकन का एक परिणाम के रूप में उत्पादित कर रहे हैं और subtractive प्रभाव का उत्पादन कर रहे हैं जब उत्तरदाताओं बड़ा रूपरेखा के भीतर जो सवाल रखे हैं करने के लिए और अधिक संवेदनशील बना रहे हैं। पढ़ें Moore (2002) , फिर डिजाइन और additive या subtractive प्रभाव को प्रदर्शित करने के Mturk पर एक सर्वेक्षण प्रयोग चलाते हैं।

  7. [ कठिन , डेटा संग्रहण ] क्रिस्टोफर Antoun और उनके सहयोगियों (2015) Mturk, Craigslist, गूगल ऐडवर्ड्स और फेसबुक: चार अलग अलग ऑनलाइन भर्ती स्रोतों से प्राप्त सुविधा नमूनों की तुलना में एक अध्ययन किया। एक साधारण सर्वेक्षण डिजाइन और कम से कम दो अलग अलग ऑनलाइन भर्ती स्रोतों के माध्यम से प्रतिभागियों की भर्ती (वे में इस्तेमाल किया चार स्रोतों से विभिन्न स्रोतों हो सकता है Antoun et al. (2015) )।

    1. भर्ती प्रति लागत, पैसे और समय के संदर्भ में तुलना करें, विभिन्न स्रोतों के बीच।
    2. विभिन्न स्रोतों से प्राप्त नमूनों की संरचना की तुलना करें।
    3. नमूने के बीच डेटा की गुणवत्ता की तुलना करें। कैसे उत्तरदाताओं से डेटा की गुणवत्ता मापने के बारे में विचारों के लिए, देखें Schober et al. (2015)
    4. अपने पसंदीदा स्रोत क्या है? क्यूं कर?
  8. [ मध्यम ] YouGov, एक इंटरनेट आधारित बाजार अनुसंधान फर्म, ब्रिटेन में 800,000 के बारे में उत्तरदाताओं का एक पैनल के ऑनलाइन पोल का आयोजन किया और श्री पी इस्तेमाल किया यूरोपीय संघ के जनमत संग्रह (यानी, Brexit) का परिणाम जहां ब्रिटेन मतदाताओं को वोट या तो रहने के लिए भविष्यवाणी करने के लिए में या यूरोपीय संघ छोड़ दें।

    YouGov के सांख्यिकीय मॉडल का एक विस्तृत विवरण यहाँ है (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/)। मोटे तौर पर बोल, YouGov पर 2015 के आम चुनाव के मतदान के चुनाव, उम्र, योग्यता, लिंग, साक्षात्कार की तारीख, साथ ही निर्वाचन क्षेत्र में वे। पहला, वे YouGov पैनल से एकत्र आंकड़ों का इस्तेमाल किया रहते अनुमान लगाने के लिए उन लोगों के बीच, आधारित प्रकार में मतदाताओं विभाजन जो वोट, प्रत्येक मतदाता प्रकार के लोगों को छोड़ मतदान करने का इरादा का अनुपात। वे 2015 में ब्रिटिश चुनाव अध्ययन (BES) चुनाव के बाद का सामना करने वाली चेहरे सर्वेक्षण है, जो मतदाता सूची से मतदान मान्य का उपयोग करके प्रत्येक मतदाता प्रकार के मतदान का अनुमान है। अंत में, वे अनुमान है कि कितने लोगों को, आम चुनाव, और जानकारी के चारों ओर से YouGov सर्वेक्षण के आंकड़ों पर कई लोगों के लिए मतदान कैसे नवीनतम जनगणना और वार्षिक जनसंख्या सर्वेक्षण (BES से कुछ अतिरिक्त जानकारी के आधार पर मतदाताओं में प्रत्येक मतदाता प्रकार के देखते हैं प्रत्येक निर्वाचन क्षेत्र में हर पार्टी)।

    तीन दिन मतदान से पहले, YouGov लीव के लिए एक दो अंक की बढ़त देखी गई। मतदान की पूर्व संध्या पर, चुनाव भी (49-51 रहना) फोन करने के लिए करीब से पता चला है। अंतिम ऑन-दिवसीय अध्ययन रहने का (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/) पक्ष में 48/52 की भविष्यवाणी की। वास्तव में, यह अनुमान चार प्रतिशत अंक की अंतिम परिणाम (52-48 छुट्टी) को याद किया।

    1. आकलन करने के लिए क्या गलत हो गया हो सकता है कुल सर्वेक्षण त्रुटि का ढांचा इस अध्याय में चर्चा का प्रयोग करें।
    2. चुनाव (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) के बाद YouGov की प्रतिक्रिया के बारे में बताया: "यह मतदान के कारण एक बड़े हिस्से में लगता है - कुछ है कि हम सभी के साथ कहा है कि इस तरह के एक पतले संतुलित दौड़ के परिणाम के लिए महत्वपूर्ण होगा। हमारा मतदान मॉडल भाग में स्थित था, पर उत्तरदाताओं कि क्या पिछले आम चुनाव में वोट दिया था और लोकसभा चुनाव के ऊपर है कि एक मतदान स्तर के मॉडल, विशेष रूप से उत्तर में परेशान। "इस भाग (क) से आपका जवाब परिवर्तन करता है?
  9. [ मध्यम , कोडिंग ] चित्रा 3.1 में प्रतिनिधित्व त्रुटियों के प्रत्येक वर्णन करने के लिए एक सिमुलेशन लिखें।

    1. एक ऐसी स्थिति है जहां इन त्रुटियों को वास्तव में बाहर रद्द बनाएँ।
    2. जहां एक की स्थिति त्रुटियों प्रत्येक अन्य यौगिक बनाएँ।
  10. [ बहुत मुश्किल , कोडिंग ] Blumenstock और उनके सहयोगियों के अनुसंधान (2015) एक मशीन सीखने के मॉडल है कि डिजिटल ट्रेस डेटा का उपयोग कर सकता सर्वेक्षण प्रतिक्रियाओं की भविष्यवाणी करने के लिए निर्माण शामिल किया गया। अब, आप एक अलग डाटासेट के साथ एक ही बात करने की कोशिश करने के लिए जा रहे हैं। Kosinski, Stillwell, and Graepel (2013) में पाया गया कि फेसबुक पसंद करती व्यक्ति लक्षण और गुण भविष्यवाणी कर सकते हैं। हैरानी की बात है, इन भविष्यवाणियों भी मित्रों और सहकर्मियों के उन लोगों की तुलना में ज्यादा सटीक हो सकता है (Youyou, Kosinski, and Stillwell 2015)

    1. पढ़ें Kosinski, Stillwell, and Graepel (2013) , और चित्रा 2. दोहराने उनका डेटा यहां उपलब्ध हैं: http://mypersonality.org/
    2. अब, चित्रा 3 को दोहराने।
    3. http://applymagicsauce.com/: अंत में, अपने खुद के फेसबुक डेटा पर अपने मॉडल की कोशिश करो। कितनी अच्छी तरह से यह आप के लिए काम करता है?
  11. [ मध्यम ] Toole et al. (2015) उपयोग कॉल विवरण रिकॉर्ड (सीडीआर) मोबाइल फोन से कुल बेरोजगारी रुझान की भविष्यवाणी करने के लिए।

    1. तुलना करें और के डिजाइन विपरीत Toole et al. (2015) के साथ Blumenstock, Cadamuro, and On (2015)
    2. क्या आपको लगता है सीडीआर, पारंपरिक सर्वे की जगह चाहिए उन्हें पूरक या बेरोजगारी ट्रैक करने के लिए सरकार ने नीति निर्माताओं के लिए सब पर इस्तेमाल नहीं किया जा सकता है? क्यूं कर?
    3. क्या सबूत है कि आप मना होता है कि सीडीआर पूरी तरह से बेरोजगारी की दर के पारंपरिक उपायों जगह ले सकता है?