กิจกรรม

  • ระดับความยากง่าย ง่าย ปานกลาง กลาง หนัก ยาก , ยากมาก ยากมาก
  • ต้องใช้คณิตศาสตร์ ( ต้องใช้คณิตศาสตร์ )
  • ต้องใช้รหัส ( ต้องเข้ารหัส )
  • การเก็บรวบรวมข้อมูล ( การเก็บรวบรวมข้อมูล )
  • สิ่งที่ฉันชอบ ( ของโปรด )
  1. [ ยาก , ต้องใช้คณิตศาสตร์ ] ในบทฉันเป็นคนดีมากเกี่ยวกับการแบ่งชั้นหลัง อย่างไรก็ตามวิธีนี้ไม่ได้ปรับปรุงคุณภาพของการประมาณการเสมอไป สร้างสถานการณ์ที่หลังการแบ่งชั้นสามารถลดคุณภาพของการประมาณได้ (สำหรับคำแนะนำให้ดูที่ Thomsen (1973) )

  2. [ ยาก , การเก็บรวบรวมข้อมูล , ต้องเข้ารหัส ] ออกแบบและดำเนินการสำรวจความเป็นไปได้ที่ Amazon Mechanical Turk เพื่อสอบถามเกี่ยวกับความเป็นเจ้าของปืนและทัศนคติต่อการควบคุมอาวุธปืน เพื่อให้คุณสามารถเปรียบเทียบค่าประมาณของคุณกับค่าที่ได้จากตัวอย่างความน่าจะเป็นโปรดคัดลอกข้อความคำถามและตัวเลือกการตอบกลับโดยตรงจากการสำรวจที่มีคุณภาพสูงเช่น Pew Research Center

    1. แบบสำรวจของคุณใช้เวลานานแค่ไหน? ค่าใช้จ่ายเท่าไร? ประชากรของกลุ่มตัวอย่างของคุณเปรียบเทียบกับข้อมูลประชากรของประชากรสหรัฐอย่างไร?
    2. ค่าประมาณของการเป็นเจ้าของปืนโดยใช้ตัวอย่างของคุณคืออะไร?
    3. ถูกต้องสำหรับ nonrepresentativeness ของตัวอย่างของคุณโดยใช้โพสต์การแบ่งชั้นหรือเทคนิคอื่น ๆ บางอย่าง ตอนนี้การประเมินความเป็นเจ้าของปืนคืออะไร?
    4. ค่าประมาณของคุณเปรียบเทียบกับค่าประมาณล่าสุดจากตัวอย่างความน่าจะเป็นได้อย่างไร? คุณคิดว่าอะไรที่อธิบายความแตกต่างถ้ามี?
    5. คำถามซ้ำ (b) - (d) สำหรับทัศนคติต่อการควบคุมอาวุธปืน ผลการวิจัยของคุณแตกต่างกันอย่างไร?
  3. [ ยากมาก , การเก็บรวบรวมข้อมูล , ต้องเข้ารหัส ] Goel และเพื่อนร่วมงาน (2016) คำถามเชิงทัศนคติแบบเลือกตอบ 49 ตัวเลือกจากการสำรวจทางสังคมโดยทั่วไป (GSS) และเลือกแบบสำรวจโดยศูนย์วิจัย Pew ไปยังกลุ่มตัวอย่างที่ไม่น่าจะเป็นของผู้ตอบแบบสอบถามที่มาจาก Amazon Mechanical เติร์ก จากนั้นจึงปรับค่าข้อมูลที่ไม่เป็นตัวแทนของข้อมูลโดยใช้โครงสร้างหลังชนชั้นตามรูปแบบและเปรียบเทียบการประเมินที่ปรับปรุงแล้วกับข้อมูลจากการสำรวจ GSS และ Pew ตามความน่าจะเป็น ดำเนินการสำรวจแบบเดียวกันกับ Amazon Mechanical Turk และลองทำซ้ำรูปที่ 2a และรูปที่ 2b โดยการเปรียบเทียบค่าประมาณที่ปรับปรุงแล้วของคุณกับประมาณการจากรอบล่าสุดของการสำรวจ GSS และ Pew (ดูตารางภาคผนวก A2 สำหรับรายชื่อ 49 ข้อ)

    1. เปรียบเทียบและเปรียบเทียบผลลัพธ์ของคุณกับผลลัพธ์จาก Pew และ GSS
    2. เปรียบเทียบและเปรียบเทียบผลการค้นหากับผลการสำรวจจาก Mechanical Turk ใน Goel, Obeng, and Rothschild (2016)
  4. [ กลาง , การเก็บรวบรวมข้อมูล , ต้องเข้ารหัส ] การศึกษาจำนวนมากใช้มาตรการรายงานด้วยตนเองในการใช้โทรศัพท์มือถือ นี่เป็นการตั้งค่าที่น่าสนใจซึ่งนักวิจัยสามารถเปรียบเทียบพฤติกรรมที่รายงานด้วยตนเองกับพฤติกรรมที่บันทึกไว้ (ดูตัวอย่าง Boase and Ling (2013) ) สองพฤติกรรมทั่วไปที่ถามเกี่ยวกับการโทรและส่งข้อความและสองกรอบเวลาทั่วไปคือ "เมื่อวาน" และ "ในสัปดาห์ที่ผ่านมา"

    1. ก่อนที่คุณจะเก็บรวบรวมข้อมูลใด ๆ คุณคิดว่ามาตรการการรายงานด้วยตัวเองมีความถูกต้องมากขึ้นหรือไม่? ทำไม?
    2. รับสมัครเพื่อนห้าคนเพื่ออยู่ในแบบสำรวจของคุณ โปรดสรุปสั้น ๆ ว่าเพื่อนทั้งห้าคนนี้ถูกสุ่มตัวอย่างอย่างไร ขั้นตอนการสุ่มตัวอย่างนี้อาจก่อให้เกิดความลำเอียงที่เฉพาะเจาะจงในการประมาณการของคุณหรือไม่?
    3. ถามคำถามเกี่ยวกับ microsurvey ต่อไปนี้:
    • "คุณใช้โทรศัพท์มือถือของคุณกี่ครั้งเพื่อเรียกคนอื่นเมื่อวานนี้?"
    • "คุณส่งข้อความมากี่วันแล้ว?"
    • "คุณใช้โทรศัพท์มือถือของคุณกี่ครั้งเพื่อเรียกคนอื่นในช่วงเจ็ดวันที่ผ่านมา?"
    • "คุณใช้โทรศัพท์มือถือของคุณกี่ครั้งเพื่อส่งหรือรับข้อความ / SMS ในช่วงเจ็ดวันที่ผ่านมา?"
    1. เมื่อการตรวจสอบครั้งนี้เสร็จสิ้นแล้วให้ขอให้ตรวจสอบข้อมูลการใช้งานของตนตามที่ทางโทรศัพท์หรือผู้ให้บริการของพวกเขาบันทึกไว้ การใช้รายงานด้วยตนเองเปรียบเทียบกับข้อมูลบันทึกอย่างไร? ซึ่งมีความถูกต้องที่สุดซึ่งมีความแม่นยำน้อยที่สุด?
    2. ตอนนี้รวมข้อมูลที่คุณเก็บรวบรวมไว้กับข้อมูลจากคนอื่น ๆ ในชั้นเรียนของคุณ (ถ้าคุณกำลังทำกิจกรรมนี้สำหรับชั้นเรียน) ด้วยชุดข้อมูลขนาดใหญ่นี้ให้ทำซ้ำส่วน (d)
  5. [ กลาง , การเก็บรวบรวมข้อมูล ] Schuman และ Presser (1996) ยืนยันว่าคำสั่งคำถามจะเป็นเรื่องสำคัญสำหรับคำถามสองประเภท: คำถามส่วนหนึ่งส่วนที่สองคำถามอยู่ในระดับเดียวกับความเฉพาะเจาะจง (เช่นการจัดอันดับของผู้สมัครประธานาธิบดีสองคน); และคำถามทั้งส่วนซึ่งเป็นคำถามทั่วไปตามคำถามเฉพาะเจาะจงมากขึ้น (เช่นถามว่า "คุณพอใจกับผลงานของคุณมากน้อยแค่ไหน" ตามด้วย "คุณพอใจกับชีวิตคุณมากแค่ไหน?")

    พวกเขายังระบุลักษณะของคำสั่งคำถามสองแบบ: ความสอดคล้องกันเกิดขึ้นเมื่อการตอบคำถามต่อมาถูกนำมาใกล้ (มากกว่าที่จะเป็นอย่างอื่น) กับคำถามก่อนหน้านี้ ความคมชัดเกิดขึ้นเมื่อมีความแตกต่างระหว่างคำตอบกับคำถามสองข้อ

    1. สร้างคู่คำถามส่วนหนึ่งที่คุณคิดว่าจะมีผลสั่งซื้อคำถามที่มีขนาดใหญ่ คำถามทั้งส่วนที่คุณคิดว่าจะมีผลต่อคำสั่งซื้อจำนวนมาก และคู่คำถามที่คุณคิดว่าจะไม่สำคัญ ดำเนินการทดลองสำรวจเกี่ยวกับ Amazon Mechanical Turk เพื่อทดสอบคำถามของคุณ
    2. คุณมีส่วนสร้างผลงานชิ้นส่วนขนาดใหญ่เท่าไร? มันเป็นความสอดคล้องหรือความคมชัดผล?
    3. คุณมีส่วนทำให้เกิดผลกระทบทั้งองค์รวมได้มากน้อยแค่ไหน? มันเป็นความสอดคล้องหรือความคมชัดผล?
    4. มีคำถามลำดับคำสั่งในคู่ของคุณที่คุณไม่คิดว่าการสั่งซื้อจะสำคัญหรือไม่?
  6. [ กลาง , การเก็บรวบรวมข้อมูล ] จากการทำงานของ Schuman และ Presser Moore (2002) อธิบายถึงมิติที่แตกต่างกันของผลสั่งซื้อคำถาม: ผลบวกและลบ ในขณะที่ผลกระทบเชิงลบและความสอดคล้องกันเป็นผลมาจากการประเมินของผู้ตอบแบบสอบถามทั้งสองประเด็นที่มีความสัมพันธ์กันและกันจะมีการเพิ่มผลกระทบด้านบวกและด้านลบเมื่อผู้ตอบแบบสอบถามรู้สึกไวต่อกรอบใหญ่ขึ้นภายในคำถามที่ถูกตั้งขึ้น อ่าน Moore (2002) แล้วออกแบบและดำเนินการสำรวจความคิดเห็นเกี่ยวกับ MTurk เพื่อแสดงผลเสริมหรือลบ

  7. [ ยาก , การเก็บรวบรวมข้อมูล ] คริสโตเฟอร์แอนโตนและเพื่อนร่วมงาน (2015) ได้ทำการศึกษาเปรียบเทียบตัวอย่างความสะดวกที่ได้รับจากแหล่งการสรรหาออนไลน์สี่แห่ง ได้แก่ MTurk, Craigslist, Google AdWords และ Facebook ออกแบบการสำรวจอย่างง่ายและรับสมัครผู้เข้าร่วมผ่านทางแหล่งการสรรหาออนไลน์อย่างน้อยสองแหล่ง (แหล่งข้อมูลเหล่านี้อาจแตกต่างจากแหล่งที่มาสี่แห่งที่ใช้ใน Antoun et al. (2015) )

    1. เปรียบเทียบค่าใช้จ่ายต่อผู้รับสมัครในด้านเงินและเวลาระหว่างแหล่งต่างๆ
    2. เปรียบเทียบองค์ประกอบของตัวอย่างที่ได้จากแหล่งต่างๆ
    3. เปรียบเทียบคุณภาพของข้อมูลระหว่างตัวอย่าง สำหรับแนวคิดเกี่ยวกับการวัดคุณภาพข้อมูลจากผู้ตอบแบบสอบถามโปรดดู Schober et al. (2015)
    4. แหล่งที่คุณต้องการคืออะไร? ทำไม?
  8. [ กลาง ] ในความพยายามที่จะคาดการณ์ผลลัพธ์ของการลงประชามติของสหภาพยุโรปในปีพ. ศ. 2016 (เช่น Brexit) YouGov ซึ่งเป็น บริษัท วิจัยตลาดอินเทอร์เน็ตทำการสำรวจออนไลน์ของผู้ตอบแบบสอบถามประมาณ 800,000 รายในสหราชอาณาจักร

    คำอธิบายโดยละเอียดของแบบจำลองทางสถิติของ YouGov สามารถดูได้ที่ https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ ประมาณพูด YouGov ผู้มีสิทธิเลือกตั้งแบ่งออกเป็นประเภทขึ้นอยู่กับการเลือกลงคะแนนเลือกตั้งทั่วไปปี 2015 อายุคุณสมบัติคุณวุฒิเพศและวันที่สัมภาษณ์เช่นเดียวกับเขตเลือกตั้งที่พวกเขาอาศัยอยู่ อันดับแรกพวกเขาใช้ข้อมูลที่รวบรวมจากผู้ร่วมอภิปรายของ YouGov เพื่อประเมินในหมู่ผู้ที่โหวตว่าสัดส่วนของผู้คนในแต่ละประเภทผู้ลงคะแนนเสียงที่ประสงค์จะลงคะแนนทิ้ง พวกเขาประเมินการเลือกตั้งของแต่ละประเภทผู้มีสิทธิเลือกตั้งโดยใช้การศึกษาการเลือกตั้งแห่งบริติชในปี พ.ศ. 2551 (BES) ซึ่งเป็นแบบสำรวจหันหน้าไปทางโพสต์การเลือกตั้งซึ่งเป็นการยืนยันการเลือกตั้งจากม้วนการเลือกตั้ง ในที่สุดพวกเขาประมาณจำนวนผู้คนที่มีอยู่ในแต่ละประเภทผู้มีสิทธิเลือกตั้งในเขตเลือกตั้งตามการสำรวจสำมะโนประชากรล่าสุดและการสำรวจประชากรประจำปี (ด้วยข้อมูลเพิ่มเติมบางส่วนจากแหล่งข้อมูลอื่น ๆ )

    สามวันก่อนการโหวต YouGov แสดงให้เห็นถึงการนำสองจุดสำหรับการลาออก ในวันลงคะแนนเสียงแบบสำรวจความคิดเห็นระบุว่าผลที่ได้ใกล้เคียงกับการโทรมาก (49/51 Remain) การศึกษาในวันสุดท้ายที่คาดการณ์ไว้ว่า 48/52 ให้ความสำคัญกับ Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/) ในความเป็นจริงการประมาณการนี้พลาดผลลัพธ์สุดท้าย (52/48 Leave) โดย 4 เปอร์เซ็นต์

    1. ใช้กรอบข้อผิดพลาดในการสำรวจทั้งหมดที่กล่าวถึงในบทนี้เพื่อประเมินสิ่งที่อาจผิดพลาด
    2. การตอบสนองของ YouGov หลังจากการเลือกตั้ง (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) อธิบายว่า: "สิ่งนี้ดูเหมือนเป็นส่วนใหญ่เนื่องจากมีการเลือกตั้งซึ่งเป็นสิ่งที่ เราได้กล่าวว่าทั้งหมดพร้อมจะเป็นสิ่งสำคัญต่อผลของการแข่งขันที่สมดุลอย่างประณีต รูปแบบการเลือกตั้งของเราขึ้นอยู่กับว่าผู้ตอบแบบสอบถามเคยลงคะแนนเสียงในการเลือกตั้งครั้งล่าสุดและระดับพลุกว่าการเลือกตั้งทั่วไปทำให้รูปแบบนี้ไม่ดีนักโดยเฉพาะอย่างยิ่งในภาคเหนือ "การเปลี่ยนแปลงคำตอบของคุณเป็นส่วนหนึ่งหรือไม่?
  9. [ กลาง , ต้องเข้ารหัส เขียนแบบจำลองเพื่ออธิบายข้อผิดพลาดในการแทนแต่ละข้อในรูปที่ 3.2

    1. สร้างสถานการณ์ที่ข้อผิดพลาดเหล่านี้ถูกยกเลิกออกไปจริง
    2. สร้างสถานการณ์ที่ข้อผิดพลาดของกันและกัน
  10. [ ยากมาก , ต้องเข้ารหัส ] การวิจัยของ Blumenstock และเพื่อนร่วมงาน (2015) เกี่ยวข้องกับการสร้างโมเดลการเรียนรู้ด้วยเครื่องซึ่งสามารถใช้ข้อมูลการติดตามข้อมูลดิจิตอลเพื่อทำนายการตอบสนองการสำรวจได้ ตอนนี้คุณกำลังจะลองสิ่งเดียวกันกับชุดข้อมูลอื่น Kosinski, Stillwell, and Graepel (2013) พบว่า Facebook ชอบทำนายลักษณะและคุณลักษณะเฉพาะของแต่ละบุคคล น่าแปลกใจที่การคาดการณ์เหล่านี้สามารถทำได้แม่นยำกว่าเพื่อนและเพื่อนร่วมงาน (Youyou, Kosinski, and Stillwell 2015)

    1. อ่าน Kosinski, Stillwell, and Graepel (2013) และทำซ้ำรูปที่ 2. ข้อมูลของพวกเขามีอยู่ที่ http://mypersonality.org/
    2. ตอนนี้ทำซ้ำรูปที่ 3
    3. สุดท้ายลองใช้โมเดลของพวกเขากับข้อมูล Facebook ของคุณเอง: http://applymagicsauce.com/ มันทำงานได้ดีสำหรับคุณ?
  11. [ กลาง ] Toole et al. (2015) ใช้บันทึกรายละเอียดการโทร (CDR) จากโทรศัพท์มือถือเพื่อคาดการณ์แนวโน้มการว่างงานโดยรวม

    1. เปรียบเทียบและเปรียบเทียบการออกแบบการศึกษาของ Toole et al. (2015) กับที่ของ Blumenstock, Cadamuro, and On (2015)
    2. คุณคิดว่า CDRs ควรแทนที่การสำรวจแบบดั้งเดิมเสริมหรือไม่ใช้เลยสำหรับผู้กำหนดนโยบายของรัฐบาลในการติดตามการว่างงานหรือไม่? ทำไม?
    3. หลักฐานใดที่จะชักจูงให้คุณเห็นว่า CDR สามารถแทนที่มาตรการเดิมของอัตราการว่างงานได้อย่างสมบูรณ์?