3.3.1 การเป็นตัวแทน

ผู้แทนจะเกี่ยวกับการทำข้อสรุปจากการตอบแบบสอบถามของคุณไปยังกลุ่มเป้าหมายของคุณ

เพื่อให้เข้าใจถึงชนิดของข้อผิดพลาดที่อาจเกิดขึ้นเมื่อการอนุมานจากผู้ตอบแบบสอบถามที่มีประชากรที่มีขนาดใหญ่ให้พิจารณาการหยั่งเสียงฟางวรรณกรรม Digest ที่พยายามที่จะคาดการณ์ผลของการเลือกตั้ง 1936 ประธานาธิบดีสหรัฐ แม้ว่ามันจะเป็นกว่า 75 ปีที่ผ่านมาน้ำท่วมยังคงมีบทเรียนที่สำคัญที่จะสอนให้นักวิจัยในวันนี้

วรรณกรรม Digest เป็นที่นิยมนิตยสารดอกเบี้ยทั่วไปและเริ่มต้นในปี 1920 พวกเขาก็เริ่มทำงานฟางเลือกตั้งที่จะคาดการณ์ผลลัพธ์ของการเลือกตั้งประธานาธิบดี ที่จะทำให้การคาดการณ์เหล่านี้พวกเขาจะส่งบัตรลงคะแนนให้กับผู้คนจำนวนมากและจากนั้นก็นับไปถึงบัตรลงคะแนนที่ถูกส่งกลับมา; วรรณกรรม Digest ภูมิใจรายงานว่าบัตรลงคะแนนที่พวกเขาได้รับไม่เป็น "ถ่วงน้ำหนักปรับหรือตีความ." ขั้นตอนนี้จะถูกทำนายผู้ชนะ ของการเลือกตั้งในปี 1920, 1924, 1928 และปี 1932 ในปี 1936 ในท่ามกลางของตกต่ำวรรณกรรม Digest ส่งออกไปลงคะแนนถึง 10 ล้านคนที่มีรายชื่อส่วนใหญ่มาจากสมุดโทรศัพท์และบันทึกการลงทะเบียนรถยนต์ นี่คือวิธีการที่พวกเขาอธิบายวิธีการของพวกเขา

"เครื่องเดินเรียบย่อยของเคลื่อนที่ไปพร้อมกับความแม่นยำรวดเร็วของประสบการณ์สามสิบปี 'เพื่อลดการคาดเดาไปข้อเท็จจริงที่ยาก . . โรงแรมแห่งนี้ในสัปดาห์ที่ 500 ปากกามีรอยขีดข่วนออกมากกว่าหนึ่งในสี่ของล้านที่อยู่วัน ทุกวันในห้องพักที่ดีสูงเหนือมอเตอร์ ribboned สี่อเวนิวในนิวยอร์ก 400 คนช่ำชองเลื่อนล้านชิ้นพิมพ์เรื่องพอที่จะปูสี่สิบเมืองบล็อกลงในซองจ่าหน้า [sic] ทุกชั่วโมงในการย่อยของตัวเองที่ทำการไปรษณีย์สถานีสามพูดเจื้อยแจ้วเครื่องวัดแสงไปรษณีย์ปิดผนึกและประทับตรา oblongs สีขาว; พนักงานไปรษณีย์ที่มีทักษะพลิกพวกเขาเข้าไปในปูด mailsacks; รถบรรทุกเรือเดินสมุทรไดเจสท์เร่งพวกเขาแสดงอีเมลรถไฟ . . สัปดาห์ถัดไปคำตอบเหล่านี้เป็นครั้งแรกจากสิบล้านจะเริ่มต้นการน้ำเข้ามาของบัตรลงคะแนนที่ทำเครื่องหมายไว้เพื่อเป็นสามตรวจสอบการตรวจสอบแล้วห้าครั้งข้ามจัดและมีมูลค่ารวมทั้งสิ้น เมื่อร่างที่ผ่านมาได้รับการตรวจสอบและ totted ถ้าประสบการณ์ที่ผ่านมาเป็นเกณฑ์ให้ประเทศจะได้รู้ว่าภายในส่วนของร้อยละ 1 คะแนนความนิยมที่เกิดขึ้นจริงของ 40000000 [ผู้มีสิทธิเลือกตั้ง] ได้. "(22 สิงหาคม 1936)

fetishization ของ Digest ขนาดเป็นที่รู้จักทันทีที่ "ข้อมูลขนาดใหญ่" ใด ๆ ในวันนี้นักวิจัย ของ 10 ล้านบัตรลงคะแนนกระจายที่น่าตื่นตาตื่นใจ 2.4 ล้านบัตรลงคะแนนที่ถูกส่งกลับมาที่ประมาณ 1,000 ครั้งใหญ่กว่าการเมืองสำรวจที่ทันสมัย จากนี้ 2.4 ล้านผู้ตอบแบบสอบถามคำตัดสินของศาลเป็นที่ชัดเจน: วรรณกรรม Digest คาดการณ์ว่าผู้ท้าชิง Alf แลนกำลังจะพ่ายแพ้หน้าที่แฟรงคลินรูสเวล แต่ในความเป็นจริงตรงข้ามแน่นอนที่เกิดขึ้น โรสเวลต์แพ้แลนในการเลือกตั้ง วิธีวรรณกรรม Digest อาจผิดไปด้วยข้อมูลมาก? ความเข้าใจที่ทันสมัยของเราของการสุ่มตัวอย่างทำให้ข้อผิดพลาดวรรณกรรม Digest ชัดเจนและช่วยให้เราหลีกเลี่ยงการทำข้อผิดพลาดที่คล้ายกันในอนาคต

คิดอย่างชัดเจนเกี่ยวกับการสุ่มตัวอย่างเราต้องพิจารณาสี่กลุ่มที่แตกต่างกันของผู้คน (รูปที่ 3.1) กลุ่มแรกของคนที่เป็นกลุ่มเป้าหมาย; นี้จะเป็นกลุ่มที่วิจัยกำหนดว่าเป็นประชากรที่น่าสนใจ ในกรณีของวรรณกรรมย่อยประชากรกลุ่มเป้าหมายเป็นผู้มีสิทธิเลือกตั้งในการเลือกตั้งประธานาธิบดี 1936 หลังจากตัดสินใจเกี่ยวกับประชากรเป้าหมายต่อไปนักวิจัยต้องการในการพัฒนารายชื่อของคนที่สามารถใช้สำหรับการสุ่มตัวอย่าง รายการนี้จะถูกเรียกว่ากรอบการสุ่มตัวอย่างประชากรและการสุ่มตัวอย่างในกรอบที่เรียกว่าประชากรกรอบ ในกรณีของวรรณกรรม Digest ประชากรกรอบเป็น 10 ล้านคนที่มีรายชื่อเข้ามามีอำนาจเหนือกว่าจากสมุดโทรศัพท์และบันทึกการลงทะเบียนรถยนต์ จะเป็นการดีที่มีประชากรเป้าหมายและจำนวนประชากรกรอบจะเหมือนกัน แต่ในทางปฏิบัตินี้มักจะเป็นกรณีที่ไม่ ความแตกต่างระหว่างกลุ่มเป้าหมายและจำนวนประชากรกรอบที่เรียกว่าข้อผิดพลาดความคุ้มครอง ข้อผิดพลาดการรายงานข่าวไม่ได้ด้วยตัวเองรับประกันปัญหา แต่ถ้าคนในประชากรกรอบที่มีระบบที่แตกต่างจากคนที่ไม่ได้อยู่ในกรอบของประชากรจะมีความคุ้มครองอคติ ข้อผิดพลาดความคุ้มครองเป็นครั้งแรกของข้อบกพร่องที่สำคัญกับการสำรวจความคิดเห็นวรรณกรรม Digest พวกเขาต้องการที่จะเรียนรู้เกี่ยวกับผู้มีสิทธิเลือกตั้งที่เป็นเป้าหมายประชากร แต่พวกเขาสร้างกรอบการสุ่มตัวอย่างมีอำนาจเหนือกว่าจากสมุดโทรศัพท์และการลงทะเบียนรถยนต์แหล่งที่มาที่มากกว่าการเป็นตัวแทนของความมั่งคั่งของพวกเขาชาวอเมริกันที่มีแนวโน้มที่จะสนับสนุน Alf แลน (จำได้ว่าทั้งสองของเทคโนโลยีเหล่านี้ ซึ่งเป็นเรื่องปกติในวันนี้ค่อนข้างใหม่ในเวลาและว่าสหรัฐกำลังอยู่ในระหว่างตกต่ำ)

รูปที่ 3.1: ข้อผิดพลาดการเป็นตัวแทน

รูปที่ 3.1: ข้อผิดพลาดการเป็นตัวแทน

หลังจากกำหนดประชากรกรอบขั้นตอนต่อไปสำหรับนักวิจัยในการเลือกกลุ่มตัวอย่างที่; เหล่านี้เป็นคนที่นักวิจัยจะพยายามที่จะสัมภาษณ์ หากกลุ่มตัวอย่างมีลักษณะที่แตกต่างจากประชากรกรอบแล้วเราสามารถแนะนำสุ่มตัวอย่างข้อผิดพลาด นี้เป็นชนิดของข้อผิดพลาดในการวัดอัตรากำไรขั้นต้นของความผิดพลาดที่มักจะมาพร้อมกับการประมาณการ ในกรณีของความล้มเหลววรรณกรรมย่อยมีจริงเป็นตัวอย่างไม่; พวกเขาพยายามที่จะติดต่อทุกคนในประชากรกรอบ แม้ว่าจะมีข้อผิดพลาดการสุ่มตัวอย่างไม่มีเห็นได้ชัดว่ายังคงมีข้อผิดพลาด นี้ชี้แจงว่าขอบของข้อผิดพลาดที่จะมีการรายงานโดยปกติจะมีการประมาณการจากการสำรวจที่มีขนาดเล็กมักจะทำให้เข้าใจผิด; พวกเขาไม่ได้รวมไปถึงแหล่งที่มาทั้งหมดของข้อผิดพลาด

ในที่สุดนักวิจัยพยายามที่จะสัมภาษณ์ทุกคนในประชากรกลุ่มตัวอย่าง คนที่ประสบความสำเร็จในการสัมภาษณ์จะเรียกว่าผู้ตอบแบบสอบถาม จะเป็นการดีที่มีประชากรตัวอย่างและผู้ตอบแบบสอบถามจะเหมือนกัน แต่ในทางปฏิบัติมีการตอบสนองที่ นั่นคือคนที่ได้รับการคัดเลือกในกลุ่มตัวอย่างปฏิเสธที่จะมีส่วนร่วม ถ้าคนที่ตอบสนองความแตกต่างจากผู้ที่ไม่ตอบสนองแล้วอาจจะมีการตอบสนองที่มีอคติ การตอบสนองที่มีอคติเป็นปัญหาหลักที่สองกับโพลวรรณกรรม Digest เพียง 24% ของคนที่ได้รับการลงคะแนนเสียงการตอบสนองและมันกลับกลายเป็นว่าคนที่ได้รับการสนับสนุนแลนมีแนวโน้มที่จะตอบสนอง

นอกเหนือจากการเป็นเพียงตัวอย่างที่จะแนะนำความคิดของการเป็นตัวแทนการสำรวจความคิดเห็นของวรรณกรรม Digest เป็นอุปมาผู้ทรงซ้ำเตือนนักวิจัยเกี่ยวกับอันตรายของการสุ่มตัวอย่างจับจด แต่น่าเสียดายที่ผมคิดว่าบทเรียนที่หลายคนวาดจากเรื่องนี้คือผิดหนึ่ง คุณธรรมที่พบมากที่สุดของเรื่องคือว่านักวิจัยไม่สามารถเรียนรู้อะไรจากตัวอย่างที่ไม่น่าจะเป็น (เช่นตัวอย่างไม่มีกฎความน่าจะเป็นตามที่เข้มงวดสำหรับการเลือกผู้เข้าร่วม) แต่ที่ผมจะแสดงต่อไปในบทนี้ที่ไม่ถูกต้องนัก แต่ผมคิดว่ามีจริงๆสองศีลธรรมกับเรื่องนี้; ศีลธรรมที่เป็นจริงวันนี้ขณะที่พวกเขาอยู่ในปี 1936 เป็นครั้งแรกที่มีขนาดใหญ่ของข้อมูลที่เก็บรวบรวมส่งเดชจะไม่รับประกันประมาณการที่ดี สองนักวิจัยต้องคำนึงถึงวิธีการที่ข้อมูลของพวกเขาถูกเก็บเมื่อพวกเขาจะทำให้ประมาณการจากมัน ในคำอื่น ๆ เนื่องจากกระบวนการเก็บรวบรวมข้อมูลในการสำรวจความคิดเห็นวรรณกรรมสำคัญเป็นเบ้เป็นระบบที่มีต่อผู้ตอบแบบสอบถามบางนักวิจัยต้องใช้กระบวนการการประมาณค่าที่ซับซ้อนมากขึ้นว่าผู้ตอบแบบสอบถามบางน้ำหนักมากกว่าคนอื่น ๆ ต่อมาในบทนี้ผมจะแสดงให้คุณหนึ่งน้ำหนักขั้นตอนดังกล่าวโพสต์ชนชั้นที่สามารถช่วยให้คุณสามารถประมาณการที่ดีขึ้นกับกลุ่มตัวอย่างที่ไม่น่าจะเป็น