รวมข้อผิดพลาดข้อผิดพลาดการสำรวจ = ตัวแทน + ข้อผิดพลาดของการวัด
ประมาณการที่มาจากการสำรวจตัวอย่างมักไม่สมบูรณ์ นั่นคือโดยปกติจะมีความแตกต่างระหว่างค่าประมาณที่ได้จากการสำรวจตัวอย่าง (เช่นความสูงเฉลี่ยโดยประมาณของนักเรียนในโรงเรียน) และค่าที่แท้จริงของประชากร (เช่นความสูงโดยเฉลี่ยของนักเรียนในโรงเรียน) บางครั้งข้อผิดพลาดเหล่านี้มีขนาดเล็กจนไม่สำคัญ แต่บางครั้งก็น่าเสียดายที่อาจเป็นเรื่องใหญ่และเป็นผลสืบเนื่อง ในความพยายามที่จะเข้าใจวัดและลดข้อผิดพลาดนักวิจัยได้สร้างกรอบแนวคิดแนวคิดเดียวที่ครอบคลุมสำหรับข้อผิดพลาดที่อาจเกิดขึ้นในการสำรวจตัวอย่าง: กรอบข้อผิดพลาดในการสำรวจทั้งหมด (Groves and Lyberg 2010) แม้ว่าการพัฒนากรอบนี้จะเริ่มขึ้นในทศวรรษที่ 1940 ผมคิดว่าข้อเสนอนี้มีความคิดที่เป็นประโยชน์สำหรับการสำรวจวิจัยในยุคดิจิตอล
ข้อแรกกรอบข้อผิดพลาดในการสำรวจทั้งหมดชี้แจงว่ามีข้อผิดพลาดสองประเภทคือ ความลำเอียง และ ความแปรปรวน ประมาณความลำเอียงเป็นข้อผิดพลาดของระบบและความแปรปรวนเป็นข้อผิดพลาดแบบสุ่ม กล่าวอีกนัยหนึ่งลองจินตนาการถึงการเรียกใช้งานซ้ำ 1,000 ครั้งจากแบบสำรวจตัวอย่างเดียวกันและดูการแจกแจงประมาณการจาก 1,000 ซ้ำนี้ อคติคือความแตกต่างระหว่างค่าเฉลี่ยของค่าประมาณที่ทำซ้ำเหล่านี้และค่าที่แท้จริง ความแปรปรวนคือความแปรปรวนของค่าประมาณเหล่านี้ ทุกคนเท่าเทียมกันเราต้องการขั้นตอนที่ไม่มีอคติและความแปรปรวนเล็ก ๆ แต่น่าเสียดายที่สำหรับปัญหาจริงจำนวนมากเช่นไม่มีอคติขั้นตอนการแปรปรวนขนาดเล็กไม่มีอยู่ซึ่งจะทำให้นักวิจัยในตำแหน่งที่ยากลำบากในการตัดสินใจว่าจะทำให้สมดุลปัญหาที่นำมาใช้โดยอคติและความแปรปรวน นักวิจัยบางคนชอบกระบวนการที่ไม่เป็นธรรม แต่สัญชาตญาณเพียงอย่างเดียวอาจมีข้อผิดพลาด ถ้าเป้าหมายคือการสร้างการประมาณค่าที่ใกล้เคียงกับความเป็นจริง (เช่นมีข้อผิดพลาดน้อยที่สุด) คุณอาจจะดีกว่าด้วยขั้นตอนที่มีอคติเล็ก ๆ น้อย ๆ และมีความแปรปรวนน้อยกว่าข้อใดข้อหนึ่ง เป็นกลาง แต่มีความแปรปรวนมาก (รูปที่ 3.1) กล่าวอีกนัยหนึ่งข้อผิดพลาดในการสำรวจพบว่าเมื่อประเมินขั้นตอนการวิจัยเชิงสำรวจคุณควรพิจารณา ทั้ง ความลำเอียงและความแปรปรวน
ความเข้าใจหลักที่สองจากกรอบข้อผิดพลาดแบบสำรวจทั้งหมดซึ่งจะจัดระเบียบมากบทนี้ก็คือว่ามีสองแหล่งที่มาของข้อผิดพลาด: ปัญหาที่เกี่ยวข้องกับคนที่คุณพูดคุยกับ (ตัวแทน) และปัญหาที่เกี่ยวข้องกับสิ่งที่คุณเรียนรู้จากการสนทนาเหล่านั้น (การวัด ) ตัวอย่างเช่นคุณอาจสนใจในการประเมินทัศนคติเกี่ยวกับความเป็นส่วนตัวออนไลน์ในหมู่ผู้ใหญ่ที่อาศัยอยู่ในฝรั่งเศส การประมาณค่าเหล่านี้ต้องใช้การอนุมานสองแบบ อันดับแรกจากคำตอบที่ผู้ตอบตอบให้คุณต้องอนุมานทัศนคติเกี่ยวกับความเป็นส่วนตัวออนไลน์ (ซึ่งเป็นปัญหาในการวัดผล) ประการที่สองจากทัศนคติที่อนุมานในหมู่ผู้ตอบแบบสอบถามคุณต้องอนุมานทัศนคติในประชากรโดยรวม (ซึ่งเป็นปัญหาในการเป็นตัวแทน) การสุ่มตัวอย่างที่สมบูรณ์แบบด้วยคำถามการสำรวจที่ไม่ดีจะทำให้เกิดการประมาณการที่ไม่ดีเนื่องจากจะมีการสุ่มตัวอย่างที่ไม่ดีพร้อมกับคำถามในการสำรวจที่สมบูรณ์แบบ กล่าวอีกนัยหนึ่งการประมาณค่าที่ดีต้องใช้วิธีการวัด และการ แทน จากข้อมูลเบื้องหลังนี้ฉันจะทบทวนวิธีที่นักวิจัยสำรวจได้คิดเกี่ยวกับการเป็นตัวแทนและการวัดผลในอดีต จากนั้นฉันจะแสดงให้เห็นว่าแนวคิดเกี่ยวกับการเป็นตัวแทนและการวัดผลสามารถนำไปสู่การวิจัยสำรวจข้อมูลดิจิทัลได้อย่างไร