ການເປັນຕົວແທນແມ່ນກ່ຽວກັບການວິນິດໄສຈາກຕອບຂອງທ່ານກັບປະຊາກອນເປົ້າຫມາຍຂອງທ່ານ.
ເພື່ອເຂົ້າໃຈຄວາມຜິດພາດທີ່ສາມາດເກີດຂື້ນໃນເວລາທີ່ອ້າງອີງຈາກຜູ້ຕອບແບບສໍາຫຼວດກັບປະຊາກອນຂະຫນາດໃຫຍ່, ໃຫ້ພິຈາລະນາການສໍາຫຼວດການເກັບ ກໍາຂໍ້ມູນຂ່າວປະຈໍາວັນ ທີ່ພະຍາຍາມຄາດຄະເນຜົນໄດ້ຮັບຂອງການເລືອກຕັ້ງປະທານາທິບໍດີສະຫະລັດໃນປີ 1936. ເຖິງແມ່ນວ່າມັນເກີດຂຶ້ນຫຼາຍກວ່າ 75 ປີແລ້ວ, ບັນຫາດັ່ງກ່າວຍັງມີບົດຮຽນທີ່ສໍາຄັນທີ່ຈະສອນນັກຄົ້ນຄວ້າໃນມື້ນີ້.
ຫນັງສືເຫຼັ້ມທໍາອິດ ແມ່ນວາລະສານທີ່ມີຄວາມສົນໃຈທົ່ວໄປ, ແລະເລີ່ມຕົ້ນໃນປີ 1920 ພວກເຂົາເຈົ້າເລີ່ມຕົ້ນການເລືອກຕັ້ງເຟືອງເພື່ອຄິດໄລ່ຜົນໄດ້ຮັບຂອງການເລືອກຕັ້ງປະທານາທິບໍດີ. ເພື່ອເຮັດໃຫ້ການຄາດຄະເນເຫຼົ່ານີ້, ພວກເຂົາຈະສົ່ງຄະແນນສຽງໃຫ້ຫຼາຍໆຄົນແລະຫຼັງຈາກນັ້ນພຽງແຕ່ປະທ້ວງເຖິງການເລືອກຕັ້ງທີ່ຖືກສົ່ງຄືນ; ວັນນະຄະດີຫົວຂໍ້ສໍາຄັນ proudly ລາຍງານວ່າສຽງລົງຄະແນນຂອງພວກເຂົາເຈົ້າໄດ້ຮັບໄດ້ບໍ່ "ນ້ໍາ, ປັບ, ຫຼືການຕີລາຄາ." ລະບຽບການນີ້ຖືກຄາດຄະເນຜູ້ຊະນະຂອງການເລືອກຕັ້ງໃນປີ 1920, 1924, 1928 ແລະ 1932. ໃນ 1936, ໃນທ່າມກາງຂອງຕົກຕ່ໍາຂອງ, ວັນນະຄະດີ Digest ສົ່ງອອກສຽງໃຫ້ 10 ລ້ານຄົນ, ທີ່ມີຊື່ມາຈາກບັນດາລາຍຊື່ໂທລະສັບແລະບັນທຶກການລົງທະບຽນລົດໃຫຍ່. ນີ້ແມ່ນວິທີທີ່ພວກເຂົາໄດ້ອະທິບາຍວິທີການຂອງພວກເຂົາ:
"ເຄື່ອງຈັກທີ່ລຽບງ່າຍຂອງ DIGEST ເຄື່ອນຍ້າຍດ້ວຍຄວາມໄວຂອງປະສົບການ 30 ປີທີ່ລ້າສຸດເພື່ອຫຼຸດຜ່ອນການຄາດເດົາທີ່ເປັນຂໍ້ເທັດຈິງທີ່ຫນັກແຫນ້ນ ... ໃນອາທິດນີ້ 500 ໂຕະໄດ້ແຜ່ອອກຫຼາຍກວ່າ 1/4 ລ້ານທີ່ຢູ່ຕໍ່ມື້. ທຸກໆມື້, ຢູ່ໃນຫ້ອງທີ່ດີກວ່າຊັ້ນສູງ, ຢູ່ເຫນືອສີ່ຖະຫນົນຫົນທາງໃນກຸງນິວຢອກ, ພະນັກງານ 400 ຄົນໄດ້ເລື່ອນລົງຢ່າງຫນ້ອຍຫນຶ່ງລ້ານແຜ່ນຂອງສິ່ງພິມ - ພຽງພໍທີ່ຈະປຸກສີ່ສິບຕົວເມືອງ - ເຂົ້າໄປໃນເອກະສານທີ່ຖືກແກ້ໄຂ. ທຸກໆຊົ່ວໂມງ, ພາຍໃນ Post Office Substation ຂອງ DIGEST ຂອງຕົນເອງ, ສາມຕາຕະລາງການໂຕ້ຖຽງເຄື່ອງຈັກແລະ sealed stamped ສີຂາວ oblongs; ພະນັກງານໄປສະນີທີ່ມີຄວາມຊໍານິຊໍານານໃຫ້ພວກເຂົາເຂົ້າໄປໃນຂີ້ເຫຍື້ອ; ລົດບັນທຸກ DIGEST ໄດ້ພາໃຫ້ພວກເຂົາສະແດງການຝຶກອົບຮົມທາງລົດໄຟ. ທີ່ຢູ່ ທີ່ຢູ່ ອາທິດຕໍ່ໄປ, ຄໍາຕອບຄັ້ງທໍາອິດຈາກສິບລ້ານຄົນເຫຼົ່ານີ້ຈະເລີ່ມຕົ້ນໃນການເຂົ້າສູ່ລະບົບຂອງການລົງສໍາຫຼວດທີ່ຈະຕ້ອງໄດ້ຮັບການກວດສາມຄັ້ງ, ກວດສອບ, ຫ້າເວລາລະຫວ່າງການຈັດແບ່ງແລະລວມ. ໃນເວລາທີ່ຕົວເລກສຸດທ້າຍໄດ້ຖືກກວດສອບແລະກວດເບິ່ງວ່າຖ້າຫາກວ່າປະສົບການທີ່ຜ່ານມາເປັນເງື່ອນໄຂ, ປະເທດຈະຮູ້ວ່າໃນປະມານຫນຶ່ງເປີເຊັນຂອງການລົງຄະແນນສຽງທີ່ມີປະຊາທິປະໄຕປະມານ 40 ລ້ານຄົນ. "(22 ສິງຫາ 1936)
ການສຶກສາຄວາມເປັນໄປໄດ້ຂອງຫນັງສືເຫຼັ້ມຂອງ Digest ແມ່ນສາມາດຮັບຮູ້ໄດ້ທັນທີກັບຜູ້ຄົ້ນຄວ້າ "ຂໍ້ມູນຂະຫນາດໃຫຍ່" ໃນມື້ນີ້. ໃນຈໍານວນ 10 ລ້ານລາຍໄດ້ແຈກຢາຍ, ປະມານ 2.4 ລ້ານຄົນໄດ້ຖືກສົ່ງກັບ - ເຊິ່ງປະມານ 1,000 ຄັ້ງກ່ວາການເລືອກຕັ້ງທາງດ້ານການເມືອງທີ່ທັນສະໄຫມ. ຈາກຜູ້ຕອບ 2.4 ລ້ານຄົນນີ້, ຄໍາຕັດສິນດັ່ງກ່າວແມ່ນເຫັນໄດ້ຊັດເຈນວ່າ Alf Landon ຈະທໍາລາຍນາຍ Franklin Roosevelt. ແຕ່, ໃນຄວາມເປັນຈິງ, Roosevelt defeated Landon ໃນລະດັບດິນ. ວິທີການ ຂຽນຫນັງສື ສາມາດຜິດພາດກັບຂໍ້ມູນຫຼາຍປານໃດ? ຄວາມເຂົ້າໃຈທີ່ທັນສະໄຫມຂອງພວກເຮົາກ່ຽວກັບຕົວຢ່າງເຮັດໃຫ້ຄວາມຜິດພາດ ຂອງ Literary Digest ຊັດເຈນແລະຊ່ວຍໃຫ້ພວກເຮົາຫລີກລ່ຽງຄວາມຜິດພາດທີ່ຄ້າຍຄືກັນໃນອະນາຄົດ.
ການຄິດທີ່ຊັດເຈນກ່ຽວກັບຕົວຢ່າງຕ້ອງການໃຫ້ເຮົາພິຈາລະນາສີ່ກຸ່ມທີ່ແຕກຕ່າງກັນຂອງຄົນ (ຮູບທີ 3.2). ກຸ່ມທໍາອິດແມ່ນ ປະຊາກອນເປົ້າຫມາຍ ; ນີ້ແມ່ນກຸ່ມທີ່ນັກຄົ້ນຄວ້າກໍານົດເປັນປະຊາກອນທີ່ມີຄວາມສົນໃຈ. ໃນກໍລະນີຂອງ Literary Digest , ປະຊາກອນເປົ້າຫມາຍແມ່ນຜູ້ລົງຄະແນນສຽງໃນການເລືອກຕັ້ງປະທານາທິບໍດີໃນປີ 1936.
ຫຼັງຈາກຕັດສິນໃຈກ່ຽວກັບປະຊາຊົນເປົ້າຫມາຍ, ນັກຄົ້ນຄວ້າຕ້ອງການພັດທະນາບັນຊີລາຍຊື່ຂອງຄົນທີ່ສາມາດນໍາໃຊ້ສໍາລັບຕົວຢ່າງ. ບັນຊີລາຍຊື່ນີ້ແມ່ນເອີ້ນວ່າ ກອບຕົວຢ່າງ ແລະປະຊາຊົນມັນຖືກເອີ້ນວ່າ ປະຊາກອນພາ . ໂດຍສະເພາະ, ປະຊາກອນທີ່ເປົ້າຫມາຍແລະປະຊາກອນທີ່ມີກໍາແພງກໍ່ຈະມີຄວາມແຕກຕ່າງຄືກັນ, ແຕ່ວ່າໃນປະຕິບັດນີ້ມັນກໍ່ບໍ່ແມ່ນກໍລະນີ. ຕົວຢ່າງ, ໃນກໍລະນີຂອງ Literary Digest , ປະຊາກອນພາມີ 10 ລ້ານຄົນທີ່ມີຊື່ມາຈາກໂທລະສັບແລະບັນທຶກການລົງທະບຽນລົດໃຫຍ່. ຄວາມແຕກຕ່າງລະຫວ່າງປະຊາກອນເປົ້າຫມາຍແລະປະຊາກອນຂອງເຟຣມຖືກເອີ້ນວ່າ ຂໍ້ຜິດພາດກ່ຽວກັບການຄຸ້ມຄອງ . ຂໍ້ຜິດພາດກ່ຽວກັບການຄຸ້ມຄອງບໍ່ໄດ້, ໂດຍຕົວຂອງມັນເອງ, ຮັບປະກັນບັນຫາ. ເຖິງຢ່າງໃດກໍ່ຕາມ, ມັນສາມາດນໍາໄປສູ່ການ ປົກປັກຮັກສາຄວາມສະຫງົບ ຖ້າວ່າປະຊາຊົນໃນປະເທດມີຄວາມແຕກຕ່າງລະບົບຈາກປະຊາຊົນທີ່ຢູ່ໃນປະຊາກອນເປົ້າຫມາຍທີ່ບໍ່ຢູ່ໃນປະຊາກອນ. ໃນຄວາມເປັນຈິງ, ນີ້ແມ່ນສິ່ງທີ່ເກີດຂື້ນໃນການສໍາຫຼວດ ວັນນະຄະດີ . ປະຊາກອນທີ່ຢູ່ໃນປະຕູຂອງເຂົາເຈົ້າມີແນວໂນ້ມທີ່ຈະສະຫນັບສະຫນູນ Alf Landon, ສ່ວນຫນຶ່ງແມ່ນຍ້ອນວ່າພວກເຂົາມີຄວາມຮັ່ງມີ (ບອກວ່າໂທລະສັບແລະລົດໃຫຍ່ແມ່ນຂ້ອນຂ້າງໃຫມ່ແລະລາຄາແພງໃນປີ 1936). ດັ່ງນັ້ນ, ໃນການສໍາຫຼວດ ວັນນະຄະດີ , ຂໍ້ຜິດພາດກ່ຽວກັບການຄຸ້ມຄອງນໍາໄປສູ່ຄວາມສະຫງົບປົກກະຕິ.
ຫຼັງຈາກການກໍານົດ ປະຊາກອນພາ , ຂັ້ນຕອນຕໍ່ໄປແມ່ນສໍາລັບນັກຄົ້ນຄວ້າທີ່ຈະເລືອກ ປະຊາກອນຕົວຢ່າງ ; ເຫຼົ່ານີ້ແມ່ນປະຊາຊົນຜູ້ທີ່ນັກຄົ້ນຄວ້າຈະພະຍາຍາມສໍາພາດ. ຖ້າຕົວຢ່າງມີລັກສະນະທີ່ແຕກຕ່າງກັນກ່ວາປະຊາກອນຂອງເຟຣມ, ຫຼັງຈາກນັ້ນຕົວຢ່າງສາມາດນໍາສະເຫນີ ຂໍ້ຜິດພາດຕົວຢ່າງ . ແຕ່ໃນກໍລະນີຂອງການປະດິດສ້າງຂອງ ຫນັງສືເຫຼັ້ມນີ້ , ບໍ່ມີຕົວຢ່າງ - ວາລະສານທີ່ຕິດຕໍ່ກັບທຸກໆຄົນຢູ່ໃນປະຊາກອນພາກັນ - ແລະດັ່ງນັ້ນຈຶ່ງບໍ່ມີຂໍ້ຜິດພາດຕົວຢ່າງ. ນັກຄົ້ນຄວ້າຈໍານວນຫຼາຍມີແນວໂນ້ມທີ່ຈະສຸມໃສ່ການເອົາຕົວຢ່າງຜິດພາດ, ໂດຍປົກກະຕິນີ້ແມ່ນຂໍ້ຜິດພາດທີ່ຖືກບັນທຶກໄວ້ໃນຂອບຂອງຂໍ້ຜິດພາດທີ່ໄດ້ລາຍງານໃນການສໍາຫຼວດ - ແຕ່ຄວາມລົ້ມເຫລວຂອງ Literary Digest foresco reminds us that we need to consider all sources of error, both random and systematic.
ສຸດທ້າຍ, ຫຼັງຈາກການເລືອກປະຊາກອນຕົວຢ່າງ, ນັກຄົ້ນຄວ້າໄດ້ພະຍາຍາມສໍາພາດສະມາຊິກທຸກຄົນ. ຜູ້ທີ່ຖືກສໍາພາດສົບຜົນສໍາເລັດແມ່ນເອີ້ນວ່າ ຜູ້ຕອບ . ໂດຍຕົວຢ່າງ, ຕົວຢ່າງຕົວຢ່າງແລະຜູ້ຕອບແບບສອບຖາມຈະເປັນຄືກັນແຕ່ໃນປະຕິບັດບໍ່ມີຄໍາຕອບ. ນັ້ນແມ່ນ, ຜູ້ທີ່ຖືກຄັດເລືອກໃນຕົວຢ່າງບາງຄັ້ງບໍ່ເຂົ້າຮ່ວມ. ຖ້າຜູ້ທີ່ຕອບສະຫນອງແມ່ນແຕກຕ່າງຈາກຜູ້ທີ່ບໍ່ຕອບສະຫນອງ, ຫຼັງຈາກນັ້ນອາດຈະມີຄວາມ ບໍ່ສະເຫມີກັນ . ການຕອບສະຫນອງຕໍ່ການຕອບສະຫນອງຄວາມບໍ່ສະເຫມີພາບແມ່ນບັນຫາສໍາຄັນທີ່ສອງກັບການສໍາຫຼວດເລື່ອງ ວັນນະຄະດີ . ມີພຽງແຕ່ 24% ຂອງຜູ້ທີ່ໄດ້ຮັບການເລືອກຕັ້ງ, ແລະມັນໄດ້ກາຍເປັນວ່າຜູ້ທີ່ສະຫນັບສະຫນູນ Landon ມັກຈະຕອບໂຕ້.
ນອກເຫນືອຈາກການເປັນຕົວຢ່າງທີ່ນໍາສະເຫນີແນວຄວາມຄິດຂອງການເປັນຕົວແທນ, ການສໍາຫຼວດເລື່ອງ ວັນນະຄະດີ ແມ່ນເປັນຄໍາອຸປະຖໍາ, ເຕືອນກ່ຽວກັບອັນຕະລາຍຂອງການຫລອກລວງ haphazard. ແຕ່ຫນ້າເສຍດາຍ, ຂ້າພະເຈົ້າຄິດວ່າບົດຮຽນທີ່ຫຼາຍຄົນແຕ້ມຈາກເລື່ອງນີ້ແມ່ນຜິດພາດ. ການສົມບັດສິນທໍາທົ່ວໄປທີ່ສຸດຂອງເລື່ອງແມ່ນວ່ານັກຄົ້ນຄວ້າບໍ່ສາມາດຮຽນຮູ້ຫຍັງຈາກຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມສົມເຫດສົມຜົນ (ຕົວຢ່າງ, ໂດຍບໍ່ມີຫຼັກການທີ່ມີຄວາມສອດຄ່ອງຕາມຫຼັກການສໍາລັບການຄັດເລືອກຜູ້ເຂົ້າຮ່ວມ). ແຕ່, ເປັນຂ້າພະເຈົ້າຈະສະແດງໃຫ້ເຫັນຕໍ່ມາໃນບົດນີ້, ວ່າບໍ່ຖືກຕ້ອງ. ແທນທີ່ຈະ, ຂ້າພະເຈົ້າຄິດວ່າມີສອງສົມບັດສົມບັດກັບເລື່ອງນີ້; ສົມບັດສິນທໍາທີ່ເປັນຄວາມຈິງໃນມື້ນີ້ຍ້ອນວ່າພວກເຂົາແມ່ນຢູ່ໃນ 1936. ຫນ້າທໍາອິດ, ຈໍານວນຂະຫນາດໃຫຍ່ຂອງຂໍ້ມູນເກັບກໍາ haphazardly ຈະບໍ່ຮັບປະກັນການຄາດຄະເນທີ່ດີ. ໂດຍທົ່ວໄປແລ້ວ, ມີຜູ້ຕອບຈໍານວນຫຼວງຫຼາຍຫຼຸດລົງຄວາມແຕກຕ່າງຂອງການຄາດຄະເນ, ແຕ່ວ່າມັນບໍ່ຈໍາເປັນຕ້ອງຫຼຸດລົງ. ມີຫຼາຍຂໍ້ມູນ, ນັກຄົ້ນຄວ້າບາງຄັ້ງສາມາດໄດ້ຮັບການຄາດຄະເນທີ່ຊັດເຈນກ່ຽວກັບສິ່ງທີ່ຜິດ; ພວກເຂົາສາມາດມີ ຄວາມຖືກຕ້ອງບໍ່ຖືກຕ້ອງ (McFarland and McFarland 2015) . ບົດຮຽນທີ່ສໍາຄັນທີ່ສອງຈາກບົດປະພັນທີ່ກ່ຽວກັບ ວັນນະຄະດີ ແມ່ນນັກຄົ້ນຄວ້າຈໍາເປັນຕ້ອງຄິດໄລ່ວິທີການເກັບຕົວຢ່າງຂອງພວກເຂົາໃນເວລາທີ່ການປະມານການ. ໃນທາງກົງກັນຂ້າມ, ເນື່ອງຈາກວ່າຂະບວນການຕົວຢ່າງໃນການສໍາຫຼວດຂອງ Literary Digest ໄດ້ຖືກບີບບັງຄັບໃຫ້ກັບຜູ້ຕອບບາງຄົນ, ນັກຄົ້ນຄວ້າຈໍາເປັນຕ້ອງໃຊ້ຂະບວນການຄາດຄະເນທີ່ສະລັບສັບຊ້ອນຫຼາຍທີ່ໃຫ້ຄົນຕອບຫຼາຍກວ່າຄົນອື່ນ. ຫຼັງຈາກນັ້ນ, ໃນບົດນີ້, ຂ້ອຍຈະສະແດງໃຫ້ທ່ານຮູ້ເຖິງຂັ້ນຕອນການປ້ອນຂໍ້ມູນທີ່ມີຄວາມຫນາແຫນ້ນດັ່ງຕໍ່ໄປນີ້ເຊິ່ງສາມາດເຮັດໃຫ້ທ່ານສາມາດເຮັດໃຫ້ການຄາດຄະເນທີ່ດີກວ່າໄດ້ຈາກຕົວຢ່າງ haphazard.