3.4.2 ຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ: ນ້ໍາ

ມີຕົວຢ່າງທີ່ບໍ່ແມ່ນຫນ້າຈະເປັນນ້ໍາສາມາດຍົກເລີກການບິດເບືອນທີ່ເກີດຈາກຂະບວນການເກັບຕົວຢ່າງສົມມຸດ.

ໃນວິທີການດຽວກັນກັບທີ່ນັກວິໄຈນ້ໍາການຕອບສະຫນອງຈາກຕົວຢ່າງຈະເປັນ, ພວກເຂົາເຈົ້າຍັງສາມາດນ້ໍາການຕອບສະຫນອງຈາກຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ. ສໍາລັບການຍົກຕົວຢ່າງ, ເປັນທາງເລືອກທີ່ CPS ໄດ້, ຈິນຕະນາການວ່າທ່ານໄວ້ໂຄສະນາປ້າຍໂຄສະນາໃນພັນຂອງເວັບໄຊທ໌ການທົດແທນທີ່ຜູ້ເຂົ້າຮ່ວມສໍາລັບການສໍາຫຼວດເພື່ອປະເມີນອັດຕາການຫວ່າງງານໄດ້. ຕາມທໍາມະຊາດ, ທ່ານອາດຈະບໍ່ຄ່ອຍເຊື່ອງ່າຍໆວ່າວິທີການງ່າຍດາຍຂອງຕົວຢ່າງຂອງທ່ານຈະເປັນການຄາດຄະເນທີ່ດີຂອງອັດຕາການຫວ່າງງານ. ບໍ່ຄ່ອຍເຊື່ອງ່າຍໆຂອງທ່ານອາດຈະເປັນເພາະວ່າທ່ານຄິດວ່າປະຊາຊົນບາງຈະສໍາເລັດການສໍາຫຼວດຂອງທ່ານກ່ວາຄົນອື່ນ. ສໍາລັບການຍົກຕົວຢ່າງ, ປະຊາຊົນຜູ້ທີ່ບໍ່ໄດ້ໃຊ້ເວລາຢ່າງຫຼາຍຂອງການໃຊ້ເວລາໃນເວັບໄຊຕ໌ບໍ່ມັກທີ່ຈະສໍາເລັດການສໍາຫຼວດຂອງທ່ານ.

ດັ່ງທີ່ພວກເຮົາໄດ້ເຫັນຢູ່ໃນພາກສຸດທ້າຍ, ຢ່າງໃດກໍຕາມ, ຖ້າຫາກວ່າພວກເຮົາຮູ້ຈັກວິທີຕົວຢ່າງທີ່ໄດ້ຖືກຄັດເລືອກ, ດັ່ງທີ່ພວກເຮົາເຮັດແນວໃດກັບການຄາດຄະເນຕົວຢ່າງ, ຫຼັງຈາກນັ້ນພວກເຮົາສາມາດຍົກເລີກການບິດເບືອນທີ່ເກີດຈາກຂະບວນການຕົວຢ່າງການ. ແຕ່ຫນ້າເສຍດາຍ, ໃນເວລາທີ່ເຮັດວຽກຮ່ວມກັບຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ, ພວກເຮົາບໍ່ຮູ້ຈັກວິທີຕົວຢ່າງທີ່ຖືກຄັດເລືອກ. ແຕ່ວ່າ, ພວກເຮົາສາມາດເຮັດໃຫ້ສົມມຸດຕິຖານກ່ຽວກັບຂະບວນການເກັບຕົວຢ່າງແລະຫຼັງຈາກນັ້ນໃຊ້ນ້ໍາໃນວິທີການດຽວກັນ. ຖ້າຫາກວ່າສົມມຸດຕິຖານເຫຼົ່ານີ້ແມ່ນຖືກຕ້ອງ, ຫຼັງຈາກນັ້ນນ້ໍາຈະແກ້ໄຂມີການບິດເບືອນທີ່ເກີດຈາກຂະບວນການຕົວຢ່າງການ.

ສໍາລັບການຍົກຕົວຢ່າງ, ຄິດວ່າໃນການຕອບສະຫນອງການໂຄສະນາປ້າຍໂຄສະນາຂອງທ່ານ, ທ່ານບັນຈຸ 100,000 ຕອບ. ຢ່າງໃດກໍຕາມ, ທ່ານບໍ່ເຊື່ອວ່າການເຫຼົ່ານີ້ 100,000 ຕອບແມ່ນຕົວຢ່າງທີ່ສຸ່ມງ່າຍດາຍຂອງຜູ້ໃຫຍ່ອາເມລິກາ. ໃນຄວາມເປັນຈິງ, ໃນເວລາທີ່ທ່ານສົມທຽບຕອບຂອງທ່ານກັບປະຊາກອນສະຫະລັດ, ທ່ານເຫັນວ່າປະຊາຊົນຈາກບາງປະເທດ (eg, New York) ມີຫຼາຍກວ່າການເປັນຕົວແທນແລະປະຊາຊົນຈາກບາງປະເທດ (eg, Alaska) ແມ່ນຢູ່ພາຍໃຕ້ການເປັນຕົວແທນ. ດັ່ງນັ້ນ, ອັດຕາຫວ່າງງານຂອງຕົວຢ່າງຂອງທ່ານຈະເປັນການຄາດຄະເນທີ່ບໍ່ດີຂອງອັດຕາການຫວ່າງງານໃນປະຊາກອນເປົ້າຫມາຍດັ່ງກ່າວ.

ຫນຶ່ງໃນວິທີທີ່ຈະແກ້ໄຂການບິດເບືອນທີ່ເກີດຂຶ້ນໃນຂະບວນການເກັບຕົວຢ່າງແມ່ນການກໍາຫນົດນ້ໍາຫນັກແຕ່ລະຄົນ; ນ້ໍາຕ່ໍາກັບປະຊາຊົນຈາກປະເທດທີ່ມີຫຼາຍກວ່າການເປັນຕົວແທນຢູ່ໃນຕົວຢ່າງ (ຕົວຢ່າງ:, New York) ແລະນ້ໍາທີ່ສູງຂຶ້ນເພື່ອປະຊາຊົນຈາກປະເທດທີ່ຢູ່ພາຍໃຕ້ການເປັນຕົວແທນຢູ່ໃນຕົວຢ່າງ (ຕົວຢ່າງ:, Alaska). ຫຼາຍໂດຍສະເພາະ, ນ້ໍາສໍາລັບແຕ່ລະຄົນຕອບສະຫນອງແມ່ນທີ່ກ່ຽວຂ້ອງກັບການແຈກຢາຍຂອງພວກເຂົາໃນພີ່ນ້ອງຕົວຢ່າງຂອງທ່ານເຮັດໃຫ້ຕົວຂອງເຂົາເຈົ້າໃນປະຊາກອນສະຫະລັດ. ຂັ້ນຕອນການນ້ໍານີ້ຖືກເອີ້ນວ່ານີ, stratification, ແລະຄວາມຄິດຂອງການຊັ່ງນໍ້າຫນັກຄວນເຕືອນໃຫ້ທ່ານຍົກຕົວຢ່າງໃນພາກ 341 ທີ່ຕອບແບບສອບຖາມຈາກ Rhode Island ໄດ້ຮັບນ້ໍາຫນັກຫນ້ອຍກ່ວາຜູ້ທີ່ຈາກແຄລິຟໍເນຍ. ຕອບ stratification ຮຽກຮ້ອງໃຫ້ທ່ານຮູ້ພຽງພໍທີ່ຈະເຮັດໃຫ້ຕອບແບບສອບຖາມຂອງທ່ານເຂົ້າໄປໃນກຸ່ມແລະຮູ້ອັດຕາສ່ວນຂອງປະຊາກອນເປົ້າຫມາຍດັ່ງກ່າວໃນແຕ່ລະກຸ່ມ.

ເຖິງແມ່ນວ່ານ້ໍາຫນັກຂອງຕົວຢ່າງການຄາດຄະເນແລະຂອງຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ແມ່ນທາງຄະນິດສາດດຽວກັນ (ເບິ່ງເອກະສານຊ້ອນດ້ານວິຊາການ), ພວກເຂົາເຈົ້າເຮັດວຽກໄດ້ດີໃນສະຖານະການທີ່ແຕກຕ່າງກັນ. ຖ້າຫາກວ່ານັກຄົ້ນຄວ້າໄດ້ມີຕົວຢ່າງຈະເປັນທີ່ດີເລີດ (ຕົວຢ່າງ, ບໍ່ມີຄວາມຜິດພາດການຄຸ້ມຄອງແລະບໍ່ມີບໍ່ແມ່ນການຕອບສະຫນອງ), ຫຼັງຈາກນັ້ນນ້ໍາຈະຜະລິດຕະພັນການຄາດຄະເນມີອັກຄະຕິສໍາລັບການລັກສະນະທັງຫມົດໃນທຸກກໍລະນີ. ນີ້ການຮັບປະກັນທາງທິດສະດີທີ່ເຂັ້ມແຂງແມ່ນວ່າເປັນຫຍັງສະຫນັບສະຫນູນຂອງຕົວຢ່າງອາດຈະຊອກຫາໃຫ້ເຂົາເຈົ້າທີ່ດຶງດູດນັ້ນ. ໃນອີກດ້ານຫນຶ່ງ, ຕົວຢ່າງທີ່ບໍ່ແມ່ນຫນ້າຈະເປັນນ້ໍາຈະມີພຽງແຕ່ຜະລິດຕະພັນການຄາດຄະເນມີອັກຄະຕິສໍາລັບການລັກສະນະທັງຫມົດຖ້າຫາກວ່າທ່າອ່ຽງຄວາມມັກການຕອບສະຫນອງແມ່ນຄືກັນສໍາລັບທຸກຄົນໃນແຕ່ລະກຸ່ມ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ຄິດກັບຄືນໄປບ່ອນຕົວຢ່າງຂອງພວກເຮົາ, ການນໍາໃຊ້ໄປສະນີ, stratification ຈະຜະລິດຕະພັນການຄາດຄະເນມີອັກຄະຕິຖ້າຫາກວ່າທຸກຄົນໃນ New York ມີການຄາດຄະເນດຽວກັນຂອງການເຂົ້າຮ່ວມແລະທຸກຄົນໃນ Alaska ມີການຄາດຄະເນດຽວກັນຂອງການເຂົ້າຮ່ວມແລະອື່ນໆ. ສົມມຸດຕິຖານນີ້ໄດ້ຖືກເອີ້ນວ່າສົມມຸດຕິຖານການຄຸ້ມຄອງການຕອບສະຫນອງ, ທ່າອ່ຽງຄວາມມັກພາຍໃນກຸ່ມ, ແລະມັນມີບົດບາດເປັນພາລະບົດບາດສໍາຄັນໃນການຮູ້ວ່າຕອບ stratification ຈະເຮັດວຽກໄດ້ດີທີ່ມີຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ.

ແຕ່ຫນ້າເສຍດາຍ, ໃນຕົວຢ່າງຂອງພວກເຮົາ, ສົມມຸດຕິຖານການຄຸ້ມຄອງການຕອບສະຫນອງ, ທ່າອ່ຽງຄວາມມັກພາຍໃນກຸ່ມເບິ່ງຄືວ່າຄົງຈະບໍ່ເປັນຄວາມຈິງ. ວ່າແມ່ນ, ມັນເບິ່ງຄືວ່າຄົງຈະບໍ່ວ່າທຸກຄົນໃນ Alaska ມີການຄາດຄະເນຂອງການເປັນຢູ່ໃນການສໍາຫຼວດຂອງທ່ານ. ແຕ່, ມີສາມຈຸດທີ່ສໍາຄັນທີ່ຈະຮັກສາຢູ່ໃນໃຈກ່ຽວກັບການໄປສະນີ, stratification, ທັງຫມົດທີ່ເຮັດໃຫ້ມັນເບິ່ງຄືວ່າດີຫຼາຍ.

ຫນ້າທໍາອິດ, ສົມມຸດຕິຖານການຄຸ້ມຄອງການຕອບສະຫນອງ, ທ່າອ່ຽງຄວາມມັກພາຍໃນກຸ່ມຈະກາຍເປັນໄປໄດ້ຫຼາຍເປັນຈໍານວນຂອງກຸ່ມເພີ່ມຂຶ້ນ. ແລະນັກວິໄຈຍັງບໍ່ໄດ້ຈໍາກັດກຸ່ມອີງໃສ່ພຽງແຕ່ໃນມິຕິພູມິພາກດຽວ. ສໍາລັບການຍົກຕົວຢ່າງ, ພວກເຮົາສາມາດສ້າງກຸ່ມຂຶ້ນຢູ່ກັບລັດ, ອາຍຸສູງສຸດ, ການຮ່ວມເພດ, ແລະລະດັບຂອງການສຶກສາ. ມັນເບິ່ງຄືວ່າເປັນໄປໄດ້ຫຼາຍວ່າບໍ່ມີທ່າອ່ຽງຄວາມມັກການຕອບສະຫນອງການຄຸ້ມຄອງພາຍໃນກຸ່ມຂອງ 18-29 ໄດ້, ຮຽນຈົບແມ່ຍິງ, ວິທະຍາໄລດໍາລົງຊີວິດໃນ Alaska ກ່ວາພາຍໃນກຸ່ມຂອງທັງຫມົດປະຊາຊົນດໍາລົງຊີວິດໃນ Alaska. ດັ່ງນັ້ນ, ເປັນຈໍານວນຂອງກຸ່ມນໍາໃຊ້ສໍາລັບການຕອບ stratification ການເພີ່ມຂຶ້ນຂອງ, ສົມມຸດຕິຖານທີ່ຈໍາເປັນເພື່ອສະຫນັບສະຫນູນມັນກາຍເປັນສົມເຫດສົມຜົນຫຼາຍ. ເນື່ອງຈາກຄວາມຈິງນີ້, ມັນເບິ່ງຄືວ່ານັກຄົ້ນຄວ້າຈະຕ້ອງການທີ່ຈະສ້າງເປັນຈໍານວນ huge ຂອງກຸ່ມສໍາລັບການຕອບ stratification. ແຕ່ວ່າ, ເປັນຈໍານວນຂອງກຸ່ມເພີ່ມຂຶ້ນ, ນັກຄົ້ນຄວ້າດໍາເນີນການເຂົ້າໄປໃນບັນຫາທີ່ແຕກຕ່າງກັນ: sparsity ຂໍ້ມູນ. ຖ້າຫາກວ່າມີພຽງແຕ່ຈໍານວນຂະຫນາດນ້ອຍຂອງປະຊາຊົນໃນແຕ່ລະກຸ່ມ, ຫຼັງຈາກນັ້ນການຄາດຄະເນຈະເປັນທີ່ບໍ່ແນ່ນອນຫລາຍຂຶ້ນ, ແລະໃນກໍລະນີທີ່ຮ້າ​​ຍບ່ອນທີ່ມີກຸ່ມທີ່ບໍ່ມີຜູ້ຕອບ, ຫຼັງຈາກນັ້ນໄປສະນີ, stratification ຫມົດ breaks ລົງ. ມີສອງວິທີອອກຈາກຄວາມກົດດັນປະກົດຂຶ້ນນີ້ລະຫວ່າງເຫດຜົນຂອງ homogeneous- ສົມມຸດຕິຖານການຕອບສະຫນອງ, ທ່າອ່ຽງຄວາມມັກພາຍໃນກຸ່ມແລະຄວາມຕ້ອງການສໍາລັບການຂະຫນາດຕົວຢ່າງສົມເຫດສົມຜົນໃນແຕ່ລະກຸ່ມທີ່ມີ. ວິທີການຫນຶ່ງແມ່ນເພື່ອຍ້າຍອອກໄປໃນຮູບແບບທາງສະຖິຕິຊັບຊ້ອນຫລາຍຂຶ້ນສໍາລັບການຄິດໄລ່ນ້ໍາແລະປະເທດອື່ນໆແມ່ນເພື່ອເກັບກໍາຂະຫນາດໃຫຍ່, ຕົວຢ່າງຫຼາກຫຼາຍຊະນິດ, ເຊິ່ງຈະຊ່ວຍໃຫ້ຮັບປະກັນຂະຫນາດຕົວຢ່າງສົມເຫດສົມຜົນໃນແຕ່ລະກຸ່ມ. ແລະນັກວິໄຈບາງຄັ້ງທັງສອງດ້ານ, ເປັນຂ້າພະເຈົ້າຈະອະທິບາຍໃນລາຍລະອຽດເພີ່ມເຕີມຂ້າງລຸ່ມນີ້.

ພິຈາລະນາຄັ້ງທີສອງໃນເວລາທີ່ເຮັດວຽກຮ່ວມກັບສະນີ, stratification ຈາກຕົວຢ່າງທີ່ບໍ່ແມ່ນອາດຈະແມ່ນວ່າສົມມຸດຕິຖານການຄຸ້ມຄອງການຕອບສະຫນອງ, ທ່າອ່ຽງຄວາມມັກພາຍໃນກຸ່ມແມ່ນແລ້ວເຮັດເລື້ອຍໆໃນເວລາການວິເຄາະຕົວຢ່າງອາດຈະ. ເຫດຜົນທີ່ວ່າສົມມຸດຕິຖານນີ້ເປັນສິ່ງຈໍາເປັນສໍາລັບຕົວຢ່າງຈະເປັນໃນການປະຕິບັດແມ່ນວ່າຕົວຢ່າງອາດຈະມີບໍ່ແມ່ນການຕອບສະຫນອງ, ແລະວິທີການທົ່ວໄປທີ່ສຸດສໍາລັບການດັດປັບສໍາລັບບໍ່ຕອບສະຫນອງເປັນຊ່ອງ post-stratification ເປັນອະທິບາຍຂ້າງເທິງນີ້. ແນ່ນອນ, ພຽງແຕ່ຍ້ອນວ່ານັກຄົ້ນຄວ້າຈໍານວນຫຼາຍເຮັດໃຫ້ມີການສົມມຸດຕິຖານສະເພາະໃດຫນຶ່ງບໍ່ໄດ້ຫມາຍຄວາມວ່າທ່ານຄວນຈະເຮັດມັນເກີນໄປ. ແຕ່, ມັນບໍ່ຫມາຍຄວາມວ່າໃນເວລາທີ່ຕົວຢ່າງທີ່ບໍ່ແມ່ນຫນ້າຈະເປັນຕົວຢ່າງຈະເປັນໃນການປະຕິບັດ, ພວກເຮົາຈະຕ້ອງຮັກສາຢູ່ໃນໃຈວ່າທັງສອງຂຶ້ນກັບການສົມມຸດຖານແລະຂໍ້ມູນຂ່າວສານຊ່ວຍໃນການຜະລິດຄາດຄະເນ. ໃນການປັບຄ່າຈິງທີ່ສຸດ, ມີພຽງແຕ່ບໍ່ມີວິທີການສົມມຸດຕິຖານໃນການຟຣີກັບ inference.

ສຸດທ້າຍ, ຖ້າຫາກວ່າທ່ານບົວລະບັດໃນກ່ຽວກັບການຫນຶ່ງຄາດຄະເນໂດຍສະເພາະແມ່ນໃນຕົວຢ່າງການຫວ່າງງານຂອງພວກເຮົາອັດຕາການຫຼັງຈາກນັ້ນທ່ານຈໍາເປັນຕ້ອງສະພາບດ້ອຍໂອກາດກວ່າສົມມຸດຕິຖານການຄຸ້ມຄອງການຕອບສະຫນອງ, ທ່າອ່ຽງຄວາມມັກພາຍໃນກຸ່ມໄດ້. ໂດຍສະເພາະ, ທ່ານບໍ່ຈໍາເປັນຕ້ອງສົມມຸດວ່າທຸກຄົນມີທ່າອ່ຽງຄວາມມັກການຕອບສະຫນອງດຽວກັນ, ທ່ານພຽງແຕ່ຕ້ອງການທີ່ຈະສົມມຸດວ່າມີການພົວພັນລະຫວ່າງທ່າອ່ຽງຄວາມມັກການຕອບສະຫນອງແລະອັດຕາການຫວ່າງງານໃນແຕ່ລະກຸ່ມທີ່ບໍ່ມີ. ແນ່ນອນ, ເຖິງແມ່ນວ່ານີ້ສະພາບດ້ອຍໂອກາດຈະບໍ່ຖືໃນບາງສະຖານະການ. ສໍາລັບການຍົກຕົວຢ່າງ, ຈິນຕະນາການຄາດຄະເນອັດຕາສ່ວນຂອງອາເມລິກາທີ່ເຮັດວຽກງານອາສາສະຫມັກໄດ້. ຖ້າຫາກວ່າປະຊາຊົນຜູ້ທີ່ເຮັດວຽກງານອາສາສະຫມັກແມ່ນມັກຈະຕົກລົງເຫັນດີທີ່ຈະຢູ່ໃນການສໍາຫຼວດ, ຫຼັງຈາກນັ້ນນັກວິໄຈຈະເປັນລະບົບໃນໄລຍະການປະເມີນຈໍານວນຂອງອາສາສະຫມັກ, ເຖິງແມ່ນວ່າຖ້າຫາກວ່າພວກເຂົາເຈົ້າເຮັດການປັບສະນີ, stratification, ຜົນທີ່ໄດ້ຮັບການສະແດງໃຫ້ເຫັນຕົວຈິງໂດຍ Abraham, Helms, and Presser (2009) .

ໃນຖານະເປັນຂ້າພະເຈົ້າໄດ້ກ່າວວ່າກ່ອນຫນ້ານັ້ນ, ຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນສາມາດເບິ່ງດ້ວຍຄວາມສົງໄສຍິ່ງໃຫຍ່ໂດຍການວິທະຍາສາດສັງຄົມ, ສ່ວນຫນຶ່ງແມ່ນຍ້ອນພາລະບົດບາດຂອງເຂົາເຈົ້າໃນບາງສ່ວນຂອງຄວາມລົ້ມເຫຼວທີ່ຫນ້າອັບອາຍທີ່ສຸດໃນມື້ທໍາອິດຂອງການຄົ້ນຄວ້າສໍາຫຼວດ. A ຍົກຕົວຢ່າງທີ່ຊັດເຈນຂອງວິທີການໄກພວກເຮົາໄດ້ມາພ້ອມກັບຕົວຢ່າງທີ່ບໍ່ແມ່ນອາດຈະເປັນການຄົ້ນຄວ້າຂອງ Wei Wang, David Rothschild, Sharad Goel, ແລະ Andrew Gelman ທີ່ຖືກຕ້ອງການຟື້ນຟູຜົນໄດ້ຮັບຂອງການເລືອກຕັ້ງສະຫະລັດປີ 2012 ການນໍາໃຊ້ເປັນຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນຂອງຜູ້ຊົມໃຊ້ອາເມລິກາ Xbox ໄດ້ -a ຕົວຢ່າງ decidedly ບໍ່ແມ່ນ Random ຂອງອາເມລິກາ (Wang et al. 2015) . ນັກຄົ້ນຄວ້າໄດ້ຮັບການບັນຈຸຕອບຈາກລະບົບເກມ XBox, ແລະຕາມທີ່ທ່ານອາດຈະຄາດຫວັງວ່າການ, ຕົວຢ່າງ Xbox ໄດ້ skewed ຊາຍແລະເບ້ຫນຸ່ມ: 18 - ອາຍຸ 29 ປີເຮັດໃຫ້ເຖິງ 19% ຂອງການເລືອກຕັ້ງແ​​ຕ່ 65% ຂອງຕົວຢ່າງ Xbox ແລະຜູ້ຊາຍເຮັດໃຫ້ເພີ່ມຂຶ້ນ 47% ຂອງການເລືອກຕັ້ງແ​​ລະ 93% ຂອງການອັບເດດຕົວຢ່າງ (ຮູບ 34). ເນື່ອງຈາກວ່າມີອະຄະຕິຂອງພົນລະເມືອງເຫຼົ່ານີ້ແຂງແຮງ, ຂໍ້ມູນ Xbox ວັດຖຸດິບເປັນຕົວຊີ້ວັດທີ່ທຸກຍາກຂອງການກັບຄືນການເລືອກຕັ້ງ. ມັນຄາດຄະເນໄຊຊະນະທີ່ເຂັ້ມແຂງສໍາລັບການ Mitt Romney ໃນໄລຍະ Barack ໂອບາມາ. ອີກເທື່ອຫນຶ່ງ, ນີ້ເປັນຕົວຢ່າງຂອງຄວາມອັນຕະລາຍຂອງວັດຖຸດິບ, ຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ unadjusted ຂອງຄົນອື່ນແລະເປັນທີ່ລະນຶກຂອງ fiasco ວັນນະຄະດີສໍາຄັນ.

ຕົວເລກ 34: ປະຊາກອນຂອງຜ້ຕອບຄໍາ Wang et al. (2015). ເນື່ອງຈາກວ່າຜູ້ທີ່ໄດ້ຮັບການຄັດເລືອກຈາກ XBox, ພວກເຂົາເຈົ້າມີແນວໂນ້ມທີ່ຈະໄວຫນຸ່ມແລະແນວໂນ້ມທີ່ຈະມີຜູ້ຊາຍ, ພີ່ນ້ອງກັບຜູ້ລົງຄະແນນໃນການເລືອກຕັ້ງ 2012.

ຕົວເລກ 34: ປະຊາກອນຂອງຜ້ຕອບຄໍາ Wang et al. (2015) . ເນື່ອງຈາກວ່າຜູ້ທີ່ໄດ້ຮັບການຄັດເລືອກຈາກ XBox, ພວກເຂົາເຈົ້າມີແນວໂນ້ມທີ່ຈະໄວຫນຸ່ມແລະແນວໂນ້ມທີ່ຈະມີຜູ້ຊາຍ, ພີ່ນ້ອງກັບຜູ້ລົງຄະແນນໃນການເລືອກຕັ້ງ 2012.

ຢ່າງໃດກໍຕາມ, Wang ແລະເພື່ອນຮ່ວມງານໄດ້ຮັບຮູ້ເຖິງບັນຫາເຫຼົ່ານີ້ແລະພະຍາຍາມນ້ໍາຕອບທີ່ຖືກຕ້ອງສໍາລັບຂະບວນການເກັບຕົວຢ່າງໄດ້. ໂດຍສະເພາະ, ພວກເຂົາເຈົ້ານໍາໃຊ້ຮູບແບບ sophisticated ຫຼາຍຂອງການຕອບ stratification ຂ້າພະເຈົ້າບອກທ່ານກ່ຽວກັບ. ມັນແມ່ນຕົກເປັນມູນຄ່າການຮຽນຮູ້ເລັກນ້ອຍກ່ຽວກັບວິທີການຂອງເຂົາເຈົ້າເນື່ອງຈາກວ່າມັນສ້າງ intuition ກ່ຽວກັບ post-stratification, ແລະການສະບັບໂດຍສະເພາະ Wang ແລະເພື່ອນຮ່ວມງານນໍາໃຊ້ເປັນຫນຶ່ງໃນວິທີການທີ່ຫນ້າຕື່ນເຕັ້ນຫຼາຍທີ່ສຸດຕົວຢ່າງທີ່ບໍ່ແມ່ນຫນ້າຈະເປັນນ້ໍາ.

ໃນຕົວຢ່າງທີ່ງ່າຍດາຍຂອງພວກເຮົາກ່ຽວກັບການຄາດຄະເນການຫວ່າງງານໃນພາກ 341, ພວກເຮົາແບ່ງປະຊາກອນເປັນກຸ່ມໂດຍອີງໃສ່ສະຖານະຂອງທີ່ຢູ່ອາໄສ. ໃນທາງກົງກັນຂ້າມ, Wang ແລະເພື່ອນຮ່ວມງານແບ່ງອອກປະຊາກອນເຂົ້າໄປໃນເປັນ 176.256 ກຸ່ມກໍານົດໂດຍ: ບົດບາດຍິງຊາຍ (2 ປະເພດ), ເຊື້ອຊາດ (4 ປະເພດ), ອາຍຸສູງສຸດ (4 ປະເພດ), ການສຶກສາ (4 ປະເພດ), ລັດ (51 ປະເພດ), ID ພັກ (3 ປະເພດ), ອຸດົມການ (3 ປະເພດ) ແລະ 2008 ລົງຄະແນນສຽງ (3 ປະເພດ). ກັບກຸ່ມຫຼາຍ, ນັກຄົ້ນຄວ້າໄດ້ຫວັງວ່າມັນຈະເປັນການອາດຈະເພີ່ມຂຶ້ນຢູ່ພາຍໃນແຕ່ລະກຸ່ມ, ການຕອບສະຫນອງທ່າອ່ຽງຄວາມມັກແມ່ນ uncorrelated ກັບສະຫນັບສະຫນູນສໍາລັບໂອບາມາ. ຕໍ່ໄປ, ແທນທີ່ຈະກ່ວາການກໍ່ສ້າງນ້ໍາບຸກຄົນໃນລະດັບ, ດັ່ງທີ່ພວກເຮົາໄດ້ຢູ່ໃນຕົວຢ່າງຂອງພວກເຮົາ, Wang ແລະເພື່ອນຮ່ວມງານຂອງການນໍາໃຊ້ຮູບແບບສະລັບສັບຊ້ອນທີ່ຈະປະເມີນອັດຕາສ່ວນຂອງປະຊາຊົນໃນແຕ່ລະກຸ່ມທີ່ຈະລົງຄະແນນສຽງສໍາລັບໂອບາມາ. ສຸດທ້າຍ, ພວກເຂົາເຈົ້າອະນຸຍາດຂອງການຄາດຄະເນກຸ່ມເຫຼົ່ານີ້ຂອງສະຫນັບສະຫນູນທີ່ມີຂະຫນາດເປັນທີ່ຮູ້ຈັກຂອງແຕ່ລະກຸ່ມການຜະລິດໃນລະດັບໂດຍລວມຄາດຄະເນຂອງສະຫນັບສະຫນູນ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ພວກເຂົາເຈົ້າຕັດປະຊາກອນເປັນກຸ່ມທີ່ແຕກຕ່າງກັນ, ການຄາດຄະເນສະຫນັບສະຫນູນສໍາລັບໂອບາມາໃນແຕ່ລະກຸ່ມ, ແລະຫຼັງຈາກນັ້ນໄດ້ສະເລ່ຍນ້ໍາຫນັກປະມານກຸ່ມການຜະລິດເປັນການຄາດຄະເນໂດຍລວມ.

ດັ່ງນັ້ນ, ໃນສິ່ງທີ່ທ້າທາຍຂະຫນາດໃຫຍ່ໃນວິທີການຂອງເຂົາເຈົ້າແມ່ນເພື່ອປະເມີນສະຫນັບສະຫນູນສໍາລັບໂອບາມາໃນແຕ່ລະເຫຼົ່ານີ້ 176.256 ກຸ່ມ. ເຖິງແມ່ນວ່າຄະນະກໍາມະຂອງເຂົາເຈົ້າລວມ 345.858 ຜູ້ເຂົ້າຮ່ວມເປັນເອກະລັກ, ເປັນຈໍານວນ huge ໂດຍມາດຕະຖານຂອງການສໍາຫລວດການເລືອກຕັ້ງ, ມີຈໍານວນຫຼາຍ, ກຸ່ມຈໍານວນຫຼາຍສໍາລັບການທີ່ Wang ແລະເພື່ອນຮ່ວມງານມີເກືອບບໍ່ມີຜູ້ຕອບ. ເພາະສະນັ້ນ, ເພື່ອປະເມີນສະຫນັບສະຫນູນໃນແຕ່ລະກຸ່ມພວກເຂົາເຈົ້ານໍາໃຊ້ວິທີທີ່ເອີ້ນວ່າ regression multilevel ກັບຕອບ stratification, ຊຶ່ງນັກຄົ້ນຄວ້າດ້ວຍຄວາມຮັກໂທຫາທ່ານ P. ເປັນ, ເພື່ອປະເມີນສະຫນັບສະຫນູນສໍາລັບໂອບາມາພາຍໃນກຸ່ມສະເພາະໃດ, ຫນອງທ່ານ P. ຂໍ້ມູນຈາກຈໍານວນຫຼາຍ ກຸ່ມທີ່ກ່ຽວຂ້ອງຢ່າງໃກ້ຊິດ. ສໍາລັບການຍົກຕົວຢ່າງ, ພິຈາລະນາສິ່ງທີ່ທ້າທາຍຂອງການຄາດຄະເນສະຫນັບສະຫນູນສໍາລັບໂອບາມາໃນບັນດາແມ່ຍິງ, Hispanics ໄດ້, ລະຫວ່າງ 18-29 ປີອາຍຸ, ຜູ້ທີ່ຮຽນຈົບວິທະຍາໄລ, ຜູ້ທີ່ໄດ້ລົງທະບຽນຊາທິປະໄຕ, ຜູ້ທີ່ຕົນເອງກໍານົດເປັນກາງ, ແລະຜູ້ທີ່ voted ສໍາລັບໂອບາມາໃນປີ 2008 ນີ້ ເປັນກຸ່ມຫຼາຍ, ເພາະຫຼາຍ, ແລະມັນເປັນໄປໄດ້ວ່າບໍ່ມີໃຜຢູ່ໃນຕົວຢ່າງທີ່ມີລັກສະນະເຫຼົ່ານີ້. ເພາະສະນັ້ນ, ເພື່ອເຮັດໃຫ້ການຄາດຄະເນກ່ຽວກັບກຸ່ມນີ້, ຫນອງທ່ານ P. ກັນການຄາດຄະເນຈາກປະຊາຊົນໃນກຸ່ມທີ່ຄ້າຍຄືກັນຫຼາຍ.

ການນໍາໃຊ້ຍຸດທະສາດການວິເຄາະນີ້, Wang ແລະເພື່ອນຮ່ວມງານໄດ້ສາມາດນໍາໃຊ້ຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ XBox ເພື່ອປະເມີນຢ່າງໃກ້ຊິດສະຫນັບສະຫນູນທັງຫມົດທີ່ທ່ານໂອບາມາໄດ້ຮັບໃນການເລືອກຕັ້ງສະພາ 2012 (ຮູບສະແດງ 35). ໃນຄວາມເປັນຈິງການຄາດຄະເນຂອງເຂົາເຈົ້າໄດ້ຖືກຕ້ອງຫຼາຍກ່ວາລວມຂອງຄວາມຄິດຄວາມເຫັນສາທາລະນະເປັນ. ດັ່ງນັ້ນ, ໃນກໍລະນີນີ້, ນ້ໍາ, ໂດຍສະເພາະທ່ານ P. , ເບິ່ງຄືວ່າຈະເຮັດວຽກເຮັດງານທໍາທີ່ດີແກ້ໄຂອະຄະຕິໃນຂໍ້ມູນທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້; ອະຄະຕິທີ່ສັງເກດເຫັນໃນເວລາທີ່ທ່ານຊອກຫາຢູ່ໃນການຄາດຄະເນຈາກຂໍ້ມູນ Xbox unadjusted ໄດ້.

ຕົວເລກ 35: ການຄາດຄະເນຈາກ Wang et al. (2015). ຕົວຢ່າງ XBox Unadjusted ຜະລິດຄາດຄະເນທີ່ບໍ່ຖືກຕ້ອງ. ແຕ່ວ່າ, ຕົວຢ່າງ XBox ນ້ໍາການຜະລິດຄາດວ່າຈະໄດ້ຖືກຕ້ອງຫຼາຍກ່ວາໂດຍສະເລ່ຍຂອງການສໍາຫຼວດໂທລະສັບຄວາມຫນ້າຈະເປັນພື້ນຖານ.

ຕົວເລກ 35: ການຄາດຄະເນຈາກ Wang et al. (2015) . ຕົວຢ່າງ XBox Unadjusted ຜະລິດຄາດຄະເນທີ່ບໍ່ຖືກຕ້ອງ. ແຕ່ວ່າ, ຕົວຢ່າງ XBox ນ້ໍາການຜະລິດຄາດວ່າຈະໄດ້ຖືກຕ້ອງຫຼາຍກ່ວາໂດຍສະເລ່ຍຂອງການສໍາຫຼວດໂທລະສັບຄວາມຫນ້າຈະເປັນພື້ນຖານ.

ມີສອງບົດຮຽນທີ່ສໍາຄັນຈາກການສຶກສາຂອງ Wang ແລະເພື່ອນຮ່ວມງານແມ່ນ. ຫນ້າທໍາອິດ, ຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ unadjusted ສາມາດນໍາໄປສູ່ການປະມານການບໍ່ດີ; ນີ້ເປັນບົດຮຽນທີ່ນັກຄົ້ນຄວ້າຫຼາຍຄົນທີ່ໄດ້ຍິນມາກ່ອນ. ຢ່າງໃດກໍຕາມ, ບົດຮຽນທີສອງແມ່ນວ່າຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ, ໃນເວລາທີ່ນ້ໍາຢ່າງຖືກຕ້ອງ, ສາມາດຕົວຈິງແລ້ວການຜະລິດຄາດຄະເນທີ່ດີທີ່ຂ້ອນຂ້າງ. ໃນຄວາມເປັນຈິງ, ການຄາດຄະເນຂອງເຂົາເຈົ້າໄດ້ຖືກຕ້ອງຫຼາຍກ່ວາການຄາດຄະເນຈາກ pollster.com, ການລວບລວມຂອງໂພເລືອກຕັ້ງປະເພນີຫຼາຍ.

ສຸດທ້າຍ, ມີຂໍ້ຈໍາກັດທີ່ສໍາຄັນກັບສິ່ງທີ່ພວກເຮົາສາມາດຮຽນຮູ້ຈາກນີ້ການສຶກສາສະເພາະແມ່ນຫນຶ່ງ. ພຽງແຕ່ເນື່ອງຈາກວ່າຕອບ stratification ເຮັດວຽກໄດ້ດີໃນກໍລະນີນີ້ໂດຍສະເພາະແມ່ນການຮັບປະກັນວ່າມັນຈະເຮັດວຽກໄດ້ດີໃນກໍລະນີອື່ນໆທີ່ບໍ່ມີ. ໃນຄວາມເປັນຈິງ, ການເລືອກຕັ້ງແ​​ມ່ນບາງທີອາດມີຫນຶ່ງໃນການຕັ້ງຄ່າທີ່ງ່າຍທີ່ສຸດເນື່ອງຈາກວ່າຜົນສໍາລວດໄດ້ຮັບການສຶກສາການເລືອກຕັ້ງສໍາລັບການເກືອບ 100 ປີ, ມີຄວາມຄິດເຫັນເປັນປົກກະຕິ (ພວກເຮົາສາມາດເບິ່ງທີ່ wins ການເລືອກຕັ້ງ), ແລະການກໍານົດພັກແລະຄຸນລັກສະນະຂອງພົນລະເມືອງແມ່ນຂ້ອນຂ້າງຄາດຄະເນຂອງຄະແນນສຽງ. ໃນຈຸດນີ້, ເຮົາບໍ່ມີທິດສະດີທີ່ຫມັ້ນຄົງແລະປະສົບການຕົວຈິງທີ່ຈະຮູ້ວ່າໃນເວລາທີ່ການຊັ່ງຊາປັບຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນຈະຜະລິດຕະພັນການຄາດຄະເນທີ່ຖືກຕ້ອງພຽງພໍ. ຫນຶ່ງໃນສິ່ງທີ່ເປັນທີ່ຈະແຈ້ງ, ຢ່າງໃດກໍຕາມ, ຖ້າຫາກວ່າທ່ານຖືກບັງຄັບໃຫ້ເຮັດວຽກທີ່ມີຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ, ຫຼັງຈາກນັ້ນບໍ່ມີເຫດຜົນທີ່ເຂັ້ມແຂງທີ່ຈະເຊື່ອວ່າການຄາດຄະເນການປັບປຸງຈະດີກ່ວາການຄາດຄະເນທີ່ບໍ່ແມ່ນປັບ.