ອາຍຸສູງສຸດຂອງດິຈິຕອນແມ່ນເຮັດໃຫ້ການທົດລອງຄວາມເປັນໄປໄດ້ໃນການປະຕິບັດທີ່ຫນັກແຫນ້ນແລະກໍາລັງສ້າງໂອກາດໃຫມ່ສໍາລັບຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້.
ໃນປະຫວັດສາດຂອງຕົວຢ່າງ, ມີສອງວິທີການແຂ່ງຂັນ: ວິທີການຕົວຢ່າງການທົດລອງຄວາມເປັນໄປໄດ້ແລະວິທີການຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້. ເຖິງແມ່ນວ່າວິທີການທັງສອງໄດ້ຖືກນໍາໃຊ້ໃນຊ່ວງຕົ້ນໆຂອງການສໍາຫຼວດ, ການທົດລອງການຄາດຄະເນອາດຈະເປັນໄປໄດ້, ແລະນັກຄົ້ນຄວ້າສັງຄົມຈໍານວນຫຼາຍໄດ້ຖືກສອນເພື່ອເບິ່ງຕົວຢ່າງທີ່ບໍ່ອາດຈະເກີດຂື້ນກັບຄວາມບໍ່ຄ່ອຍເຊື່ອງ່າຍໆ. ຢ່າງໃດກໍຕາມ, ດັ່ງທີ່ຂ້າພະເຈົ້າຈະອະທິບາຍຂ້າງລຸ່ມນີ້, ການປ່ຽນແປງທີ່ສ້າງຂື້ນໂດຍອາຍຸດິຈິຕອນຫມາຍຄວາມວ່າມັນແມ່ນເວລາສໍາລັບນັກຄົ້ນຄວ້າທີ່ຈະພິຈາລະນາຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້. ໂດຍສະເພາະແມ່ນ, ຕົວຢ່າງການທົດລອງຄວາມເປັນໄປໄດ້ໄດ້ຮັບການຍາກທີ່ຈະເຮັດໃນການປະຕິບັດ, ແລະຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້ຮັບຄວາມໄວ, ລາຄາຖືກແລະດີກວ່າເກົ່າ. ການສໍາຫຼວດໄວແລະລາຄາຖືກກວ່າບໍ່ພຽງແຕ່ສິ້ນສຸດລົງດ້ວຍຕົນເອງ: ພວກເຂົາເຮັດໃຫ້ໂອກາດໃຫມ່ເຊັ່ນການສໍາຫຼວດເລື້ອຍໆແລະຂະຫນາດຕົວຢ່າງຂະຫນາດໃຫຍ່. ຕົວຢ່າງ: ໂດຍການນໍາໃຊ້ວິທີການທີ່ບໍ່ສາມາດຄາດຄະເນໄດ້, ການສຶກສາການເລືອກຕັ້ງສະພາການຮ່ວມມືສາກົນ (CCES) ສາມາດມີຜູ້ເຂົ້າຮ່ວມປະມານ 10 ເທື່ອກວ່ານັກສຶກສາກ່ອນຫນ້າໂດຍນໍາໃຊ້ຕົວເລກການຄາດຄະເນ. ຕົວຢ່າງຂະຫນາດໃຫຍ່ນີ້ເຮັດໃຫ້ນັກຄົ້ນຄວ້າທາງດ້ານການເມືອງສາມາດຮຽນຮູ້ການປ່ຽນແປງໃນທັດສະນະແລະພຶດຕິກໍາໃນກຸ່ມຍ່ອຍແລະສະພາບສັງຄົມ. ນອກຈາກນັ້ນ, ຂະຫນາດທີ່ເພີ່ມຂຶ້ນທັງຫມົດນີ້ມາໂດຍບໍ່ມີການຫຼຸດລົງໃນຄຸນນະພາບຂອງການຄາດຄະເນ (Ansolabehere and Rivers 2013) .
ໃນປັດຈຸບັນ, ວິທີການເດັ່ນສໍາລັບການສໍາຫຼວດສໍາລັບການຄົ້ນຄວ້າທາງດ້ານສັງຄົມແມ່ນ ການທົດສອບຄວາມເປັນໄປໄດ້ . ໃນຕົວຢ່າງການຄາດຄະເນ, ສະມາຊິກຂອງປະຊາກອນເປົ້າຫມາຍທັງຫມົດມີຄວາມເປັນໄປໄດ້ທີ່ຮູ້ຈັກ, ບໍ່ແມ່ນເຊື້ອ, ແລະທຸກຄົນທີ່ຖືກທົດສອບຕອບສະຫນອງຕໍ່ການສໍາຫຼວດ. ໃນເວລາທີ່ເງື່ອນໄຂເຫຼົ່ານີ້ຖືກພົບ, ຜົນສະທ້ອນທາງເສດຖະກິດທີ່ສະຫງ່າງາມສະຫນອງການຮັບປະກັນກ່ຽວກັບຄວາມສາມາດຂອງນັກຄົ້ນຄວ້າໃນການນໍາໃຊ້ຕົວຢ່າງເພື່ອເຮັດໃຫ້ຂໍ້ມູນກ່ຽວກັບປະຊາກອນເປົ້າຫມາຍ.
ໃນໂລກທີ່ແທ້ຈິງ, ແນວໃດກໍ່ຕາມ, ເງື່ອນໄຂທີ່ຢູ່ພາຍໃຕ້ຜົນສະທ້ອນເຫຼົ່ານີ້ແມ່ນບໍ່ຄ່ອຍພົບ. ຕົວຢ່າງ, ມັກຈະມີຂໍ້ຜິດພາດກ່ຽວກັບການຄຸ້ມຄອງແລະບໍ່ຕອບສະຫນອງ. ເນື່ອງຈາກບັນຫາເຫຼົ່ານີ້, ນັກຄົ້ນຄ້ວາມັກຈະຕ້ອງໃຊ້ການປັບຕົວສະຖິຕິຕ່າງໆເພື່ອເຮັດໃຫ້ການຄິດໄລ່ຈາກຕົວຢ່າງຂອງພວກເຂົາໄປສູ່ປະຊາກອນເປົ້າຫມາຍຂອງພວກເຂົາ. ດັ່ງນັ້ນ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະແຍກແຍະລະຫວ່າງ ການເກັບຕົວຢ່າງທີ່ສົມເຫດສົມຜົນໃນທິດສະດີ ເຊິ່ງມີການຮັບປະກັນທາງທິດສະດີຢ່າງແຂງແຮງແລະ ການທົດລອງທີ່ອາດຈະເປັນການປະຕິບັດ ທີ່ບໍ່ມີການຮັບປະກັນດັ່ງກ່າວແລະແມ່ນຂຶ້ນກັບການປັບຕົວສະຖິຕິຕ່າງໆ.
ໃນໄລຍະເວລາ, ຄວາມແຕກຕ່າງລະຫວ່າງຕົວຢ່າງການທົດລອງໃນການທົດລອງທາງທິດສະດີແລະການທົດລອງຄວາມເປັນໄປໄດ້ໃນການປະຕິບັດໄດ້ເພີ່ມຂື້ນ. ຕົວຢ່າງ, ອັດຕາການຕອບສະຫນອງຕໍ່ການຕອບສະຫນອງແມ່ນເພີ່ມຂຶ້ນຢ່າງຕໍ່ເນື່ອງ, ເຖິງແມ່ນວ່າໃນການສໍາຫຼວດທີ່ມີຄຸນນະພາບສູງແລະລາຄາແພງ (ຮູບທີ່ 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . ອັດຕາການຕອບສະຫນອງແມ່ນມີຫຼາຍຂຶ້ນໃນການສໍາຫຼວດໂທລະສັບທາງທຸລະກິດ - ບາງຄັ້ງເຖິງ 90% (Kohut et al. 2012) . ການເພີ່ມຂຶ້ນຂອງການຕອບສະຫນອງຄວາມບໍ່ມີການທົບທວນໄພຂົ່ມຂູ່ເຖິງຄຸນະພາບຂອງການຄາດຄະເນຍ້ອນວ່າການຄາດຄະເນຂຶ້ນຫຼາຍຂຶ້ນກັບຕົວແບບສະຖິຕິທີ່ນັກວິທະຍາສາດນໍາໃຊ້ເພື່ອປັບປຸງການຕອບສະຫນອງ. ນອກຈາກນັ້ນ, ການຫຼຸດລົງຂອງຄຸນນະພາບໄດ້ເກີດຂຶ້ນເຖິງແມ່ນວ່າຄວາມພະຍາຍາມທີ່ມີລາຄາແພງຫຼາຍໂດຍນັກຄົ້ນຄວ້າສໍາຫຼວດເພື່ອຮັກສາອັດຕາການຕອບສະຫນອງສູງ. ບາງຄົນມີຄວາມຢ້ານກົວວ່າແນວໂນ້ມຄູ່ແຝງເຫຼົ່ານີ້ຂອງການຫຼຸດລົງໃນຄຸນະພາບແລະການເພີ່ມຂຶ້ນຂອງຄ່າໃຊ້ຈ່າຍຈະເປັນໄພຂົ່ມຂູ່ຕໍ່ພື້ນຖານຂອງການສໍາຫຼວດການຄົ້ນຄວ້າ (National Research Council 2013)
ໃນເວລາດຽວກັນວ່າມີຄວາມຫຍຸ້ງຍາກທີ່ເພີ່ມຂຶ້ນສໍາລັບວິທີການຕົວຢ່າງການທົດລອງຄວາມເປັນໄປໄດ້, ຍັງມີການພັດທະນາທີ່ຫນ້າຕື່ນເຕັ້ນໃນ ວິທີການຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງ ໄດ້. ມີແນວພັນທີ່ແຕກຕ່າງກັນຂອງວິທີການຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້, ແຕ່ສິ່ງຫນຶ່ງທີ່ພວກເຂົາມີຢູ່ຮ່ວມກັນແມ່ນວ່າພວກເຂົາບໍ່ສາມາດເຂົ້າໃຈງ່າຍໃນຂອບຂອງຄະນິດສາດຂອງການທົດລອງຄວາມເປັນໄປໄດ້ (Baker et al. 2013) . ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ໃນວິທີການຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້, ທຸກໆຄົນບໍ່ມີຄວາມເປັນທີ່ຮູ້ຈັກແລະອາດຈະບໍ່ລວມກັນ. ວິທີການຕົວເລກທີ່ບໍ່ສາມາດຄາດຄະເນໄດ້ມີຊື່ສຽງທີ່ຮ້າຍແຮງລະຫວ່າງນັກຄົ້ນຄວ້າສັງຄົມແລະພວກເຂົາເຈົ້າແມ່ນກ່ຽວຂ້ອງກັບຄວາມລົ້ມເຫລວທີ່ສຸດຂອງນັກຄົ້ນຄວ້າການສໍາຫຼວດເຊັ່ນ: ຄວາມລົ້ມເຫລວຂອງ Literary Digest (ເວົ້າກ່ອນຫນ້ານີ້) ແລະ "Dewey Defeats Truman", ການຄາດຄະເນທີ່ບໍ່ຖືກຕ້ອງກ່ຽວກັບສະຫະຣັດ ການເລືອກຕັ້ງປະທານາທິບໍດີປີ 1948 (ສະບັບທີ 3.6).
ຮູບແບບຫນຶ່ງຂອງຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງທີ່ເຫມາະສົມກັບອາຍຸຂອງດິຈິຕອນແມ່ນການນໍາໃຊ້ຂອງ ຫມູ່ຄະນະອອນໄລນ໌ . ນັກຄົ້ນຄວ້ານໍາໃຊ້ຄະນະກໍາມະການອອນໄລນ໌ແມ່ນຂຶ້ນກັບຜູ້ໃຫ້ບໍລິການບາງກຸ່ມ - ໂດຍປົກກະຕິແມ່ນບໍລິສັດ, ລັດຖະບານຫຼືມະຫາວິທະຍາໄລ - ກໍ່ສ້າງກຸ່ມທີ່ມີຄວາມຫຼາກຫຼາຍແລະມີຄວາມຫຼາກຫຼາຍທີ່ເປັນຜູ້ຕອບແບບສໍາຫຼວດ. ຜູ້ເຂົ້າຮ່ວມຂອງຜູ້ພິພາກສາເຫຼົ່ານີ້ມັກຈະໄດ້ຮັບການແຕ່ງຕັ້ງໂດຍນໍາໃຊ້ວິທີການຕ່າງໆທີ່ແຕກຕ່າງກັນເຊັ່ນໂຄສະນາປ້າຍໂຄສະນາອອນລາຍ. ຫຼັງຈາກນັ້ນ, ນັກຄົ້ນຄວ້າສາມາດຈ່າຍຜູ້ໃຫ້ບໍລິການກະດານເພື່ອເຂົ້າເຖິງຕົວຢ່າງຂອງຜູ້ຕອບທີ່ມີຄຸນລັກສະນະທີ່ຕ້ອງການ (ຕົວຢ່າງ, ຜູ້ຕາງຫນ້າໃນປະເທດຂອງຜູ້ໃຫຍ່). ຫມູ່ຄະນະອອນໄລນ໌ເຫຼົ່ານີ້ແມ່ນວິທີການທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ເພາະວ່າທຸກໆຄົນບໍ່ມີຄວາມເປັນທີ່ຮູ້ຈັກ, ອາດຈະບໍ່ລວມເອົາ. ເຖິງແມ່ນວ່າຄະນະກໍາມະການທາງສັງຄົມທີ່ບໍ່ສາມາດຄາດຄະເນໄດ້ຖືກນໍາໃຊ້ໂດຍນັກຄົ້ນຄວ້າສັງຄົມ (ຕົວຢ່າງເຊັ່ນ CCES), ຍັງມີການປຶກສາຫາລືກ່ຽວກັບຄຸນນະພາບຂອງການຄາດຄະເນທີ່ມາຈາກພວກເຂົາ (Callegaro et al. 2014) .
ເຖິງວ່າຈະມີການໂຕ້ວາທີເຫຼົ່ານີ້, ຂ້າພະເຈົ້າຄິດວ່າມີສອງເຫດຜົນວ່າເປັນຫຍັງເວລາເຫມາະສົມສໍາລັບນັກຄົ້ນຄວ້າສັງຄົມທີ່ຈະຄິດກ່ຽວກັບຕົວຢ່າງທີ່ບໍ່ສາມາດຄາດເດົາໄດ້. ຫນ້າທໍາອິດ, ໃນອາຍຸສູງສຸດດິຈິຕອນ, ມີການພັດທະນາຫຼາຍໃນການເກັບກໍາແລະການວິເຄາະຂອງຕົວຢ່າງທີ່ບໍ່ແມ່ນຕົວຄັກ. ວິທີການໃຫມ່ເຫຼົ່ານີ້ແມ່ນແຕກຕ່າງກັນຢ່າງພຽງພໍຈາກວິທີການທີ່ເຮັດໃຫ້ເກີດບັນຫາໃນອະດີດທີ່ຂ້ອຍຄິດວ່າມັນເປັນຄວາມຄິດທີ່ຈະຄິດວ່າມັນເປັນ "ການທົດລອງທີ່ບໍ່ສາມາດທົດລອງໄດ້ 2.0". ເຫດຜົນທີສອງທີ່ນັກຄົ້ນຄວ້າຄວນພິຈາລະນາການທົດລອງທີ່ບໍ່ສາມາດທົດລອງໄດ້ແມ່ນຍ້ອນວ່າ ການປະຕິບັດກາຍເປັນຄວາມຫຍຸ້ງຍາກຫຼາຍຂຶ້ນ. ໃນເວລາທີ່ມີອັດຕາການຕອບສະຫນອງທີ່ບໍ່ມີການຕອບສະຫນອງສູງ, ໃນເວລາທີ່ມີການສໍາຫຼວດທີ່ແທ້ຈິງ - ຄວາມເປັນຈິງຂອງການລວມເຂົ້າໃນຜູ້ຕອບແບບສໍາຫຼວດແມ່ນບໍ່ມີຄວາມຮູ້, ແລະດັ່ງນັ້ນ, ຕົວຢ່າງຄວາມເປັນໄປໄດ້ແລະຕົວຢ່າງທີ່ບໍ່ແມ່ນຕົວຄັກຈະບໍ່ແຕກຕ່າງກັນຍ້ອນນັກຄົ້ນຄວ້າຫຼາຍຄົນເຊື່ອ.
ດັ່ງທີ່ຂ້າພະເຈົ້າໄດ້ກ່າວມາກ່ອນຫນ້ານີ້, ຕົວຢ່າງທີ່ບໍ່ສາມາດຄາດຄະເນໄດ້ຖືກສັງເກດເຫັນດ້ວຍຄວາມບໍ່ຄ່ອຍເຊື່ອງ່າຍໆໂດຍນັກຄົ້ນຄວ້າສັງຄົມຫຼາຍໆຄົນ, ສ່ວນຫນຶ່ງແມ່ນຍ້ອນວ່າພວກເຂົາມີບົດບາດໃນບາງຢ່າງທີ່ຫນ້າຢ້ານກົວໃນອາທິດທໍາອິດຂອງການສໍາຫຼວດ. ຕົວຢ່າງທີ່ຊັດເຈນວ່າພວກເຮົາມາກັບຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ແມ່ນການຄົ້ນຄວ້າໂດຍ Wei Wang, David Rothschild, Sharad Goel, ແລະ Andrew Gelman (2015) ທີ່ໄດ້ກູ້ຄືນຜົນໄດ້ຮັບຂອງການເລືອກຕັ້ງສະຫະລັດໃນປີ 2012 ໂດຍໃຊ້ຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້ ຜູ້ໃຊ້ Xbox ຂອງອາເມຣິກາ - ເປັນຕົວຢ່າງທີ່ບໍ່ຖືກຕ້ອງຂອງຊາວອະເມຣິກັນ. ນັກຄົ້ນຄວ້າໄດ້ເລືອກຜູ້ຕອບຈາກລະບົບການຫລິ້ນເກມ XBox ແລະທ່ານອາດຈະຄາດຫວັງວ່າຕົວແບບ Xbox ທີ່ມີຊາຍຫນຸ່ມແລະຜູ້ທີ່ອ່ອນແອແມ່ນຜູ້ທີ່ມີອາຍຸ 18 ຫາ 29 ປີເຊິ່ງມີ 19% ຂອງຜູ້ເລືອກຕັ້ງແຕ່ 65% ຂອງຕົວຢ່າງ Xbox ແລະຜູ້ຊາຍ ເຮັດໃຫ້ເຖິງ 47% ຂອງຜູ້ເລືອກຕັ້ງແຕ່ 93% ຂອງຕົວຢ່າງ Xbox (ຮູບ 3.7). ເນື່ອງຈາກຄວາມໂປ່ງໃສທາງດ້ານປະຊາກອນທີ່ເຂັ້ມແຂງເຫຼົ່ານີ້, ຂໍ້ມູນ Xbox ດິບແມ່ນຕົວຊີ້ວັດທີ່ບໍ່ດີຂອງຜົນຕອບແທນການເລືອກຕັ້ງ. ມັນຄາດຄະເນວ່າໄຊຊະນະທີ່ສໍາຄັນສໍາລັບ Mitt Romney ໃນໄລຍະ Barack Obama. ອີກເທື່ອຫນຶ່ງ, ນີ້ແມ່ນຕົວຢ່າງອັນຫນຶ່ງຂອງອັນຕະລາຍຂອງຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ທີ່ບໍ່ຖືກຕ້ອງ, ແລະບໍ່ມີການປັບປຸງ, ແລະມັນແມ່ນຄວາມຈື່ຈໍາຂອງຄວາມລົ້ມເຫລວຂອງ Literary Digest .
ຢ່າງໃດກໍຕາມ, Wang ແລະເພື່ອນຮ່ວມງານໄດ້ຮັບຮູ້ເຖິງບັນຫາເຫຼົ່ານີ້ແລະພະຍາຍາມປັບປຸງສໍາລັບຂະບວນການຕົວຢ່າງທີ່ບໍ່ແມ່ນແບບສຸ່ມຂອງເຂົາເຈົ້າໃນເວລາທີ່ເຮັດໃຫ້ການຄາດຄະເນ. ໂດຍສະເພາະ, ພວກເຂົາເຈົ້າໄດ້ນໍາໃຊ້ ຂັ້ນຕອນການວາງແຜນ , ການໃຊ້ເຕັກນິກທີ່ຖືກນໍາໃຊ້ຢ່າງກວ້າງຂວາງເພື່ອປັບຕົວຕົວຢ່າງທີ່ອາດຈະມີຂໍ້ຜິດພາດແລະການບໍ່ຕອບຮັບ.
ແນວຄວາມຄິດຕົ້ນຕໍຂອງການຈັດວາງຫຼັງແມ່ນການນໍາໃຊ້ຂໍ້ມູນກ່ຽວກັບປະຊາຊົນເປົ້າຫມາຍເພື່ອຊ່ວຍປັບປຸງການຄາດຄະເນທີ່ມາຈາກຕົວຢ່າງ. ໃນເວລາທີ່ການນໍາໃຊ້ຂັ້ນຕອນການວາງແຜນເພື່ອເຮັດໃຫ້ການຄາດຄະເນຈາກຕົວຢ່າງທີ່ບໍ່ສາມາດທົດແທນຂອງພວກເຂົາ, Wang ແລະເພື່ອນຮ່ວມງານໄດ້ຕັດຈໍານວນປະຊາກອນອອກເປັນກຸ່ມທີ່ແຕກຕ່າງກັນ, ຄາດຄະເນການສະຫນັບສະຫນູນຂອງໂອບາມາໃນແຕ່ລະກຸ່ມ, ແລະຫຼັງຈາກນັ້ນໄດ້ຄາດຄະເນໂດຍສະເລ່ຍຂອງການຄາດຄະເນຂອງກຸ່ມທີ່ຈະຜະລິດປະມານ. ຕົວຢ່າງ, ພວກເຂົາສາມາດແບ່ງປັນປະຊາກອນເປັນສອງກຸ່ມ (ຜູ້ຊາຍແລະແມ່ຍິງ), ຄາດຄະເນການສະຫນັບສະຫນູນຂອງໂອບາມາໃນບັນດາຜູ້ຊາຍແລະຜູ້ຍິງ, ແລະຄາດຄະເນສະຫນັບສະຫນູນໂດຍທົ່ວໄປສໍາລັບໂອບາມາໂດຍການຄິດໄລ່ໂດຍສະເລ່ຍ, ເພີ່ມຂຶ້ນ 53% ຂອງຜູ້ເລືອກຕັ້ງແລະຜູ້ຊາຍ 47%. ຢ່າງຫຼວງຫຼາຍ, ການຈັດວາງຫຼັງຈາກການ stratification ຊ່ວຍແກ້ໄຂສໍາລັບຕົວຢ່າງທີ່ບໍ່ສົມເຫດສົມຜົນໂດຍນໍາເອົາຂໍ້ມູນຊ່ວຍກ່ຽວກັບຂະຫນາດຂອງກຸ່ມ.
ກຸນແຈສໍາຄັນຕໍ່ການຈັດວາງລະບົບແມ່ນເພື່ອສ້າງກຸ່ມທີ່ຖືກຕ້ອງ. ຖ້າທ່ານສາມາດຂຸດປະຊາກອນອອກເປັນກຸ່ມທີ່ມີຄວາມແຕກຕ່າງກັນດັ່ງນັ້ນຄວາມຄືບຫນ້າຂອງການຕອບສະຫນອງແມ່ນສໍາລັບທຸກໆຄົນໃນແຕ່ລະກຸ່ມ, ຫຼັງຈາກນັ້ນ, ການຈັດຕ່ໍາຫຼັງຈະມີການຄາດຄະເນທີ່ບໍ່ສົມເຫດສົມຜົນ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ການຍ່ອຍຫຼັງໂດຍເພດຈະຜະລິດການຄາດຄະເນທີ່ບໍ່ສົມເຫດສົມຜົນຖ້າຜູ້ຊາຍທັງຫມົດມີທັດສະນະຕອບໂຕ້ແລະແມ່ຍິງທຸກຄົນມີຄວາມໂປ່ງໃສດຽວກັນ. ການສົມມຸດຕິຖານນີ້ແມ່ນເອີ້ນວ່າການສົມມຸດຕິຖານ ແບບດຽວກັບກຸ່ມ , ແລະຂ້ອຍໄດ້ອະທິບາຍມັນຫຼາຍກວ່າໃນບັນທຶກຄະນິດສາດໃນຕອນທ້າຍຂອງບົດນີ້.
ແນ່ນອນ, ມັນເບິ່ງຄືວ່າບໍ່ແມ່ນວ່າຄວາມໂປ່ງໃສໃນການຕອບໂຕ້ຈະຄືກັນກັບຜູ້ຊາຍແລະແມ່ຍິງທັງຫມົດ. ເຖິງຢ່າງໃດກໍ່ຕາມ, ການສົມມຸດຕິຖານທີ່ມີຄວາມສອດຄ່ອງກັນ - ໃນການຕອບສະຫນອງຕໍ່ຄວາມຕ້ອງການຂອງກຸ່ມພາຍໃນກຸ່ມຈະເປັນໄປໄດ້ຫລາຍຂຶ້ນຍ້ອນວ່າຈໍານວນກຸ່ມເພີ່ມຂຶ້ນ. ປະມານ, ມັນຈະງ່າຍຂຶ້ນທີ່ຈະຕັດປະຊາກອນເຂົ້າໄປໃນກຸ່ມທີ່ເປັນກັນເອງຖ້າທ່ານສ້າງກຸ່ມຫຼາຍຂຶ້ນ. ຕົວຢ່າງເຊັ່ນມັນອາດເບິ່ງຄືວ່າບໍ່ສົມເຫດສົມຜົນທີ່ແມ່ຍິງທຸກຄົນມີຄວາມໂປ່ງໃສໃນການຕອບໂຕ້ດຽວກັນແຕ່ມັນອາດຈະເປັນໄປໄດ້ທີ່ວ່າມີຄວາມຕອບສະຫນອງດຽວກັນກັບແມ່ຍິງທັງຫມົດທີ່ມີອາຍຸ 18-29 ປີຜູ້ທີ່ຈົບການສຶກສາຈາກວິທະຍາໄລແລະຜູ້ທີ່ຢູ່ໃນຄາລິຟໍເນຍ ທີ່ຢູ່ ດັ່ງນັ້ນ, ຍ້ອນວ່າຈໍານວນກຸ່ມທີ່ນໍາໃຊ້ໃນການຈັດຕ່ໍາ stratification ໄດ້ຮັບການຂະຫຍາຍຕົວ, ສົມມຸດຕິຖານທີ່ຈໍາເປັນເພື່ອສະຫນັບສະຫນູນວິທີການທີ່ຈະກາຍເປັນສົມເຫດສົມຜົນຫຼາຍຂຶ້ນ. ເນື່ອງຈາກຄວາມເປັນຈິງນີ້, ນັກຄົ້ນຄ້ວາມັກຕ້ອງການສ້າງຈໍານວນກຸ່ມໃຫຍ່ໆສໍາລັບການຈັດວາງຫຼັງ. ຢ່າງໃດກໍຕາມ, ຍ້ອນວ່າຈໍານວນຂອງກຸ່ມເພີ່ມຂຶ້ນ, ນັກຄົ້ນຄວ້າຈະແລ່ນເຂົ້າໄປໃນບັນຫາທີ່ແຕກຕ່າງກັນຄື: ຂໍ້ມູນທີ່ຫຍາບຄາຍ. ຖ້າມີພຽງແຕ່ຈໍານວນຄົນນ້ອຍໃນແຕ່ລະກຸ່ມ, ຄາດວ່າການຄາດຄະເນຈະບໍ່ມີຄວາມແນ່ນອນ, ແລະໃນກໍລະນີທີ່ມີກຸ່ມທີ່ບໍ່ມີຜູ້ຕອບ, ຫຼັງຈາກນັ້ນ, ການວາງແຜນການຫລຸດລົງກໍ່ຈະຫມົດລົງ.
ມີສອງວິທີອອກຈາກຄວາມເຄັ່ງຕຶງທີ່ເກີດຂຶ້ນນີ້ລະຫວ່າງຄວາມສົມເຫດສົມຜົນຂອງການສົມມຸດຕິຖານທີ່ສອດຄ່ອງ - ຕອບສະຫນອງຕໍ່ຄວາມຕ້ອງການພາຍໃນກຸ່ມແລະຄວາມຕ້ອງການສໍາລັບຂະຫນາດຕົວຢ່າງສົມເຫດສົມຜົນໃນແຕ່ລະກຸ່ມ. ຫນ້າທໍາອິດ, ນັກຄົ້ນຄວ້າສາມາດເກັບຕົວຢ່າງທີ່ມີຂະຫນາດໃຫຍ່, ຫຼາຍ, ເຊິ່ງຊ່ວຍໃຫ້ແນ່ໃຈວ່າຂະຫນາດຕົວຢ່າງທີ່ສົມເຫດສົມຜົນໃນແຕ່ລະກຸ່ມ. ສອງ, ພວກເຂົາສາມາດນໍາໃຊ້ຮູບແບບສະຖິຕິທີ່ມີຄວາມທັນສະໄຫມຫຼາຍກວ່າເກົ່າເພື່ອເຮັດໃຫ້ການຄາດຄະເນພາຍໃນກຸ່ມ. ແລະໃນຕົວຈິງແລ້ວ, ບາງຄັ້ງນັກຄົ້ນຄວ້າເຮັດທັງສອງ, ຍ້ອນວ່າ Wang ແລະເພື່ອນຮ່ວມງານຂອງເຂົາເຈົ້າໄດ້ເຮັດການສຶກສາກ່ຽວກັບການເລືອກຕັ້ງໂດຍໃຊ້ຜູ້ຕອບແບບສອບຖາມຈາກ Xbox.
ເນື່ອງຈາກວ່າພວກເຂົາເຈົ້າໄດ້ນໍາໃຊ້ວິທີການຕົວຢ່າງທີ່ບໍ່ສາມາດນໍາໃຊ້ໄດ້ກັບການສໍາພາດໂດຍຄອມພິວເຕີ້ (ຂ້າພະເຈົ້າຈະເວົ້າກ່ຽວກັບການສໍາພາດກ່ຽວກັບຄອມພິວເຕີ້ໃນພາກ 3.5), Wang ແລະເພື່ອນຮ່ວມງານໄດ້ເກັບກໍາຂໍ້ມູນທີ່ລາຄາບໍ່ແພງເຊິ່ງຊ່ວຍໃຫ້ເຂົາເຈົ້າເກັບຂໍ້ມູນຈາກ 345,858 ຜູ້ເຂົ້າຮ່ວມເປັນເອກະລັກ , ເປັນຈໍານວນຫຼວງຫຼາຍໂດຍມາດຕະຖານຂອງການເລືອກຕັ້ງໃນການເລືອກຕັ້ງ. ຂະຫນາດຕົວຢ່າງຂະຫນາດໃຫຍ່ນີ້ໄດ້ເປີດໃຫ້ພວກມັນສ້າງຈໍານວນຂະຫນາດໃຫຍ່ຂອງກຸ່ມການຈັດວາງຫຼັງ. (4 ປະເພດ), ອາຍຸ (4 ປະເພດ), ການສຶກສາ (4 ປະເພດ), ປະເທດ (51 ປະເພດ), ID ຂອງພັກ (3 ປະເພດ), ideology (3 ປະເພດ) ແລະ 2008 vote (3 ປະເພດ). ໃນຄໍາສັບຕ່າງໆອື່ນ, ຂະຫນາດຕົວຢ່າງຂະຫນາດໃຫຍ່ຂອງພວກເຂົາ, ເຊິ່ງໄດ້ຖືກເປີດໃຊ້ໂດຍການເກັບກໍາຂໍ້ມູນທີ່ມີຄ່າໃຊ້ຈ່າຍຕ່ໍາ, ເຮັດໃຫ້ພວກເຂົາເຮັດໃຫ້ມີການສົມມຸດຖານທີ່ສົມເຫດສົມຜົນໃນຂະບວນການຄາດຄະເນຂອງພວກເຂົາ.
ເຖິງແມ່ນວ່າມີ 345,858 ຜູ້ເຂົ້າຮ່ວມເປັນເອກະລັກ, ຢ່າງໃດກໍຕາມ, ຍັງມີຈໍານວນຫຼາຍ, ຫຼາຍກຸ່ມທີ່ Wang ແລະເພື່ອນຮ່ວມງານມີເກືອບບໍ່ມີຜູ້ຕອບ. ດັ່ງນັ້ນ, ພວກເຂົາເຈົ້າໄດ້ນໍາໃຊ້ເຕັກນິກທີ່ເອີ້ນວ່າ ການ ເລື່ອນ multilevel ເພື່ອປະມານການສະຫນັບສະຫນູນໃນແຕ່ລະກຸ່ມ. ໂດຍພື້ນຖານແລ້ວ, ເພື່ອປະເມີນສະຫນັບສະຫນູນສໍາລັບໂອບາມາພາຍໃນກຸ່ມໃດຫນຶ່ງ, ການແກ້ໄຂ multilevel ໄດ້ລວມຂໍ້ມູນຈາກກຸ່ມທີ່ກ່ຽວຂ້ອງຢ່າງໃກ້ຊິດ. ສໍາລັບຕົວຢ່າງ, ຈິນຕະນາການຄາດຄະເນການສະຫນັບສະຫນູນຂອງໂອບາມາໃນບັນດາຜູ້ຍິງ Hispanic ໃນລະຫວ່າງ 18 ຫາ 29 ປີ, ຜູ້ທີ່ມີບັນດານັກສຶກສາທີ່ຈົບປະລິນຍາຕີ, ຜູ້ທີ່ຖືກລົງທະບຽນເປັນຜູ້ສະຫມັກສະມາຊິກ, ແລະຜູ້ທີ່ໄດ້ເລືອກເອົາໂອບາມາໃນປີ 2008. , ກຸ່ມທີ່ແນ່ນອນ, ແລະມັນກໍ່ເປັນໄປໄດ້ວ່າບໍ່ມີໃຜໃນຕົວຢ່າງທີ່ມີຄຸນລັກສະນະເຫຼົ່ານີ້. ດັ່ງນັ້ນ, ເພື່ອເຮັດໃຫ້ການຄາດຄະເນກ່ຽວກັບກຸ່ມນີ້, ການຟື້ນຟູ multilevel ໃຊ້ຮູບແບບສະຖິຕິເພື່ອສົມທົບການຄາດຄະເນຈາກຜູ້ທີ່ຢູ່ໃນກຸ່ມທີ່ຄ້າຍຄືກັນຫຼາຍ.
ດັ່ງນັ້ນ, Wang ແລະເພື່ອນຮ່ວມງານໄດ້ນໍາໃຊ້ວິທີການທີ່ລວມເອົາການຟື້ນຟູ multilevel ແລະ post-stratification, ດັ່ງນັ້ນພວກເຂົາໄດ້ຮຽກຮ້ອງໃຫ້ມີ ການແກ້ໄຂ multilevel ຍຸດທະສາດຂອງພວກເຂົາ ກັບ post stratification ຫຼື, more affectionately, "Mr. ໃນເວລາທີ່ທ່ານ Wang ແລະເພື່ອນຮ່ວມງານນໍາໃຊ້ທ່ານ P. ເພື່ອເຮັດໃຫ້ການຄາດຄະເນຈາກຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້, ພວກເຂົາເຈົ້າຜະລິດປະມານທີ່ໃກ້ຄຽງກັບການສະຫນັບສະຫນູນໂດຍລວມທີ່ທ່ານໂອບາມາໄດ້ຮັບໃນການເລືອກຕັ້ງປີ 2012 (ຮູບທີ 3.8). ໃນຄວາມເປັນຈິງ, ການຄາດຄະເນຂອງພວກເຂົາແມ່ນຖືກຕ້ອງຫຼາຍກວ່າການສໍາຫຼວດຄວາມຄິດເຫັນຂອງປະຊາຊົນແບບດັ້ງເດີມ. ດັ່ງນັ້ນ, ໃນກໍລະນີນີ້, ການດັດປັບສະຖິຕິໂດຍສະເພາະທ່ານ P. ເບິ່ງຄືວ່າເຮັດວຽກທີ່ດີທີ່ຈະແກ້ໄຂຄວາມບໍ່ສະຖຽນລະພາບໃນຂໍ້ມູນທີ່ບໍ່ສາມາດຄາດຄະເນໄດ້; ຄວາມບໍ່ສະຫງົບທີ່ເຫັນໄດ້ຊັດເຈນເມື່ອທ່ານເບິ່ງການຄາດຄະເນຈາກຂໍ້ມູນ Xbox ທີ່ບໍ່ຖືກປັບ.
ມີສອງບົດຮຽນຫລັກຈາກການສຶກສາຂອງ Wang ແລະເພື່ອນຮ່ວມງານ. ຫນ້າທໍາອິດ, ຕົວຢ່າງທີ່ບໍ່ສາມາດປັບຕົວທີ່ບໍ່ຖືກຕ້ອງສາມາດນໍາໄປສູ່ການຄາດຄະເນທີ່ບໍ່ດີ; ນີ້ແມ່ນບົດຮຽນທີ່ນັກຄົ້ນຄວ້າຈໍານວນຫຼາຍໄດ້ຍິນມາກ່ອນ. ບົດຮຽນທີສອງ, ຢ່າງໃດກໍຕາມ, ແມ່ນວ່າຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້, ໃນເວລາທີ່ໄດ້ຖືກວິເຄາະຢ່າງຖືກຕ້ອງ, ກໍ່ສາມາດຜະລິດປະມານການທີ່ດີ; ຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມຄາດຫວັງຕ້ອງບໍ່ອັດຕະໂນມັດນໍາໄປສູ່ສິ່ງທີ່ຄ້າຍຄືກັບຄວາມລົ້ມເຫລວຂອງ ຫນັງສື .
ຖ້າທ່ານກໍາລັງພະຍາຍາມຕັດສິນໃຈເລືອກເອົາວິທີການຕົວຢ່າງທີ່ເປັນໄປໄດ້ແລະວິທີການຕົວເລກທີ່ບໍ່ສາມາດຄາດຄະເນໄດ້ທ່ານຈະຕ້ອງມີທາງເລືອກທີ່ຍາກທີ່ສຸດ. ບາງຄັ້ງນັກຄົ້ນຄວ້າຕ້ອງການກົດລະບຽບທີ່ໄວແລະ rigid (ຕົວຢ່າງເຊັ່ນນໍາໃຊ້ວິທີການທົດລອງຄວາມເປັນໄປໄດ້) ແຕ່ວ່າມັນເປັນການຍາກທີ່ຈະສະເຫນີກົດລະບຽບດັ່ງກ່າວ. ນັກຄົ້ນຄວ້າຈະປະເຊີນກັບການເລືອກທີ່ມີຄວາມຫຍຸ້ງຍາກລະຫວ່າງວິທີການຕົວຢ່າງການທົດລອງໃນການປະຕິບັດ - ທີ່ມີລາຄາແພງຂຶ້ນແລະໄກຈາກຜົນໄດ້ຮັບທິດສະດີທີ່ເຫມາະສົມກັບການນໍາໃຊ້ແລະວິທີການຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມຫນ້າເຊື່ອຖື - ທີ່ມີລາຄາຖືກແລະໄວກ່ວາ, ແຕ່ບໍ່ຄຸ້ນເຄີຍແລະແຕກຕ່າງກັນຫຼາຍ. ຢ່າງໃດກໍ່ຕາມ, ສິ່ງຫນຶ່ງທີ່ເປັນທີ່ຊັດເຈນແມ່ນວ່າຖ້າທ່ານຖືກບັງຄັບໃຫ້ເຮັດວຽກກັບຕົວຢ່າງທີ່ບໍ່ແມ່ນຄວາມຫນ້າຈະເປັນຫຼືແຫຼ່ງຂໍ້ມູນທີ່ບໍ່ແມ່ນຕົວແທນ (ເບິ່ງກັບພາກທີ 2), ຫຼັງຈາກນັ້ນມີເຫດຜົນທີ່ແຂງແຮງທີ່ຈະເຊື່ອວ່າການຄາດຄະເນໄດ້ຖືກນໍາໃຊ້ໂດຍຜ່ານການວາງແຜນແລະ ເຕັກນິກທີ່ກ່ຽວຂ້ອງຈະດີກ່ວາການຄາດຄະເນດິບທີ່ບໍ່ຖືກປັບປຸງ, ບໍ່ຖືກຕ້ອງ.