ທີ່ສໍາຄັນ:
[ , ] ໃນບົດ, ຂ້າພະເຈົ້າໄດ້ໃນທາງບວກທີ່ສຸດກ່ຽວກັບ post-stratification. ຢ່າງໃດກໍຕາມ, ມັນບໍ່ສະເຫມີປັບປຸງຄຸນນະພາບຂອງການຄາດຄະເນ. ໂຄງການກໍ່ສ້າງສະຖານະການທີ່ສາມາດຕອບ stratification ສາມາດຫຼຸດລົງຄຸນນະພາບຂອງການຄາດຄະເນໄດ້. (ສໍາລັບການ hints ເປັນ, ເບິ່ງ Thomsen (1973) ).
[ , , ] ການອອກແບບແລະດໍາເນີນການເປັນການສໍາຫຼວດທີ່ບໍ່ແມ່ນການຄາດຄະເນກ່ຽວກັບການ Amazon MTurk ຈະຖາມກ່ຽວກັບການເປັນເຈົ້າຂອງປືນ ( "ທ່ານ, ຫຼືບໍ່ມີໃຜໃນຄົວເຮືອນຂອງທ່ານ, ເປັນເຈົ້າຂອງປືນ rifle, ຫຼື pistol? ແມ່ນວ່າທ່ານຫຼືໃຜຜູ້ຫນຶ່ງໃນຄົວເຮືອນຂອງທ່ານ?") ແລະ ຄວາມຄິດເຫັນຕໍ່ການຄວບຄຸມປືນ ( "ຈະເປັນແນວໃດເຮັດແນວໃດທ່ານຄິດວ່າເປັນສິ່ງສໍາຄັນທີ່ຈະໃຫ້ການປົກປ້ອງສິດທິຂອງຊາວອາເມຣິກັນເປັນເຈົ້າຂອງປືນ, ຫຼືທີ່ຈະຄວບຄຸມການເປັນເຈົ້າຂອງປືນ?").
[ , , ] Goel ແລະເພື່ອນຮ່ວມງານ (2016) ການຄຸ້ມຄອງການສໍາຫຼວດທີ່ບໍ່ແມ່ນການຄາດຄະເນທີ່ປະກອບດ້ວຍ 49 ຄໍາຖາມ attitudinally ຫຼາຍທາງເລືອກກັນຈາກການສໍາຫຼວດທົ່ວໄປສັງຄົມ (GSS) ແລະຄັດເລືອກເອົາການສໍາຫຼວດໂດຍສູນກາງຄົ້ນຄວ້າ Pew ກ່ຽວກັບ Amazon MTurk. ພວກເຂົາເຈົ້າຫຼັງຈາກນັ້ນປັບສໍາລັບການທີ່ບໍ່ແມ່ນ representativeness ຂອງຂໍ້ມູນການນໍາໃຊ້ຮູບແບບທີ່ຕອບ stratification (ນາຍ P) ແລະປຽບທຽບການຄາດຄະເນການປັບກັບຜູ້ຄາດຄະເນການນໍາໃຊ້ການຄາດຄະເນທີ່ອີງໃສ່ການສໍາຫຼວດ GSS / Pew. ດໍາເນີນການສໍາຫຼວດດຽວກັນກ່ຽວກັບ MTurk ແລະພະຍາຍາມທີ່ຈະເຮັດຊ້ໍາ 2a ຮູບແລະຮູບ 2b ໂດຍການປຽບທຽບການຄາດຄະເນການປັບປຸງຂອງທ່ານທີ່ມີການຄາດຄະເນຈາກຮອບທີ່ຜ່ານມາທີ່ສຸດຂອງ GSS / Pew ໄດ້ (ເບິ່ງເອກະສານຊ້ອນຕາຕະລາງ A2 ສໍາລັບບັນຊີລາຍຊື່ຂອງ 49 ຄໍາຖາມ).
[ , , ] ການສຶກສາຈໍານວນຫຼາຍການນໍາໃຊ້ມາດຕະການລາຍງານຕົນເອງຂອງຂໍ້ມູນກິດຈະກໍາໂທລະສັບມືຖື. ນີ້ແມ່ນສະຖານທີ່ທີ່ຫນ້າສົນໃຈບ່ອນທີ່ນັກຄົ້ນຄວ້າສາມາດປຽບທຽບພຶດຕິກໍາຂອງຕົນເອງ, ບົດລາຍງານທີ່ມີພຶດຕິກໍາບັນທຶກການເຂົ້າ (ເບິ່ງຕົວຢ່າງ, Boase and Ling (2013) ). ສອງພຶດຕິກໍາທົ່ວໄປທີ່ຈະຖາມກ່ຽວກັບກໍາລັງເອີ້ນແລະສົ່ງຂໍ້ຄວາມ, ແລະສອງເຟຣມທີ່ໃຊ້ເວລາທົ່ວໄປ "ມື້ວານນີ້" ແລະ "ໃນອາທິດທີ່ຜ່ານມາ."
[ , ] Schuman ແລະ Presser (1996) ການໂຕ້ຖຽງວ່າຄໍາສັ່ງຂອງຄໍາຖາມຈະເປັນສໍາລັບສອງປະເພດຂອງການພົວພັນລະຫວ່າງຄໍາຖາມ: ຄໍາຖາມສ່ວນພາກສ່ວນທີ່ທັງສອງຄໍາຖາມຢູ່ໃນລະດັບດຽວກັນຂອງການສະເພາະ (ຕົວຢ່າງ: ການຈັດອັນດັບຂອງທັງສອງຜູ້ສະຫມັກປະທານປະເທດ); ແລະຄໍາຖາມສ່ວນລວມທັງຫມົດທີ່ເປັນຄໍາຖາມທົ່ວໄປຕໍ່ໄປນີ້ເປັນຄໍາຖາມທີ່ສະເພາະເຈາະຈົງ (ຕົວຢ່າງ: ຂໍໃຫ້ "ທ່ານພໍໃຈກັບການເຮັດວຽກຂອງທ່ານ?" ຕິດຕາມດ້ວຍ "ແນວໃດທ່ານພໍໃຈກັບຊີວິດຂອງທ່ານ?").
ພວກເຂົາເຈົ້າຕື່ມອີກລັກສະນະທັງສອງປະເພດຂອງຜົນກະທົບຄໍາສັ່ງຄໍາຖາມ: ຜົນກະທົບຄວາມຫມັ້ນຄົງເກີດຂຶ້ນໃນເວລາທີ່ການຕອບຄໍາຖາມຕໍ່ມາແມ່ນໄດ້ນໍາເອົາໃກ້ຊິດ (ກ່ວາພວກເຂົາເຈົ້າຖ້າບໍ່ດັ່ງນັ້ນຈະເປັນ) ກັບຜູ້ໄດ້ຮັບການໃຫ້ເປັນຄໍາຖາມທີ່ກ່ອນຫນ້ານີ້; ກົງກັນຂ້າມຜົນກະທົບເກີດຂຶ້ນໃນເວລາທີ່ມີຄວາມແຕກຕ່າງລະຫວ່າງການຕອບສະຫນອງກັບຄໍາຖາມສອງຂໍ້.
[ , ] ການກໍ່ສ້າງກ່ຽວກັບວຽກງານຂອງ Schuman ແລະ Presser, ໄດ້ Moore (2002) ອະທິບາຍມິຕິທີ່ແຍກຕ່າງຫາກຂອງຜົນກະທົບຄໍາສັ່ງຄໍາຖາມ: ນອກຈາກນັ້ນແລະການຫັກລົບ. ໃນຂະນະທີ່ກົງກັນຂ້າມແລະຄວາມສອດຄ່ອງຜົນກະທົບທີ່ຜະລິດເປັນຜົນຂອງການປະເມີນຜົນຕອບແບບສອບຖາມຂອງສອງລາຍການທີ່ກ່ຽວຂ້ອງກັບແຕ່ລະຄົນອື່ນໆ, ນອກຈາກນັ້ນແລະຜົນກະທົບ subtractive ມີການຜະລິດໃນເວລາທີ່ຕອບແບບສອບຖາມນີ້ແມ່ນມີຄວາມອ່ອນໄຫວເພີ່ມເຕີມຕໍ່ກັບການຂະຫນາດໃຫຍ່ພາຍໃນທີ່ຄໍາຖາມທີ່ວ່າເກີດ. ອ່ານ Moore (2002) , ຫຼັງຈາກນັ້ນການອອກແບບແລະດໍາເນີນການເປັນການທົດລອງສໍາຫຼວດກ່ຽວກັບ MTurk ສະແດງໃຫ້ເຫັນເພີ່ມເຕີມຫຼືການຫັກລົບຜົນກະທົບ.
[ , ] Christopher Antoun ແລະເພື່ອນຮ່ວມງານ (2015) ໄດ້ດໍາເນີນການສຶກສາປຽບທຽບຕົວຢ່າງສະດວກສະບາຍທີ່ໄດ້ຮັບຈາກທີ່ແຕກຕ່າງກັນສີ່ແຫຼ່ງຂໍ້ມູນການທົດແທນທີ່ອອນໄລນ໌: MTurk, Craigslist, ກູໂກ AdWords ແລະເຟສບຸກ. ການອອກແບບການສໍາຫຼວດທີ່ງ່າຍດາຍແລະການທົດແທນຜູ້ເຂົ້າຮ່ວມໂດຍຜ່ານການຢ່າງຫນ້ອຍສອງແຫຼ່ງຂໍ້ມູນການທົດແທນທີ່ອອນໄລນ໌ທີ່ແຕກຕ່າງກັນ (ພວກເຂົາເຈົ້າສາມາດເປັນແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນມາຈາກສີ່ໃຊ້ໃນ Antoun et al. (2015) ).
[ ] YouGov, ບໍລິສັດວິໄຈຕະຫຼາດອິນເຕີເນັດທີ່, ໄດ້ດໍາເນີນການສໍາຫຼວດອອນໄລນ໌ຂອງຄະນະກໍາມະກ່ຽວກັບ 800,000 ຕອບຢູ່ໃນອັງກິດແລະການນໍາໃຊ້ທ່ານ P. ຈະຄາດຄະເນຜົນໄດ້ຮັບຂອງຫະພາບເອີຣົບປະຊາມະຕິ (ie, Brexit) ທີ່ຜູ້ລົງຄະແນນ UK ລົງຄະແນນສຽງບໍ່ວ່າຈະຍັງຄົງຢູ່ ໃນຫລືອອກຈາກສະຫະພາບເອີຣົບ.
A ຄໍາອະທິບາຍລາຍລະອຽດຂອງຮູບແບບທາງສະຖິຕິ YouGov ແມ່ນທີ່ນີ້ (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). ມານໃນການເວົ້າ, YouGov partitions ຜູ້ລົງຄະແນນເຂົ້າໄປໃນປະເພດອີງໃສ່ 2015 ການເລືອກລົງຄະແນນສຽງເລືອກຕັ້ງທົ່ວໄປອາຍຸສູງສຸດ, ຄຸນສົມບັດ, ບົດບາດຍິງຊາຍ, ວັນທີຂອງການສໍາພາດ, ເຊັ່ນດຽວກັນກັບເລືອກຕັ້ງຂອງພວກເຂົາເຈົ້າອາໄສຢູ່ໃນ. ຫນ້າທໍາອິດ, ພວກເຂົາເຈົ້ານໍາໃຊ້ຂໍ້ມູນທີ່ເກັບມາຈາກ panelists YouGov ປະມານການ, ໃນບັນດາຜູ້ ຜູ້ທີ່ລົງຄະແນນສຽງ, ອັດຕາສ່ວນຂອງປະຊາຊົນຂອງແຕ່ລະປະເພດອອກສຽງເລືອກຕັ້ງທີ່ມີຈຸດປະສົງເພື່ອລົງຄະແນນສຽງໃບ. ພວກເຂົາເຈົ້າປະເມີນຜະລິດພັນຂອງແຕ່ລະປະເພດຜູ້ລົງຄະແນນໂດຍການນໍາໃຊ້ການສຶກສາປີ 2015 ປະເທດອັງກິດການເລືອກຕັ້ງ (BES) ຕອບການເລືອກຕັ້ງດ້ວຍຕົນເອງໃຫ້ໃບຫນ້າການສໍາຫຼວດ, ຊຶ່ງຜ່ານການກວດສອບຜະລິດພັນຈາກມ້ວນເລືອກຕັ້ງ. ສຸດທ້າຍ, ພວກເຂົາເຈົ້າປະເມີນວິທີການຈໍານວນຫຼາຍປະຊາຊົນມີຂອງແຕ່ລະປະເພດອອກສຽງເລືອກຕັ້ງໃນການເລືອກຕັ້ງການສໍາຫລວດຫລ້າສຸດແລະການສໍາຫຼວດປະຊາກອນປະຈໍາປີ (ຂໍ້ມູນຂ່າວສານນອກຈາກນັ້ນ, ຈາກ BES ທີ່, YouGov ຂໍ້ມູນການສໍາຫຼວດຈາກປະມານເລືອກຕັ້ງທົ່ວໄປ, ແລະຂໍ້ມູນກ່ຽວກັບວິທີການຈໍານວນຫຼາຍປະຊາຊົນ voted ສໍາລັບ ພັກແຕ່ລະຄົນໃນແຕ່ລະເຂດເລືອກຕັ້ງ).
ສາມມື້ກ່ອນທີ່ຈະລົງຄະແນນສຽງ, YouGov ສະແດງໃຫ້ເຫັນເປັນຜູ້ນໍາພາສອງຈຸດສໍາລັບການອອກຈາກ. ໃນສະມາດ Eve ຂອງການເລືອກຕັ້ງ, ແບບສໍາຫຼວດສະແດງໃຫ້ເຫັນຢ່າງໃກ້ຊິດເກີນໄປທີ່ຈະໂທຫາ (49-51 ຍັງຄົງ). ການສຶກສາກ່ຽວກັບການມື້ສຸດທ້າຍຄາດຄະເນ 48/52 ຢູ່ໃນເງື່ອນໄຂຂອງຍັງ (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). ໃນຄວາມເປັນຈິງ, ການຄາດຄະເນນີ້ໄດ້ພາດໂອກາດຜົນສຸດທ້າຍ (52-48 ອອກ) ໂດຍສີ່ຈຸດສ່ວນຮ້ອຍ.
[ , ] ຂຽນ simulation ສະແດງໃຫ້ເຫັນແຕ່ລະຄົນຂອງຄວາມຜິດພາດການເປັນຕົວແທນຢູ່ໃນຮູບສະແດງທີ 31 ໄດ້.
[ , ] ການຄົ້ນຄວ້າຂອງ Blumenstock ແລະເພື່ອນຮ່ວມງານ (2015) ການມີສ່ວນຮ່ວມການກໍ່ສ້າງຮູບແບບການຮຽນຮູ້ເຄື່ອງທີ່ສາມາດນໍາໃຊ້ຂໍ້ມູນການຕິດຕາມດິຈິຕອນການຄາດຄະເນການຕອບສະຫນອງການສໍາຫຼວດ. ໃນປັດຈຸບັນ, ທ່ານຈະພະຍາຍາມສິ່ງດຽວກັນກັບຊຸດຂໍ້ມູນທີ່ແຕກຕ່າງກັນ. Kosinski, Stillwell, and Graepel (2013) ພົບວ່າເຟສບຸກມັກສາມາດຄາດຄະເນລັກສະນະສ່ວນບຸກຄົນແລະຄຸນລັກສະນະ. ເປັນເລື່ອງແປກຫຍັງ, ການຄາດຄະເນເຫຼົ່ານີ້ສາມາດເຖິງແມ່ນວ່າຖືກຕ້ອງຫຼາຍກ່ວາຜູ້ທີ່ຂອງຫມູ່ເພື່ອນແລະເພື່ອນຮ່ວມງານ (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) ການບັນທຶກລາຍລະອຽດການນໍາໃຊ້ໂທ (CDRs) ຈາກໂທລະສັບມືຖືຈະຄາດຄະເນແນວໂນ້ມການຫວ່າງງານລວມ.