[ , ] ໃນບົດນີ້, ຂ້າພະເຈົ້າມີທັດສະນະຄະຕິຫຼາຍກ່ຽວກັບການຈັດວາງແບບຈໍາລອງ. ຢ່າງໃດກໍ່ຕາມ, ນີ້ບໍ່ແມ່ນການປັບປຸງຄຸນນະພາບຂອງການຄາດຄະເນ. ການກໍ່ສ້າງສະຖານະການທີ່ມີການຫລໍ່ຫລອມຫລຸດຜ່ອນຄວາມຄຸນະພາບຂອງການຄາດຄະເນ. (ສໍາລັບຄໍາແນະນໍາ, ເບິ່ງ Thomsen (1973) .)
[ , , ] ການອອກແບບແລະດໍາເນີນການສໍາຫຼວດທີ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ກ່ຽວກັບ Amazon Mechanical Turk ເພື່ອຖາມກ່ຽວກັບຄວາມເປັນເຈົ້າຂອງປືນແລະທັດສະນະຕໍ່ການຄວບຄຸມປືນ. ເພື່ອໃຫ້ທ່ານສາມາດປຽບທຽບການຄາດຄະເນຂອງທ່ານກັບຜູ້ທີ່ມາຈາກຕົວຢ່າງຄວາມເປັນໄປໄດ້, ກະລຸນາຄັດລອກຂໍ້ຄວາມຄໍາຖາມແລະຕົວຕອບຄໍາຖາມໂດຍກົງຈາກການສໍາຫຼວດທີ່ມີຄຸນນະພາບສູງເຊັ່ນວ່າການດໍາເນີນງານໂດຍສູນຄົ້ນຄວ້າ Pew.
[ , , ] Goel ແລະເພື່ອນຮ່ວມງານ (2016) ໄດ້ນໍາໃຊ້ຄໍາຖາມທີ່ມີການເລືອກຫລາຍຄໍາຖາມ 49 ຕົວຈາກການສໍາຫຼວດສັງຄົມທົ່ວໄປ (GSS) ແລະຄັດເລືອກເອົາການສໍາຫຼວດໂດຍສູນຄົ້ນຄວ້າ Pew ກັບຕົວຢ່າງທີ່ບໍ່ສາມາດທົດລອງໄດ້ຈາກ Amazon Mechanical Turk. ຫຼັງຈາກນັ້ນພວກເຂົາເຈົ້າໄດ້ປັບຕົວສໍາລັບຂໍ້ມູນທີ່ບໍ່ແມ່ນຕົວແທນຂອງຂໍ້ມູນໂດຍນໍາໃຊ້ການສ້າງແບບຈໍາລອງແບບທີ່ອີງໃສ່ແບບຈໍາລອງແລະການປຽບທຽບການຄາດຄະເນຂອງພວກເຂົາກັບຜູ້ທີ່ມາຈາກການສໍາຫຼວດ GSS ແລະ Pew ທີ່ເປັນໄປໄດ້. ດໍາເນີນການສໍາຫຼວດດຽວກັນກັບ Amazon Mechanical Turk ແລະພະຍາຍາມເຮັດສໍາເນົາຮູບ 2a ແລະຮູບ 2b ໂດຍການປຽບທຽບການຄາດຄະເນຂອງທ່ານທີ່ປັບທຽບກັບການຄາດຄະເນຈາກຮອບສຸດທ້າຍຂອງການສໍາຫຼວດ GSS ແລະ Pew. (ເບິ່ງຕາຕະລາງເອກະສານຊ້ອນທ້າຍ A2 ສໍາລັບບັນຊີ 49 ຄໍາຖາມ.)
[ , , ] ການສຶກສາຈໍານວນຫຼາຍໃຊ້ມາດຕະການການລາຍງານຂອງການໃຊ້ໂທລະສັບມືຖື. ນີ້ແມ່ນການຕັ້ງຄ່າທີ່ຫນ້າສົນໃຈທີ່ນັກຄົ້ນຄວ້າສາມາດປຽບທຽບກັບພຶດຕິກໍາຕົວຕົນທີ່ມີລາຍລະອຽດກ່ຽວກັບພຶດຕິກໍາທີ່ຖືກລັອກໄວ້ (ເບິ່ງຕົວຢ່າງ Boase and Ling (2013) ). ສອງພຶດຕິກໍາທີ່ຈະຖາມກ່ຽວກັບການໂທແລະການສົ່ງຂໍ້ຄວາມແລະເວລາທີ່ໃຊ້ເວລາສອງແມ່ນ "ມື້ວານ" ແລະ "ໃນອາທິດທີ່ຜ່ານມາ."
[ , ] Schuman ແລະ Presser (1996) ໂຕ້ຖຽງວ່າຄໍາສັ່ງຄໍາຖາມຈະສໍາຄັນສໍາລັບສອງປະເພດຄໍາຖາມ: ຄໍາຖາມສ່ວນຫນຶ່ງທີ່ສອງຄໍາຖາມຢູ່ໃນລະດັບດຽວກັນຂອງສະເພາະ (ຕົວຢ່າງ, ອັດຕາຂອງຜູ້ສະຫມັກປະທານາທິບໍດີສອງຄົນ); ແລະຄໍາຖາມທັງຫມົດທີ່ມີຄໍາຖາມທົ່ວໄປຕາມຄໍາຖາມສະເພາະ (ຕົວຢ່າງ: ຖາມວ່າ "ທ່ານມີຄວາມພໍໃຈກັບວຽກຂອງທ່ານບໍ?" ຕາມດ້ວຍ "ທ່ານພໍໃຈກັບຊີວິດຂອງທ່ານແນວໃດ?").
ພວກເຂົາເຈົ້າຍັງມີລັກສະນະສອງປະເພດຂອງຜົນກະທົບຄໍາສັ່ງ: ຜົນກະທົບທີ່ເກີດຂື້ນໃນເວລາທີ່ຄໍາຕອບຕໍ່ຄໍາຖາມຕໍ່ມາໄດ້ຖືກນໍາມາໃກ້ຊິດ (ແທນທີ່ຈະເປັນ) ກັບຜູ້ທີ່ໃຫ້ຄໍາຖາມກ່ອນຫນ້ານີ້; ຜົນກະທົບທາງກົງກັນຂ້າມເກີດຂຶ້ນເມື່ອມີຄວາມແຕກຕ່າງຫຼາຍລະຫວ່າງຄໍາຕອບກັບສອງຄໍາຖາມ.
[ , ] ການກໍ່ສ້າງໃນການເຮັດວຽກຂອງ Schuman ແລະ Presser, Moore (2002) ອະທິບາຍເຖິງຂະຫນາດທີ່ແຕກຕ່າງກັນຂອງຄໍາສັ່ງຄໍາຖາມຄໍາຖາມ: ຜົນກະທົບເພີ່ມເຕີມແລະລົບອອກ. ໃນຂະນະທີ່ຜົນກະທົບທາງກົງກັນຂ້າມແລະຄວາມສອດຄ່ອງແມ່ນຜະລິດເປັນຜົນຂອງການປະເມີນຜົນຂອງຜູ້ຕອບສະຫນອງຂອງສອງລາຍການທີ່ກ່ຽວຂ້ອງກັບກັນແລະກັນ, ຜົນກະທົບທີ່ເພີ່ມເຕີມແລະລົບອອກແມ່ນເກີດຂື້ນເມື່ອຜູ້ຕອບຖືກສ້າງຂື້ນຫຼາຍໃນຂອບທີ່ໃຫຍ່ກວ່າທີ່ມີຄໍາຖາມ. ອ່ານ Moore (2002) , ຫຼັງຈາກນັ້ນ, ການອອກແບບແລະດໍາເນີນການທົດລອງການສໍາຫຼວດກ່ຽວກັບ MTurk ເພື່ອສະແດງໃຫ້ເຫັນຜົນກະທົບທີ່ເພີ່ມຫຼືລົບ.
[ , ] Christopher Antoun ແລະເພື່ອນຮ່ວມງານ (2015) ໄດ້ດໍາເນີນການສຶກສາຄົ້ນຄວ້າກ່ຽວກັບຕົວຢ່າງຄວາມສະດວກທີ່ໄດ້ຮັບຈາກສີ່ແຫຼ່ງທີ່ຢູ່ອາໄສອອນໄລ໌ທີ່ແຕກຕ່າງກັນຄື: MTurk, Craigslist, Google AdWords ແລະ Facebook. ການອອກແບບການສໍາຫຼວດແບບງ່າຍໆແລະການເຂົ້າຫາຜູ້ເຂົ້າຮ່ວມໂດຍຜ່ານແຫຼ່ງທີ່ຢູ່ອາໄສອອນລາຍສອງຢ່າງທີ່ແຕກຕ່າງກັນ (ເຫຼົ່ານີ້ສາມາດແຕກຕ່າງຈາກສີ່ແຫຼ່ງທີ່ໃຊ້ໃນ Antoun et al. (2015) ).
[ ] ໃນຄວາມພະຍາຍາມທີ່ຈະຄາດຄະເນຜົນໄດ້ຮັບຂອງການສໍາຫຼວດສະຫະພາບເອີຣົບປີ 2016 (ເຊົ່ນ Brexit) ທ່ານ YouGov, ບໍລິສັດວິໄຈຕະຫຼາດອິນເຕີເນັດ, ໄດ້ດໍາເນີນການສໍາຫລວດແບບອອນລາຍຂອງຄະນະປະມານ 800,000 ຄົນໃນສະຫະລາຊະອານາຈັກ.
ລາຍລະອຽດຂອງຮູບແບບສະຖິຕິຂອງ YouGov ສາມາດພົບໄດ້ທີ່ https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. ປະມານວ່າທ່ານ YouGov ແບ່ງປັນຜູ້ລົງຄະແນນໃນປະເພດໂດຍອີງໃສ່ການເລືອກຕັ້ງການເລືອກຕັ້ງທົ່ວໄປໃນປີ 2015, ອາຍຸ, ຄຸນສົມບັດ, ບົດບາດຍິງຊາຍ, ແລະວັນທີຂອງການສໍາພາດ, ແລະການເລືອກຕັ້ງທີ່ພວກເຂົາຢູ່. ຫນ້າທໍາອິດ, ພວກເຂົາເຈົ້າໄດ້ນໍາໃຊ້ຂໍ້ມູນທີ່ເກັບຈາກຄະນະກໍາມະການ YouGov ເພື່ອປະເມີນ, ໃນບັນດາຜູ້ທີ່ໄດ້ລົງຄະແນນສຽງ, ອັດຕາສ່ວນຂອງປະຊາຊົນໃນແຕ່ລະປະເພດຜູ້ລົງຄະແນນທີ່ມີຈຸດປະສົງທີ່ຈະອອກສຽງອອກ. ພວກເຂົາເຈົ້າຄາດຄະເນການເລືອກຕັ້ງຂອງຜູ້ລົງຄະແນນສຽງແຕ່ລະຄົນໂດຍໃຊ້ການສຶກສາການເລືອກຕັ້ງອັງກິດປີ 2015 (BES), ການສໍາຫຼວດແບບສໍາຫຼວດແບບຫນ້າຕໍ່ຫນ້າ, ເຊິ່ງໄດ້ຮັບການສະຫນັບສະຫນູນຈາກມວນຊົນ. ສຸດທ້າຍ, ພວກເຂົາເຈົ້າໄດ້ຄາດຄະເນວ່າມີຈໍານວນປະຊາຊົນຈໍານວນຫນຶ່ງໃນແຕ່ລະຜູ້ລົງຄະແນນສຽງໃນຜູ້ເລືອກຕັ້ງ, ອີງຕາມການສໍາຫຼວດພົນລະເມືອງແລະການສໍາຫລວດປະຈໍາປີ (ມີຂໍ້ມູນເພີ່ມເຕີມຈາກແຫຼ່ງຂໍ້ມູນອື່ນໆ).
ສາມມື້ກ່ອນການລົງຄະແນນສຽງ, ທ່ານ YouGov ສະແດງໃຫ້ເຫັນການນໍາສອງຈຸດສໍາລັບການອອກຈາກພັກ. ໃນເວລາວ່າງຂອງການລົງຄະແນນສຽງ, ການສໍາຫຼວດໄດ້ຊີ້ໃຫ້ເຫັນວ່າຜົນໄດ້ຮັບເກີນໄປໃກ້ຊິດກັບການໂທ (49/51 ຍັງຄົງ). ການສຶກສາສຸດທ້າຍໃນມື້ນີ້ຄາດຄະເນ 48/52 ໃນການຊື່ນຊົມຂອງ Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). ໃນຄວາມເປັນຈິງ, ຄາດຄະເນນີ້ພາດໄລຍະສຸດທ້າຍ (52/48 ອອກ) ໂດຍສີ່ຈຸດສ່ວນຮ້ອຍ.
[ , ] ຂຽນ simulation ເພື່ອສະແດງໃຫ້ເຫັນເຖິງແຕ່ລະຂໍ້ຜິດພາດໃນຕົວເລກ 3.2.
[ , ] ການຄົ້ນຄວ້າຂອງ Blumenstock ແລະເພື່ອນຮ່ວມງານ (2015) ກ່ຽວຂ້ອງກັບການກໍ່ສ້າງຮູບແບບການຮຽນຮູ້ເຄື່ອງທີ່ສາມາດໃຊ້ຂໍ້ມູນຕາມຂໍ້ມູນດິຈິຕອນເພື່ອຄາດຄະເນການຕອບສະຫນອງການສໍາຫຼວດ. ໃນປັດຈຸບັນ, ທ່ານຈະພະຍາຍາມສິ່ງດຽວກັນກັບຊຸດຂໍ້ມູນທີ່ແຕກຕ່າງກັນ. Kosinski, Stillwell, and Graepel (2013) ພົບເຫັນວ່າ Facebook ມັກຈະສາມາດຄາດຄະ Kosinski, Stillwell, and Graepel (2013) ສະນະແລະຄຸນລັກສະນະຂອງບຸກຄົນ. ເປັນເລື່ອງແປກທີ່ຄາດຄະເນເຫຼົ່ານີ້ສາມາດມີຄວາມຖືກຕ້ອງຫຼາຍກ່ວາຫມູ່ຂອງຫມູ່ເພື່ອນແລະເພື່ອນຮ່ວມງານ (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) ນໍາໃຊ້ບັນທຶກລາຍລະອຽດຂອງການໂທ (CDRs) ຈາກໂທລະສັບມືຖືເພື່ອຄາດເດົາແນວໂນ້ມການຫວ່າງງານລວມ.