2.4.2 ພະຢາກອນແລະ Nowcasting

ນາຍອະນາຄົດເປັນການຍາກ, ແຕ່ການຄາດປະຈຸບັນແມ່ນງ່າຍ.

ຄັ້ງທີສອງແຜນຍຸດທະສາດສໍາຄັນທີ່ໃຊ້ໂດຍນັກຄົ້ນຄວ້າທີ່ມີຂໍ້ມູນການສັງເກດການແມ່ນຄາດ. ນາຍອະນາຄົດແມ່ນມີຄວາມຫຍຸ້ງຍາກ notoriously, ແຕ່ວ່າມັນສາມາດມີຄວາມສໍາຄັນ incredibly ສໍາລັບການຕັດສິນໃຈ, ວ່າພວກເຂົາເຈົ້າເຮັດວຽກຢູ່ໃນບໍລິສັດຫຼືລັດຖະບານ.

Kleinberg et al. (2015) ສະເຫນີທັງສອງເລື່ອງທີ່ອະທິບາຍຄວາມສໍາຄັນຂອງການຄາດການສໍາລັບບັນຫານະໂຍບາຍສະເພາະໃດຫນຶ່ງ. ຈິນຕະນາການຜູ້ຜະລິດນະໂຍບາຍຫນຶ່ງ, ຂ້າພະເຈົ້າຈະໂທຫານາງ Anna, ຜູ້ທີ່ກໍາລັງປະເຊີນ​​ໄພແຫ້ງແລ້ງແລະຕ້ອງຕັດສິນໃຈບໍ່ວ່າຈະເປັນທີ່ຈະຈ້າງ shaman ທີ່ຈະເຮັດໃຫ້ການເຕັ້ນລະດູຝົນທີ່ຈະເພີ່ມທະວີການໂອກາດຂອງລະດູຝົນ. ຜູ້ຜະລິດນະໂຍບາຍອີກປະການຫນຶ່ງ, ຂ້າພະເຈົ້າຈະໂທຫາເຂົາ Bob, ຕ້ອງຕັດສິນໃຈບໍ່ວ່າຈະເປັນການໃຊ້ເວລາ umbrella ທີ່ຈະເຮັດວຽກເພື່ອຫຼີກເວັ້ນການໄດ້ຮັບຄວາມຊຸ່ມກ່ຽວກັບວິທີທໍາອິດ. Both Anna ແລະ Bob ສາມາດເຮັດໃຫ້ການຕັດສິນໃຈທີ່ດີກວ່າຖ້າຫາກວ່າເຂົາເຈົ້າເຂົ້າໃຈສະພາບອາກາດ, ແຕ່ພວກເຂົາເຈົ້າຈໍາເປັນຕ້ອງຮູ້ສິ່ງທີ່ແຕກຕ່າງກັນ. Anna ຕ້ອງການທີ່ຈະເຂົ້າໃຈບໍ່ວ່າຈະເປັນການເຕັ້ນລະດູຝົນເຮັດໃຫ້ຝົນຕົກຫນັກ. Bob, ໃນອີກດ້ານຫນຶ່ງ, ບໍ່ຈໍາເປັນຕ້ອງເຂົ້າໃຈຫຍັງກ່ຽວກັບການກໍ່ໃຫ້ເກີດ; ເຂົາພຽງແຕ່ຕ້ອງການການຄາດຄະເນທີ່ຖືກຕ້ອງ. ນັກຄົ້ນຄວ້າທາງສັງຄົມມັກຈະສຸມໃສ່ສິ່ງທີ່ Kleinberg et al. (2015) ເອີ້ນວ່າ "ຝົນເຕັ້ນຄ້າຍຄື" ນະໂຍບາຍບັນຫາ, ຜູ້ທີ່ສຸມໃສ່ການກໍ່ໃຫ້ເກີດແລະບໍ່ສົນໃຈບັນຫານະໂຍບາຍ "umbrella ຄ້າຍຄື" ທີ່ກໍາລັງສຸມໃສ່ການຄາດຄະເນ.

ຂ້າພະເຈົ້າຕ້ອງການທີ່ຈະສຸມໃສ່ການ, ຢ່າງໃດກໍຕາມ, ກ່ຽວກັບປະເພດພິເສດຂອງການຄາດການເອີ້ນວ່າ Nowcasting -a ໄລຍະມາຈາກການສົມທົບ "ໃນປັດຈຸບັນ" ແລະ "ການຄາດ." ແທນທີ່ຈະກ່ວາການຄາດການໃນອະນາຄົດ, nowcasting ຄວາມພະຍາຍາມທີ່ຈະຄາດຄະເນໃນປັດຈຸບັນ (Choi and Varian 2012) . ໃນຄໍາສັບຕ່າງໆອື່ນໆ, Nowcasting ນໍາໃຊ້ວິທີການຄາດການສໍາລັບບັນຫາຂອງການວັດແທກ. ດັ່ງນັ້ນ, ມັນຄວນຈະເປັນທີ່ເປັນປະໂຫຍດໂດຍສະເພາະແມ່ນລັດຖະບານທີ່ຮຽກຮ້ອງໃຫ້ມີມາດຕະການໃຫ້ທັນເວລາແລະຖືກຕ້ອງກ່ຽວກັບບັນດາປະເທດຂອງເຂົາເຈົ້າ. Nowcasting ສາມາດໄດ້ຮັບການສະແດງໃຫ້ເຫັນຢ່າງຈະແຈ້ງທີ່ມີຕົວຢ່າງຂອງກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ໄດ້.

ຈິນຕະນາການວ່າທ່ານມີຄວາມຮູ້ສຶກນ້ອຍພາຍໃຕ້ດິນຟ້າອາກາດດັ່ງນັ້ນທ່ານພິມ "ວິທີແກ້ໄຂໄຂ້ຫວັດໃຫຍ່" ເຂົ້າໄປໃນເຄື່ອງຈັກຊອກຫາ, ໄດ້ຮັບຫນ້າຂອງການເຊື່ອມຕໍ່ໃນການຕອບສະຫນອງ, ແລະຫຼັງຈາກນັ້ນປະຕິບັດຕາມຫນຶ່ງຂອງເຂົາເຈົ້າທີ່ຈະເປັນເວັບໄຊເປັນປະໂຫຍດ. ໃນປັດຈຸບັນຈິນຕະນາການກິດຈະກໍານີ້ຈະຖືກມີຄົນຫຼິ້ນອອກຈາກທັດສະນະຂອງເຄື່ອງຈັກໃນການຊອກຫາ. ປັດຈຸບັນທຸກ, ລ້ານຂອງການຄົ້ນຫາມາຈາກທົ່ວໂລກ, ແລະນ້ໍາຂອງການສອບຖາມ, ສິ່ງທີ່ນີ້ Battelle (2006) ໄດ້ເອີ້ນວ່າ "ຖານຂໍ້ມູນຂອງຈຸດປະສົງ" - ສະຫນອງຫນ້າຕ່າງການປັບປຸງຢູ່ສະເຫມີເຂົ້າໄປໃນສະຕິໃນທົ່ວໂລກການລວບລວມ. ຢ່າງໃດກໍຕາມ, ປ່ຽນເປັນສີນ້ໍາຂອງຂໍ້ມູນຂ່າວສານນີ້ເຂົ້າໄປໃນການວັດແທກອັດຕາສ່ວນຂອງໄຂ້ຫວັດໃຫຍ່ດັ່ງກ່າວແມ່ນມີຄວາມຫຍຸ້ງຍາກ. ພຽງແຕ່ນັບຈໍານວນຂອງຄໍາສັ່ງສໍາລັບການ "ວິທີແກ້ໄຂໄຂ້ຫວັດໃຫຍ່" ບໍ່ອາດເຮັດວຽກໄດ້ດີ. ບໍ່ແມ່ນທຸກຄົນທີ່ມີການຄົ້ນຫາໄຂ້ຫວັດໃຫຍ່ສໍາລັບວິທີແກ້ໄຂໄຂ້ຫວັດໃຫຍ່ແລະບໍ່ແມ່ນທຸກຄົນຄົ້ນຫາສໍາລັບວິທີແກ້ໄຂໄຂ້ຫວັດໃຫຍ່ມີໄຂ້ຫວັດໃຫຍ່.

ສິ່ງທີ່ສໍາຄັນທີ່ສໍາຄັນແລະ clever ຫລັງກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ນີ້ແມ່ນເພື່ອເຮັດໃຫ້ບັນຫາການວັດແທກເຂົ້າໄປໃນບັນຫາການຄາດການໄດ້. ຂອງສູນກາງຄວບຄຸມແລະປ້ອງກັນພະຍາດ (CDC) ມີລະບົບການຕິດຕາມກວດກາໄຂ້ຫວັດໃຫຍ່ທີ່ເກັບລວບລວມຂໍ້ມູນຈາກທ່ານຫມໍໃນທົ່ວປະເທດ. ຢ່າງໃດກໍຕາມ, ບັນຫາຫນຶ່ງທີ່ມີລະບົບ CDC ນີ້ແມ່ນມີຄວາມລ່າຊ້າການລາຍງານສອງອາທິດ; ທີ່ໃຊ້ເວລາມັນໃຊ້ເວລາສໍາລັບຂໍ້ມູນມາຈາກທ່ານຫມໍຈະໄດ້ຮັບການອະນາໄມ, ການປຸງແຕ່ງ, ແລະຈັດພີມມາ. ແຕ່ວ່າ, ໃນເວລາທີ່ການຈັດການລະບາດທີ່ເກີດຂຶ້ນໃຫມ່, ຫ້ອງການສຸຂະພາບສາທາລະນະບໍ່ຕ້ອງການທີ່ຈະຮູ້ວ່າວິທີການໄຂ້ຫວັດໃຫຍ່ຫຼາຍມີສອງອາທິດກ່ອນຫນ້ານີ້; ພວກເຂົາເຈົ້າຕ້ອງການທີ່ຈະຮູ້ວ່າວິທີການໄຂ້ຫວັດໃຫຍ່ຫຼາຍບໍ່ມີສິດທິໃນປັດຈຸບັນ. ໃນຄວາມເປັນຈິງ, ໃນຫຼາຍປະເພນີອື່ນໆຂອງຂໍ້ມູນທາງດ້ານສັງຄົມ, ມີຊ່ອງຫວ່າງລະຫວ່າງຄື້ນຟອງຂອງການເກັບກໍາຂໍ້ມູນແລະ lags ລາຍງານ. ທີ່ສຸດແຫຼ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່, ໃນອີກດ້ານຫນຶ່ງ, ມີສະເຫມີກ່ຽວກັບການ (Section 2.3.1.2).

ເພາະສະນັ້ນ, Jeremy Ginsberg ແລະເພື່ອນຮ່ວມງານ (2009) ໄດ້ພະຍາຍາມທີ່ຈະຄາດຄະເນໄດ້ຂໍ້ມູນໄຂ້ຫວັດໃຫຍ່ CDC ຈາກຂໍ້ມູນການຄົ້ນຫາກູໂກ. ນີ້ເປັນຕົວຢ່າງຂອງ "ການຄາດການໃນປັດຈຸບັນ" ເນື່ອງຈາກວ່ານັກຄົ້ນຄວ້າໄດ້ພະຍາຍາມໃນການວັດແທກວິທີການໄຂ້ຫວັດໃຫຍ່ຫຼາຍບໍ່ມີໃນປັດຈຸບັນໂດຍການຄາດການຂໍ້ມູນໃນອະນາຄົດຈາກ CDC, ຂໍ້ມູນໃນອະນາຄົດທີ່ຖືກວັດແທກໃນປະຈຸບັນໄດ້. ການນໍາໃຊ້ການຮຽນຮູ້ເຄື່ອງ, ພວກເຂົາຄົ້ນຫາໂດຍຜ່ານການ 50 ລ້ານຂໍ້ກໍານົດການຊອກຫາທີ່ແຕກຕ່າງກັນເພື່ອເບິ່ງວ່າມີຄາດຄະເນທີ່ສຸດຂອງຂໍ້ມູນໄຂ້ຫວັດໃຫຍ່ CDC. ໃນທີ່ສຸດ, ພວກເຂົາເຈົ້າພົບເຫັນທີ່ກໍານົດໄວ້ຂອງ 45 ຄໍາສັ່ງທີ່ແຕກຕ່າງກັນທີ່ເບິ່ງຄືວ່າຈະຄາດຄະເນທີ່ສຸດ, ແລະຜົນໄດ້ຮັບທີ່ດີທີ່ຂ້ອນຂ້າງ: ພວກເຂົາເຈົ້າສາມາດນໍາໃຊ້ຂໍ້ມູນໃນການຊອກຫາການຄາດຄະເນຂອງຂໍ້ມູນ CDC. ຢູ່ໃນພາກສ່ວນເອກະສານນີ້, ເຊິ່ງໄດ້ຈັດພີມມາໃນທໍາມະຊາດ, ກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ໄດ້ກາຍເປັນຄວາມສໍາເລັດມັກຈະຊ້ໍາກ່ຽວກັບພະລັງງານຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ໄດ້.

ມີສອງ caveats ທີ່ສໍາຄັນແມ່ນເພື່ອຄວາມສໍາເລັດນີ້, ຢ່າງໃດກໍຕາມ, ແລະຄວາມເຂົ້າໃຈ caveats ເຫຼົ່ານີ້ຈະຊ່ວຍໃຫ້ທ່ານປະເມີນຜົນແລະເຮັດການຄາດການແລະ Nowcasting. ຫນ້າທໍາອິດ, ການປະຕິບັດຂອງກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ໃນຕົວຈິງແມ່ນບໍ່ຫຼາຍປານໃດດີກ່ວາເປັນຮູບແບບທີ່ງ່າຍດາຍທີ່ການຄາດຄະເນຈໍານວນຂອງໄຂ້ຫວັດໃຫຍ່ໂດຍອີງໃສ່ເມີນຄ່າໃບຈາກສອງມາດຕະການທີ່ຜ່ານມາທີ່ສຸດຂອງອັດຕາສ່ວນໄຂ້ຫວັດໃຫຍ່ (Goel et al. 2010) . ແລະ, ໃນໄລຍະໄລຍະເວລາທີ່ໃຊ້ເວລາບາງກູໂກໄຂ້ຫວັດໃຫຍ່ແນວໂນ້ມໃນຕົວຈິງແມ່ນຮ້າຍແຮງກວ່າເກົ່າກ່ວາວິທີການນີ້ງ່າຍດາຍ (Lazer et al. 2014) . ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ກັບຂໍ້ມູນທັງຫມົດຂອງຕົນ, ຮຽນຮູ້ເຄື່ອງ, ແລະຄອມພິວເຕີມີອໍານາດບໍ່ໄດ້ຢ່າງວ່ອງໄວດີກວ່າແບບງ່າຍດາຍແລະງ່າຍທີ່ຈະເຂົ້າໃຈ heuristic. ນີ້ຊີ້ໃຫ້ເຫັນວ່າໃນເວລາທີ່ການປະເມີນການຄາດຄະເນຫຼື Nowcasting ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະປຽບທຽບກັບຂໍ້ມູນພື້ນຖານໄດ້.

ການ caveat ສໍາຄັນທີ່ສອງກ່ຽວກັບກູໂກແນວໂນ້ມຍາດໄຂ້ຫວັດໃຫຍ່ແມ່ນວ່າຄວາມສາມາດຂອງຕົນໃນການຄາດຄະເນໃນຂໍ້ມູນໄຂ້ຫວັດໃຫຍ່ CDC ແມ່ນມັກຈະລົ້ມເຫຼວໃນໄລຍະສັ້ນແລະລາຍໃນໄລຍະຍາວເພາະວ່າຂອງພຽງການລອຍລົມແລະ confound ສູດການຄິດໄລ່. ສໍາລັບການຍົກຕົວຢ່າງ, ໃນໄລຍະ 2009 ໄຂ້ຫວັດໃຫຍ່ລະບາດກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ລະຄອນໃນໄລຍະການຄາດຄະເນຈໍານວນຂອງໄຂ້ຫວັດໃຫຍ່, ອາດຈະເປັນຍ້ອນປະຊາຊົນມີແນວໂນ້ມທີ່ມີການປ່ຽນແປງພຶດຕິກໍາການຄົ້ນຫາຂອງເຂົາເຈົ້າໃນການຕອບສະຫນອງກັບຄວາມຢ້ານກົວທີ່ແຜ່ຂະຫຍາຍຂອງການລະບາດໃນທົ່ວໂລກ (Cook et al. 2011; Olson et al. 2013) . ນອກເຫນືອໄປຈາກບັນຫາເຫຼົ່ານີ້ໃນໄລຍະສັ້ນ, ການປະຕິບັດເທື່ອລະກ້າວຊຸດໂຊມໃນໄລຍະທີ່ໃຊ້ເວລາ. ການບົ່ງມະຕິດ້ວຍເຫດຜົນສໍາລັບການນີ້ທະລາຍໃນໄລຍະຍາວແມ່ນມີຄວາມຫຍຸ້ງຍາກເນື່ອງຈາກວ່າຂັ້ນຕອນວິທີການຊອກຫາກູໂກແມ່ນບັດ, ແຕ່ວ່າມັນປະກົດວ່າໃນປີ 2011 ກູໂກເຮັດໃຫ້ການປ່ຽນແປງທີ່ຈະແນະນໍາຂໍ້ກໍານົດການຊອກຫາທີ່ກ່ຽວຂ້ອງໃນເວລາຄົ້ນຫາປະຊາຊົນສໍາລັບອາການເຊັ່ນ: "ອາການໄຂ້" ແລະ "ອາການໄອ" (ມັນຍັງເບິ່ງຄືວ່າ ທີ່ຄຸນນະສົມບັດນີ້ແມ່ນບໍ່ມີຕໍ່ໄປອ​​ີກແລ້ວການເຄື່ອນໄຫວ). ເພີ່ມຄຸນນະສົມບັດນີ້ເປັນສິ່ງທີ່ສົມເຫດສົມຜົນທັງຫມົດຈະເຮັດແນວໃດຖ້າຫາກວ່າທ່ານກໍາລັງເຮັດທຸລະກິດເຄື່ອງຈັກຊອກຫາ, ແລະມັນມີຜົນກະທົບຂອງການຜະລິດຄົ້ນຫາເພີ່ມເຕີມທີ່ກ່ຽວຂ້ອງກັບສຸຂະພາບ. ນີ້ແມ່ນອາດຈະເປັນຜົນສໍາເລັດສໍາລັບທຸລະກິດ, ແຕ່ວ່າມັນເກີດມາຈາກກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ໃນໄລຍະການຄາດຄະເນອັດຕາໄຂ້ຫວັດໃຫຍ່ (Lazer et al. 2014) .

ໂຊກດີ, ບັນຫາເຫຼົ່ານີ້ມີກູໂກແນວໂນ້ມຍາດໄຂ້ຫວັດໃຫຍ່ແມ່ນແນ່ນອນ. ໃນຄວາມເປັນຈິງ, ການນໍາໃຊ້ວິທີການລະມັດລະວັງຫຼາຍ, Lazer et al. (2014) ແລະ Yang, Santillana, and Kou (2015) ສາມາດໄດ້ຮັບຜົນໄດ້ຮັບທີ່ດີກວ່າ. ກ້າວໄປຂ້າງຫນ້າ, ຂ້າພະເຈົ້າຄາດຫວັງວ່າການສຶກສາ Nowcasting ທີ່ສົມທົບການຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ມີນັກຄົ້ນຄວ້າເກັບກໍາຂໍ້ມູນທີ່ສົມທົບ Readymades Duchamp ແບບມີ Michaelangelo ແບບ Custommades, ຈະເຮັດໃຫ້ຜູ້ຜະລິດນະໂຍບາຍການຜະລິດມາດຕະການໄວຂຶ້ນແລະຖືກຕ້ອງຫລາຍໃນປະຈຸບັນແລະການຄາດຄະເນໃນອະນາຄົດ.