2.3.2 ສະເຫມີໄປ

ສະເຫມີກ່ຽວກັບການຂໍ້ມູນຂະຫນາດໃຫຍ່ເຮັດໃຫ້ການສຶກສາຂອງກິດຈະກໍາທີ່ບໍ່ຄາດຄິດແລະມາດຕະການທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາໄດ້.

ຫຼາຍຄົນລະບົບຂໍ້ມູນຂະຫນາດໃຫຍ່ມີຄວາມສະເຫມີກ່ຽວກັບການ; ພວກເຂົາເຈົ້າແມ່ນຢູ່ສະເຫມີການເກັບກໍາຂໍ້ມູນ. ນີ້ລັກສະນະສະເຫມີກ່ຽວກັບການໃຫ້ນັກຄົ້ນຄວ້າທີ່ມີຂໍ້ມູນຕາມລວງຍາວ (ie, ຂໍ້ມູນໃນໄລຍະທີ່ໃຊ້ເວລາ). ເປັນສະເຫມີໄປ, ສຸດທີ່ມີສອງຄວາມຫມາຍສໍາຄັນສໍາລັບການຄົ້ນຄວ້າ.

ຫນ້າທໍາອິດ, ການເກັບກໍາຂໍ້ມູນສະເຫມີໄປເຮັດໃຫ້ນັກຄົ້ນຄວ້າສາມາດຄົ້ນຄ້ວາເຫດການທີ່ບໍ່ໄດ້ຄາດຫວັງໄວ້ໃນວິທີທີ່ອາດຈະບໍ່ເປັນໄປໄດ້. ຕົວຢ່າງ, ນັກຄົ້ນຄວ້າທີ່ສົນໃຈໃນການສຶກສາການປະທ້ວງ Occupy Gezi ໃນຕຸລະກີໃນຊ່ວງລຶະເບິ່ງຮ້ອນ 2013 ໂດຍປົກກະຕິຈະມຸ່ງເນັ້ນໃສ່ພຶດຕິກໍາຂອງພວກປະທ້ວງໃນລະຫວ່າງເຫດການ. Ceren Budak ແລະ Duncan Watts (2015) ສາມາດເຮັດໄດ້ຫຼາຍຂື້ນໂດຍນໍາໃຊ້ລັກສະນະສະເຫມີຂອງ Twitter ເພື່ອສຶກສາຜູ້ປະທ້ວງທີ່ໃຊ້ Twitter ກ່ອນ, ໃນລະຫວ່າງແລະຫຼັງຈາກເຫດການ. ແລະ, ພວກເຂົາສາມາດສ້າງກຸ່ມທີ່ບໍ່ມີສ່ວນຮ່ວມກ່ອນ, ໃນລະຫວ່າງແລະຫຼັງຈາກເຫດການ (ຮູບທີ່ 2.2). ໃນຈໍານວນທັງຫມົດ, ຄະນະກໍາມະການໃນອະດີດ ຂອງພວກເຂົາລວມມີ tweets ຂອງ 30,000 ຄົນໃນໄລຍະສອງປີ. ໂດຍເພີ່ມທະວີການນໍາໃຊ້ຂໍ້ມູນທົ່ວໄປຈາກການປະທ້ວງທີ່ມີຂໍ້ມູນນີ້, Budak ແລະ Watts ສາມາດຮຽນຮູ້ເພີ່ມເຕີມ: ພວກເຂົາສາມາດຄາດຄະເນວ່າປະເພດຂອງຜູ້ທີ່ມັກຈະເຂົ້າຮ່ວມໃນການປະທ້ວງຂອງ Gezi ແລະການຄາດຄະເນການປ່ຽນແປງໃນທັດສະນະຂອງ ຜູ້ເຂົ້າຮ່ວມແລະຜູ້ທີ່ບໍ່ມີສ່ວນຮ່ວມ, ທັງໃນໄລຍະສັ້ນ (ປຽບທຽບກ່ອນ Gezi ໃນໄລຍະ Gezi) ແລະໃນໄລຍະຍາວ (ປຽບທຽບກ່ອນ Gezi ກັບ Post-Gezi).

ຮູບທີ່ 22: ການອອກແບບໃຊ້ໂດຍ Budak ແລະ Watts (2015) ເພື່ອສຶກສາການປະທ້ວງ Occupy Gezi ໃນຕຸລະກີໃນຊ່ວງລຶະເບິ່ງຮ້ອນຂອງປີ 2013 ໂດຍການນໍາໃຊ້ລັກສະນະສະເຫມີຂອງ Twitter, ນັກຄົ້ນຄວ້າໄດ້ສ້າງສິ່ງທີ່ພວກເຂົາເອີ້ນວ່າເອກະສານທີ່ຜ່ານມາ 30,000 ຄົນໃນໄລຍະສອງປີ. ນອກເຫນືອຈາກການສຶກສາປົກກະຕິທີ່ສຸມໃສ່ຜູ້ເຂົ້າຮ່ວມໃນເວລາການປະທ້ວງ, ຄະນະກໍາມະການສະແດງອອກຄັ້ງທໍາອິດເພີ່ມ 1 ຂໍ້ມູນຈາກຜູ້ເຂົ້າຮ່ວມກ່ອນແລະຫຼັງເຫດການແລະ 2) ຂໍ້ມູນຈາກຜູ້ທີ່ບໍ່ເຂົ້າຮ່ວມກ່ອນ, ໃນແລະພາຍຫຼັງເຫດການ. ໂຄງສ້າງຂໍ້ມູນທີ່ເພີ່ມຂື້ນນີ້ຊ່ວຍໃຫ້ Budak ແລະ Watts ປະເມີນວ່າປະຊາຊົນມີແນວໂນ້ມທີ່ຈະມີສ່ວນຮ່ວມໃນການປະທ້ວງ Gezi ແລະຄາດຄະເນການປ່ຽນແປງໃນທັດສະນະຂອງຜູ້ເຂົ້າຮ່ວມແລະຜູ້ເຂົ້າຮ່ວມບໍ່ວ່າໃນໄລຍະສັ້ນ (ປຽບທຽບກ່ອນ Gezi ໃນລະຫວ່າງ Gezi ) ແລະໃນໄລຍະຍາວ (ປຽບທຽບກ່ອນ Gezi ກັບ Post-Gezi).

ຮູບທີ່ 22: ການອອກແບບໃຊ້ໂດຍ Budak and Watts (2015) ເພື່ອສຶກສາການປະທ້ວງ Occupy Gezi ໃນຕຸລະກີໃນຊ່ວງລຶະເບິ່ງຮ້ອນຂອງປີ 2013 ໂດຍການນໍາໃຊ້ລັກສະນະສະເຫມີຂອງ Twitter, ນັກຄົ້ນຄວ້າໄດ້ສ້າງສິ່ງທີ່ພວກເຂົາເອີ້ນວ່າເອ ກະສານ ທີ່ຜ່ານມາ 30,000 ຄົນໃນໄລຍະສອງປີ. ນອກເຫນືອຈາກການສຶກສາປົກກະຕິທີ່ສຸມໃສ່ຜູ້ເຂົ້າຮ່ວມໃນເວລາການປະທ້ວງ, ຄະນະກໍາມະການສະແດງອອກຄັ້ງທໍາອິດເພີ່ມ 1 ຂໍ້ມູນຈາກຜູ້ເຂົ້າຮ່ວມກ່ອນແລະຫຼັງເຫດການແລະ 2) ຂໍ້ມູນຈາກຜູ້ທີ່ບໍ່ເຂົ້າຮ່ວມກ່ອນ, ໃນແລະພາຍຫຼັງເຫດການ. ໂຄງສ້າງຂໍ້ມູນທີ່ເພີ່ມຂື້ນນີ້ຊ່ວຍໃຫ້ Budak ແລະ Watts ປະເມີນວ່າປະຊາຊົນມີແນວໂນ້ມທີ່ຈະມີສ່ວນຮ່ວມໃນການປະທ້ວງ Gezi ແລະຄາດຄະເນການປ່ຽນແປງໃນທັດສະນະຂອງຜູ້ເຂົ້າຮ່ວມແລະຜູ້ເຂົ້າຮ່ວມບໍ່ວ່າໃນໄລຍະສັ້ນ (ປຽບທຽບກ່ອນ Gezi ໃນລະຫວ່າງ Gezi ) ແລະໃນໄລຍະຍາວ (ປຽບທຽບກ່ອນ Gezi ກັບ Post-Gezi).

ຄວາມບໍ່ຄ່ອຍເຊື່ອງ່າຍໆອາດຊີ້ໃຫ້ເຫັນວ່າບາງການຄາດຄະເນເຫຼົ່ານີ້ອາດຈະເຮັດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ເວລາໃນການເກັບກໍາຂໍ້ມູນ (ຕົວຢ່າງ, ການຄາດຄະເນໄລຍະຍາວຂອງການປ່ຽນແປງທັດສະນະ), ແລະແມ່ນຖືກຕ້ອງ, ເຖິງແມ່ນວ່າການເກັບຂໍ້ມູນສໍາລັບ 30,000 ຄົນ ລາຄາແພງ. ເຖິງວ່າຈະໄດ້ຮັບງົບປະມານທີ່ບໍ່ຈໍາກັດແຕ່ຢ່າງໃດກໍ່ຕາມ, ຂ້າພະເຈົ້າບໍ່ສາມາດຄິດກ່ຽວກັບວິທີການອື່ນທີ່ຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າ ເດີນໄປໃນເວລາ ແລະສັງເກດເບິ່ງພຶດຕິກໍາຂອງຜູ້ເຂົ້າຮ່ວມໃນໄລຍະຜ່ານມາ. ທາງເລືອກທີ່ໃກ້ທີ່ສຸດແມ່ນຈະເກັບກໍາລາຍງານກ່ຽວກັບພຶດຕິກໍາໃຫມ່, ແຕ່ລາຍງານເຫຼົ່ານີ້ຈະມີຂໍ້ຈໍາກັດແລະຄວາມຖືກຕ້ອງທີ່ຖືກຕ້ອງ. ຕາຕະລາງ 2.1 ສະຫນອງຕົວຢ່າງອື່ນໆຂອງການສຶກສາທີ່ນໍາໃຊ້ແຫຼ່ງຂໍ້ມູນສະເຫມີກ່ຽວກັບການສຶກສາເຫດການທີ່ບໍ່ຄາດຄິດ.

ຕາຕະລາງ 2.1: ການສຶກສາຂອງເຫດການທີ່ບໍ່ຄາດຄິດທີ່ນໍາໃຊ້ສະເຫມີກ່ຽວກັບແຫຼ່ງຂໍ້ມູນໃຫຍ່.
ເຫດການທີ່ບໍ່ຄາດຝັນ ສະເຫມີກ່ຽວກັບແຫຼ່ງຂໍ້ມູນ ການອ້າງອິງ
ເຄື່ອນຍ້າຍ Gezi ໃນ Turkey Twitter Budak and Watts (2015)
ການປະທ້ວງ Umbrella ໃນຮ່ອງກົງ Weibo Zhang (2016)
ການຍິງຂອງຕໍາຫຼວດໃນນະຄອນນິວຢອກ ບົດລາຍງານຢຸດແລະຄວາມຂັດແຍ້ງ Legewie (2016)
ບຸກຄົນເຂົ້າຮ່ວມ ISIS Twitter Magdy, Darwish, and Weber (2016)
11 ກັນຍາ 2001 ການໂຈມຕີ livejournalcom Cohn, Mehl, and Pennebaker (2004)
11 ກັນຍາ 2001 ການໂຈມຕີ pager messages Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

ນອກເຫນືອຈາກການສຶກສາເຫດການທີ່ບໍ່ໄດ້ຄາດຫວັງ, ລະບົບຂໍ້ມູນທີ່ໃຫຍ່ທີ່ສຸດກໍ່ຍັງຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າສາມາດຜະລິດການຄາດຄະເນໃນເວລາທີ່ແທ້ຈິງ, ເຊິ່ງສາມາດມີຄວາມສໍາຄັນໃນສະຖານທີ່ຜູ້ກໍານົດນະໂຍບາຍໃນລັດຖະບານຫຼືອຸດສາຫະກໍາຕ້ອງຕອບສະຫນອງຕາມຄວາມຮູ້. ຕົວຢ່າງ: ຂໍ້ມູນສື່ມວນຊົນສັງຄົມສາມາດນໍາໃຊ້ເພື່ອຕອບສະຫນອງການຕອບສະຫນອງຕໍ່ໄພພິບັດຕໍ່ໄພພິບັດທໍາມະຊາດ (Castillo 2016) ແລະສາມາດນໍາໃຊ້ແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນຈາກແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນທີ່ແຕກຕ່າງກັນ (Choi and Varian 2012) .

ໃນທີ່ສຸດ, ລະບົບຂໍ້ມູນສະເຫມີໄປເຮັດໃຫ້ນັກຄົ້ນຄວ້າສາມາດຮຽນຮູ້ເຫດການທີ່ບໍ່ຄາດຄິດແລະໃຫ້ຂໍ້ມູນໃນເວລາທີ່ແທ້ຈິງແກ່ຜູ້ສ້າງນະໂຍບາຍ. ແຕ່ຂ້ອຍບໍ່ຄິດວ່າລະບົບຂໍ້ມູນສະເຫມີໄປເຫມາະສົມສໍາລັບການຕິດຕາມການປ່ຽນແປງໃນໄລຍະເວລາດົນນານ. ນັ້ນແມ່ນຍ້ອນວ່າລະບົບຂໍ້ມູນທີ່ມີຂະຫນາດໃຫຍ່ມີການປ່ຽນແປງເລື້ອຍໆ - ຂະບວນການທີ່ຂ້ອຍຈະຮ່ໍ ຮຽນໃນພາກຕໍ່ມາ (ພາກ 2.3.7).