ສະເຫມີກ່ຽວກັບການຂໍ້ມູນຂະຫນາດໃຫຍ່ເຮັດໃຫ້ການສຶກສາຂອງກິດຈະກໍາທີ່ບໍ່ຄາດຄິດແລະມາດຕະການທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາໄດ້.
ຫຼາຍຄົນລະບົບຂໍ້ມູນຂະຫນາດໃຫຍ່ມີຄວາມສະເຫມີກ່ຽວກັບການ; ພວກເຂົາເຈົ້າແມ່ນຢູ່ສະເຫມີການເກັບກໍາຂໍ້ມູນ. ນີ້ລັກສະນະສະເຫມີກ່ຽວກັບການໃຫ້ນັກຄົ້ນຄວ້າທີ່ມີຂໍ້ມູນຕາມລວງຍາວ (ie, ຂໍ້ມູນໃນໄລຍະທີ່ໃຊ້ເວລາ). ເປັນສະເຫມີໄປ, ສຸດທີ່ມີສອງຄວາມຫມາຍສໍາຄັນສໍາລັບການຄົ້ນຄວ້າ.
ຫນ້າທໍາອິດ, ການເກັບກໍາຂໍ້ມູນສະເຫມີໄປເຮັດໃຫ້ນັກຄົ້ນຄວ້າສາມາດຄົ້ນຄ້ວາເຫດການທີ່ບໍ່ໄດ້ຄາດຫວັງໄວ້ໃນວິທີທີ່ອາດຈະບໍ່ເປັນໄປໄດ້. ຕົວຢ່າງ, ນັກຄົ້ນຄວ້າທີ່ສົນໃຈໃນການສຶກສາການປະທ້ວງ Occupy Gezi ໃນຕຸລະກີໃນຊ່ວງລຶະເບິ່ງຮ້ອນ 2013 ໂດຍປົກກະຕິຈະມຸ່ງເນັ້ນໃສ່ພຶດຕິກໍາຂອງພວກປະທ້ວງໃນລະຫວ່າງເຫດການ. Ceren Budak ແລະ Duncan Watts (2015) ສາມາດເຮັດໄດ້ຫຼາຍຂື້ນໂດຍນໍາໃຊ້ລັກສະນະສະເຫມີຂອງ Twitter ເພື່ອສຶກສາຜູ້ປະທ້ວງທີ່ໃຊ້ Twitter ກ່ອນ, ໃນລະຫວ່າງແລະຫຼັງຈາກເຫດການ. ແລະ, ພວກເຂົາສາມາດສ້າງກຸ່ມທີ່ບໍ່ມີສ່ວນຮ່ວມກ່ອນ, ໃນລະຫວ່າງແລະຫຼັງຈາກເຫດການ (ຮູບທີ່ 2.2). ໃນຈໍານວນທັງຫມົດ, ຄະນະກໍາມະການໃນອະດີດ ຂອງພວກເຂົາລວມມີ tweets ຂອງ 30,000 ຄົນໃນໄລຍະສອງປີ. ໂດຍເພີ່ມທະວີການນໍາໃຊ້ຂໍ້ມູນທົ່ວໄປຈາກການປະທ້ວງທີ່ມີຂໍ້ມູນນີ້, Budak ແລະ Watts ສາມາດຮຽນຮູ້ເພີ່ມເຕີມ: ພວກເຂົາສາມາດຄາດຄະເນວ່າປະເພດຂອງຜູ້ທີ່ມັກຈະເຂົ້າຮ່ວມໃນການປະທ້ວງຂອງ Gezi ແລະການຄາດຄະເນການປ່ຽນແປງໃນທັດສະນະຂອງ ຜູ້ເຂົ້າຮ່ວມແລະຜູ້ທີ່ບໍ່ມີສ່ວນຮ່ວມ, ທັງໃນໄລຍະສັ້ນ (ປຽບທຽບກ່ອນ Gezi ໃນໄລຍະ Gezi) ແລະໃນໄລຍະຍາວ (ປຽບທຽບກ່ອນ Gezi ກັບ Post-Gezi).
ຄວາມບໍ່ຄ່ອຍເຊື່ອງ່າຍໆອາດຊີ້ໃຫ້ເຫັນວ່າບາງການຄາດຄະເນເຫຼົ່ານີ້ອາດຈະເຮັດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ເວລາໃນການເກັບກໍາຂໍ້ມູນ (ຕົວຢ່າງ, ການຄາດຄະເນໄລຍະຍາວຂອງການປ່ຽນແປງທັດສະນະ), ແລະແມ່ນຖືກຕ້ອງ, ເຖິງແມ່ນວ່າການເກັບຂໍ້ມູນສໍາລັບ 30,000 ຄົນ ລາຄາແພງ. ເຖິງວ່າຈະໄດ້ຮັບງົບປະມານທີ່ບໍ່ຈໍາກັດແຕ່ຢ່າງໃດກໍ່ຕາມ, ຂ້າພະເຈົ້າບໍ່ສາມາດຄິດກ່ຽວກັບວິທີການອື່ນທີ່ຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າ ເດີນໄປໃນເວລາ ແລະສັງເກດເບິ່ງພຶດຕິກໍາຂອງຜູ້ເຂົ້າຮ່ວມໃນໄລຍະຜ່ານມາ. ທາງເລືອກທີ່ໃກ້ທີ່ສຸດແມ່ນຈະເກັບກໍາລາຍງານກ່ຽວກັບພຶດຕິກໍາໃຫມ່, ແຕ່ລາຍງານເຫຼົ່ານີ້ຈະມີຂໍ້ຈໍາກັດແລະຄວາມຖືກຕ້ອງທີ່ຖືກຕ້ອງ. ຕາຕະລາງ 2.1 ສະຫນອງຕົວຢ່າງອື່ນໆຂອງການສຶກສາທີ່ນໍາໃຊ້ແຫຼ່ງຂໍ້ມູນສະເຫມີກ່ຽວກັບການສຶກສາເຫດການທີ່ບໍ່ຄາດຄິດ.
ເຫດການທີ່ບໍ່ຄາດຝັນ | ສະເຫມີກ່ຽວກັບແຫຼ່ງຂໍ້ມູນ | ການອ້າງອິງ |
---|---|---|
ເຄື່ອນຍ້າຍ Gezi ໃນ Turkey | Budak and Watts (2015) | |
ການປະທ້ວງ Umbrella ໃນຮ່ອງກົງ | Zhang (2016) | |
ການຍິງຂອງຕໍາຫຼວດໃນນະຄອນນິວຢອກ | ບົດລາຍງານຢຸດແລະຄວາມຂັດແຍ້ງ | Legewie (2016) |
ບຸກຄົນເຂົ້າຮ່ວມ ISIS | Magdy, Darwish, and Weber (2016) | |
11 ກັນຍາ 2001 ການໂຈມຕີ | livejournalcom | Cohn, Mehl, and Pennebaker (2004) |
11 ກັນຍາ 2001 ການໂຈມຕີ | pager messages | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
ນອກເຫນືອຈາກການສຶກສາເຫດການທີ່ບໍ່ໄດ້ຄາດຫວັງ, ລະບົບຂໍ້ມູນທີ່ໃຫຍ່ທີ່ສຸດກໍ່ຍັງຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າສາມາດຜະລິດການຄາດຄະເນໃນເວລາທີ່ແທ້ຈິງ, ເຊິ່ງສາມາດມີຄວາມສໍາຄັນໃນສະຖານທີ່ຜູ້ກໍານົດນະໂຍບາຍໃນລັດຖະບານຫຼືອຸດສາຫະກໍາຕ້ອງຕອບສະຫນອງຕາມຄວາມຮູ້. ຕົວຢ່າງ: ຂໍ້ມູນສື່ມວນຊົນສັງຄົມສາມາດນໍາໃຊ້ເພື່ອຕອບສະຫນອງການຕອບສະຫນອງຕໍ່ໄພພິບັດຕໍ່ໄພພິບັດທໍາມະຊາດ (Castillo 2016) ແລະສາມາດນໍາໃຊ້ແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນຈາກແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນທີ່ແຕກຕ່າງກັນ (Choi and Varian 2012) .
ໃນທີ່ສຸດ, ລະບົບຂໍ້ມູນສະເຫມີໄປເຮັດໃຫ້ນັກຄົ້ນຄວ້າສາມາດຮຽນຮູ້ເຫດການທີ່ບໍ່ຄາດຄິດແລະໃຫ້ຂໍ້ມູນໃນເວລາທີ່ແທ້ຈິງແກ່ຜູ້ສ້າງນະໂຍບາຍ. ແຕ່ຂ້ອຍບໍ່ຄິດວ່າລະບົບຂໍ້ມູນສະເຫມີໄປເຫມາະສົມສໍາລັບການຕິດຕາມການປ່ຽນແປງໃນໄລຍະເວລາດົນນານ. ນັ້ນແມ່ນຍ້ອນວ່າລະບົບຂໍ້ມູນທີ່ມີຂະຫນາດໃຫຍ່ມີການປ່ຽນແປງເລື້ອຍໆ - ຂະບວນການທີ່ຂ້ອຍຈະຮ່ໍ າ ຮຽນໃນພາກຕໍ່ມາ (ພາກ 2.3.7).