ສະເຫມີກ່ຽວກັບການຂໍ້ມູນຂະຫນາດໃຫຍ່ເຮັດໃຫ້ການສຶກສາຂອງກິດຈະກໍາທີ່ບໍ່ຄາດຄິດແລະມາດຕະການທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາໄດ້.
ຫຼາຍຄົນລະບົບຂໍ້ມູນຂະຫນາດໃຫຍ່ມີຄວາມສະເຫມີກ່ຽວກັບການ; ພວກເຂົາເຈົ້າແມ່ນຢູ່ສະເຫມີການເກັບກໍາຂໍ້ມູນ. ນີ້ລັກສະນະສະເຫມີກ່ຽວກັບການໃຫ້ນັກຄົ້ນຄວ້າທີ່ມີຂໍ້ມູນຕາມລວງຍາວ (ie, ຂໍ້ມູນໃນໄລຍະທີ່ໃຊ້ເວລາ). ເປັນສະເຫມີໄປ, ສຸດທີ່ມີສອງຄວາມຫມາຍສໍາຄັນສໍາລັບການຄົ້ນຄວ້າ.
ຫນ້າທໍາອິດ, ສະເຫມີໄປ, ໃນການເກັບຂໍ້ມູນເຮັດໃຫ້ນັກຄົ້ນຄວ້າການສຶກສາກິດຈະກໍາທີ່ບໍ່ຄາດຄິດໃນວິທີການທີ່ເປັນໄປບໍ່ໄດ້ໃນເມື່ອກ່ອນ. ສໍາລັບການຍົກຕົວຢ່າງ, ນັກຄົ້ນຄວ້າມີຄວາມສົນໃຈໃນການສຶກສາໄວກວ່າການປະທ້ວງ Gezi ໃນ Turkey ໃນ summer ຂອງ 2013 ໂດຍປົກກະຕິຈະສຸມໃສ່ການກ່ຽວກັບພຶດຕິກໍາຂອງພວກປະທ້ວງໃນລະຫວ່າງການກໍລະນີທີ່ໄດ້. Ceren Budak ແລະ Duncan Watts (2015) ສາມາດເຮັດໄດ້ຫຼາຍໂດຍການນໍາໃຊ້ລັກສະນະສະເຫມີກ່ຽວກັບການຂອງສະມາຊິກການສຶກສາ Twitter, ການນໍາໃຊ້ພວກປະທ້ວງກ່ອນ, ໃນໄລຍະ, ແລະຫຼັງຈາກເກີດເຫດ. ແລະພວກເຂົາສາມາດທີ່ຈະສ້າງກຸ່ມການປຽບທຽບທີ່ບໍ່ແມ່ນຜູ້ເຂົ້າຮ່ວມ, (ຫຼືຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ໄດ້ທະວີກ່ຽວກັບການປະທ້ວງ) ກ່ອນທີ່ຈະ, ໃນໄລຍະ, ແລະຫຼັງຈາກເກີດເຫດ (ຮູບ 21). ໃນຈໍານວນທັງຫມົດຄະນະກໍາມະຫັງການຂອງເຂົາເຈົ້າລວມ tweets ຂອງ 30,000 ປະຊາຊົນໃນໄລຍະສອງປີ. ໂດຍ augmenting ໄດ້ຂໍ້ມູນທີ່ໃຊ້ທົ່ວໄປຈາກການປະທ້ວງທີ່ມີຂໍ້ມູນອື່ນນີ້, Budak ແລະວັດມີຄວາມສາມາດຮຽນຮູ້ຫຼາຍ: ພວກເຂົາເຈົ້າໄດ້ສາມາດທີ່ຈະຄາດຄະເນສິ່ງທີ່ປະເພດຂອງປະຊາຊົນມີແນວໂນ້ມທີ່ຈະເຂົ້າຮ່ວມໃນການປະທ້ວງ Gezi ແລະເພື່ອປະເມີນການປ່ຽນແປງໃນທັດສະນະຂອງ ຜູ້ເຂົ້າຮ່ວມແລະຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ແມ່ນ, ທັງໃນໄລຍະສັ້ນ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ກັບໃນລະຫວ່າງການ Gezi) ແລະໃນໄລຍະຍາວ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ໄປສະນີ, Gezi).
ມັນເປັນຄວາມຈິງທີ່ວ່າບາງສ່ວນຂອງການຄາດຄະເນເຫຼົ່ານີ້ສາມາດໄດ້ຮັບການເຮັດໂດຍບໍ່ມີການສະເຫມີກ່ຽວກັບແຫຼ່ງຂໍ້ມູນທີ່ເກັບກໍາຂໍ້ມູນ (ຕົວຢ່າງ, ການຄາດຄະເນໃນໄລຍະຍາວຂອງການປ່ຽນແປງທັດສະນະຄະ), ເຖິງແມ່ນວ່າການເກັບຂໍ້ມູນດັ່ງກ່າວສໍາລັບ 30,000 ຄົນຈະໄດ້ຮັບລາຄາແພງທີ່ຂ້ອນຂ້າງ. ແລະ, ເຖິງແມ່ນວ່າໄດ້ຮັບງົບປະມານບໍ່ຈໍາກັດ, ຂ້າພະເຈົ້າບໍ່ສາມາດຄິດຂອງວິທີການອື່ນໆທີ່ເປັນສິ່ງຈໍາເປັນອະນຸຍາດໃຫ້ນັກຄົ້ນຄວ້າທີ່ຈະເດີນທາງກັບຄືນໄປບ່ອນໃນທີ່ໃຊ້ເວລາແລະໂດຍກົງໄດ້ສັງເກດເຫັນພຶດຕິກໍາຜູ້ເຂົ້າຮ່ວມໃນໄລຍະຜ່ານມາ. ທາງເລືອກຊະນິດຈະເປັນການເກັບກໍາລາຍງານ retrospective ຂອງພຶດຕິກໍາ, ແຕ່ບົດລາຍງານເຫຼົ່ານີ້ຈະເປັນຂອງຈໍານວນເມັດຈໍາກັດແລະຄວາມຖືກຕ້ອງທີ່ຫນ້າສົງໄສ. ຕາຕະລາງ 2.1 ສະແດງຕົວຢ່າງຂອງການສຶກສາທີ່ໃຊ້ເປັນສະເຫມີໄປ, ກັບແຫລ່ງຂໍ້ມູນການສຶກສາກໍລະນີທີ່ບໍ່ໄດ້ຄາດຫວັງ.
ກໍລະນີທີ່ບໍ່ໄດ້ຄາດຫວັງ | ສະເຫມີກ່ຽວກັບແຫລ່ງຂໍ້ມູນ | ການຂຽນກ່າວອ້າງ |
---|---|---|
ເຄື່ອນໄຫວໄວກວ່າ Gezi ໃນ Turkey | Budak and Watts (2015) | |
ການປະທ້ວງ Umbrella ໃນຮ່ອງກົງ | Zhang (2016) | |
ຫນໍ່ໄມ້ສ່ວນຫຼາຍຂອງຕໍາຫຼວດໃນນິວຢອກ, ນະຄອນ | ບົດລາຍງານແລະ frisk ຢຸດເຊົາການ | Legewie (2016) |
ບຸກຄົນເຂົ້າຮ່ວມ ISIS | Magdy, Darwish, and Weber (2016) | |
11 ກັນຍາ, 2001 ການໂຈມຕີ | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 ກັນຍາ, 2001 ການໂຈມຕີ | ຂໍ້ຄວາມ pager | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
ຄັ້ງທີສອງ, ສະເຫມີໄປໃນການເກັບຂໍ້ມູນເຮັດໃຫ້ນັກຄົ້ນຄວ້າການຜະລິດມາດຕະການທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາ, ທີ່ສາມາດເປັນສິ່ງສໍາຄັນໃນການຕັ້ງຄ່າທີ່ຜູ້ຜະລິດນະໂຍບາຍຕ້ອງການທີ່ຈະບໍ່ພຽງແຕ່ໄດ້ຮຽນຮູ້ຈາກພຶດຕິກໍາທີ່ມີຢູ່ແລ້ວແຕ່ວ່າຍັງຕອບສະຫນອງກັບມັນ. ສໍາລັບການຍົກຕົວຢ່າງ, ຂໍ້ມູນສື່ມວນຊົນສັງຄົມສາມາດນໍາໃຊ້ເພື່ອເປັນທິດທາງການຕອບສະຫນອງການໄພພິບັດທໍາມະຊາດ (Castillo 2016) .
ໃນການສະຫລຸບ, ສະເຫມີໄປ, ຂໍ້ມູນລະບົບການເຮັດໃຫ້ນັກຄົ້ນຄວ້າການສຶກສາກິດຈະກໍາທີ່ບໍ່ຄາດຄິດແລະການສະຫນອງຂໍ້ມູນທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາກັບຜູ້ຜະລິດນະໂຍບາຍ. ຂ້າພະເຈົ້າບໍ່ໄດ້, ຢ່າງໃດກໍຕາມ, ສະເຫນີວ່າສະເຫມີໄປ, ຂໍ້ມູນລະບົບການເຮັດໃຫ້ນັກຄົ້ນຄວ້າທີ່ຈະຕິດຕາມການປ່ຽນແປງໃນໄລຍະໄລຍະເວລາທີ່ຍາວນານທີ່ໃຊ້ເວລາ. ວ່າແມ່ນຍ້ອນວ່າລະບົບການຫຼາຍຂໍ້ມູນຂະຫນາດໃຫຍ່ມີການປ່ຽນແປງ, ຂະບວນການເອີ້ນວ່າພຽງການລອຍລົມ (ພາກ 2.3.2.4).