2.3.1.2 ສະເຫມີກ່ຽວກັບການ

ສະເຫມີກ່ຽວກັບການຂໍ້ມູນຂະຫນາດໃຫຍ່ເຮັດໃຫ້ການສຶກສາຂອງກິດຈະກໍາທີ່ບໍ່ຄາດຄິດແລະມາດຕະການທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາໄດ້.

ຫຼາຍຄົນລະບົບຂໍ້ມູນຂະຫນາດໃຫຍ່ມີຄວາມສະເຫມີກ່ຽວກັບການ; ພວກເຂົາເຈົ້າແມ່ນຢູ່ສະເຫມີການເກັບກໍາຂໍ້ມູນ. ນີ້ລັກສະນະສະເຫມີກ່ຽວກັບການໃຫ້ນັກຄົ້ນຄວ້າທີ່ມີຂໍ້ມູນຕາມລວງຍາວ (ie, ຂໍ້ມູນໃນໄລຍະທີ່ໃຊ້ເວລາ). ເປັນສະເຫມີໄປ, ສຸດທີ່ມີສອງຄວາມຫມາຍສໍາຄັນສໍາລັບການຄົ້ນຄວ້າ.

ຫນ້າທໍາອິດ, ສະເຫມີໄປ, ໃນການເກັບຂໍ້ມູນເຮັດໃຫ້ນັກຄົ້ນຄວ້າການສຶກສາກິດຈະກໍາທີ່ບໍ່ຄາດຄິດໃນວິທີການທີ່ເປັນໄປບໍ່ໄດ້ໃນເມື່ອກ່ອນ. ສໍາລັບການຍົກຕົວຢ່າງ, ນັກຄົ້ນຄວ້າມີຄວາມສົນໃຈໃນການສຶກສາໄວກວ່າການປະທ້ວງ Gezi ໃນ Turkey ໃນ summer ຂອງ 2013 ໂດຍປົກກະຕິຈະສຸມໃສ່ການກ່ຽວກັບພຶດຕິກໍາຂອງພວກປະທ້ວງໃນລະຫວ່າງການກໍລະນີທີ່ໄດ້. Ceren Budak ແລະ Duncan Watts (2015) ສາມາດເຮັດໄດ້ຫຼາຍໂດຍການນໍາໃຊ້ລັກສະນະສະເຫມີກ່ຽວກັບການຂອງສະມາຊິກການສຶກສາ Twitter, ການນໍາໃຊ້ພວກປະທ້ວງກ່ອນ, ໃນໄລຍະ, ແລະຫຼັງຈາກເກີດເຫດ. ແລະພວກເຂົາສາມາດທີ່ຈະສ້າງກຸ່ມການປຽບທຽບທີ່ບໍ່ແມ່ນຜູ້ເຂົ້າຮ່ວມ, (ຫຼືຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ໄດ້ທະວີກ່ຽວກັບການປະທ້ວງ) ກ່ອນທີ່ຈະ, ໃນໄລຍະ, ແລະຫຼັງຈາກເກີດເຫດ (ຮູບ 21). ໃນຈໍານວນທັງຫມົດຄະນະກໍາມະຫັງການຂອງເຂົາເຈົ້າລວມ tweets ຂອງ 30,000 ປະຊາຊົນໃນໄລຍະສອງປີ. ໂດຍ augmenting ໄດ້ຂໍ້ມູນທີ່ໃຊ້ທົ່ວໄປຈາກການປະທ້ວງທີ່ມີຂໍ້ມູນອື່ນນີ້, Budak ແລະວັດມີຄວາມສາມາດຮຽນຮູ້ຫຼາຍ: ພວກເຂົາເຈົ້າໄດ້ສາມາດທີ່ຈະຄາດຄະເນສິ່ງທີ່ປະເພດຂອງປະຊາຊົນມີແນວໂນ້ມທີ່ຈະເຂົ້າຮ່ວມໃນການປະທ້ວງ Gezi ແລະເພື່ອປະເມີນການປ່ຽນແປງໃນທັດສະນະຂອງ ຜູ້ເຂົ້າຮ່ວມແລະຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ແມ່ນ, ທັ​​ງໃນໄລຍະສັ້ນ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ກັບໃນລະຫວ່າງການ Gezi) ແລະໃນໄລຍະຍາວ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ໄປສະນີ, Gezi).

ຮູບທີ່ 21: ການອອກແບບການນໍາໃຊ້ used ໂດຍ Budak ແລະ Watts (2015) ການສຶກສາໄວກວ່າການປະທ້ວງ Gezi ໃນ Turkey ໃນ summer ຂອງປີ 2013 ໂດຍການນໍາໃຊ້ລັກສະນະສະເຫມີໄປ, ສຸດຂອງ Twitter, ຄົ້ນຄວ້າການສ້າງຕັ້ງສິ່ງທີ່ພວກເຂົາເຈົ້າເອີ້ນວ່າຄະນະກໍາມະ ex ຕອບໄດ້ວ່າລວມກ່ຽວກັບ 30,000 ປະຊາຊົນໃນໄລຍະສອງປີ. ໃນທາງກົງກັນຂ້າມການສຶກສາປົກກະຕິທີ່ໄດ້ສຸມໃສ່ກ່ຽວກັບການຮ່ວມໃນລະຫວ່າງການປະທ້ວງໄດ້, ຄະນະກໍາມະຫັງການເພີ້ມ 1) ຂໍ້ມູນຈາກຜູ້ເຂົ້າຮ່ວມກ່ອນແລະຫຼັງຈາກກໍລະນີແລະ 2) ຂໍ້ມູນຈາກຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ແມ່ນກ່ອນ, ໃນໄລຍະ, ແລະຫຼັງຈາກເກີດເຫດ. ໂຄງປະກອບການຂໍ້ມູນນີ້ອຸດົມເປີດການໃຊ້ງານ Budak ແລະວັດເພື່ອປະເມີນສິ່ງທີ່ປະເພດຂອງປະຊາຊົນມີແນວໂນ້ມທີ່ຈະເຂົ້າຮ່ວມໃນການປະທ້ວງ Gezi ແລະເພື່ອປະເມີນການປ່ຽນແປງໃນທັດສະນະຂອງຜູ້ເຂົ້າຮ່ວມແລະຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ໄດ້, ທັງຢູ່ໃນໄລຍະສັ້ນ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ກັບໃນລະຫວ່າງການ Gezi) ແລະໃນໄລຍະຍາວ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ໄປສະນີ, Gezi).

ຮູບທີ່ 21: ການອອກແບບການນໍາໃຊ້ used ໂດຍ Budak and Watts (2015) ການສຶກສາໄວກວ່າການປະທ້ວງ Gezi ໃນ Turkey ໃນ summer ຂອງປີ 2013 ໂດຍການນໍາໃຊ້ລັກສະນະສະເຫມີໄປ, ສຸດຂອງ Twitter, ຄົ້ນຄວ້າການສ້າງຕັ້ງສິ່ງທີ່ພວກເຂົາເຈົ້າເອີ້ນວ່າຄະນະກໍາມະ ex ຕອບໄດ້ວ່າລວມກ່ຽວກັບ 30,000 ປະຊາຊົນໃນໄລຍະສອງປີ. ໃນທາງກົງກັນຂ້າມການສຶກສາປົກກະຕິທີ່ໄດ້ສຸມໃສ່ກ່ຽວກັບການຮ່ວມໃນລະຫວ່າງການປະທ້ວງໄດ້, ຄະນະກໍາມະຫັງການເພີ້ມ 1) ຂໍ້ມູນຈາກຜູ້ເຂົ້າຮ່ວມກ່ອນແລະຫຼັງຈາກກໍລະນີແລະ 2) ຂໍ້ມູນຈາກຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ແມ່ນກ່ອນ, ໃນໄລຍະ, ແລະຫຼັງຈາກເກີດເຫດ. ໂຄງປະກອບການຂໍ້ມູນນີ້ອຸດົມເປີດການໃຊ້ງານ Budak ແລະວັດເພື່ອປະເມີນສິ່ງທີ່ປະເພດຂອງປະຊາຊົນມີແນວໂນ້ມທີ່ຈະເຂົ້າຮ່ວມໃນການປະທ້ວງ Gezi ແລະເພື່ອປະເມີນການປ່ຽນແປງໃນທັດສະນະຂອງຜູ້ເຂົ້າຮ່ວມແລະຜູ້ເຂົ້າຮ່ວມທີ່ບໍ່ໄດ້, ທັງຢູ່ໃນໄລຍະສັ້ນ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ກັບໃນລະຫວ່າງການ Gezi) ແລະໃນໄລຍະຍາວ (ການປຽບທຽບທາງສ່ວນຫນ້າຂອງ Gezi ໄປສະນີ, Gezi).

ມັນເປັນຄວາມຈິງທີ່ວ່າບາງສ່ວນຂອງການຄາດຄະເນເຫຼົ່ານີ້ສາມາດໄດ້ຮັບການເຮັດໂດຍບໍ່ມີການສະເຫມີກ່ຽວກັບແຫຼ່ງຂໍ້ມູນທີ່ເກັບກໍາຂໍ້ມູນ (ຕົວຢ່າງ, ການຄາດຄະເນໃນໄລຍະຍາວຂອງການປ່ຽນແປງທັດສະນະຄະ), ເຖິງແມ່ນວ່າການເກັບຂໍ້ມູນດັ່ງກ່າວສໍາລັບ 30,000 ຄົນຈະໄດ້ຮັບລາຄາແພງທີ່ຂ້ອນຂ້າງ. ແລະ, ເຖິງແມ່ນວ່າໄດ້ຮັບງົບປະມານບໍ່ຈໍາກັດ, ຂ້າພະເຈົ້າບໍ່ສາມາດຄິດຂອງວິທີການອື່ນໆທີ່ເປັນສິ່ງຈໍາເປັນອະນຸຍາດໃຫ້ນັກຄົ້ນຄວ້າທີ່ຈະເດີນທາງກັບຄືນໄປບ່ອນໃນທີ່ໃຊ້ເວລາແລະໂດຍກົງໄດ້ສັງເກດເຫັນພຶດຕິກໍາຜູ້ເຂົ້າຮ່ວມໃນໄລຍະຜ່ານມາ. ທາງເລືອກຊະນິດຈະເປັນການເກັບກໍາລາຍງານ retrospective ຂອງພຶດຕິກໍາ, ແຕ່ບົດລາຍງານເຫຼົ່ານີ້ຈະເປັນຂອງຈໍານວນເມັດຈໍາກັດແລະຄວາມຖືກຕ້ອງທີ່ຫນ້າສົງໄສ. ຕາຕະລາງ 2.1 ສະແດງຕົວຢ່າງຂອງການສຶກສາທີ່ໃຊ້ເປັນສະເຫມີໄປ, ກັບແຫລ່ງຂໍ້ມູນການສຶກສາກໍລະນີທີ່ບໍ່ໄດ້ຄາດຫວັງ.

ຕາຕະລາງ 21: ການສຶກສາຂອງເຫດການທີ່ບໍ່ຄາດຄິດການນໍາໃຊ້ສະເຫມີໄປ, ກັບແຫຼ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່.
ກໍລະນີທີ່ບໍ່ໄດ້ຄາດຫວັງ ສະເຫມີກ່ຽວກັບແຫລ່ງຂໍ້ມູນ ການຂຽນກ່າວອ້າງ
ເຄື່ອນໄຫວໄວກວ່າ Gezi ໃນ Turkey Twitter Budak and Watts (2015)
ການປະທ້ວງ Umbrella ໃນຮ່ອງກົງ Weibo Zhang (2016)
ຫນໍ່ໄມ້ສ່ວນຫຼາຍຂອງຕໍາຫຼວດໃນນິວຢອກ, ນະຄອນ ບົດລາຍງານແລະ frisk ຢຸດເຊົາການ Legewie (2016)
ບຸກຄົນເຂົ້າຮ່ວມ ISIS Twitter Magdy, Darwish, and Weber (2016)
11 ກັນຍາ, 2001 ການໂຈມຕີ livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 ກັນຍາ, 2001 ການໂຈມຕີ ຂໍ້ຄວາມ pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

ຄັ້ງທີສອງ, ສະເຫມີໄປໃນການເກັບຂໍ້ມູນເຮັດໃຫ້ນັກຄົ້ນຄວ້າການຜະລິດມາດຕະການທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາ, ທີ່ສາມາດເປັນສິ່ງສໍາຄັນໃນການຕັ້ງຄ່າທີ່ຜູ້ຜະລິດນະໂຍບາຍຕ້ອງການທີ່ຈະບໍ່ພຽງແຕ່ໄດ້ຮຽນຮູ້ຈາກພຶດຕິກໍາທີ່ມີຢູ່ແລ້ວແຕ່ວ່າຍັງຕອບສະຫນອງກັບມັນ. ສໍາລັບການຍົກຕົວຢ່າງ, ຂໍ້ມູນສື່ມວນຊົນສັງຄົມສາມາດນໍາໃຊ້ເພື່ອເປັນທິດທາງການຕອບສະຫນອງການໄພພິບັດທໍາມະຊາດ (Castillo 2016) .

ໃນການສະຫລຸບ, ສະເຫມີໄປ, ຂໍ້ມູນລະບົບການເຮັດໃຫ້ນັກຄົ້ນຄວ້າການສຶກສາກິດຈະກໍາທີ່ບໍ່ຄາດຄິດແລະການສະຫນອງຂໍ້ມູນທີ່ແທ້ຈິງທີ່ໃຊ້ເວລາກັບຜູ້ຜະລິດນະໂຍບາຍ. ຂ້າພະເຈົ້າບໍ່ໄດ້, ຢ່າງໃດກໍຕາມ, ສະເຫນີວ່າສະເຫມີໄປ, ຂໍ້ມູນລະບົບການເຮັດໃຫ້ນັກຄົ້ນຄວ້າທີ່ຈະຕິດຕາມການປ່ຽນແປງໃນໄລຍະໄລຍະເວລາທີ່ຍາວນານທີ່ໃຊ້ເວລາ. ວ່າແມ່ນຍ້ອນວ່າລະບົບການຫຼາຍຂໍ້ມູນຂະຫນາດໃຫຍ່ມີການປ່ຽນແປງ, ຂະບວນການເອີ້ນວ່າພຽງການລອຍລົມ (ພາກ 2.3.2.4).