2.4.1.2 ທີ່ການສ້າງຕັ້ງບັນດານັກສຶກສາ

ນັກຄົ້ນຄວ້ານໍາໃຊ້ຂໍ້ມູນບັນທຶກອີເມວແລະການບັນທຶກການບໍລິຫານທີ່ຈະເຂົ້າໃຈການສ້າງຕັ້ງມິດຕະພາບ. ການຄົ້ນຄວ້ານີ້ຮຽກຮ້ອງໃຫ້ມີການຈັດການກັບຄວາມບໍ່ສົມບູນຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ໄດ້.

ໃນສະຖານະການຈໍານວນຫຼາຍ, ນັກຄົ້ນຄວ້າແມ່ນບໍ່ພົບພຽງພໍທີ່ຈະມີທຸກສິ່ງທຸກຢ່າງທີ່ພວກເຂົາເຈົ້າຕ້ອງການເກັບກໍາຂໍ້ມູນອັດຕະໂນມັດໃນສະຖານທີ່ຫນຶ່ງ. ສອງບັນຫາທົ່ວໄປທີ່ມີຂໍ້ມູນທີ່ບໍ່ຄົບຖ້ວນກ່ຽວກັບການປະຊາຊົນແລະບໍ່ກົງກັນລະຫວ່າງການກໍ່ສ້າງທິດສະດີແລະຂໍ້ມູນ. ທັງສອງຂອງບັນຫາເຫລົ່ານີ້ໄດ້ຮັບການແກ້ໄຂໂດຍ Kossinets ແລະ Watts (2009) ເປັນສ່ວນຫນຶ່ງຂອງຄວາມພະຍາຍາມຂອງເຂົາເຈົ້າທີ່ຈະເຂົ້າໃຈວິທີການເຄືອຂ່າຍສັງຄົມຂະບວນການ.

ມານໃນການເວົ້າ, ນັກຄົ້ນຄວ້າຄິດວ່າວິວັດທະນາເຄືອຂ່າຍທາງສັງຄົມໄດ້ຖືກຂັບເຄື່ອນໂດຍສາມລັກສະນະ: 1) ໂຄງປະກອບການຂອງການພົວພັນທີ່ມີຢູ່ແລ້ວ 2) ກິດຈະກໍາຮ່ວມ (ຕົວຢ່າງ:, ຫໍພັກ, ຫ້ອງຮຽນ) ແລະ 3) ປະຊາກອນໄດ້. ຄວາມເຂົ້າໃຈ interrelationships ລະຫວ່າງສາມປັດໃຈເຫຼົ່ານີ້ຮຽກຮ້ອງໃຫ້ມີເຄືອຂ່າຍຂໍ້ມູນຕາມລວງຍາວບວກກັບຂໍ້ມູນກ່ຽວກັບປະຊາກອນບຸກຄົນແລະກິດຈະກໍາ. ການສຶກສາກ່ອນຫນ້ານີ້ມີບາງສ່ວນຂອງຄຸນນະສົມບັດເຫຼົ່ານີ້, ແຕ່ບໍ່ມີໃຜໄດ້ທັງສາມ.

Kossinets ແລະ Watts ເລີ່ມຕົ້ນການຄົ້ນຄວ້າຂອງເຂົາເຈົ້າໂດຍການຮັບຂໍ້ມູນບັນທຶກ email ຈາກວິທະຍາໄລຂະຫນາດໃຫຍ່. ຢ່າງໃດກໍຕາມ, ການເຫຼົ່ານີ້ຂໍ້ມູນບັນທຶກ email ດຽວໄດ້ບໍ່ຄົບຖ້ວນ, ພວກເຂົາເຈົ້າບໍ່ປະກອບມີທຸກສິ່ງທຸກຢ່າງທີ່ຈໍາເປັນທີ່ຈະເຂົ້າໃຈປັດໄຈຕ່າງໆຂັບລົດ evolution ເຄືອຂ່າຍ. ເພາະສະນັ້ນ, Kossinets ແລະ Watts ລວມຂໍ້ມູນບັນທຶກ email ເຫຼົ່ານີ້, ມີສອງແຫຼ່ງຂໍ້ມູນອື່ນໆ: ຂໍ້ມູນຂ່າວສານຂອງພົນລະເມືອງທີ່ເກັບກໍາໂດຍວິທະຍາໄລແລະຂໍ້ມູນກ່ຽວກັບກິດຈະກໍາຮ່ວມ (ຕົວຢ່າງ, ຂໍ້ມູນຂ່າວສານທີ່ຢູ່ອາໄສນັກສຶກສາແລະບັນຊີລາຍຊື່ທີ່ສົມບູນຂອງການລົງທະບຽນໃນວິຊາການ). ເມື່ອມາເຫຼົ່ານີ້ມີສາມຂອງຂໍ້ມູນຂ່າວສານ, ແຕ່ລະຄົນທີ່ແມ່ນບໍ່ຄົບຖ້ວນ, ຖືກລວມກັນ Kossinets ແລະ Watts ມີໂຄງປະກອບການຂໍ້ມູນທີ່ມີອໍານາດສໍາລັບການວິວັດທະນາເຄືອຂ່າຍຄວາມເຂົ້າໃຈ.

ແຕ່, ມີແມ່ນຫນຶ່ງໃນສິ່ງທ້າທາຍຂັ້ນສຸດທ້າຍທີ່ພວກເຂົາເຈົ້າໄດ້ເພື່ອເອົາຊະນະ. Kossinets ແລະ Watts ຕ້ອງການຢາກສຶກສາວິທີການເຄືອຂ່າຍສັງຄົມໃນວິທະຍາໄລນີ້ການພັດທະນາດັ່ງນັ້ນເຂົາເຈົ້າຈໍາເປັນວິທີການທີ່ຈະນໍາໃຊ້ຂໍ້ມູນບັນທຶກ email ເຂົ້າໄປໃນການຄາດຄະເນຂອງຜູ້ທີ່ໄດ້ເຊື່ອມຕໍ່ກັບຜູ້ທີ່ຢູ່ທີ່ໃຊ້ເວລາ. ປຶກສາຫາລືໃນເມື່ອກ່ອນ (ພາກ 2.3.2.1), ປະເພດຂອງການດໍາເນີນຂອງການກໍ່ສ້າງທິດສະດີນີ້ເປັນສິ່ງທີ່ທ້າທາຍຂະຫນາດໃຫຍ່ໃນເວລາທີ່ການນໍາໃຊ້ຕາມຮອຍດິຈິຕອນສໍາລັບການຄົ້ນຄ້ວາສັງຄົມ. ໃນທີ່ສຸດ, Kossinets ແລະວັດຕັດສິນໃຈທີ່ວ່າທັງສອງປະຊາຊົນໄດ້ຮັບການພິຈາລະນາການເຊື່ອມຕໍ່ຢູ່ໃນທີ່ໃຊ້ເວລາ \ (t \) ຖ້າແລະພຽງແຕ່ຖ້າຫາກວ່າພວກເຂົາເຈົ້າໄດ້ແລກປ່ຽນອີ (\ (i \) ການສົ່ງອີເມວ \ (j \) ແລະ \ (j \) ການສົ່ງອີເມວ \ ( i \)) ໃນ 60 ວັນທີ່ຜ່ານມາ. ທາງເລືອກເຫຼົ່ານີ້ແມ່ນບໍ່ທີ່ຕົນເອງມັກ; ພວກເຂົາໄດ້ອີງໃສ່ການພິຈາລະນາລະມັດລະວັງຂອງການສ້າງຕັ້ງຕົວຈິງນີ້, ແລະ Kossinets ແລະ Watts ການກວດກາຜົນໄດ້ຮັບຂອງເຂົາເຈົ້າແມ່ນປະສິດທິພາບທີ່ຈະເລືອກເຫຼົ່ານີ້. ໂດຍທົ່ວໄປ, ຖ້າຫາກວ່າການດໍາເນີນຂອງທ່ານກ່ຽວຂ້ອງກັບການເລືອກສະເພາະບາງຄົນ Cutoffs, ເວົ້າວ່າ 60 ມື້ແທນທີ່ຈະ 30 ວັນຫລື 90 ວັນ, ມັນເປັນຄວາມຄິດທີ່ດີທີ່ຈະເຮັດໃຫ້ແນ່ໃຈວ່າຜົນໄດ້ຮັບຂອງທ່ານບໍ່ແມ່ນຄວາມອ່ອນໄຫວຕໍ່ກັບການເລືອກນີ້.

ເມື່ອ Kossinets ແລະ Watts ການແກ້ໄຂບັນຫາທີ່ເກີດຈາກຄວາມບໍ່ສົມບູນ (eg, ຫາຍຂໍ້ມູນຂອງພົນລະເມືອງ, ຂໍ້ມູນກ່ຽວກັບກິດຈະກໍາຮ່ວມກັນທີ່ຂາດຫາຍໄປ, ແລະຫາຍສາບສູນກໍ່ສ້າງທິດສະດີ), ພວກເຂົາເຈົ້າມີຂໍ້ມູນທີ່ເຮັດໃຫ້ເຂົາເຈົ້າເຂົ້າໃຈສາມກໍາລັງຕົ້ນຕໍທີ່ສາມາດຂັບ evolution ເຄືອຂ່າຍ: 1) ໂຄງປະກອບການຂອງການພົວພັນທີ່ມີຢູ່ແລ້ວ 2) ກິດຈະກໍາຮ່ວມ (ຕົວຢ່າງ:, ຫໍພັກ, ຫ້ອງຮຽນ) ແລະ 3) ປະຊາກອນ. ສອດຄ່ອງກັບການວິໄຈກ່ອນຫນ້ານີ້, ພວກເຂົາເຈົ້າໄດ້ພົບເຫັນວ່າປະຊາຊົນທີ່ມີປະຊາກອນທີ່ຄ້າຍຄືກັນມີແນວໂນ້ມທີ່ຈະປະກອບເປັນສາຍພົວພັນ. ຢ່າງໃດກໍຕາມ, ບໍ່ເຫມືອນກັບການສຶກສາກ່ອນຫນ້ານີ້, ພວກເຂົາເຈົ້າໄດ້ພົບເຫັນວ່າແບບແຜນນີ້ໄດ້ຫຼຸດຜ່ອນຢ່າງຫຼວງຫຼາຍໂດຍໂຄງສ້າງເຄືອຂ່າຍທີ່ມີຢູ່ແລ້ວແລະກິດຈະກໍາຮ່ວມ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ຮູບແບບທີ່ນັກຄົ້ນຄວ້າກ່ອນຫນ້ານີ້ໄດ້ເຫັນໄດ້ອະທິບາຍບາງສ່ວນໂດຍຂໍ້ມູນທີ່ນັກຄົ້ນຄວ້າກ່ອນຫນ້ານີ້ບໍ່ມີ. ດັ່ງນັ້ນ, ໂດຍສົບຜົນສໍາເລັດການຈັດການກັບຄວາມບໍ່ສົມບູນຂອງຂໍ້ມູນຂອງເຂົາເຈົ້າ, Kossinets ແລະວັດມີຄວາມສາມາດອະທິບາຍປະຕິສໍາພັນຂອງແນວພັນຂອງປັດໄຈທີ່ແຕກຕ່າງກັນວ່າການຂັບລົດວິວັຖນາເຄືອຂ່າຍສັງຄົມ.