ການວັດແທກເປັນຫຼາຍຫນ້ອຍທີ່ອາດຈະມີການປ່ຽນແປງພຶດຕິກໍາໃນແຫລ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່.
ສິ່ງທີ່ທ້າທາຍຫນຶ່ງຂອງການຄົ້ນຄວ້າທາງດ້ານສັງຄົມແມ່ນວ່າປະຊາຊົນສາມາດມີການປ່ຽນແປງພຶດຕິກໍາຂອງເຂົາເຈົ້າໃນເວລາທີ່ພວກເຂົາເຈົ້າຮູ້ວ່າພວກເຂົາເຈົ້າແມ່ນໄດ້ຖືກສັງເກດເຫັນໂດຍນັກຄົ້ນຄວ້າ. ວິທະຍາສາດສັງຄົມໂດຍທົ່ວໄປແລ້ວໃຫ້ໂທຫາການປ່ຽນແປງພຶດຕິກໍາການນີ້ໃນການຕອບໂຕ້ກັບ reactivity ຄົ້ນຄວ້າມາດຕະ (Webb et al. 1966) . ລັກສະນະຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ພວກນັກຄົ້ນຄວ້າຊອກຫາສັນຍາແມ່ນວ່າຜູ້ເຂົ້າຮ່ວມແມ່ນໂດຍທົ່ວໄປບໍ່ຮູ້ວ່າຂໍ້ມູນຂອງເຂົາເຈົ້າແມ່ນໄດ້ຖືກ captured ຫຼືພວກເຂົາເຈົ້າໄດ້ກາຍເປັນດັ່ງນັ້ນເຮັດໃຫ້ເຄຍຊີນກັບການເກັບກໍາຂໍ້ມູນນີ້ວ່າມັນບໍ່ມີຕໍ່ໄປອີກແລ້ວການປ່ຽນແປງພຶດຕິກໍາຂອງເຂົາເຈົ້າ. ເນື່ອງຈາກວ່າພວກເຂົາເຈົ້າແມ່ນບໍ່ແມ່ນ reactive, ເພາະສະນັ້ນ, ຈໍານວນຫຼາຍທີ່ມາຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ສາມາດຖືກນໍາໃຊ້ເພື່ອສຶກສາພຶດຕິກໍາທີ່ບໍ່ໄດ້ຮັບການແກ້ໄຂມາດຕະການທີ່ຖືກຕ້ອງໃນເມື່ອກ່ອນ. ສໍາລັບການຍົກຕົວຢ່າງ, Stephens-Davidowitz (2014) ການນໍາໃຊ້ອັດຕາສ່ວນຂອງຂໍ້ກໍານົດ racist ໃນເຄື່ອງຈັກໃນການຄົ້ນຫາການວັດແທກ animus ເຊື້ອຊາດໃນພູມິພາກທີ່ແຕກຕ່າງກັນຂອງສະຫະລັດອະເມລິກາ. ລັກສະນະທີ່ບໍ່ແມ່ນ reactive ແລະຂະຫນາດໃຫຍ່ (ເບິ່ງພາກສ່ວນທີ່ຜ່ານມາ) ຂອງຂໍ້ມູນຄົ້ນຫາເຮັດໃຫ້ມາດຕະການທີ່ຈະມີຄວາມຫຍຸ້ງຍາກໂດຍນໍາໃຊ້ວິທີການອື່ນໆ, ເຊັ່ນ: ການສໍາຫຼວດ.
ບໍ່ແມ່ນຕິ, ຢ່າງໃດກໍຕາມ, ບໍ່ໄດ້ຮັບປະກັນວ່າຂໍ້ມູນເຫຼົ່ານີ້ແມ່ນ somehow ໂດຍກົງສະທ້ອນໃຫ້ເຫັນຂອງພຶດຕິກໍາຂອງປະຊາຊົນກໍ່ຕາມ. ສໍາລັບການຍົກຕົວຢ່າງ, ເປັນຜູ້ຕອບບອກ Newman et al. (2011) , "ມັນບໍ່ແມ່ນວ່າຂ້າພະເຈົ້າບໍ່ມີບັນຫາ, ຂ້າພະເຈົ້າພຽງແຕ່ບໍ່ໄດ້ວາງເຂົາເຈົ້າກ່ຽວກັບເຟສບຸກ." ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ເຖິງແມ່ນວ່າບາງແຫລ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ບໍ່ແມ່ນ reactive, ພວກເຂົາເຈົ້າແມ່ນບໍ່ສະເຫມີໄປຂອງອະຄະຕິຄວາມຕ້ອງການທາງສັງຄົມ ແນວໂນ້ມສໍາລັບປະຊາຊົນຕ້ອງການທີ່ຈະນໍາສະເຫນີດ້ວຍຕົນເອງໃນວິທີການທີ່ເປັນໄປໄດ້ທີ່ດີທີ່ສຸດ. ນອກຈາກນັ້ນ, ເປັນຂ້າພະເຈົ້າຈະອະທິບາຍເພີ່ມເຕີມຂ້າງລຸ່ມນີ້, ເຫຼົ່ານີ້ແຫຼ່ງຂໍ້ມູນບາງຄັ້ງຜົນກະທົບຈາກເປົ້າຫມາຍຂອງເຈົ້າຂອງເວທີການ, ບັນຫາທີ່ເອີ້ນວ່າ confound ສູດການຄິດໄລ່ (ອະທິບາຍເພີ່ມເຕີມຂ້າງລຸ່ມນີ້).
ເຖິງແມ່ນວ່າບໍ່ແມ່ນຕິເປັນປະໂຫຍດສໍາລັບການຄົ້ນຄວ້າ, ການຕິດຕາມພຶດຕິກໍາຂອງປະຊາຊົນໂດຍບໍ່ມີການຍິນຍອມເຫັນດີແລະປູກຈິດສໍານຶກຂອງເຂົາເຈົ້າລ້ຽງຄວາມກັງວົນດ້ານຈັນຍາບັນປຶກສາຫາລືຂ້າງລຸ່ມນີ້ແລະໃນລາຍລະອຽດໃນບົດທີ 6 A backlash ສາທາລະນະກັບການເຝົ້າລະວັງດິຈິຕອນເພີ່ມຂຶ້ນສາມາດນໍາໄປສູ່ການລະບົບຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ຈະກາຍເປັນ reactive ຫຼາຍກວ່າທີ່ໃຊ້ເວລາ, ແລະຄວາມເຂັ້ມແຂງ ຄວາມກັງວົນກ່ຽວກັບການເຝົ້າລະວັງດິຈິຕອນເຖິງແມ່ນວ່າຈະສາມາດນໍາໄປສູ່ບາງຄົນທີ່ຈະພະຍາຍາມທີ່ຈະເລືອກອອກຂອງລະບົບຂໍ້ມູນຂະຫນາດໃຫຍ່ສົມບູນ, ເພີ່ມທະວີຄວາມກັງວົນກ່ຽວກັບການທີ່ບໍ່ແມ່ນຜູ້ຕາງຫນ້າ (ອະທິບາຍເພີ່ມເຕີມຂ້າງລຸ່ມນີ້).
ເຫຼົ່ານີ້ມີສາມຄຸນສົມບັດທີ່ດີຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ສໍາລັບການຄົ້ນຄວ້າຂະຫນາດໃຫຍ່ທາງສັງຄົມ, ສະເຫມີໄປ, ແລະບໍ່ແມ່ນ reactive, ໂດຍທົ່ວໄປເກີດຂຶ້ນເນື່ອງຈາກວ່າເຫຼົ່ານີ້ແຫຼ່ງຂໍ້ມູນບໍ່ໄດ້ຖືກສ້າງໂດຍນັກຄົ້ນຄວ້າສໍາລັບການຄົ້ນຄ້ວາ. ໃນປັດຈຸບັນ, ຂ້າພະເຈົ້າຈະເຮັດໃຫ້ການເຈັດຄຸນສົມບັດຂອງແຫຼ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ບໍ່ດີສໍາລັບການຄົ້ນຄ້ວາ. ຄຸນນະສົມບັດເຫຼົ່ານີ້ຍັງມີແນວໂນ້ມທີ່ຈະເກີດຂຶ້ນເນື່ອງຈາກວ່າຂໍ້ມູນນີ້ບໍ່ໄດ້ຖືກສ້າງໂດຍນັກຄົ້ນຄວ້າສໍາລັບການຄົ້ນຄ້ວາ.