ເຖິງແມ່ນວ່າມັນສາມາດເປັນ messy, ການສະເຫນີຂໍອຸດົມສາມາດຈະມີອໍານາດ.
A ວິທີການທີ່ແຕກຕ່າງກັນການຈັດການກັບຄວາມບໍ່ສົມບູນຂອງຂໍ້ມູນຕິດຕາມການດິຈິຕອນແມ່ນເພື່ອເຊັ່ນມັນໂດຍກົງກັບຂໍ້ມູນການສໍາຫຼວດ, ຂະບວນການທີ່ຂ້າພະເຈົ້າຈະໂທຫາຂໍອຸດົມການ. ຕົວຢ່າງຫນຶ່ງຂອງການສະເຫນີຂໍອຸປະແມ່ນການສຶກສາຂອງ Burke and Kraut (2014) , ທີ່ຂ້າພະເຈົ້າອະທິບາຍກ່ອນຫນ້ານັ້ນໃນບົດ (ພາກທີ 32), ກ່ຽວກັບການບໍ່ວ່າຈະເປັນການໂຕ້ຕອບກ່ຽວກັບເຟສບຸກເພີ່ມຄວາມເຂັ້ມແຂງມິດຕະພາບ. ໃນກໍລະນີທີ່, Burke ແລະ Kraut ລວມຂໍ້ມູນການສໍາຫຼວດທີ່ມີຂໍ້ມູນການບັນທຶກເຟສບຸກ.
ການຕັ້ງຄ່າທີ່ Burke ແລະ Kraut ໄດ້ເຮັດວຽກຢູ່ໃນ, ຢ່າງໃດກໍຕາມ, ຫມາຍຄວາມວ່າພວກເຂົາເຈົ້າບໍ່ໄດ້ມີການຈັດການທີ່ມີສອງບັນຫາໃຫຍ່ທີ່ນັກຄົ້ນຄວ້າເຮັດເຊັ່ນການສະເຫນີຂໍໃບຫນ້າ. ຫນ້າທໍາອິດ, ໃນຕົວຈິງແມ່ນການເຊື່ອມຕໍ່ກັນໄດ້ກໍານົດເປັນຂໍ້ມູນຂະບວນການທີ່ເອີ້ນວ່າການບັນທຶກການເຊື່ອມຕໍ່, ໂຍບາຍຄວາມລັບຂອງການບັນທຶກໃນຊຸດຂໍ້ມູນທີ່ມີການບັນທຶກການທີ່ເຫມາະສົມໃນອື່ນໆຊຸດຂໍ້ມູນທີ່ສາມາດຈະມີຄວາມຫຍຸ້ງຍາກແລະຄວາມຜິດພາດມັກ (ພວກເຮົາຈະເບິ່ງຕົວຢ່າງຂອງບັນຫາຂ້າງລຸ່ມນີ້ໄດ້ ). ບັນຫາຕົ້ນຕໍທີ່ສອງຂອງການສະເຫນີຂໍອຸດົມແມ່ນວ່າຄຸນນະພາບຂອງຕາມຮອຍດິຈິຕອນໄດ້ມັກຈະມີຄວາມຫຍຸ້ງຍາກສໍາລັບການຄົ້ນຄ້ວາໃນການປະເມີນ. ສໍາລັບການຍົກຕົວຢ່າງ, ບາງຄັ້ງຂະບວນການໂດຍຜ່ານທີ່ມັນຈະຖືກເກັບເປັນກັນມະສິດແລະສາມາດຈະມີຄວາມອ່ອນໄຫວຕໍ່ກັບຈໍານວນຫຼາຍຂອງບັນຫາທີ່ອະທິບາຍໃນບົດທີ 2 ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ສະເຫນີຂໍອຸດົມມັກຈະກ່ຽວຂ້ອງກັບການເຊື່ອມໂຍງຄວາມຜິດພາດມັກໃນການສໍາຫຼວດຫາແຫຼ່ງຂໍ້ມູນຂໍ້ມູນສີດໍາຫມາຍໃສ່ໃນປ່ອງຂອງການຮູ້ຈັກ ຄຸນນະພາບ. ເຖິງວ່າຈະມີຄວາມກັງວົນທີ່ວ່າການເຫຼົ່ານີ້ທັງສອງບັນຫາແນະນໍາ, ມັນເປັນໄປໄດ້ທີ່ຈະດໍາເນີນການຄົ້ນຄ້ວາທີ່ສໍາຄັນທີ່ມີແຜນຍຸດທະສາດນີ້ເປັນສະແດງໃຫ້ເຫັນໂດຍ Stephen Ansolabehere ແລະ Eitan Hersh (2012) ໃນການຄົ້ນຄວ້າຂອງເຂົາເຈົ້າໃນຮູບແບບການລົງຄະແນນສຽງໃນສະຫະລັດ. ມັນເປັນ worthwhile ກັບໄປໃນໄລຍະການສຶກສາໃນລາຍລະອຽດບາງຢ່າງເພາະວ່າຈໍານວນຫຼາຍຂອງກົນລະຍຸດທີ່ Ansolabehere ແລະ Hersh ການພັດທະນາຈະເປັນປະໂຫຍດໃນຄໍາຮ້ອງສະຫມັກຂອງການສະເຫນີຂໍອຸດົມ.
ລົງຄະແນນ turnout ໄດ້ຫົວເລື່ອງຂອງການຄົ້ນຄ້ວາຢ່າງກວ້າງຂວາງໃນວິທະຍາສາດທາງດ້ານການເມືອງ, ແລະໃນໄລຍະຜ່ານມາ, ຄວາມເຂົ້າໃຈຄົ້ນຄ້ວາຂອງຜູ້ທີ່ໂຫວດແລະເປັນຫຍັງຈຶ່ງໄດ້ຮັບໂດຍທົ່ວໄປໂດຍອີງໃສ່ການວິເຄາະຂໍ້ມູນການສໍາຫຼວດ. ລົງຄະແນນສຽງໃນສະຫະລັດ, ຢ່າງໃດກໍຕາມ, ແມ່ນເປັນພຶດຕິກໍາຜິດປົກກະຕິໃນທີ່ການບັນທຶກການຂອງລັດຖະບານບໍ່ວ່າຈະເປັນພົນລະເມືອງແຕ່ລະຄົນໄດ້ voted (ແນ່ນອນ, ລັດຖະບານບໍ່ໄດ້ບັນທຶກທີ່ແຕ່ລະຄົນໂຫວດພົນລະເມືອງສໍາລັບ). ສໍາລັບເວລາຫຼາຍປີ, ການເຫຼົ່ານີ້ການບັນທຶກການລົງຄະແນນສຽງຂອງລັດຖະບານໄດ້ມີຢູ່ໃນຮູບແບບເອກະສານ, ກະແຈກກະຈາຍຢູ່ໃນຫ້ອງການຂອງລັດຖະບານໃນທ້ອງຖິ່ນຕ່າງໆໃນທົ່ວປະເທດ. ນີ້ເຮັດໃຫ້ມັນມີຄວາມຫຍຸ້ງຍາກ, ແຕ່ບໍ່ເປັນໄປບໍ່ໄດ້, ສໍາລັບການວິທະຍາສາດທາງດ້ານການເມືອງທີ່ຈະມີຄວາມສໍາເລັດຂອງການເລືອກຕັ້ງແລະຈະສົມທຽບສິ່ງປະຊາຊົນເວົ້າວ່າໃນການສໍາຫຼວດກ່ຽວກັບການລົງຄະແນນສຽງກັບການປະພຶດຂອງເຂົາເຈົ້າລົງຄະແນນສຽງທີ່ແທ້ຈິງ (Ansolabehere and Hersh 2012) .
ແຕ່ວ່າ, ໃນປັດຈຸບັນນີ້ການບັນທຶກການລົງຄະແນນສຽງໄດ້ຮັບການປ້ອນ, ແລະຈໍານວນຂອງບໍລິສັດເອກະຊົນໄດ້ເກັບກໍາເປັນລະບົບແລະລວມການບັນທຶກການລົງຄະແນນສຽງເຫຼົ່ານີ້ໃນການຜະລິດໄຟຕົ້ນສະບັບລົງຄະແນນສຽງທີ່ສົມບູນແບບທີ່ບັນທຶກພຶດຕິກໍາການລົງຄະແນນສຽງຂອງອາເມລິກາທັງຫມົດ. Ansolabehere ແລະ Hersh ຮ່ວມມືກັບຫນຶ່ງຂອງບໍລິສັດ, Catalist ເຫຼົ່ານີ້ LCC ໃນຄໍາສັ່ງທີ່ຈະນໍາໃຊ້ໄຟລ໌ສຽງຕົ້ນສະບັບຂອງເຂົາເຈົ້າເພື່ອຊ່ວຍໃຫ້ການພັດທະນາຮູບພາບທີ່ດີກວ່າຂອງການເລືອກຕັ້ງ. ນອກຈາກນັ້ນ, ເນື່ອງຈາກວ່າມັນໄດ້ອີງອາໃສການບັນທຶກການດິຈິຕອນການເກັບກໍາແລະ curated ໂດຍບໍລິສັດ, ມັນສະຫນອງໃຫ້ຈໍານວນຂອງຄວາມໄດ້ປຽບຫຼາຍກວ່າຄວາມພະຍາຍາມຜ່ານມາໂດຍນັກວິໄຈທີ່ໄດ້ຮັບການເຮັດໄດ້ໂດຍບໍ່ມີການຊ່ວຍເຫຼືອຂອງບໍລິສັດແລະການນໍາໃຊ້ການບັນທຶກການປຽບທຽບໄດ້.
ເຊັ່ນດຽວກັນກັບຈໍານວນຫຼາຍຂອງແຫຼ່ງຂໍ້ມູນທີ່ຕິດຕາມດິຈິຕອນໃນບົດທີ 2, ເອກະສານຕົ້ນສະບັບ Catalist ບໍ່ໄດ້ປະກອບຫຼາຍຂອງຂໍ້ມູນຂ່າວສານຂອງພົນລະເມືອງ, attitudinally, ແລະການປະພຶດທີ່ Ansolabehere ແລະ Hersh ຈໍາເປັນ. ນອກເຫນືອໄປຈາກຂໍ້ມູນນີ້, Ansolabehere ແລະ Hersh ມີຄວາມສົນໃຈໂດຍສະເພາະແມ່ນໃນການປຽບທຽບລາຍງານພຶດຕິກໍາການລົງຄະແນນສຽງກັບການປະພຶດລົງຄະແນນສຽງຜ່ານການກວດສອບ (ie, ຂໍ້ມູນໃນຖານຂໍ້ມູນ Catalist). ດັ່ງນັ້ນ, ນັກຄົ້ນຄວ້າໄດ້ເກັບກໍາຂໍ້ມູນທີ່ພວກເຂົາເຈົ້າຕ້ອງການຢາກເປັນສ່ວນຫນຶ່ງຂອງການສຶກສາສະຫະກອນສະພາເລືອກຕັ້ງ (CCES), ເປັນການສໍາຫຼວດທາງດ້ານສັງຄົມຂະຫນາດໃຫຍ່. ຕໍ່ໄປ, ນັກຄົ້ນຄວ້າໄດ້ໃຫ້ຂໍ້ມູນນີ້ເພື່ອ Catalist, ແລະ Catalist ໃຫ້ນັກຄົ້ນຄວ້າສະຫນັບສະຫນູນໄຟລ໌ຜະສານຂໍ້ມູນທີ່ມີການກວດສອບພຶດຕິກໍາການລົງຄະແນນສຽງ (ຈາກ Catalist), ພຶດຕິກໍາການລົງຄະແນນສຽງຂອງຕົນເອງ, ບົດລາຍງານ (ຈາກ CCES) ແລະປະຊາກອນແລະທັດສະນະຂອງຜູ້ຕອບແບບສອບ (ຈາກ CCES ). ໃນຄໍາສັບຕ່າງໆອື່ນໆ, Ansolabehere ແລະ Hersh ເຊັ່ນຂໍ້ມູນລົງຄະແນນສຽງທີ່ມີຂໍ້ມູນການສໍາຫຼວດ, ແລະເອກະສານຜະສານຜົນເຮັດໃຫ້ເຂົາເຈົ້າເຮັດແນວໃດບາງສິ່ງບາງຢ່າງທີ່ເອກະສານບໍ່ເປີດການໃຊ້ງານສ່ວນບຸກຄົນ.
ໂດຍສົມບູນເອກະສານຂໍ້ມູນ Catalist ຕົ້ນສະບັບທີ່ມີຂໍ້ມູນການສໍາຫຼວດ, Ansolabehere ແລະ Hersh ມາສາມບົດສະຫຼຸບທີ່ສໍາຄັນ. ຄັ້ງທໍາອິດ, ໃນໄລຍະການລາຍງານຂອງຄະແນນສຽງແມ່ນຍັງຄົງ: ເກືອບເຄິ່ງຫນຶ່ງຂອງທີ່ບໍ່ແມ່ນຜູ້ລົງຄະແນນ, ບົດລາຍງານລົງຄະແນນສຽງ. ຫຼື, ວິທີການຊອກຫາຢູ່ມັນຄົນອື່ນແມ່ນຖ້າຫາກວ່າຜູ້ໃດຜູ້ຫນຶ່ງໄດ້ລາຍງານການເລືອກຕັ້ງ, ມີພຽງແຕ່ໂອກາດ 80% ວ່າພວກເຂົາເຈົ້າຕົວຈິງແລ້ວການໂຫວດ. ຄັ້ງທີສອງ, ໃນໄລຍະການລາຍງານແມ່ນບໍ່ເຫັນ; ໃນໄລຍະການລາຍງານແມ່ນມີທົ່ວໄປຫຼາຍໃນບັນດາລາຍຮັບສູງ, ສະຫວັດດີການສຶກສາ, ສະຫມັກພັກພວກທີ່ມີສ່ວນຮ່ວມໃນກິດຈະການສາທາລະນະ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ປະຊາຊົນຜູ້ທີ່ມີຫຼາຍທີ່ສຸດອາດຈະລົງຄະແນນສຽງຍັງມີຫຼາຍທີ່ສຸດອາດຈະນອນກ່ຽວກັບການລົງຄະແນນສຽງ. ທີສາມ, ແລະສ່ວນຫຼາຍສໍາຄັນ, ເນື່ອງຈາກວ່າການລັກສະນະເປັນລະບົບຫຼາຍກວ່າການລາຍງານ, ຄວາມແຕກຕ່າງທີ່ແທ້ຈິງລະຫວ່າງຜູ້ລົງຄະແນນແລະບໍ່ຜູ້ລົງຄະແນນມີຂະຫນາດນ້ອຍກ່ວາພວກເຂົາເຈົ້າປະກົດວ່າພຽງແຕ່ຈາກການສໍາຫຼວດ. ສໍາລັບການຍົກຕົວຢ່າງ, ຜູ້ທີ່ມີລະດັບປະລິນຍາຕີມີປະມານ 22 ຈຸດສ່ວນຮ້ອຍຫນ້າທີ່ລາຍງານການເລືອກຕັ້ງ, ແຕ່ມີພຽງແຕ່ 10 ເປີເຊັນແນວໂນ້ມທີ່ຈະລົງຄະແນນສຽງທີ່ແທ້ຈິງ. ນອກຈາກນັ້ນ, ທິດສະດີທີ່ມີຢູ່ແລ້ວຊັບພະຍາກອນຂອງລົງຄະແນນສຽງແມ່ນດີຂຶ້ນກວ່າຫຼາຍຢູ່ໃນ predicting ຜູ້ທີ່ຈະລາຍງານການເລືອກຕັ້ງກ່ວາຜູ້ທີ່ແທ້ຈິງຄະແນນສຽງ, ການຄົ້ນພົບຕົວຈິງທີ່ໄດ້ສໍາລັບທິດສະດີໃຫມ່ທີ່ຈະເຂົ້າໃຈແລະຄາດຄະເນລົງຄະແນນສຽງ.
ແຕ່ວ່າ, ຫຼາຍປານໃດທີ່ພວກເຮົາຄວນຈະໄວ້ວາງໃຈຜົນເຫຼົ່ານີ້? ຈືຂໍ້ມູນການຜົນໄດ້ຮັບເຫຼົ່ານີ້ຂຶ້ນກັບການເຊື່ອມໂຍງຄວາມຜິດພາດມັກຈະຂໍ້ມູນສີດໍາຫມາຍໃສ່ໃນປ່ອງທີ່ມີຈໍານວນຂອງການຮູ້ຈັກຄວາມຜິດພາດ. ຫຼາຍໂດຍສະເພາະ, ຜົນໄດ້ຮັບ hinge ກ່ຽວກັບສອງຂັ້ນຕອນທີ່ສໍາຄັນ: 1) ຄວາມສາມາດຂອງ Catalist ໃນການສົມທົບຈໍານວນຫຼາຍແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນເພື່ອຜະລິດແຟ້ມຂໍ້ມູນຕົ້ນສະບັບທີ່ຖືກຕ້ອງແລະ 2) ຄວາມສາມາດຂອງ Catalist ໃນການເຊື່ອມຕໍ່ຂໍ້ມູນການສໍາຫຼວດໃນການແຟ້ມຂໍ້ມູນຕົ້ນສະບັບຂອງຕົນ. ແຕ່ລະຂັ້ນຕອນເຫຼົ່ານີ້ແມ່ນຂ້ອນຂ້າງມີຄວາມຫຍຸ້ງຍາກແລະຄວາມຜິດພາດຢູ່ໃນຂັ້ນຕອນບໍ່ວ່າຈະສາມາດນໍາໄປສູ່ການຄົ້ນຄວ້າກັບການສະຫລຸບທີ່ຜິດພາດ. ຢ່າງໃດກໍຕາມ, ຂະບວນການຂໍ້ມູນແລະຂໍ້ມູນມີຄວາມສໍາຄັນກັບການດໍາລົງຢູ່ຢ່າງຕໍ່ເນື່ອງຂອງ Catalist ເປັນບໍລິສັດດັ່ງນັ້ນມັນກໍສາມາດລົງທຶນຊັບພະຍາກອນໃນການແກ້ໄຂບັນຫາເຫລົ່ານີ້, ມັກຈະຢູ່ໃນລະດັບທີ່ບໍ່ມີນັກຄົ້ນຄວ້າທາງວິຊາການບຸກຄົນຫຼືກຸ່ມຂອງນັກຄົ້ນຄວ້າສາມາດມີຄໍາວ່າໄດ້. ໃນການອ່ານເພີ່ມເຕີມຢູ່ໃນຕອນທ້າຍຂອງບົດໄດ້, ຂ້າພະເຈົ້າອະທິບາຍບັນຫາເຫລົ່ານີ້ໃນລາຍລະອຽດເພີ່ມເຕີມແລະວິທີການ Ansolabehere ແລະ Hersh ສ້າງຄວາມເຊື່ອຫມັ້ນໃນຜົນໄດ້ຮັບຂອງເຂົາເຈົ້າ. ເຖິງແມ່ນວ່າລາຍລະອຽດເຫຼົ່ານີ້ແມ່ນສະເພາະກັບການສຶກສານີ້, ບັນຫາທີ່ຄ້າຍຄືກັນກັບການເຫຼົ່ານີ້ຈະເກີດຂຶ້ນສໍາລັບນັກຄົ້ນຄວ້າອື່ນໆທີ່ຕ້ອງການການເຊື່ອມຕໍ່ກັບສີດໍາຫມາຍໃສ່ໃນປ່ອງແຫລ່ງຂໍ້ມູນການຕິດຕາມດິຈິຕອນ.
ສິ່ງທີ່ມີການຖອດຖອນບົດຮຽນໂດຍທົ່ວໄປນັກຄົ້ນຄວ້າສາມາດແຕ້ມຈາກການສຶກສານີ້? ຫນ້າທໍາອິດ, ມີມູນຄ່າ tremendous ຈາກ enriching ຕາມຮອຍດິຈິຕອນທີ່ມີຂໍ້ມູນການສໍາຫຼວດ. ຄັ້ງທີສອງ, ເຖິງແມ່ນວ່າການເຫຼົ່ານີ້ລວມ, ແຫລ່ງຂໍ້ມູນທາງການຄ້າຄວນບໍ່ໄດ້ຮັບການພິຈາລະນາ "ພື້ນທີ່ຄວາມຈິງ", ໃນບາງກໍລະນີພວກເຂົາເຈົ້າສາມາດຈະເປັນປະໂຫຍດ. ໃນຄວາມເປັນຈິງ, ມັນເປັນທີ່ດີທີ່ສຸດທີ່ຈະສົມທຽບແຫຼ່ງຂໍ້ມູນເຫຼົ່ານີ້ຈະບໍ່ຈິງຢ່າງແທ້ຈິງ (ຈາກທີ່ພວກເຂົາເຈົ້າສະເຫມີໄປຈະຕໍ່າກ່ວາ). ແນ່ນອນວ່າ, ມັນເປັນທີ່ດີກວ່າທີ່ຈະສົມທຽບໃຫ້ເຂົາເຈົ້າໃສ່ຂໍ້ມູນທີ່ມີການອື່ນໆ, ເຊິ່ງມີສ່ວນພົວມີຄວາມຜິດພາດເຊັ່ນດຽວກັນ.