ກິດຈະກໍາ

ທີ່ສໍາຄັນ:

  • ລະດັບຂອງຄວາມຫຍຸ້ງຍາກ: ງ່າຍ ງ່າຍ , ຂະຫນາດກາງ ຂະຫນາດກາງ , ຍາກ ຍາກ , ຫນັກ​ຫຼາຍ ຫນັກ​ຫຼາຍ
  • ຮຽກຮ້ອງໃຫ້ຄະນິດສາດ ( ຮຽກຮ້ອງໃຫ້ທາງຄະນິດສາດ )
  • ຮຽກຮ້ອງໃຫ້ມີການເຂົ້າລະຫັດ ( ຮຽກຮ້ອງໃຫ້ມີການເຂົ້າລະຫັດ )
  • ເກັບກໍາຂໍ້ມູນ ( ເກັບກໍາຂໍ້ມູນ )
  1. [ ຫນັກ​ຫຼາຍ , ຮຽກຮ້ອງໃຫ້ມີການເຂົ້າລະຫັດ , ເກັບກໍາຂໍ້ມູນ ] ຫນຶ່ງຂອງການຮ້ອງຂໍທີ່ຫນ້າຕື່ນເຕັ້ນຫຼາຍທີ່ສຸດຈາກ Benoit et al. (2015) ກ່ຽວກັບການຫຸ້ມ, ການເຂົ້າລະຫັດຂອງ manifesto ທາງດ້ານການເມືອງແມ່ນວ່າຜົນໄດ້ຮັບແມ່ນຊ້ໍາ. Merz, Regel, and Lewandowski (2016) ໃຫ້ການເຂົ້າເຖິງ Manifesto Corpus. ພະຍາຍາມໃຫ້ມີການແຜ່ພັນຮູບທີ່ 2 ຈາກ Benoit et al. (2015) ການນໍາໃຊ້ພະນັກງານຈາກ Amazon ກົນ Turk. ວິທີການທີ່ຄ້າຍຄືກັນໄດ້ຜົນຂອງທ່ານ?

  2. [ ຂະຫນາດກາງ ] ໃນໂຄງການ InfluenzaNet ໄດ້ຄະນະກໍາມະອາສາສະຫມັກຂອງປະຊາຊົນລາຍງານການເກີດ, ອັດຕາສ່ວນ, ແລະສະແຫວງຫາສຸຂະພາບພຶດຕິກໍາທີ່ກ່ຽວຂ້ອງກັບໄຂ້ຫວັດໃຫຍ່ເຊັ່ນ: ເຈັບເປັນ (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. ການປຽບທຽບແລະກົງກັນຂ້າມການອອກແບບ, ຄ່າໃຊ້ຈ່າຍ, ແລະຄວາມຜິດພາດອາດຈະໃນ InfluenzaNet, ກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່, ແລະລະບົບການຕິດຕາມໄຂ້ຫວັດໃຫຍ່ປະເພນີ.
    2. ພິຈາລະນາທີ່ໃຊ້ເວລາທີ່ບໍ່ແນ່ນອນ, ດັ່ງກ່າວເປັນການລະບາດຂອງໄຂ້ຫວັດຫມູ. ອະທິບາຍຄວາມຜິດພາດທີ່ເປັນໄປໄດ້ໃນແຕ່ລະລະບົບ.
  3. [ ຍາກ , ຮຽກຮ້ອງໃຫ້ມີການເຂົ້າລະຫັດ , ເກັບກໍາຂໍ້ມູນ ] The Economist ເປັນວາລະສານຂ່າວປະຈໍາອາທິດ. ສ້າງໂຄງການຄອມພິວເຕີຂອງມະນຸດເພື່ອເຂົ້າໄປເບິ່ງຖ້າຫາກວ່າອັດຕາສ່ວນຂອງແມ່ຍິງກັບຜູ້ຊາຍກ່ຽວກັບການປົກຫຸ້ມຂອງໄດ້ເພີ່ມຂຶ້ນໃນໄລຍະທີ່ໃຊ້ເວລາ.

    1. ວາລະສານສາມາດມີການປົກຫຸ້ມຂອງທີ່ແຕກຕ່າງກັນໃນແປດພາກພື້ນທີ່ແຕກຕ່າງກັນ (ອາຟຣິກາ, ອາຊີປາຊີຟິກ, ເອີຣົບ, ສະຫະພາບເອີຣົບ, ອາເມລິກາ, ຕາເວັນອອກກາງ, ອາເມລິກາເຫນືອ, ແລະສະຫະລັດຊະອານາຈັກ) ແລະພວກເຂົາເຈົ້າສາມາດທັງຫມົດທີ່ຈະດາວໂຫຼດໄດ້ຈາກເວັບໄຊຂອງ ເສດຖະສາດ . ເລືອກເອົາຫນຶ່ງໃນພາກພື້ນນີ້ແລະປະຕິບັດການວິເຄາະ. ໃຫ້ແນ່ໃຈວ່າເພື່ອອະທິບາຍຂັ້ນຕອນການຂອງທ່ານທີ່ມີລາຍລະອຽດພຽງພໍທີ່ພວກເຂົາເຈົ້າສາມາດໄດ້ຮັບການຜັນໂດຍບຸກຄົນອື່ນ.

    ຄໍາຖາມນີ້ໄດ້ຮັບການດົນໃຈໂດຍໂຄງການທີ່ຄ້າຍຄືກັນໂດຍ Justin Tenuto, ວິທະຍາສາດຂໍ້ມູນບໍລິສັດ crowdsourcing ໄດ້ CrowdFlower , ເບິ່ງ "ວາລະສານທີ່ໃຊ້ເວລາກໍ່ມັກ Dudes" .

  4. [ ຫນັກ​ຫຼາຍ , ຮຽກຮ້ອງໃຫ້ມີການເຂົ້າລະຫັດ , ເກັບກໍາຂໍ້ມູນ ] ການກໍ່ສ້າງກ່ຽວກັບຄໍາຖາມຂ້າງເທິງນັ້ນ, ໃນປັດຈຸບັນປະຕິບັດການວິເຄາະສໍາລັບການທັງຫມົດແປດພາກພື້ນ.

    1. ທ່ານບໍ່ຈະເປັນແນວໃດຄວາມແຕກຕ່າງຊອກຫາໃນທົ່ວພາກພື້ນ?
    2. ຫຼາຍປານໃດພິເສດທີ່ໃຊ້ເວລາແລະເງິນມັນໃຊ້ເວລາທີ່ຈະຂະຫຍາຍເຖິງການວິເຄາະຂອງທ່ານທັງຫມົດແປດຂອງພາກພື້ນແນວໃດ?
    3. ຈິນຕະນາການເສດຖະສາດມີ 100 ການປົກຫຸ້ມຂອງທີ່ແຕກຕ່າງກັນໃນແຕ່ລະອາທິດ. ປະມານຫຼາຍປານໃດທີ່ໃຊ້ເວລາພິເສດແລະເງິນມັນຈະໃຊ້ເວລາທີ່ຈະຂະຫຍາຍເຖິງການວິເຄາະຂອງທ່ານ 100 ການປົກຫຸ້ມຕໍ່ອາທິດ.
  5. [ ຍາກ , ຮຽກຮ້ອງໃຫ້ມີການເຂົ້າລະຫັດ ] [Kaggle] (https://www.kaggle.com/) ເປັນເວັບໄຊທີ່ເປັນເຈົ້າພາບໂຄງການເອີ້ນເປີດເປັນ. ເຂົ້າຮ່ວມໃນການຫນຶ່ງຂອງໂຄງການທີ່.

  6. [ ຂະຫນາດກາງ ] ຊອກຫາໂດຍຜ່ານບັນຫາທີ່ຜ່ານມາຂອງວາລະສານໃນພາກສະຫນາມຂອງທ່ານ. ມີເອກະສານໃດຫນຶ່ງທີ່ສາມາດໄດ້ຮັບການ reformulated ເປັນໂຄງການເອີ້ນເປີດ? ເປັນ​ຫຍັງ​ຫຼື​ເປັນ​ຫຍັງ​ຈຶ່ງ​ບໍ່​ໄດ້?

  7. [ ງ່າຍ ] Purdam (2014) ອະທິບາຍການເກັບກໍາຂໍ້ມູນການກະຈາຍການຂໍທານໃນລອນດອນ. ສະຫຼຸບຄວາມເຂັ້ມແຂງແລະຈຸດອ່ອນຂອງການອອກແບບການຄົ້ນຄວ້ານີ້.

  8. [ ຂະຫນາດກາງ ] ຊ້ໍາຊ້ອນແມ່ນເປັນວິທີທີ່ສໍາຄັນໃນການປະເມີນຄຸນນະພາບຂອງການເກັບກໍາຂໍ້ມູນການກະຈາຍ. Windt and Humphreys (2016) ການພັດທະນາແລະທົດສອບລະບົບການລາຍງານຂອງເຫດການຂໍ້ຂັດແຍ່ງຈາກປະຊາຊົນໃນພາກຕາເວັນອອກປະເທດຄອງໂກ. ອ່ານເອກະສານ.

    1. ແນວໃດການອອກແບບຂອງເຂົາເຈົ້າຮັບປະກັນຊ້ໍາຊ້ອນ?
    2. ພວກເຂົາເຈົ້າສະເຫນີວິທີການຈໍານວນຫນຶ່ງເພື່ອກວດສອບຂໍ້ມູນທີ່ເກັບກໍາຈາກໂຄງການຂອງເຂົາເຈົ້າ. ສະຫຼຸບໃຫ້ເຂົາເຈົ້າ. ທີ່ຫນ້າເຊື່ອຖືທີ່ສຸດ?
    3. ສະເຫນີວິທີການໃຫມ່ວ່າຂໍ້ມູນທີ່ສາມາດໄດ້ຮັບການກວດສອບ. ຄໍາແນະນໍາຄວນພະຍາຍາມເພື່ອເພີ່ມທະວີຄວາມເຊື່ອຫມັ້ນວ່າທ່ານຈະມີຢູ່ໃນຂໍ້ມູນໃນລັກສະນະທີ່ຄ່າໃຊ້ຈ່າຍ, ປະສິດທິຜົນແລະຈະລິຍະທໍາໄດ້.
  9. [ ຂະຫນາດກາງ ] Karim Lakhani ແລະເພື່ອນຮ່ວມງານ (2013) ການສ້າງຕັ້ງເປັນການເອີ້ນເປີດໃຫ້ຂໍສູດການຄິດໄລ່ການໃຫມ່ເພື່ອແກ້ໄຂບັນຫາໃນຊີວະສາດຄອມພິວເຕີ. ພວກເຂົາເຈົ້າໄດ້ຮັບຫຼາຍກ່ວາ 600 ການຍື່ນສະເຫນີທີ່ມີ 89 ວິທີການຄອມພິວເຕີນະວະນິຍາຍ. ຂອງການສົ່ງ, ພວກເຂົາເຈົ້າໄດ້ຮັບ 30 ທີ່ເກີນປະສິດທິຂອງສະຫະລັດສະຖາບັນແຫ່ງຊາດຂອງສຸຂະພາບ MegaBLAST ຂອງ, ແລະການຍື່ນສະເຫນີທີ່ດີທີ່ສຸດບັນລຸໄດ້ທັງສອງຖືກຕ້ອງຫລາຍຂຶ້ນແລະຄວາມໄວ (1,000 ຄັ້ງໄວ).

    1. ອ່ານເອກະສານຂອງເຂົາເຈົ້າ, ແລະຫຼັງຈາກນັ້ນສະເຫນີບັນຫາການຄົ້ນຄວ້າທາງສັງຄົມທີ່ສາມາດນໍາໃຊ້ປະເພດດຽວກັນຂອງການເປີດການແຂ່ງຂັນ. ໂດຍສະເພາະ, ປະເພດຂອງການເປີດການແຂ່ງຂັນນີ້ແມ່ນສຸມໃສ່ການໄວຂຶ້ນແລະການປັບປຸງປະສິດທິພາບຂອງວິທີການທີ່ມີຢູ່ແລ້ວ. ຖ້າຫາກວ່າທ່ານບໍ່ສາມາດຄິດວ່າບັນຫານີ້ໃນພາກສະຫນາມຂອງທ່ານ, ພະຍາຍາມອະທິບາຍວ່າເປັນຫຍັງບໍ່ໄດ້.
  10. [ ຂະຫນາດກາງ ] ຈໍານວນຫຼາຍໂຄງການຄອມພິວເຕີຂອງມະນຸດອີງໃສ່ຜູ້ເຂົ້າຮ່ວມຈາກ Amazon ກົນ Turk. ການລົງທະບຽນທີ່ຈະກາຍເປັນພະນັກງານກ່ຽວກັບການ Amazon ກົນ Turk ເປັນ. ໃຊ້ເວລາຫນຶ່ງຊົ່ວໂມງເຮັດວຽກບໍ່ມີ. ວິທີການຜົນກະທົບນີ້ຄວາມຄິດຂອງທ່ານກ່ຽວກັບການອອກແບບ, ຄຸນນະພາບ, ແລະຈັນຍາບັນຂອງໂຄງການ compuation ຂອງມະນຸດ?