2.4.2 ព្យាករណ៍និង nowcasting

ព្យាករថាអនាគតគឺជាការលំបាកនោះទេតែព្យាករថាបច្ចុប្បន្ននេះជាការងាយស្រួល។

ក្រុមអ្នកស្រាវជ្រាវយុទ្ធសាស្ត្រទី 2 អាចប្រើជាមួយទិន្នន័យដែលត្រូវបានគេ ព្យាករណ៍ ។ ការទស្សន៍ទាយអំពីអនាគតគឺជាការលំបាកយ៉ាងខ្លាំងហើយប្រហែលជាសម្រាប់ហេតុផលនោះការព្យាករណ៍មិនមែនជាផ្នែកមួយដ៏ធំនៃការស្រាវជ្រាវសង្គម (ទោះបីជាវាជាផ្នែកតូចមួយនិងសំខាន់នៃប្រជាសាស្ត្រសេដ្ឋកិច្ចសេដ្ឋកិច្ចរោគរាតត្បាតនិងវិទ្យាសាស្រ្តនយោបាយ) ។ នៅទីនេះទោះជាយ៉ាងណាក៏ដោយខ្ញុំចង់ផ្តោតទៅលើការព្យាករណ៍ប្រភេទពិសេសដែលហៅថាការផ្សព្វផ្សាយដែលឥឡូវត្រូវបានគេហៅថា "ការ បរិយាយ " និង "ការព្យាករណ៍" ។ ជាជាងព្យាករណ៍អំពីអនាគតការព្យាយាមក្នុងការប្រើគំនិតពីការព្យាករណ៍ដើម្បីវាស់វែងរដ្ឋបច្ចុប្បន្ន នៃ​ពិភពលោក; វាប៉ុនប៉ង "ព្យាករណ៍ពីបច្ចុប្បន្ន" (Choi and Varian 2012) ។ Nowcasting មានសក្តានុពលជាពិសេសដើម្បីឱ្យរដ្ឋាភិបាលនិងក្រុមហ៊ុនដែលត្រូវការវិធានការទាន់ពេលវេលានិងត្រឹមត្រូវនៃពិភពលោក។

ការកំណត់មួយកន្លែងដែលត្រូវការការវាស់វែងទាន់ពេលវេលានិងត្រឹមត្រូវគឺច្បាស់ណាស់គឺរោគរាតត្បាត។ ពិចារណាអំពីករណីគ្រុនផ្តាសាយ ("ជំងឺគ្រុនផ្តាសាយ") ។ ជារៀងរាល់ឆ្នាំជំងឺគ្រុនផ្តាសាយតាមរដូវបណ្តាលឱ្យមានជំងឺរាប់លាននាក់និងការស្លាប់រាប់សែននាក់នៅជុំវិញពិភពលោក។ លើសពីនេះទៅទៀតជារៀងរាល់ឆ្នាំមានលទ្ធភាពដែលជំងឺគ្រុនផ្តាសាយថ្មីមួយអាចលេចឡើងដែលអាចសម្លាប់មនុស្សរាប់លាននាក់។ ជាឧទាហរណ៍ការផ្ទុះឡើងនៃជំងឺគ្រុនផ្តាសាយបក្សីឆ្នាំ 1918 ត្រូវបានគេប៉ាន់ស្មានថាបានសម្លាប់មនុស្សចន្លោះពី 50 ទៅ 100 លាននាក់ (Morens and Fauci 2007) ។ ដោយសារតែតម្រូវការក្នុងការតាមដាននិងមានសក្តានុពលក្នុងការឆ្លើយតបទៅនឹងការរីករាលដាលនៃជម្ងឺគ្រុនផ្តាសាយរដ្ឋាភិបាលនៅជុំវិញពិភពលោកបានបង្កើតប្រព័ន្ធឃ្លាំមើលគ្រុនផ្តាសាយ។ ឧទាហរណ៍មជ្ឈមណ្ឌលគ្រប់គ្រងនិងទប់ស្កាត់ជំងឺឆ្លងរបស់សហរដ្ឋអាមេរិក (CDC) ប្រមូលពត៌មានជាប្រចាំនិងប្រមូលពត៌មានពីវេជ្ជបណ្ឌិតដែលបានជ្រើសរើសដោយប្រុងប្រយ័ត្ននៅទូទាំងប្រទេស។ បើទោះបីជាប្រព័ន្ធនេះផលិតទិន្នន័យដែលមានគុណភាពខ្ពស់, វាមានភាពយឺតយ៉ាវរាយការណ៍។ នោះគឺដោយសារតែវាត្រូវចំណាយពេលទិន្នន័យដែលបានមកពីវេជ្ជបណ្ឌិតដើម្បីសម្អាតដំណើរការនិងបោះពុម្ភផ្សាយប្រព័ន្ធ CDC បានចេញផ្សាយការប៉ាន់ស្មាននៃចំនួនគ្រុនផ្តាសាយដែលមានកាលពីពីរសប្តាហ៍មុន។ ប៉ុន្តែនៅពេលដោះស្រាយការរីករាលដាលនៃជំងឺអេដស៍មន្រ្តីសុខភាពសាធារណៈមិនចង់ដឹងថាតើមានជំងឺគ្រុនផ្តាសាយប៉ុន្មានទេកាលពីពីរសប្តាហ៍មុន។ ពួកគេចង់ដឹងថាតើមានគ្រុនផ្តាសាយប៉ុន្មានដែលមាននៅពេលនេះ។

ស្របពេលជាមួយគ្នានេះ CDC កំពុងប្រមូលទិន្នន័យដើម្បីតាមដានជំងឺផ្តាសាយ Google ក៏កំពុងប្រមូលទិន្នន័យអំពីការរីករាលដាលនៃជំងឺគ្រុនផ្តាសាយទោះយ៉ាងណាក្នុងសំណុំបែបបទខុសគ្នាខ្លាំង។ អ្នកដែលមកពីជុំវិញពិភពលោកតែងតែផ្ញើសំណួរទៅកាន់ Google ហើយសំណួរមួយចំនួនដូចជា "ជំងឺគ្រុនផ្តាសាយ" និង "រោគសញ្ញាជំងឺគ្រុនផ្តាសាយ" បង្ហាញថាអ្នកដែលសួរសំណួរមានជំងឺគ្រុនផ្តាសាយ។ ប៉ុន្តែការប្រើសំណួរស្វែងរកទាំងនេះដើម្បីប៉ាន់ប្រមាណថាអត្រាប្រេវ៉ាឡង់ជំងឺគ្រុនផ្តាសាយគឺមានល្បិចកលមិនមែនគ្រប់អ្នកដែលមានជំងឺគ្រុនផ្តាសាយបានធ្វើការស្រាវជ្រាវទាក់ទងនឹងជំងឺគ្រុនផ្តាសាយនិងមិនមែនគ្រប់ការស្វែងរកទាក់ទងនឹងជំងឺគ្រុនផ្តាសាយទេគឺមកពីអ្នកដែលមានជំងឺគ្រុនផ្តាសាយ។

លោក Jeremy Ginsberg និងក្រុមការងារមួយចំនួន (2009) ខ្លះនៅហ្គូហ្គលនិងមួយចំនួនទៀតនៅ CDC មានគំនិតសំខាន់និងឆ្លាតវៃដើម្បីបញ្ចូលប្រភពទិន្នន័យទាំងពីរនេះ។ យ៉ាងហោចណាស់តាមរយៈការស្រាវជ្រាវតាមបែបអាថ៌កំបាំងអ្នកស្រាវជ្រាវបានរួមបញ្ចូលទិន្នន័យស្វែងរកមិនត្រឹមត្រូវនិងមិនត្រឹមត្រូវជាមួយទិន្នន័យ CDC យឺតនិងត្រឹមត្រូវដើម្បីបង្កើតការវាយតម្លៃរហ័សនិងត្រឹមត្រូវនៃការរីករាលដាលនៃជំងឺគ្រុនផ្តាសាយ។ វិធីមួយទៀតដើម្បីគិតអំពីវាគឺថាពួកគេបានប្រើទិន្នន័យស្វែងរកដើម្បីបង្កើនល្បឿនទិន្នន័យ CDC ។

ជាងនេះទៅទៀតដោយប្រើទិន្នន័យពីឆ្នាំ 2003 ដល់ឆ្នាំ 2007 លោក Ginsberg និងសហសេវិកបានប៉ាន់ប្រមាណថាទំនាក់ទំនងរវាងអត្រានៃជំងឺគ្រុនផ្តាសាយនៅក្នុងទិន្នន័យរបស់ CDC និងការស្វែងរកចំនួន 50 លានខុសគ្នា។ ចាប់តាំងពីដំណើរការនេះដែលជាទិន្នន័យដែលត្រូវបានជំរុញនិងមិនត្រូវការចំណេះដឹងខាងវេជ្ជសាស្ត្រឯកទេសអ្នកស្រាវជ្រាវបានរកឃើញសំណុំសំណួរចំនួន 45 ដែលហាក់ដូចជាព្យាករណ៍បំផុតអំពីទិន្នន័យនៃជំងឺគ្រុនផ្តាសាយរបស់ CDC ។ បន្ទាប់មកដោយប្រើទំនាក់ទំនងដែលពួកគេបានរៀនពីទិន្នន័យឆ្នាំ 2003-2007 Ginsberg និងមិត្តរួមការងាររបស់គាត់បានធ្វើតេស្តគំរូរបស់ពួកគេក្នុងអំឡុងពេលមានជំងឺគ្រុនផ្តាសាយឆ្នាំ 2007-2008 ។ ពួកគេបានរកឃើញថានីតិវិធីរបស់ពួកគេពិតជាអាចធ្វើឱ្យមានរលកធាតុអាកាសដែលមានប្រយោជន៍និងត្រឹមត្រូវ (រូបភាព 2.6) ។ លទ្ធផលទាំងនេះត្រូវបានបោះពុម្ភផ្សាយនៅក្នុង ធម្មជាតិ ហើយបានទទួលការគ្របដណ្ដប់ពីសារព័ត៌មាន។ គម្រោងនេះដែលត្រូវបានគេហៅថា Google Flu Trends បានក្លាយជារឿងប្រៀបប្រដូចជាញឹកញាប់អំពីអំណាចទិន្នន័យដ៏ធំដើម្បីផ្លាស់ប្តូរពិភពលោក។

រូបភាពទី 2.6: លោក Jeremy Ginsberg និងសហសេវិក (2009) រួមបញ្ចូលទិន្នន័យស្វែងរករបស់ Google ជាមួយនឹងទិន្នន័យរបស់ CDC ដើម្បីបង្កើត Google Flu Trends ដែលអាចជះឥទ្ធិពលដល់អត្រាជំងឺផ្តាសាយ (ILI) ។ លទ្ធផលនៃតួលេខនេះគឺសម្រាប់តំបន់អាត្លង់ទិកពាក់កណ្តាលអាមេរិចក្នុងរដូវកាលគ្រុនផ្តាសាយ 2007-2008 ។ បើទោះបីជាវាជាការចាប់ផ្តើមជោគជ័យយ៉ាងខ្លាំងក្តីក៏ការអនុវត្តន៍នៃជំងឺផ្តាសាយបក្សី Google បានបែកបាក់គ្នាតាមពេលវេលា (Cook et al ។ , ឆ្នាំ 2011 Olson et al ។ , 2013 Lazer et al ។ , 2014) ។ សម្របខ្លួនពី Ginsberg et al ។ (ឆ្នាំ 2009) រូបទី 3 ។

រូបភាពទី 2.6: លោក Jeremy Ginsberg និងសហសេវិក (2009) រួមបញ្ចូលទិន្នន័យស្វែងរករបស់ Google ជាមួយនឹងទិន្នន័យរបស់ CDC ដើម្បីបង្កើត Google Flu Trends ដែលអាចជះឥទ្ធិពលដល់អត្រាជំងឺផ្តាសាយ (ILI) ។ លទ្ធផលនៃតួលេខនេះគឺសម្រាប់តំបន់អាត្លង់ទិកពាក់កណ្តាលអាមេរិចក្នុងរដូវកាលគ្រុនផ្តាសាយ 2007-2008 ។ បើទោះបីជាវាជាការចាប់ផ្តើមជោគជ័យយ៉ាងខ្លាំងក្តីក៏ការអនុវត្តន៍នៃជំងឺផ្តាសាយបក្សី Google បានបែកបាក់គ្នាតាមពេលវេលា (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) ។ សម្របខ្លួនពី Ginsberg et al. (2009) រូបទី 3 ។

ទោះជាយ៉ាងណាក៏ដោយរឿងជោគជ័យនេះជាក់ស្តែងបានក្លាយទៅជាភាពអាម៉ាស់មួយ។ យូរ ៗ ទៅក្រុមអ្នកស្រាវជ្រាវបានរកឃើញនូវកត្តាសំខាន់ពីរដែលធ្វើឱ្យ Google Flu Trends មិនសូវចាប់អារម្មណ៍ជាងអ្វីដែលវាបានលេចឡើងដំបូង។ ទីមួយការសម្តែងរបស់ Google Flu Trends ពិតជាមិនល្អប្រសើរជាងគំរូធម្មតាដែលប៉ាន់ស្មានពីចំនួននៃជំងឺគ្រុនផ្តាសាយដោយផ្អែកលើការព្យាករណ៍ស្រាលពីការវាស់ស្ទង់ថ្មីៗនៃជំងឺគ្រុនផ្តាសាយពីរ (Goel et al. 2010) ។ ហើយក្នុងអំឡុងពេលមួយចំនួន Google Flu Trends ពិតជាអាក្រក់ជាងវិធីសាស្ត្រសាមញ្ញនេះ (Lazer et al. 2014) ។ និយាយម្យ៉ាងទៀត Google Flu Trends ជាមួយនឹងទិន្នន័យទាំងអស់ការរៀនម៉ាស៊ីននិងកុំព្យូទ័រដែលមានអនុភាពមិនមានប្រសិទ្ធភាពខ្ពស់ជាងមនុស្សធម្មតានិងងាយស្រួលយល់ទេ។ នេះបានបង្ហាញថានៅពេលវាយតម្លៃការព្យាករណ៍ឬការជក់បារីឥឡូវនេះវាមានសារៈសំខាន់ណាស់ដើម្បីប្រៀបធៀបនឹងមូលដ្ឋានគ្រឹះមួយ។

ការព្រមានសំខាន់ទី 2 អំពី Google Flu Trends គឺថាសមត្ថភាពរបស់ខ្លួនក្នុងការទស្សន៍ទាយថាទិន្នន័យជំងឺគ្រុនផ្តាសាយជំងឺគ្រុនផ្តាសាយថ្មី (CDC) ងាយនឹងខូចខាតរយៈពេលខ្លីនិងមានការខូចខាតរយៈពេលវែងដោយសារតែ ការ យល់ច្រឡំ និង អាលុយមីញ៉ូម ។ ឧទាហរណ៍: ក្នុងកំឡុងពេលនៃការផ្ទុះឡើងនៃជំងឺឆ្លងរាតត្បាតឆ្នាំ 2009 ជំងឺផ្តាសាយបក្សី Google បានបង្កើនហានិភ័យនៃជំងឺគ្រុនផ្តាសាយយ៉ាងខ្លាំងដោយប្រហែលជាមានមនុស្សផ្លាស់ប្តូរអាកប្បកិរិយាស្វែងរករបស់ខ្លួនដើម្បីឆ្លើយតបនឹងការភ័យខ្លាចជាទូទៅនៃការរាលដាលនៃជំងឺឆ្លងទូទាំងពិភពលោក (Cook et al. 2011; Olson et al. 2013) ។ ក្រៅពីបញ្ហារយៈពេលខ្លីទាំងនេះការប្រព្រឹត្ដបន្ដិចម្ដងៗក្នុងរយៈពេលយូរ។ ការធ្វើរោគវិនិច្ឆ័យពីហេតុផលនៃការខូចខាតយូរអង្វែងនេះគឺពិបាកដោយសារក្បួនដោះស្រាយការស្វែងរករបស់ Google មានកម្មសិទ្ធិប៉ុន្តែវាបង្ហាញថានៅឆ្នាំ 2011 ហ្គូហ្គោលបានចាប់ផ្តើមផ្តល់នូវពាក្យស្វែងរកដែលទាក់ទងនៅពេលដែលមនុស្សស្វែងរករោគសញ្ញាជំងឺគ្រុនផ្តាសាយដូចជា "គ្រុនក្តៅ" និង "ក្អក" (វាក៏ហាក់ដូចជាថា លក្ខណៈពិសេសនេះលែងសកម្មទៀតហើយ) ។ ការបន្ថែមលក្ខណៈពិសេសនេះគឺជារឿងដែលសមហេតុផលបំផុតដែលត្រូវធ្វើប្រសិនបើអ្នកកំពុងដំណើរការម៉ាស៊ីនស្វែងរកប៉ុន្តែការផ្លាស់ប្តូរក្បួនដោះស្រាយនេះមានឥទ្ធិពលនៃការស្រាវជ្រាវដែលទាក់ទងទៅនឹងសុខភាពច្រើនជាងមុនដែលបណ្តាលឱ្យ Google Flu Trends មានសក្តានុពលខ្ពស់ជាងការរាលដាលនៃជំងឺគ្រុនផ្តាសាយ (Lazer et al. 2014)

សេចក្តីព្រមានទាំងពីរនេះធ្វើឱ្យមានភាពស្មុគស្មាញដល់កិច្ចខិតខំប្រឹងប្រែងនាពេលអនាគតប៉ុន្តែពួកគេមិនធ្វើបាបពួកគេទេ។ តាមពិតដោយប្រើវិធីសាស្រ្តប្រុងប្រយ័ត្នបន្ថែមទៀត Lazer et al. (2014) និង Yang, Santillana, and Kou (2015) អាចជៀសវាងបញ្ហាទាំងពីរនេះ។ ឆ្ពោះទៅមុខខ្ញុំរំពឹងថាការសិក្សាដែលមានលក្ខណៈស្រេកឃ្លានដែលរួមបញ្ចូលប្រភពទិន្នន័យដ៏ធំជាមួយទិន្នន័យដែលប្រមូលបានពីអ្នកស្រាវជ្រាវនឹងជួយឱ្យក្រុមហ៊ុននិងរដ្ឋាភិបាលបង្កើតការប៉ាន់ប្រមាណឱ្យបានទាន់ពេលវេលានិងត្រឹមត្រូវជាងមុនដោយបង្កើនល្បឿនការវាស់វែងដែលត្រូវបានធ្វើម្តងហើយម្តងទៀតតាមពេលវេលាដោយមានភាពយឺតយ៉ាវ។ គម្រោងដែលកំពុងស្ទង់មតិដូចជា Google Flu Trends ក៏បង្ហាញផងដែរនូវអ្វីដែលអាចកើតឡើងប្រសិនបើប្រភពទិន្នន័យធំត្រូវបានផ្សំជាមួយទិន្នន័យប្រពៃណីច្រើនដែលត្រូវបានបង្កើតឡើងសម្រាប់គោលបំណងនៃការស្រាវជ្រាវ។ ដោយគិតពីភាពស្រដៀងគ្នានៃសិល្បៈជំពូកទី 1 ការច្រៀងឥឡូវមានសក្តានុពលក្នុងការផ្សំបញ្ចូលស្ទីលតាមបែបគំនូរឌុចផាបជាមួយនឹងមុខម្ហូបតាមបែប Michelangelo ដើម្បីផ្ដល់ឱ្យអ្នកធ្វើការសម្រេចចិត្តនូវការវាស់វែងកាន់តែច្រើននិងទាន់ពេលវេលានៃបច្ចុប្បន្ននិងការទស្សន៍ទាយនាពេលអនាគត។