2.3.1.2 លើជានិច្ច

ជានិច្ចនៅលើទិន្នន័យធំអាចធ្វើឱ្យការសិក្សានៃព្រឹត្តិការណ៍មិនបានរំពឹងទុកនិងការវាស់ពេលវេលាពិតប្រាកដនោះទេ។

ប្រព័ន្ធទិន្នន័យធំជាច្រើនមានជានិច្ច; ពួកគេត្រូវបានគេប្រមូលទិន្នន័យជានិច្ច។ លក្ខណៈជានិច្ចនេះផ្ដល់នូវអ្នកស្រាវជ្រាវជាមួយនឹងទិន្នន័យដែលមានបណ្តោយ (ពោលគឺទិន្នន័យនៅលើពេលវេលា) ។ ក្នុងនាមជានិច្ចមានផលប៉ះពាល់សំខាន់ពីរសម្រាប់ការស្រាវជ្រាវ។

ជាដំបូងតែងតែនៅលើទិន្នន័យដែលប្រមូលផ្ដុំអនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវសិក្សាព្រឹត្តិការណ៍ដែលមិនរំពឹងទុកនៅក្នុងវិធីដែលមិនអាចធ្វើទៅបានកាលពីមុន។ ឧទាហរណ៍ក្រុមអ្នកស្រាវជ្រាវបានការចាប់អារម្មណ៍ក្នុងការរៀន Occupy ការតវ៉ា Gezi នៅប្រទេសទួរគីនៅរដូវក្តៅនៃឆ្នាំ 201​​3 នេះជាធម្មតានឹងផ្តោតលើឥរិយាបថរបស់ក្រុមបាតុករក្នុងអំឡុងពេលព្រឹត្តិការណ៍នេះ។ Ceren Budak និងលោក Duncan វ៉ាត់ (2015) អាចធ្វើកាន់តែច្រើនដោយប្រើធម្មជាតិជានិច្ចក្នុង Twitter ដើម្បីសិក្សាក្រុមអ្នកតវ៉ាដែលប្រើក្នុង Twitter មុនពេលក្នុងពេលនិងបន្ទាប់ពីព្រឹត្តិការណ៍នេះ។ ហើយពួកគេអាចបង្កើតក្រុមប្រៀបធៀបជាមួយមិនអាចចូលរួម (ឬអ្នកចូលរួមដែលមិនបាន Tweet អំពីការតវ៉ានេះ) មុនពេលក្នុងពេលនិងបន្ទាប់ពីព្រឹត្តិការណ៍នេះ (រូបភាពទី 2.1) ។ ជាសរុបបន្ទះក្រោយរបស់ពួកគេអតីតរួមបញ្ចូលទាំងធ្វីតរបស់ 30.000 នាក់ជាងពីរឆ្នាំមកហើយ។ ដោយបន្ថែមទិន្នន័យដែលបានប្រើជាទូទៅពីការតវ៉ាដោយមានការព័តមាននេះផ្សេងទៀត Budak និងវ៉ាត់អាចរៀនបានច្រើនបន្ថែមទៀត: ពួកគេអាចប៉ាន់ស្មានថាអ្វីដែលប្រភេទនៃមនុស្សដែលត្រូវបានគេទំនងជាបន្ថែមទៀតដើម្បីចូលរួមនៅក្នុងការតវ៉ា Gezi និងការប៉ាន់ប្រមាណការផ្លាស់ប្តូរនៅក្នុងអាកប្បកិរិយានៃការ អ្នកចូលរួមនិងអ្នកមិនចូលរួមទាំងនៅក្នុងរយៈព​​េលខ្លី (ប្រៀបធៀបទៅនឹងមុនក្នុងអំឡុងពេល Gezi Gezi) និងនៅក្នុងរយៈព​​េលវែង (ប្រៀបធៀបមុន Gezi ដើម្បីប្រកាស-Gezi) ។

រូបភាពទី 2.1: រចនាបានប្រើដោយ Budak និង Watts (2015) ដើម្បីសិក្សាពី Occupy ការតវ៉ា Gezi នៅប្រទេសទួរគីនៅរដូវក្តៅនៃឆ្នាំ 201​​3 នេះដោយប្រើធម្មជាតិជានិច្ចក្នុង Twitter, អ្នកស្រាវជ្រាវបានបង្កើតឡើងអ្វីដែលពួកគេហៅថាជាបន្ទះអតីតក្រោយដែលបានរួមបញ្ចូលអំពី 30.000 នាក់ជាងពីរឆ្នាំមកហើយ។ ផ្ទុយទៅវិញនៅក្នុងការសិក្សាធម្មតាដែលផ្តោតលើអ្នកចូលរួមក្នុងការតវ៉ាបន្ទះអតីតក្រោយបានបន្ថែមទៀតថា 1) ទិន្នន័យពីអ្នកចូលរួមមុននិងក្រោយព្រឹត្តិការណ៍នេះនិង 2) ទិន្នន័យពីការមិនចូលរួមមុនពេលក្នុងពេលនិងបន្ទាប់ពីព្រឹត្តិការណ៍នេះ។ រចនាសម្ព័ន្ធទិន្នន័យតុបតែងបន្ថែមនេះឱ្យនៅបើក Budak និងវ៉ាត់ធ្វើការប៉ាន់ស្មានអ្វីដែលប្រភេទនៃមនុស្សដែលត្រូវបានគេទំនងជាបន្ថែមទៀតដើម្បីចូលរួមនៅក្នុងការតវ៉ា Gezi និងការប៉ាន់ប្រមាណការផ្លាស់ប្តូរនៅក្នុងអាកប្បកិរិយានៃអ្នកចូលរួមនិងអ្នកមិនចូលរួមទាំងនៅក្នុងរយៈព​​េលខ្លី (ប្រៀបធៀបមុន Gezi ទៅក្នុងអំឡុងពេល Gezi) និងនៅក្នុងរយៈព​​េលវែង (ប្រៀបធៀបមុន Gezi ដើម្បីប្រកាស-Gezi) ។

រូបភាពទី 2.1: រចនាបានប្រើដោយ Budak and Watts (2015) ដើម្បីសិក្សាពី Occupy ការតវ៉ា Gezi នៅប្រទេសទួរគីនៅរដូវក្តៅនៃឆ្នាំ 2013 នេះដោយប្រើធម្មជាតិជានិច្ចក្នុង Twitter, អ្នកស្រាវជ្រាវបានបង្កើតឡើងអ្វីដែលពួកគេហៅថាជាបន្ទះអតីតក្រោយដែលបានរួមបញ្ចូលអំពី 30.000 នាក់ជាងពីរឆ្នាំមកហើយ។ ផ្ទុយទៅវិញនៅក្នុងការសិក្សាធម្មតាដែលផ្តោតលើអ្នកចូលរួមក្នុងការតវ៉ាបន្ទះអតីតក្រោយបានបន្ថែមទៀតថា 1) ទិន្នន័យពីអ្នកចូលរួមមុននិងក្រោយព្រឹត្តិការណ៍នេះនិង 2) ទិន្នន័យពីការមិនចូលរួមមុនពេលក្នុងពេលនិងបន្ទាប់ពីព្រឹត្តិការណ៍នេះ។ រចនាសម្ព័ន្ធទិន្នន័យតុបតែងបន្ថែមនេះឱ្យនៅបើក Budak និងវ៉ាត់ធ្វើការប៉ាន់ស្មានអ្វីដែលប្រភេទនៃមនុស្សដែលត្រូវបានគេទំនងជាបន្ថែមទៀតដើម្បីចូលរួមនៅក្នុងការតវ៉ា Gezi និងការប៉ាន់ប្រមាណការផ្លាស់ប្តូរនៅក្នុងអាកប្បកិរិយានៃអ្នកចូលរួមនិងអ្នកមិនចូលរួមទាំងនៅក្នុងរយៈព​​េលខ្លី (ប្រៀបធៀបមុន Gezi ទៅក្នុងអំឡុងពេល Gezi) និងនៅក្នុងរយៈព​​េលវែង (ប្រៀបធៀបមុន Gezi ដើម្បីប្រកាស-Gezi) ។

វាគឺជាការពិតដែលថាការព្យាករទាំងនេះមួយចំនួនអាចត្រូវបានគេធ្វើឡើងដោយមិនតែងតែលើប្រភពការប្រមូលទិន្នន័យ (ឧទាហរណ៍ការប៉ាន់ប្រមាណរយៈពេលវែងនៃការផ្លាស់ប្តូរអាកប្បកិរិយារបស់), បើទោះបីជាការប្រមូលទិន្នន័យបែបនេះសម្រាប់ 30.000 នាក់នឹងត្រូវបានមានតំលៃថ្លៃណាស់។ ហើយទោះបីជាបានផ្តល់ថវិកាគ្មានដែនកំណត់, ខ្ញុំមិនអាចគិតពីវិធីសាស្រ្តផ្សេងទៀតណាមួយដែលសំខាន់អនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវដំណើរត្រឡប់មកវិញនៅក្នុងពេលវេលានិងការសង្កេតដោយផ្ទាល់ឥរិយាបថអ្នកចូលរួមនៅក្នុងអតីតកាល។ ជម្រើសជិតបំផុតនឹងត្រូវបានទៅប្រមូលរបាយការណ៍ឡើងវិញនៃឥរិយាបទទេប៉ុន្តែរបាយការណ៍ទាំងនេះនឹងមានកម្រិតនិងភាពត្រឹមត្រូវលម្អិតចម្ងល់។ តារាង 2.1 ផ្ដល់នូវឧទាហរណ៍ផ្សេងទៀតនៃការសិក្សាមួយដែលប្រើជានិច្ចប្រភពទិន្នន័យទៅសិក្សាជាព្រឹត្តិការណ៍មិនបានរំពឹងទុក។

តារាង 2.1: ការសិក្សានៃព្រឹត្តិការណ៍មិនបានរំពឹងទុកការប្រើប្រាស់តែងតែលើប្រភពទិន្នន័យធំ។
ព្រឹត្តិការណ៍មិនបានរំពឹងទុក ជានិច្ចប្រភពទិន្នន័យ អំណះអំណាង
ចលនា Occupy Gezi នៅក្នុងប្រទេសទួរគី ក្នុង Twitter Budak and Watts (2015)
ការតវ៉ាឆ័ត្រនៅក្នុងទីក្រុងហុងកុង ក្នុង Weibo Zhang (2016)
ការបាញ់ប្រហាររបស់ប៉ូលីសនៅក្នុងទីក្រុងញូវយ៉ក បញ្ឈប់និង Frisk របាយការណ៍ Legewie (2016)
បុគ្គលការចូលរួមជាមួយក្រុម ISIS ក្នុង Twitter Magdy, Darwish, and Weber (2016)
11 កញ្ញាឆ្នាំ 2001 ការវាយប្រហារ livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 កញ្ញាឆ្នាំ 2001 ការវាយប្រហារ សារភេកយ័រ Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

ទីពីរ, តែងតែនៅលើការប្រមូលទិន្នន័យដែលអាចឱ្យក្រុមអ្នកស្រាវជ្រាវក្នុងការផលិតការវាស់ពេលវេលាពិតប្រាកដ, ដែលអាចមានសារៈសំខាន់ក្នុងការកំណត់ដែលជាកន្លែងដែលអ្នកបង្កើតគោលនយោបាយមិនចង់រៀនពីឥរិយាបទគ្រាន់តែការដែលមានស្រាប់ប៉ុណ្ណោះទេប៉ុន្តែថែមទាំងបានឆ្លើយតបទៅវា។ ឧទាហរណ៍ទិន្នន័យប្រព័ន្ធផ្សព្វផ្សាយសង្គមអាចត្រូវបានប្រើដើម្បីនាំការឆ្លើយតបទៅនឹងគ្រោះមហន្តរាយធម្មជាតិ (Castillo 2016)

នៅក្នុងសេចក្តីសន្និដ្ឋាន, តែងតែនៅលើប្រព័ន្ធដែលអាចឱ្យអ្នកស្រាវជ្រាវទិន្នន័យដើម្បីសិក្សាព្រឹត្តិការណ៍រំពឹងទុកនិងផ្ដល់ពពេលវេលាពិតប្រាកដក្នុងការតាក់តែងគោលនយោបាយ។ ខ្ញុំមិនបាន, ទោះជាយ៉ាងណា, ស្នើថាការដែលតែងតែនៅលើប្រព័ន្ធដែលអាចឱ្យអ្នកស្រាវជ្រាវទិន្នន័យដើម្បីតាមដានការផ្លាស់ប្តូរក្នុងរយៈព​​េលយូរ។ នេះគឺដោយសារប្រព័ន្ធទិន្នន័យធំជាច្រើនកំពុងផ្លាស់ប្តូរមួយដែលដំណើរការនេះហៅថាសំណាត់ជានិច្ច (ផ្នែក 2.3.2.4) ។