ជានិច្ចនៅលើទិន្នន័យធំអាចធ្វើឱ្យការសិក្សានៃព្រឹត្តិការណ៍មិនបានរំពឹងទុកនិងការវាស់ពេលវេលាពិតប្រាកដនោះទេ។
ប្រព័ន្ធទិន្នន័យធំជាច្រើនមានជានិច្ច; ពួកគេត្រូវបានគេប្រមូលទិន្នន័យជានិច្ច។ លក្ខណៈជានិច្ចនេះផ្ដល់នូវអ្នកស្រាវជ្រាវជាមួយនឹងទិន្នន័យដែលមានបណ្តោយ (ពោលគឺទិន្នន័យនៅលើពេលវេលា) ។ ក្នុងនាមជានិច្ចមានផលប៉ះពាល់សំខាន់ពីរសម្រាប់ការស្រាវជ្រាវ។
ជាដំបូងតែងតែនៅលើទិន្នន័យដែលប្រមូលផ្ដុំអនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវសិក្សាព្រឹត្តិការណ៍ដែលមិនរំពឹងទុកនៅក្នុងវិធីដែលមិនអាចធ្វើទៅបានកាលពីមុន។ ឧទាហរណ៍ក្រុមអ្នកស្រាវជ្រាវបានការចាប់អារម្មណ៍ក្នុងការរៀន Occupy ការតវ៉ា Gezi នៅប្រទេសទួរគីនៅរដូវក្តៅនៃឆ្នាំ 2013 នេះជាធម្មតានឹងផ្តោតលើឥរិយាបថរបស់ក្រុមបាតុករក្នុងអំឡុងពេលព្រឹត្តិការណ៍នេះ។ Ceren Budak និងលោក Duncan វ៉ាត់ (2015) អាចធ្វើកាន់តែច្រើនដោយប្រើធម្មជាតិជានិច្ចក្នុង Twitter ដើម្បីសិក្សាក្រុមអ្នកតវ៉ាដែលប្រើក្នុង Twitter មុនពេលក្នុងពេលនិងបន្ទាប់ពីព្រឹត្តិការណ៍នេះ។ ហើយពួកគេអាចបង្កើតក្រុមប្រៀបធៀបជាមួយមិនអាចចូលរួម (ឬអ្នកចូលរួមដែលមិនបាន Tweet អំពីការតវ៉ានេះ) មុនពេលក្នុងពេលនិងបន្ទាប់ពីព្រឹត្តិការណ៍នេះ (រូបភាពទី 2.1) ។ ជាសរុបបន្ទះក្រោយរបស់ពួកគេអតីតរួមបញ្ចូលទាំងធ្វីតរបស់ 30.000 នាក់ជាងពីរឆ្នាំមកហើយ។ ដោយបន្ថែមទិន្នន័យដែលបានប្រើជាទូទៅពីការតវ៉ាដោយមានការព័តមាននេះផ្សេងទៀត Budak និងវ៉ាត់អាចរៀនបានច្រើនបន្ថែមទៀត: ពួកគេអាចប៉ាន់ស្មានថាអ្វីដែលប្រភេទនៃមនុស្សដែលត្រូវបានគេទំនងជាបន្ថែមទៀតដើម្បីចូលរួមនៅក្នុងការតវ៉ា Gezi និងការប៉ាន់ប្រមាណការផ្លាស់ប្តូរនៅក្នុងអាកប្បកិរិយានៃការ អ្នកចូលរួមនិងអ្នកមិនចូលរួមទាំងនៅក្នុងរយៈពេលខ្លី (ប្រៀបធៀបទៅនឹងមុនក្នុងអំឡុងពេល Gezi Gezi) និងនៅក្នុងរយៈពេលវែង (ប្រៀបធៀបមុន Gezi ដើម្បីប្រកាស-Gezi) ។
វាគឺជាការពិតដែលថាការព្យាករទាំងនេះមួយចំនួនអាចត្រូវបានគេធ្វើឡើងដោយមិនតែងតែលើប្រភពការប្រមូលទិន្នន័យ (ឧទាហរណ៍ការប៉ាន់ប្រមាណរយៈពេលវែងនៃការផ្លាស់ប្តូរអាកប្បកិរិយារបស់), បើទោះបីជាការប្រមូលទិន្នន័យបែបនេះសម្រាប់ 30.000 នាក់នឹងត្រូវបានមានតំលៃថ្លៃណាស់។ ហើយទោះបីជាបានផ្តល់ថវិកាគ្មានដែនកំណត់, ខ្ញុំមិនអាចគិតពីវិធីសាស្រ្តផ្សេងទៀតណាមួយដែលសំខាន់អនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវដំណើរត្រឡប់មកវិញនៅក្នុងពេលវេលានិងការសង្កេតដោយផ្ទាល់ឥរិយាបថអ្នកចូលរួមនៅក្នុងអតីតកាល។ ជម្រើសជិតបំផុតនឹងត្រូវបានទៅប្រមូលរបាយការណ៍ឡើងវិញនៃឥរិយាបទទេប៉ុន្តែរបាយការណ៍ទាំងនេះនឹងមានកម្រិតនិងភាពត្រឹមត្រូវលម្អិតចម្ងល់។ តារាង 2.1 ផ្ដល់នូវឧទាហរណ៍ផ្សេងទៀតនៃការសិក្សាមួយដែលប្រើជានិច្ចប្រភពទិន្នន័យទៅសិក្សាជាព្រឹត្តិការណ៍មិនបានរំពឹងទុក។
ព្រឹត្តិការណ៍មិនបានរំពឹងទុក | ជានិច្ចប្រភពទិន្នន័យ | អំណះអំណាង |
---|---|---|
ចលនា Occupy Gezi នៅក្នុងប្រទេសទួរគី | ក្នុង Twitter | Budak and Watts (2015) |
ការតវ៉ាឆ័ត្រនៅក្នុងទីក្រុងហុងកុង | ក្នុង Weibo | Zhang (2016) |
ការបាញ់ប្រហាររបស់ប៉ូលីសនៅក្នុងទីក្រុងញូវយ៉ក | បញ្ឈប់និង Frisk របាយការណ៍ | Legewie (2016) |
បុគ្គលការចូលរួមជាមួយក្រុម ISIS | ក្នុង Twitter | Magdy, Darwish, and Weber (2016) |
11 កញ្ញាឆ្នាំ 2001 ការវាយប្រហារ | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 កញ្ញាឆ្នាំ 2001 ការវាយប្រហារ | សារភេកយ័រ | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
ទីពីរ, តែងតែនៅលើការប្រមូលទិន្នន័យដែលអាចឱ្យក្រុមអ្នកស្រាវជ្រាវក្នុងការផលិតការវាស់ពេលវេលាពិតប្រាកដ, ដែលអាចមានសារៈសំខាន់ក្នុងការកំណត់ដែលជាកន្លែងដែលអ្នកបង្កើតគោលនយោបាយមិនចង់រៀនពីឥរិយាបទគ្រាន់តែការដែលមានស្រាប់ប៉ុណ្ណោះទេប៉ុន្តែថែមទាំងបានឆ្លើយតបទៅវា។ ឧទាហរណ៍ទិន្នន័យប្រព័ន្ធផ្សព្វផ្សាយសង្គមអាចត្រូវបានប្រើដើម្បីនាំការឆ្លើយតបទៅនឹងគ្រោះមហន្តរាយធម្មជាតិ (Castillo 2016) ។
នៅក្នុងសេចក្តីសន្និដ្ឋាន, តែងតែនៅលើប្រព័ន្ធដែលអាចឱ្យអ្នកស្រាវជ្រាវទិន្នន័យដើម្បីសិក្សាព្រឹត្តិការណ៍រំពឹងទុកនិងផ្ដល់ពពេលវេលាពិតប្រាកដក្នុងការតាក់តែងគោលនយោបាយ។ ខ្ញុំមិនបាន, ទោះជាយ៉ាងណា, ស្នើថាការដែលតែងតែនៅលើប្រព័ន្ធដែលអាចឱ្យអ្នកស្រាវជ្រាវទិន្នន័យដើម្បីតាមដានការផ្លាស់ប្តូរក្នុងរយៈពេលយូរ។ នេះគឺដោយសារប្រព័ន្ធទិន្នន័យធំជាច្រើនកំពុងផ្លាស់ប្តូរមួយដែលដំណើរការនេះហៅថាសំណាត់ជានិច្ច (ផ្នែក 2.3.2.4) ។