[ ,, ] ការយល់ច្រឡំតាមក្បួនដោះស្រាយគឺជាបញ្ហាជាមួយ Google Flu Trends ។ អានក្រដាសដោយ Lazer et al. (2014) ហើយសរសេរអ៊ីមែលខ្លីមួយទៅឱ្យវិស្វករម្នាក់នៅហ្គូហ្គលដែលពន្យល់ពីបញ្ហាហើយផ្តល់គំនិតអំពីរបៀបដោះស្រាយវា។
[ ] Bollen, Mao, and Zeng (2011) អះអាងថាទិន្នន័យពី Twitter អាចត្រូវបានប្រើដើម្បីទស្សទាយទីផ្សារហ៊ុន។ ការរកឃើញនេះបាននាំឱ្យមានការបង្កើតមូលធនប័ត្រ - Derwent Capital Markets - ដើម្បីវិនិយោគនៅក្នុងទីផ្សារភាគហ៊ុនដោយផ្អែកលើទិន្នន័យដែលប្រមូលបានពី Twitter (Jordan 2010) ។ តើភស្តុតាងអ្វីដែលអ្នកចង់ឃើញមុននឹងដាក់ប្រាក់នៅក្នុងមូលនិធិនោះ?
[ ខណៈដែលអ្នកតស៊ូមតិផ្នែកសុខភាពសាធារណៈមួយចំនួនចាត់ទុកថាបារីអេឡិចត្រូនិចគឺជាជំនួយដ៏មានប្រសិទ្ធិភាពសម្រាប់ការឈប់ជក់បារីអ្នកដទៃបានព្រមានអំពីហានិភ័យដែលអាចកើតមានដូចជាកម្រិតជាតិនីកូទីនខ្ពស់។ សូមស្រមៃថាអ្នកស្រាវជ្រាវម្នាក់សម្រេចចិត្តសិក្សាពីទស្សនៈសាធារណៈទៅលើបារីអេឡិចត្រូនិចតាមរយៈការប្រមូលសារអេឡិចត្រូនិកទាក់ទងនឹងបារីអេឡិចត្រូនិចនិងការវិភាគមនោសញ្ចេតនា។
[ នៅខែវិច្ឆិកាឆ្នាំ 2009 Twitter បានផ្លាស់ប្តូរសំណួរនៅក្នុងប្រអប់ធ្វីតពី "តើអ្នកកំពុងធ្វើអ្វី?" ទៅ "តើមានអ្វីកើតឡើង?" (https://blog.twitter.com/2009/whats-happening) ។
[ ] "Retweets" ជាញឹកញាប់ត្រូវបានប្រើដើម្បីវាស់ឥទ្ធិពលនិងការរីករាលដាលនៃឥទ្ធិពលលើ Twitter ។ ដំបូងអ្នកប្រើប្រាស់ត្រូវចម្លងនិងបិទភ្ជាប់ Tweet ដែលពួកគេចូលចិត្តដាក់ស្លាកអ្នកនិពន្ធដើមជាមួយនឹងចំណុចទាញរបស់គាត់និងវាយដោយដៃ "RT" មុនពេលការបង្ហោះនោះបង្ហាញថាវាជាការលោតចេញមកវិញ។ បន្ទាប់មកក្នុងឆ្នាំ 2009 Twitter បានបន្ថែមប៊ូតុង "retweet" ។ នៅខែមិថុនាឆ្នាំ 2016 ទ្វីតធឺរបានធ្វើឱ្យអ្នកប្រើប្រាស់អាចដកថយ Tweet ផ្ទាល់ខ្លួនរបស់ពួកគេ (https://twitter.com/twitter/status/742749353689780224) ។ តើអ្នកគិតថាការផ្លាស់ប្តូរទាំងនេះគួរតែប៉ះពាល់ដល់របៀបដែលអ្នកប្រើ "retweets" នៅក្នុងការស្រាវជ្រាវរបស់អ្នកទេ? ហេតុអ្វីបានជាឬហេតុអ្វី?
[ ,, ,, ,, នៅក្នុងក្រដាសដែលបានពិភាក្សាយ៉ាងទូលំទូលាយលោក Michel និងសហការី (2011) វិភាគខ្លឹមសារសៀវភៅជាង 5 លានក្បាលក្នុងការប៉ុនប៉ងកំណត់និន្នាការវប្បធម៌រយៈពេលយូរ។ ទិន្នន័យដែលពួកគេបានប្រើឥឡូវត្រូវបានបញ្ចេញជាសំណុំទិន្នន័យ Google NGrams ហើយដូច្នេះយើងអាចប្រើទិន្នន័យដើម្បីចម្លងនិងពង្រីកការងាររបស់ពួកគេ។
ក្នុងលទ្ធផលមួយក្នុងចំណោមលទ្ធផលជាច្រើននៅក្នុងក្រដាសលោកមីឆែលនិងសហការីបានលើកហេតុផលថាយើងកំពុងភ្លេចលឿនជាងមុននិងលឿនជាងមុន។ សម្រាប់ឆ្នាំពិសេសមួយនិយាយថា "1883" ពួកគេបានគណនាសមាមាត្រនៃ 1 ក្រាមដែលបានបោះពុម្ពផ្សាយជារៀងរាល់ឆ្នាំរវាងឆ្នាំ 1875 និង 1975 ដែលត្រូវបានគេ "1883" ។ ពួកគេបានវែកញែកថាសមាមាត្រនេះគឺជារង្វាស់នៃចំណាប់អារម្មណ៍លើព្រឹត្តិការណ៍ដែលបានកើតឡើងនៅក្នុងឆ្នាំនោះ។ នៅក្នុងរូបរាងទី 3 របស់ពួកគេពួកគេបានរៀបចំផែនការប្រើគន្លងប្រើប្រាស់ក្នុងរយៈពេលបីឆ្នាំគឺឆ្នាំ 1883 ឆ្នាំ 1910 និងឆ្នាំ 1950 ។ រយៈពេលបីឆ្នាំនេះមានលំនាំរួមមួយគឺការប្រើតិចតួចមុនឆ្នាំនោះបន្ទាប់មកមានការកើនឡើង។ បន្ទាប់មកទៀតដើម្បីកំណត់បរិមាណនៃការបំបែកក្នុងមួយឆ្នាំ ៗ លោកមីឆែលនិងមិត្តរួមការងារបានគណនា "ពាក់កណ្តាលជីវិត" នៃឆ្នាំនីមួយៗអស់រយៈពេលជាច្រើនឆ្នាំរវាងឆ្នាំ 1875 និង 1975 ។ នៅក្នុងរូបភាពទី 3 របស់ពួកគេពួកគេបានបង្ហាញថាពាក់កណ្តាលនៃជីវិតនីមួយៗ ឆ្នាំកំពុងថយចុះហើយពួកគេបានអះអាងថានេះមានន័យថាយើងភ្លេចអតីតកាលលឿននិងលឿន។ ពួកគេបានប្រើ Version 1 នៃ corpus ភាសាអង់គ្លេសប៉ុន្តែក្រោយមកក្រុមហ៊ុន Google បានចេញផ្សាយកំណែទី 2 នៃសាមញ្ញា។ សូមអានផ្នែកទាំងអស់នៃសំនួរមុននឹងអ្នកចាប់ផ្តើមសរសេរកូដ។
សកម្មភាពនេះនឹងផ្តល់ឱ្យអ្នកនូវការអនុវត្តការសរសេរកូដដែលអាចប្រើឡើងវិញបានការបកប្រែលទ្ធផលនិងការខ្វែងគំនិត (ដូចជាធ្វើការជាមួយឯកសារឆ្គងនិងដោះស្រាយទិន្នន័យដែលបាត់) ។ សកម្មភាពនេះក៏នឹងជួយឱ្យអ្នកក្រោកឈរនិងរត់ជាមួយសំណុំទិន្នន័យដែលសម្បូរបែបនិងគួរឱ្យចាប់អារម្មណ៍។
ទទួលបានទិន្នន័យឆៅពីវេបសាយរបស់ Google Books Ngram Viewer ។ ជាពិសេសអ្នកគួរតែប្រើកំណែ 2 នៃ corpus ភាសាអង់គ្លេសដែលត្រូវបានចេញផ្សាយនៅថ្ងៃទី 1 ខែកក្កដាឆ្នាំ 2012 ។ មិនបង្ហាប់ទេឯកសារនេះគឺ 1.4GB ។
បង្កើតផ្នែកសំខាន់នៃតួលេខ 3a របស់ Michel et al. (2011) ។ ដើម្បីបង្កើតតួលេខនេះអ្នកនឹងត្រូវការឯកសារពីរ: ឯកសារដែលអ្នកបានទាញយកដោយផ្នែក (ក) និងឯកសារ "សរុប" ដែលអ្នកអាចប្រើដើម្បីបម្លែងចំនួនវត្ថុដើមទៅជាសមាមាត្រ។ ចំណាំថាឯកសាររាប់សរុបមានរចនាសម្ព័ន្ធដែលអាចធ្វើឱ្យពិបាកក្នុងការអាន។ តើកំណែទី 2 នៃទិន្នន័យ NGram ផ្តល់លទ្ធផលដូចគ្នាទៅនឹងអ្វីដែលបានបង្ហាញនៅក្នុង Michel et al. (2011) ដែលផ្អែកលើទិន្នន័យជំនាន់ទី 1?
ឥឡូវសូមពិនិត្យក្រាហ្វរបស់អ្នកលើក្រាហ្វិកដែលបានបង្កើតដោយកម្មវិធីមើល NGram ។
បង្កើតតួលេខលេខ 3a (តួលេខសំខាន់) ប៉ុន្តែប្តូរ \(y\) កាក់ជាចំនួនរាប់មិនអស់ (មិនមែនជាអត្រានៃការលើកឡើង) ។
តើភាពខុសគ្នារវាង (b) និង (d) នាំឱ្យអ្នកធ្វើការវាយតំលៃឡើងវិញនូវលទ្ធផលណាមួយរបស់ Michel et al ។ (ឆ្នាំ 2011) ។ ហេតុអ្វីបានជាឬហេតុអ្វី?
ឥឡូវដោយប្រើសមាមាត្រនៃការលើកឡើង, ចម្លងតួអង្គនៃរូបភាពទី 3 ក។ នោះគឺសម្រាប់ឆ្នាំនីមួយៗរវាងឆ្នាំ 1875 និងឆ្នាំ 1975 គណនារយៈពេលពាក់កណ្តាលនៃឆ្នាំនោះ។ រយៈពេលពាក់កណ្តាលជីវិតត្រូវបានគេកំណត់ថាជាចំនួនឆ្នាំដែលបានកន្លងផុតទៅមុនពេលសមាមាត្រនៃការចង្អុលបង្ហាញបានដល់ពាក់កណ្ដាលតម្លៃខ្ពស់បំផុតរបស់វា។ ចំណាំថា Michel et al. (2011) ធ្វើអ្វីមួយដែលមានភាពស្មុគស្មាញបន្ថែមទៀតដើម្បីប៉ាន់ប្រមាណផ្នែកពាក់កណ្តាលជីវិតមើលផ្នែក III.6 នៃពត៌មានបណ្តាញគាំទ្រប៉ុន្តែពួកគេអះអាងថាវិធីសាស្រ្តទាំងពីរនេះបង្កើតលទ្ធផលដូចគ្នា។ តើជំនាន់ទី 2 នៃទិន្នន័យ NGram ផ្តល់លទ្ធផលស្រដៀងគ្នាទៅនឹងអ្នកដែលបានបង្ហាញនៅក្នុង Michel et al. (2011) ដែលផ្អែកលើទិន្នន័យជំនាន់ទី 1? (គន្លឹះ: កុំភ្ញាក់ផ្អើលបើវាមិនមាន។ )
តើមានឆ្នាំណាដែលនៅឆ្ងាយដូចជាឆ្នាំដែលគេបំភ្លេចចោលជាពិសេសយ៉ាងឆាប់រហ័សឬយឺត ៗ ទេ? សូមគិតពិចារណាដោយសង្ខេបពីមូលហេតុដែលអាចធ្វើទៅបានសម្រាប់គំរូនោះហើយពន្យល់ពីរបៀបដែលអ្នកបានកំណត់អត្តសញ្ញាណមនុស្សក្រៅ។
ឥឡូវនេះចម្លងលទ្ធផលនេះសម្រាប់កំណែទី 2 នៃទិន្នន័យ NGrams ជាភាសាចិនបារាំងអាល្លឺម៉ង់ហេប្រ៊ូអ៊ីតាលីរុស្ស៊ីនិងអេស្ប៉ាញ។
បើប្រៀបធៀបជាមួយភាសាទាំងអស់តើមានឆ្នាំណាដែលនៅឆ្ងាយដូចជាឆ្នាំដែលគេបំភ្លេចចោលយ៉ាងរហ័សឬយឺត ៗ ទេ? ពិចារណាដោយសង្ខេបអំពីហេតុផលដែលអាចកើតមានចំពោះគំរូនោះ។
[ ,, ,, ,, ] Penney (2016) បានរកឃើញថាតើការផ្សព្វផ្សាយជាទូទៅអំពីការឃ្លាំមើលរបស់ NSA / PRISM (ឧទាហរណ៏ការបកស្រាយរបស់ស្នូវដិន) នៅក្នុងខែមិថុនាឆ្នាំ 2013 ត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងការធ្លាក់ចុះយ៉ាងឆាប់រហ័សនៃចរាចរទៅកាន់អត្ថបទវិគីភីឌាលើប្រធានបទដែលលើកឡើងអំពីកង្វល់ឯកជន។ បើដូច្នេះការផ្លាស់ប្តូរឥរិយាបថនេះនឹងមានភាពស៊ីសង្វាក់គ្នាជាមួយនឹងឥទ្ធិពលញាក់ដែលបណ្តាលមកពីការឃ្លាំមើលដ៏ធំ។ វិធីសាស្ត្ររបស់ Penney (2016) ជួនកាលត្រូវបានគេហៅថាការរចនា ស៊េរីពេលវេលាដែល មានការ រំខាន ហើយវាត្រូវបានទាក់ទងទៅនឹងវិធីសាស្ត្រដែលបានពិពណ៌នានៅក្នុងផ្នែក 2.4.3 ។
ដើម្បីជ្រើសរើសពាក្យគន្លឹះប្រធានបទ Penney សំដៅទៅលើបញ្ជីដែលត្រូវបានប្រើប្រាស់ដោយក្រសួងសន្តិសុខមាតុភូមិអាមេរិកដើម្បីតាមដាននិងឃ្លាំមើលប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ បញ្ជី DHS រាយប្រភេទពាក្យស្វែងរកមួយចំនួនទៅជាបញ្ហាជាច្រើនដូចជា "ការព្រួយបារម្ភផ្នែកសុខភាព" "សុវត្ថិភាពហេដ្ឋារចនាសម្ព័ន្ធ" និង "អំពើភេរវកម្ម" ។ សម្រាប់ក្រុមសិក្សាលោក Penney បានប្រើពាក្យគន្លឹះ 48 ទាក់ទងនឹងភេរវកម្ម (សូមមើលតារាងឧបសម្ព័ន្ធ 8 ) ។ បន្ទាប់មកគាត់បានរាប់ចំនួនអត្ថបទមើលវិគីភីឌាជាប្រចាំខែសម្រាប់អត្ថបទ Wikipedia ចំនួន 48 ដែលត្រូវគ្នាក្នុងរយៈពេល 32 ខែចាប់ពីដើមខែមករាឆ្នាំ 2012 រហូតដល់ចុងខែសីហាឆ្នាំ 2014 ។ ដើម្បីពង្រឹងអំណះអំណាងរបស់គាត់គាត់ក៏បានបង្កើតក្រុមការប្រៀបធៀបមួយចំនួនតាមរយៈការតាមដាន ទស្សនៈអត្ថបទលើប្រធានបទផ្សេងទៀត។
ឥឡូវអ្នកនឹងចម្លងនិងពង្រីក Penney (2016) ។ ទិន្នន័យដើមដែលអ្នកត្រូវការសម្រាប់សកម្មភាពនេះគឺអាចរកបានពី Wikipedia ។ ឬអ្នកអាចទទួលបានវាពីកញ្ចប់ R-wikipediatrend (Meissner and R Core Team 2016) ។ នៅពេលអ្នកសរសេរចម្លើយរបស់អ្នកសូមកត់សម្គាល់ប្រភពទិន្នន័យដែលអ្នកបានប្រើ។ (សូមកត់សម្គាល់ថាសកម្មភាពដូចគ្នានេះក៏បង្ហាញនៅក្នុងជំពូក 6. ) ។ សកម្មភាពនេះនឹងផ្តល់ឱ្យអ្នកនូវការអនុវត្តន៍ក្នុងការខ្វែងគំនិតគ្នានិងការគិតអំពីការធ្វើពិសោធន៍ធម្មជាតិនៅក្នុងប្រភពទិន្នន័យធំ ៗ ។ វាក៏នឹងជួយអ្នកឱ្យដំណើរការជាមួយនិងប្រភពទិន្នន័យគួរឱ្យចាប់អារម្មណ៍សម្រាប់គម្រោងនាពេលអនាគត។
[ ] Efrati (2016) បានរាយការណ៍ដោយផ្អែកលើព័ត៌មានសម្ងាត់ថា "ការចែករំលែកសរុប" នៅលើហ្វេសប៊ុកបានធ្លាក់ចុះប្រហែល 5,5% ពីមួយឆ្នាំទៅមួយឆ្នាំខណៈពេលដែលការចែកចាយតាម "ដើម" បានធ្លាក់ចុះ 21% ពីមួយឆ្នាំទៅមួយឆ្នាំ។ ការធ្លាក់ចុះនេះមានលក្ខណៈស្រួចស្រាវជាមួយអ្នកប្រើប្រាស់ហ្វេសប៊ុកក្រោមអាយុ 30 ឆ្នាំ។ របាយការណ៍នេះបានបញ្ជាក់ពីការធ្លាក់ចុះនៃកត្តាពីរ។ មួយគឺកំណើននៃចំនួនមិត្តភក្តិដែលមាននៅលើហ្វេសប៊ុក។ មួយទៀតគឺថាសកម្មភាពចែករំលែកខ្លះបានផ្លាស់ប្តូរទៅជាការផ្ញើសារនិងទៅឱ្យដៃគូប្រកួតប្រជែងដូចជា Snapchat ។ របាយការណ៍នេះក៏បានបង្ហាញពីវិធីសាស្ត្រជាច្រើនដែល Facebook បានព្យាយាមបង្កើនការចែករំលែករួមទាំងការកែប្រែបន្តិចបន្តួចដែលធ្វើឱ្យការប្រកាសដើមមានលក្ខណៈលេចធ្លោក៏ដូចជារំលឹកជាទៀងទាត់នៃអត្ថបទដើមជាមួយនឹងលក្ខណៈពិសេស "នៅថ្ងៃនេះ" ។ តើមានផលប៉ះពាល់អ្វីខ្លះប្រសិនបើការស្រាវជ្រាវនេះមានសម្រាប់អ្នកស្រាវជ្រាវដែលចង់ប្រើហ្វេសប៊ុកជាប្រភពទិន្នន័យ?
[ តើភាពវិជ្ជមានរវាងសង្គមវិទូនិងប្រវត្ដិវិទូគឺជាអ្វី? យោងទៅតាម Goldthorpe (1991) ភាពខុសគ្នាសំខាន់គឺការគ្រប់គ្រងលើការប្រមូលទិន្នន័យ។ អ្នកប្រវត្តិសាស្រ្តត្រូវបានគេបង្ខំឱ្យប្រើវត្ថុបុរាណដែលអ្នកសង្គមវិទ្យាអាចកែសម្រួលទិន្នន័យរបស់ពួកគេទៅគោលបំណងជាក់លាក់។ អាន Goldthorpe (1991) ។ តើភាពខុសគ្នារវាងសង្គមវិទ្យានិងប្រវត្តិសាស្រ្តដែលទាក់ទងទៅនឹងគំនិតនៃការសំដែងទំនៀមទម្លាប់និងការអាន?
[ ] នេះអាស្រ័យលើសំណួរមុន។ Goldthorpe (1991) បានទាក់ទាញការរិះគន់ជាច្រើនរួមមានមួយពី Nicky Hart (1994) ដែលបានប្រឆាំងនឹងការលះបង់របស់ Goldthorpe ដើម្បីកែសម្រួលទិន្នន័យ។ Hart បានពណ៌នាអំពីគម្រោងកម្មករដែលមានទ្រព្យសម្បត្តិដែលជាការស្ទង់មតិដ៏ធំមួយដើម្បីវាស់ស្ទង់ទំនាក់ទំនងរវាងថ្នាក់សង្គមនិងការបោះឆ្នោតដែលត្រូវបានធ្វើឡើងដោយ Goldthorpe និងសហការីនៅពាក់កណ្តាលទសវត្សឆ្នាំ 1960 ។ ដូចដែលមនុស្សម្នាក់អាចរំពឹងពីអ្នកប្រាជ្ញដែលពេញនិយមចំពោះទិន្នន័យដែលបានរកឃើញតាមរយៈទិន្នន័យដែលបានរកឃើញនោះក្រុមការងាររបស់អ្នកមានទ្រព្យសម្បត្តិប្រមូលទិន្នន័យដែលត្រូវបានរៀបចំដើម្បីដោះស្រាយទ្រឹស្តីដែលបានស្នើឡើងថ្មីៗនេះអំពីអនាគតនៃថ្នាក់សង្គមនៅក្នុងសម័យនៃការបង្កើនជីវភាពរស់នៅ។ ប៉ុន្តែអ្នកស្រី Goldthorpe និងមិត្តរួមការងាររបស់អ្នកស្រីបានភ្លេចប្រមូលព័ត៌មានអំពីឥរិយាបថបោះឆ្នោតរបស់ស្ត្រី។ នេះជារបៀបដែល Nicky Hart (1994) សង្ខេបវគ្គទាំងមូល:
"... វាពិបាកក្នុងការចៀសវាងការសន្និដ្ឋានថាស្ត្រីត្រូវបានលុបចោលដោយសារតែសំណុំទិន្នន័យនេះត្រូវបានបង្ខាំងដោយតក្កវិជ្ជាដែលមិនរាប់បញ្ចូលបទពិសោធនារី។ ដោយមានទស្សនវិស័យនៃទ្រឹស្ដីវណ្ណៈនិងសកម្មភាពជាការចាប់អារម្មណ៍របស់បុរស ... Goldthorpe និងមិត្តរួមការងាររបស់គាត់បានបង្កើតនូវគំរូមួយដែលបង្ហាញពីការសន្មតទ្រឹស្ដីផ្ទាល់ខ្លួនរបស់ពួកគេជំនួសឱ្យការបង្ហាញឱ្យពួកគេនូវការសាកល្បងត្រឹមត្រូវនៃភាពគ្រប់គ្រាន់ "។
ហាតបានបន្ដថា:
"ការរកឃើញជាក់ស្តែងនៃគម្រោងកម្មករចម្រូងចម្រាសប្រាប់យើងបន្ថែមអំពីគុណតម្លៃសង្គមនិយមនៃសង្គមនិយមនាពាក់កណ្តាលសតវត្សរ៍ជាជាងប្រាប់ពីដំណើរការនៃការបែងចែកនយោបាយនិងជីវិតវត្ថុធាតុដើម" ។
តើអ្នកអាចគិតពីឧទាហរណ៏ផ្សេងទៀតដែលប្រមូលទិន្នន័យដែលធ្វើដោយអ្នកឯកទេសមានភាពលំអៀងរបស់អ្នកប្រមូលទិន្នន័យដែលបានបង្កើតឡើងនៅក្នុងវា? តើវាត្រូវបានប្រៀបធៀបទៅនឹងការបង្កប់ដោយក្បួនដោះស្រាយឬទេ? តើនេះអាចមានឥទ្ធិពលយ៉ាងណានៅពេលដែលអ្នកស្រាវជ្រាវគួរតែប្រើ readymades និងនៅពេលដែលពួកគេគួរតែប្រើ custommades?
[ នៅក្នុងជំពូកនេះខ្ញុំបានប្រៀបធៀបទិន្នន័យដែលប្រមូលបានដោយអ្នកស្រាវជ្រាវសម្រាប់អ្នកស្រាវជ្រាវដែលមានកំណត់ត្រារដ្ឋបាលដែលបង្កើតឡើងដោយក្រុមហ៊ុននិងរដ្ឋាភិបាល។ មនុស្សមួយចំនួនហៅទិន្នន័យរដ្ឋបាលទាំងនេះថា "ទិន្នន័យដែលបានរកឃើញ" ដែលវាផ្ទុយគ្នាជាមួយនឹង "ទិន្នន័យដែលបានរៀបចំ" ។ វាជាការពិតដែលថាកំណត់ត្រារដ្ឋបាលត្រូវបានរកឃើញដោយអ្នកស្រាវជ្រាវប៉ុន្តែវាក៏ត្រូវបានគេបង្កើតឡើងផងដែរ។ ឧទាហរណ៍ក្រុមហ៊ុនបច្ចេកវិទ្យាទំនើបធ្វើការយ៉ាងលំបាកដើម្បីប្រមូលនិងរៀបចំទិន្នន័យរបស់ពួកគេ។ ដូច្នេះកំណត់ត្រារដ្ឋបាលទាំងនេះត្រូវបានរកឃើញនិងរចនាឡើងវាអាស្រ័យលើទស្សនៈរបស់អ្នក (រូបភាព 2.12) ។
ផ្តល់នូវឧទាហរណ៏នៃប្រភពទិន្នន័យដែលជាកន្លែងដែលឃើញវាទាំងពីរដែលបានរកឃើញនិងត្រូវបានរចនាឡើងគឺមានប្រយោជន៍នៅពេលប្រើប្រភពទិន្នន័យនោះសម្រាប់ការស្រាវជ្រាវ។
[ នៅក្នុងអត្ថបទដែលប្រកបដោយការចាប់អារម្មណ៍លោក Christian Sandvig និងលោក Eszter Hargittai (2015) បំបែកការស្រាវជ្រាវឌីជីថលជាពីរប្រភេទធំ ៗ ដោយអាស្រ័យលើថាតើប្រព័ន្ធឌីជីថលគឺជាឧបករណ៍ឬវត្ថុនៃការសិក្សា។ ឧទាហរណ៍នៃប្រភេទទីមួយដែលប្រព័ន្ធគឺ ឧបករណ៍មួយគឺការស្រាវជ្រាវដោយលោក Bengtsson និងសហសេវិក (2011) អំពីការប្រើប្រាស់ទិន្នន័យទូរស័ព្ទចល័តដើម្បីតាមដានការធ្វើចំណាកស្រុកបន្ទាប់ពីការរញ្ជួយដីនៅប្រទេសហៃទីក្នុងឆ្នាំ 2010 ។ ឧទាហរណ៏នៃប្រភេទទីពីរដែលប្រព័ន្ធនេះជាកម្មវត្ថុនៃការសិក្សាគឺការស្រាវជ្រាវដោយ Jensen (2007) អំពីរបៀបដែលការដាក់ឱ្យប្រើប្រាស់ទូរស័ព្ទចល័តនៅទូទាំង Kerala, ប្រទេសឥណ្ឌាបានប៉ះពាល់ដល់ដំណើរការនៃទីផ្សារត្រី។ ខ្ញុំដឹងថាភាពខុសគ្នានេះមានប្រយោជន៍ព្រោះវាបញ្ជាក់ថាការសិក្សាដែលប្រើប្រភពទិន្នន័យឌីជីថលអាចមានគោលដៅខុសគ្នាច្រើនបើទោះបីជាពួកគេកំពុងប្រើប្រភពទិន្នន័យដូចគ្នាក៏ដោយ។ ដើម្បីបញ្ជាក់ច្បាស់ពីភាពខុសគ្នានេះសូមពណ៌នាអំពីការសិក្សាបួនដែលអ្នកបានឃើញ: ពីរនាក់ប្រើប្រព័ន្ធឌីជីថលជាឧបករណ៍និងពីរដែលប្រើប្រព័ន្ធឌីជីថលជាវត្ថុនៃការសិក្សា។ អ្នកអាចប្រើឧទាហរណ៍ពីជំពូកនេះប្រសិនបើអ្នកចង់។