សកម្មភាព

ការបកប្រែនេះត្រូវបានបង្កើតឡើងដោយកុំព្យូទ័រ។ ×

សកម្មភាព

កម្រិតនៃការលំបាក: ងាយស្រួល មធ្យម រឹង , ពិបាកណាស់
តម្រូវឱ្យគណិតវិទ្យា ( $តម្រូវឱ្យគណិតវិទ្យា$ )
ទាមទារសរសេរកូដ ( )
ការប្រមូលទិន្នន័យ ( )
ចំណង់ចំណូលចិត្តរបស់ខ្ញុំ ( )

[ ,, ] ការយល់ច្រឡំតាមក្បួនដោះស្រាយគឺជាបញ្ហាជាមួយ Google Flu Trends ។ អានក្រដាសដោយ Lazer et al. (2014) ហើយសរសេរអ៊ីមែលខ្លីមួយទៅឱ្យវិស្វករម្នាក់នៅហ្គូហ្គលដែលពន្យល់ពីបញ្ហាហើយផ្តល់គំនិតអំពីរបៀបដោះស្រាយវា។
[ ] Bollen, Mao, and Zeng (2011) អះអាងថាទិន្នន័យពី Twitter អាចត្រូវបានប្រើដើម្បីទស្សទាយទីផ្សារហ៊ុន។ ការរកឃើញនេះបាននាំឱ្យមានការបង្កើតមូលធនប័ត្រ - Derwent Capital Markets - ដើម្បីវិនិយោគនៅក្នុងទីផ្សារភាគហ៊ុនដោយផ្អែកលើទិន្នន័យដែលប្រមូលបានពី Twitter (Jordan 2010) ។ តើភស្តុតាងអ្វីដែលអ្នកចង់ឃើញមុននឹងដាក់ប្រាក់នៅក្នុងមូលនិធិនោះ?
[ ខណៈដែលអ្នកតស៊ូមតិផ្នែកសុខភាពសាធារណៈមួយចំនួនចាត់ទុកថាបារីអេឡិចត្រូនិចគឺជាជំនួយដ៏មានប្រសិទ្ធិភាពសម្រាប់ការឈប់ជក់បារីអ្នកដទៃបានព្រមានអំពីហានិភ័យដែលអាចកើតមានដូចជាកម្រិតជាតិនីកូទីនខ្ពស់។ សូមស្រមៃថាអ្នកស្រាវជ្រាវម្នាក់សម្រេចចិត្តសិក្សាពីទស្សនៈសាធារណៈទៅលើបារីអេឡិចត្រូនិចតាមរយៈការប្រមូលសារអេឡិចត្រូនិកទាក់ទងនឹងបារីអេឡិចត្រូនិចនិងការវិភាគមនោសញ្ចេតនា។
1. តើអ្វីទៅជាភាពលម្អៀងទាំងបីដែលអ្នកអាចព្រួយបារម្ភបំផុតនៅក្នុងការសិក្សានេះ?
2. Clark et al. (2016) បានបើកការស្រាវជ្រាវបែបនេះ។ ដំបូងពួកគេប្រមូលបាន 850,000 tweets ដែលប្រើពាក្យគន្លឹះទាក់ទងនឹងបារីអេឡិចត្រូនិចចាប់ពីខែមករាឆ្នាំ 2012 រហូតដល់ខែធ្នូឆ្នាំ 2014 ។ នៅពេលពិនិត្យមើលកាន់តែជិតពួកគេបានដឹងថាធ្វីតជាច្រើននេះត្រូវបានប្រើដោយស្វ័យប្រវត្តិ (មានន័យថាមិនមែនផលិតដោយមនុស្ស) ហើយភាគច្រើននៃធ្វីតទាំងនេះដោយស្វ័យប្រវត្តិគឺសំខាន់។ ពាណិជ្ជកម្ម។ ពួកគេបានបង្កើតក្បួនដោះស្រាយការរកឃើញរបស់មនុស្សដើម្បីបំបែកសារលិខិតដោយស្វ័យប្រវត្តិពីធ្វីតធើរសរីរាង្គ។ ដោយប្រើក្បួនដោះស្រាយរកមនុស្សនេះពួកគេបានរកឃើញថា 80% នៃធ្វីតត្រូវបានប្រើដោយស្វ័យប្រវត្តិ។ តើការរកឃើញនេះផ្លាស់ប្តូរចម្លើយរបស់អ្នកទៅផ្នែក (ក) ដែរឬទេ?
3. នៅពេលដែលពួកគេបានប្រៀបធៀបអារម្មណ៍នៅក្នុងធ្វីតធ័រនិងដោយស្វ័យប្រវត្ដិពួកគេបានរកឃើញថាធ្វីតស្វ័យប្រវត្ដិមានលក្ខណៈវិជ្ជមានជាងធ្វីសសរីរាង្គ (6.17 ទៅ 5.84) ។ តើការរកឃើញនេះផ្លាស់ប្តូរចម្លើយរបស់អ្នកទៅ (ខ) ដែរឬទេ?
[ នៅខែវិច្ឆិកាឆ្នាំ 2009 Twitter បានផ្លាស់ប្តូរសំណួរនៅក្នុងប្រអប់ធ្វីតពី "តើអ្នកកំពុងធ្វើអ្វី?" ទៅ "តើមានអ្វីកើតឡើង?" (https://blog.twitter.com/2009/whats-happening) ។
1. តើអ្នកគិតថាការផ្លាស់ប្តូរប្រអប់បញ្ចូលនឹងប៉ះពាល់ដល់អ្នកដែលធ្វីតនិង / ឬអ្វីដែលពួកគេបានធ្វើ?
2. ដាក់ឈ្មោះគម្រោងស្រាវជ្រាវមួយដែលអ្នកចូលចិត្តប្រអប់សួរថា "តើអ្នកធ្វើអ្វី?" ពន្យល់ពីមូលហេតុ។
3. ដាក់ឈ្មោះគម្រោងស្រាវជ្រាវមួយដែលអ្នកចូលចិត្តប្រអប់សួរថា "តើមានអ្វីកើតឡើង?" ពន្យល់ពីមូលហេតុ។
[ ] "Retweets" ជាញឹកញាប់ត្រូវបានប្រើដើម្បីវាស់ឥទ្ធិពលនិងការរីករាលដាលនៃឥទ្ធិពលលើ Twitter ។ ដំបូងអ្នកប្រើប្រាស់ត្រូវចម្លងនិងបិទភ្ជាប់ Tweet ដែលពួកគេចូលចិត្តដាក់ស្លាកអ្នកនិពន្ធដើមជាមួយនឹងចំណុចទាញរបស់គាត់និងវាយដោយដៃ "RT" មុនពេលការបង្ហោះនោះបង្ហាញថាវាជាការលោតចេញមកវិញ។ បន្ទាប់មកក្នុងឆ្នាំ 2009 Twitter បានបន្ថែមប៊ូតុង "retweet" ។ នៅខែមិថុនាឆ្នាំ 2016 ទ្វីតធឺរបានធ្វើឱ្យអ្នកប្រើប្រាស់អាចដកថយ Tweet ផ្ទាល់ខ្លួនរបស់ពួកគេ (https://twitter.com/twitter/status/742749353689780224) ។ តើអ្នកគិតថាការផ្លាស់ប្តូរទាំងនេះគួរតែប៉ះពាល់ដល់របៀបដែលអ្នកប្រើ "retweets" នៅក្នុងការស្រាវជ្រាវរបស់អ្នកទេ? ហេតុអ្វីបានជាឬហេតុអ្វី?
[ ,, ,, ,, នៅក្នុងក្រដាសដែលបានពិភាក្សាយ៉ាងទូលំទូលាយលោក Michel និងសហការី (2011) វិភាគខ្លឹមសារសៀវភៅជាង 5 លានក្បាលក្នុងការប៉ុនប៉ងកំណត់និន្នាការវប្បធម៌រយៈពេលយូរ។ ទិន្នន័យដែលពួកគេបានប្រើឥឡូវត្រូវបានបញ្ចេញជាសំណុំទិន្នន័យ Google NGrams ហើយដូច្នេះយើងអាចប្រើទិន្នន័យដើម្បីចម្លងនិងពង្រីកការងាររបស់ពួកគេ។

ក្នុងលទ្ធផលមួយក្នុងចំណោមលទ្ធផលជាច្រើននៅក្នុងក្រដាសលោកមីឆែលនិងសហការីបានលើកហេតុផលថាយើងកំពុងភ្លេចលឿនជាងមុននិងលឿនជាងមុន។ សម្រាប់ឆ្នាំពិសេសមួយនិយាយថា "1883" ពួកគេបានគណនាសមាមាត្រនៃ 1 ក្រាមដែលបានបោះពុម្ពផ្សាយជារៀងរាល់ឆ្នាំរវាងឆ្នាំ 1875 និង 1975 ដែលត្រូវបានគេ "1883" ។ ពួកគេបានវែកញែកថាសមាមាត្រនេះគឺជារង្វាស់នៃចំណាប់អារម្មណ៍លើព្រឹត្តិការណ៍ដែលបានកើតឡើងនៅក្នុងឆ្នាំនោះ។ នៅក្នុងរូបរាងទី 3 របស់ពួកគេពួកគេបានរៀបចំផែនការប្រើគន្លងប្រើប្រាស់ក្នុងរយៈពេលបីឆ្នាំគឺឆ្នាំ 1883 ឆ្នាំ 1910 និងឆ្នាំ 1950 ។ រយៈពេលបីឆ្នាំនេះមានលំនាំរួមមួយគឺការប្រើតិចតួចមុនឆ្នាំនោះបន្ទាប់មកមានការកើនឡើង។ បន្ទាប់មកទៀតដើម្បីកំណត់បរិមាណនៃការបំបែកក្នុងមួយឆ្នាំ ៗ លោកមីឆែលនិងមិត្តរួមការងារបានគណនា "ពាក់កណ្តាលជីវិត" នៃឆ្នាំនីមួយៗអស់រយៈពេលជាច្រើនឆ្នាំរវាងឆ្នាំ 1875 និង 1975 ។ នៅក្នុងរូបភាពទី 3 របស់ពួកគេពួកគេបានបង្ហាញថាពាក់កណ្តាលនៃជីវិតនីមួយៗ ឆ្នាំកំពុងថយចុះហើយពួកគេបានអះអាងថានេះមានន័យថាយើងភ្លេចអតីតកាលលឿននិងលឿន។ ពួកគេបានប្រើ Version 1 នៃ corpus ភាសាអង់គ្លេសប៉ុន្តែក្រោយមកក្រុមហ៊ុន Google បានចេញផ្សាយកំណែទី 2 នៃសាមញ្ញា។ សូមអានផ្នែកទាំងអស់នៃសំនួរមុននឹងអ្នកចាប់ផ្តើមសរសេរកូដ។

សកម្មភាពនេះនឹងផ្តល់ឱ្យអ្នកនូវការអនុវត្តការសរសេរកូដដែលអាចប្រើឡើងវិញបានការបកប្រែលទ្ធផលនិងការខ្វែងគំនិត (ដូចជាធ្វើការជាមួយឯកសារឆ្គងនិងដោះស្រាយទិន្នន័យដែលបាត់) ។ សកម្មភាពនេះក៏នឹងជួយឱ្យអ្នកក្រោកឈរនិងរត់ជាមួយសំណុំទិន្នន័យដែលសម្បូរបែបនិងគួរឱ្យចាប់អារម្មណ៍។
1. ទទួលបានទិន្នន័យឆៅពីវេបសាយរបស់ Google Books Ngram Viewer ។ ជាពិសេសអ្នកគួរតែប្រើកំណែ 2 នៃ corpus ភាសាអង់គ្លេសដែលត្រូវបានចេញផ្សាយនៅថ្ងៃទី 1 ខែកក្កដាឆ្នាំ 2012 ។ មិនបង្ហាប់ទេឯកសារនេះគឺ 1.4GB ។
2. បង្កើតផ្នែកសំខាន់នៃតួលេខ 3a របស់ Michel et al. (2011) ។ ដើម្បីបង្កើតតួលេខនេះអ្នកនឹងត្រូវការឯកសារពីរ: ឯកសារដែលអ្នកបានទាញយកដោយផ្នែក (ក) និងឯកសារ "សរុប" ដែលអ្នកអាចប្រើដើម្បីបម្លែងចំនួនវត្ថុដើមទៅជាសមាមាត្រ។ ចំណាំថាឯកសាររាប់សរុបមានរចនាសម្ព័ន្ធដែលអាចធ្វើឱ្យពិបាកក្នុងការអាន។ តើកំណែទី 2 នៃទិន្នន័យ NGram ផ្តល់លទ្ធផលដូចគ្នាទៅនឹងអ្វីដែលបានបង្ហាញនៅក្នុង Michel et al. (2011) ដែលផ្អែកលើទិន្នន័យជំនាន់ទី 1?
3. ឥឡូវសូមពិនិត្យក្រាហ្វរបស់អ្នកលើក្រាហ្វិកដែលបានបង្កើតដោយកម្មវិធីមើល NGram ។
4. បង្កើតតួលេខលេខ 3a (តួលេខសំខាន់) ប៉ុន្តែប្តូរ $y$ កាក់ជាចំនួនរាប់មិនអស់ (មិនមែនជាអត្រានៃការលើកឡើង) ។
5. តើភាពខុសគ្នារវាង (b) និង (d) នាំឱ្យអ្នកធ្វើការវាយតំលៃឡើងវិញនូវលទ្ធផលណាមួយរបស់ Michel et al ។ (ឆ្នាំ 2011) ។ ហេតុអ្វីបានជាឬហេតុអ្វី?
6. ឥឡូវដោយប្រើសមាមាត្រនៃការលើកឡើង, ចម្លងតួអង្គនៃរូបភាពទី 3 ក។ នោះគឺសម្រាប់ឆ្នាំនីមួយៗរវាងឆ្នាំ 1875 និងឆ្នាំ 1975 គណនារយៈពេលពាក់កណ្តាលនៃឆ្នាំនោះ។ រយៈពេលពាក់កណ្តាលជីវិតត្រូវបានគេកំណត់ថាជាចំនួនឆ្នាំដែលបានកន្លងផុតទៅមុនពេលសមាមាត្រនៃការចង្អុលបង្ហាញបានដល់ពាក់កណ្ដាលតម្លៃខ្ពស់បំផុតរបស់វា។ ចំណាំថា Michel et al. (2011) ធ្វើអ្វីមួយដែលមានភាពស្មុគស្មាញបន្ថែមទៀតដើម្បីប៉ាន់ប្រមាណផ្នែកពាក់កណ្តាលជីវិតមើលផ្នែក III.6 នៃពត៌មានបណ្តាញគាំទ្រប៉ុន្តែពួកគេអះអាងថាវិធីសាស្រ្តទាំងពីរនេះបង្កើតលទ្ធផលដូចគ្នា។ តើជំនាន់ទី 2 នៃទិន្នន័យ NGram ផ្តល់លទ្ធផលស្រដៀងគ្នាទៅនឹងអ្នកដែលបានបង្ហាញនៅក្នុង Michel et al. (2011) ដែលផ្អែកលើទិន្នន័យជំនាន់ទី 1? (គន្លឹះ: កុំភ្ញាក់ផ្អើលបើវាមិនមាន។ )
7. តើមានឆ្នាំណាដែលនៅឆ្ងាយដូចជាឆ្នាំដែលគេបំភ្លេចចោលជាពិសេសយ៉ាងឆាប់រហ័សឬយឺត ៗ ទេ? សូមគិតពិចារណាដោយសង្ខេបពីមូលហេតុដែលអាចធ្វើទៅបានសម្រាប់គំរូនោះហើយពន្យល់ពីរបៀបដែលអ្នកបានកំណត់អត្តសញ្ញាណមនុស្សក្រៅ។
8. ឥឡូវនេះចម្លងលទ្ធផលនេះសម្រាប់កំណែទី 2 នៃទិន្នន័យ NGrams ជាភាសាចិនបារាំងអាល្លឺម៉ង់ហេប្រ៊ូអ៊ីតាលីរុស្ស៊ីនិងអេស្ប៉ាញ។
9. បើប្រៀបធៀបជាមួយភាសាទាំងអស់តើមានឆ្នាំណាដែលនៅឆ្ងាយដូចជាឆ្នាំដែលគេបំភ្លេចចោលយ៉ាងរហ័សឬយឺត ៗ ទេ? ពិចារណាដោយសង្ខេបអំពីហេតុផលដែលអាចកើតមានចំពោះគំរូនោះ។
[ ,, ,, ,, ] Penney (2016) បានរកឃើញថាតើការផ្សព្វផ្សាយជាទូទៅអំពីការឃ្លាំមើលរបស់ NSA / PRISM (ឧទាហរណ៏ការបកស្រាយរបស់ស្នូវដិន) នៅក្នុងខែមិថុនាឆ្នាំ 2013 ត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងការធ្លាក់ចុះយ៉ាងឆាប់រហ័សនៃចរាចរទៅកាន់អត្ថបទវិគីភីឌាលើប្រធានបទដែលលើកឡើងអំពីកង្វល់ឯកជន។ បើដូច្នេះការផ្លាស់ប្តូរឥរិយាបថនេះនឹងមានភាពស៊ីសង្វាក់គ្នាជាមួយនឹងឥទ្ធិពលញាក់ដែលបណ្តាលមកពីការឃ្លាំមើលដ៏ធំ។ វិធីសាស្ត្ររបស់ Penney (2016) ជួនកាលត្រូវបានគេហៅថាការរចនា ស៊េរីពេលវេលាដែល មានការ រំខាន ហើយវាត្រូវបានទាក់ទងទៅនឹងវិធីសាស្ត្រដែលបានពិពណ៌នានៅក្នុងផ្នែក 2.4.3 ។

ដើម្បីជ្រើសរើសពាក្យគន្លឹះប្រធានបទ Penney សំដៅទៅលើបញ្ជីដែលត្រូវបានប្រើប្រាស់ដោយក្រសួងសន្តិសុខមាតុភូមិអាមេរិកដើម្បីតាមដាននិងឃ្លាំមើលប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ បញ្ជី DHS រាយប្រភេទពាក្យស្វែងរកមួយចំនួនទៅជាបញ្ហាជាច្រើនដូចជា "ការព្រួយបារម្ភផ្នែកសុខភាព" "សុវត្ថិភាពហេដ្ឋារចនាសម្ព័ន្ធ" និង "អំពើភេរវកម្ម" ។ សម្រាប់ក្រុមសិក្សាលោក Penney បានប្រើពាក្យគន្លឹះ 48 ទាក់ទងនឹងភេរវកម្ម (សូមមើលតារាងឧបសម្ព័ន្ធ 8 ) ។ បន្ទាប់មកគាត់បានរាប់ចំនួនអត្ថបទមើលវិគីភីឌាជាប្រចាំខែសម្រាប់អត្ថបទ Wikipedia ចំនួន 48 ដែលត្រូវគ្នាក្នុងរយៈពេល 32 ខែចាប់ពីដើមខែមករាឆ្នាំ 2012 រហូតដល់ចុងខែសីហាឆ្នាំ 2014 ។ ដើម្បីពង្រឹងអំណះអំណាងរបស់គាត់គាត់ក៏បានបង្កើតក្រុមការប្រៀបធៀបមួយចំនួនតាមរយៈការតាមដាន ទស្សនៈអត្ថបទលើប្រធានបទផ្សេងទៀត។

ឥឡូវអ្នកនឹងចម្លងនិងពង្រីក Penney (2016) ។ ទិន្នន័យដើមដែលអ្នកត្រូវការសម្រាប់សកម្មភាពនេះគឺអាចរកបានពី Wikipedia ។ ឬអ្នកអាចទទួលបានវាពីកញ្ចប់ R-wikipediatrend (Meissner and R Core Team 2016) ។ នៅពេលអ្នកសរសេរចម្លើយរបស់អ្នកសូមកត់សម្គាល់ប្រភពទិន្នន័យដែលអ្នកបានប្រើ។ (សូមកត់សម្គាល់ថាសកម្មភាពដូចគ្នានេះក៏បង្ហាញនៅក្នុងជំពូក 6. ) ។ សកម្មភាពនេះនឹងផ្តល់ឱ្យអ្នកនូវការអនុវត្តន៍ក្នុងការខ្វែងគំនិតគ្នានិងការគិតអំពីការធ្វើពិសោធន៍ធម្មជាតិនៅក្នុងប្រភពទិន្នន័យធំ ៗ ។ វាក៏នឹងជួយអ្នកឱ្យដំណើរការជាមួយនិងប្រភពទិន្នន័យគួរឱ្យចាប់អារម្មណ៍សម្រាប់គម្រោងនាពេលអនាគត។
1. អាន Penney (2016) និងចម្លងតួលេខទី 2 របស់គាត់ដែលបង្ហាញពីទស្សនៈទំព័រសម្រាប់ "ភេរវកម្ម" ដែលទាក់ទងនឹងទំព័រមុននិងក្រោយការបើកបង្ហាញរបស់ស្នូវឌិន។ បកស្រាយការរកឃើញ។
2. បន្ទាប់មកតួលេខលេខ 4A ដែលប្រៀបធៀបទៅនឹងក្រុមសិក្សា (អត្ថបទទាក់ទងនឹងអំពើភេរវកម្ម) ជាមួយក្រុមប្រៀបធៀបដោយប្រើពាក្យគន្លឹះប្រភេទ "DHS & ទីភ្នាក់ងារផ្សេងៗ" ពីបញ្ជី DHS (សូមមើលតារាងបន្ថែមនិងតារាងលេខ 139) ។ បកស្រាយការរកឃើញ។
3. មួយផ្នែក (ខ) អ្នកបានប្រៀបធៀបក្រុមសិក្សាជាមួយក្រុមប្រៀបធៀបមួយ។ Penney ក៏បានប្រៀបធៀបទៅនឹងក្រុមអ្នកប្រៀបធៀបពីរផ្សេងទៀតដែលទាក់ទងនឹង "ហេដ្ឋារចនាសម្ព័ន្ធហេដ្ឋារចនាសម្ព័ន្ធ" (ឧបសម្ព័ន្ធទី 11) និងទំព័រវិបផតថលដែលមានប្រជាប្រិយ (ឧបសម្ព័ន្ធទី 12) ។ សូមអញ្ជើញមកជាមួយក្រុមប្រៀបធៀបផ្សេងទៀតនិងសាកល្បងថាតើការរកឃើញពីផ្នែក (ខ) មានភាពរសើបទៅនឹងជម្រើសនៃក្រុមប្រៀបធៀបរបស់អ្នកឬយ៉ាងណា។ តើជម្រើសមួយណាដែលសមហេតុផលបំផុត? ហេតុអ្វី?
4. Penney បាននិយាយថាពាក្យគន្លឹះទាក់ទងនឹង "ភេរវកម្ម" ត្រូវបានប្រើដើម្បីជ្រើសរើសអត្ថបទ Wikipedia ដោយសារតែរដ្ឋាភិបាលសហរដ្ឋអាមេរិកបានលើកឡើងពីភេរវកម្មថាជាយុត្តិកម្មសំខាន់សម្រាប់ការអនុវត្តការឃ្លាំមើលតាមអ៊ីនធឺណេត។ ក្នុងនាមជាអ្នកត្រួតពិនិត្យពាក្យគន្លឹះទាក់ទងនឹងភេវរកម្ម 48 នេះ Penney (2016) ក៏បានធ្វើការស្ទាបស្ទង់មតិលើ MTurk ផងដែរដោយស្នើឱ្យអ្នកឆ្លើយឆ្លងវាយតម្លៃពាក្យគន្លឹះរបស់ពាក្យគន្លឹះទាំងបីរបស់រដ្ឋាភិបាលទាក់ទងនឹងបញ្ហារដ្ឋាភិបាលភាពឯកជននិងការជៀសវាង (ឧបសម្ព័ន្ធទី 7 និង 8 ) ។ ធ្វើការស្ទង់មតិឡើងវិញលើ MTurk និងប្រៀបធៀបលទ្ធផលរបស់អ្នក។
5. ដោយផ្អែកលើលទ្ធផលនៅផ្នែកមួយ (ឃ) និងការអានអត្ថបទរបស់អ្នកតើអ្នកយល់ស្របជាមួយជម្រើសរបស់លោក Penney នៃពាក្យគន្លឹះប្រធានបទនៅក្នុងក្រុមសិក្សាទេ? ហេតុអ្វីបានជាឬហេតុអ្វី? បើមិនអ៊ីចឹងតើអ្នកនឹងស្នើជំនួសវិញទេ?
[ ] Efrati (2016) បានរាយការណ៍ដោយផ្អែកលើព័ត៌មានសម្ងាត់ថា "ការចែករំលែកសរុប" នៅលើហ្វេសប៊ុកបានធ្លាក់ចុះប្រហែល 5,5% ពីមួយឆ្នាំទៅមួយឆ្នាំខណៈពេលដែលការចែកចាយតាម "ដើម" បានធ្លាក់ចុះ 21% ពីមួយឆ្នាំទៅមួយឆ្នាំ។ ការធ្លាក់ចុះនេះមានលក្ខណៈស្រួចស្រាវជាមួយអ្នកប្រើប្រាស់ហ្វេសប៊ុកក្រោមអាយុ 30 ឆ្នាំ។ របាយការណ៍នេះបានបញ្ជាក់ពីការធ្លាក់ចុះនៃកត្តាពីរ។ មួយគឺកំណើននៃចំនួនមិត្តភក្តិដែលមាននៅលើហ្វេសប៊ុក។ មួយទៀតគឺថាសកម្មភាពចែករំលែកខ្លះបានផ្លាស់ប្តូរទៅជាការផ្ញើសារនិងទៅឱ្យដៃគូប្រកួតប្រជែងដូចជា Snapchat ។ របាយការណ៍នេះក៏បានបង្ហាញពីវិធីសាស្ត្រជាច្រើនដែល Facebook បានព្យាយាមបង្កើនការចែករំលែករួមទាំងការកែប្រែបន្តិចបន្តួចដែលធ្វើឱ្យការប្រកាសដើមមានលក្ខណៈលេចធ្លោក៏ដូចជារំលឹកជាទៀងទាត់នៃអត្ថបទដើមជាមួយនឹងលក្ខណៈពិសេស "នៅថ្ងៃនេះ" ។ តើមានផលប៉ះពាល់អ្វីខ្លះប្រសិនបើការស្រាវជ្រាវនេះមានសម្រាប់អ្នកស្រាវជ្រាវដែលចង់ប្រើហ្វេសប៊ុកជាប្រភពទិន្នន័យ?
[ តើភាពវិជ្ជមានរវាងសង្គមវិទូនិងប្រវត្ដិវិទូគឺជាអ្វី? យោងទៅតាម Goldthorpe (1991) ភាពខុសគ្នាសំខាន់គឺការគ្រប់គ្រងលើការប្រមូលទិន្នន័យ។ អ្នកប្រវត្តិសាស្រ្តត្រូវបានគេបង្ខំឱ្យប្រើវត្ថុបុរាណដែលអ្នកសង្គមវិទ្យាអាចកែសម្រួលទិន្នន័យរបស់ពួកគេទៅគោលបំណងជាក់លាក់។ អាន Goldthorpe (1991) ។ តើភាពខុសគ្នារវាងសង្គមវិទ្យានិងប្រវត្តិសាស្រ្តដែលទាក់ទងទៅនឹងគំនិតនៃការសំដែងទំនៀមទម្លាប់និងការអាន?
[ ] នេះអាស្រ័យលើសំណួរមុន។ Goldthorpe (1991) បានទាក់ទាញការរិះគន់ជាច្រើនរួមមានមួយពី Nicky Hart (1994) ដែលបានប្រឆាំងនឹងការលះបង់របស់ Goldthorpe ដើម្បីកែសម្រួលទិន្នន័យ។ Hart បានពណ៌នាអំពីគម្រោងកម្មករដែលមានទ្រព្យសម្បត្តិដែលជាការស្ទង់មតិដ៏ធំមួយដើម្បីវាស់ស្ទង់ទំនាក់ទំនងរវាងថ្នាក់សង្គមនិងការបោះឆ្នោតដែលត្រូវបានធ្វើឡើងដោយ Goldthorpe និងសហការីនៅពាក់កណ្តាលទសវត្សឆ្នាំ 1960 ។ ដូចដែលមនុស្សម្នាក់អាចរំពឹងពីអ្នកប្រាជ្ញដែលពេញនិយមចំពោះទិន្នន័យដែលបានរកឃើញតាមរយៈទិន្នន័យដែលបានរកឃើញនោះក្រុមការងាររបស់អ្នកមានទ្រព្យសម្បត្តិប្រមូលទិន្នន័យដែលត្រូវបានរៀបចំដើម្បីដោះស្រាយទ្រឹស្តីដែលបានស្នើឡើងថ្មីៗនេះអំពីអនាគតនៃថ្នាក់សង្គមនៅក្នុងសម័យនៃការបង្កើនជីវភាពរស់នៅ។ ប៉ុន្តែអ្នកស្រី Goldthorpe និងមិត្តរួមការងាររបស់អ្នកស្រីបានភ្លេចប្រមូលព័ត៌មានអំពីឥរិយាបថបោះឆ្នោតរបស់ស្ត្រី។ នេះជារបៀបដែល Nicky Hart (1994) សង្ខេបវគ្គទាំងមូល:

"... វាពិបាកក្នុងការចៀសវាងការសន្និដ្ឋានថាស្ត្រីត្រូវបានលុបចោលដោយសារតែសំណុំទិន្នន័យនេះត្រូវបានបង្ខាំងដោយតក្កវិជ្ជាដែលមិនរាប់បញ្ចូលបទពិសោធនារី។ ដោយមានទស្សនវិស័យនៃទ្រឹស្ដីវណ្ណៈនិងសកម្មភាពជាការចាប់អារម្មណ៍របស់បុរស ... Goldthorpe និងមិត្តរួមការងាររបស់គាត់បានបង្កើតនូវគំរូមួយដែលបង្ហាញពីការសន្មតទ្រឹស្ដីផ្ទាល់ខ្លួនរបស់ពួកគេជំនួសឱ្យការបង្ហាញឱ្យពួកគេនូវការសាកល្បងត្រឹមត្រូវនៃភាពគ្រប់គ្រាន់ "។

ហាតបានបន្ដថា:

"ការរកឃើញជាក់ស្តែងនៃគម្រោងកម្មករចម្រូងចម្រាសប្រាប់យើងបន្ថែមអំពីគុណតម្លៃសង្គមនិយមនៃសង្គមនិយមនាពាក់កណ្តាលសតវត្សរ៍ជាជាងប្រាប់ពីដំណើរការនៃការបែងចែកនយោបាយនិងជីវិតវត្ថុធាតុដើម" ។

តើអ្នកអាចគិតពីឧទាហរណ៏ផ្សេងទៀតដែលប្រមូលទិន្នន័យដែលធ្វើដោយអ្នកឯកទេសមានភាពលំអៀងរបស់អ្នកប្រមូលទិន្នន័យដែលបានបង្កើតឡើងនៅក្នុងវា? តើវាត្រូវបានប្រៀបធៀបទៅនឹងការបង្កប់ដោយក្បួនដោះស្រាយឬទេ? តើនេះអាចមានឥទ្ធិពលយ៉ាងណានៅពេលដែលអ្នកស្រាវជ្រាវគួរតែប្រើ readymades និងនៅពេលដែលពួកគេគួរតែប្រើ custommades?
[ នៅក្នុងជំពូកនេះខ្ញុំបានប្រៀបធៀបទិន្នន័យដែលប្រមូលបានដោយអ្នកស្រាវជ្រាវសម្រាប់អ្នកស្រាវជ្រាវដែលមានកំណត់ត្រារដ្ឋបាលដែលបង្កើតឡើងដោយក្រុមហ៊ុននិងរដ្ឋាភិបាល។ មនុស្សមួយចំនួនហៅទិន្នន័យរដ្ឋបាលទាំងនេះថា "ទិន្នន័យដែលបានរកឃើញ" ដែលវាផ្ទុយគ្នាជាមួយនឹង "ទិន្នន័យដែលបានរៀបចំ" ។ វាជាការពិតដែលថាកំណត់ត្រារដ្ឋបាលត្រូវបានរកឃើញដោយអ្នកស្រាវជ្រាវប៉ុន្តែវាក៏ត្រូវបានគេបង្កើតឡើងផងដែរ។ ឧទាហរណ៍ក្រុមហ៊ុនបច្ចេកវិទ្យាទំនើបធ្វើការយ៉ាងលំបាកដើម្បីប្រមូលនិងរៀបចំទិន្នន័យរបស់ពួកគេ។ ដូច្នេះកំណត់ត្រារដ្ឋបាលទាំងនេះត្រូវបានរកឃើញនិងរចនាឡើងវាអាស្រ័យលើទស្សនៈរបស់អ្នក (រូបភាព 2.12) ។

រូបភាពទី 2.12: រូបភាពនេះគឺទាំងទានិងទន្សាយមួយ។ អ្វីដែលអ្នកឃើញអាស្រ័យលើទស្សនៈរបស់អ្នក។ ប្រភពទិន្នន័យធំត្រូវបានរកឃើញនិងរចនាឡើង។ ជាថ្មីម្តងទៀតអ្វីដែលអ្នកឃើញអាស្រ័យលើទស្សនៈរបស់អ្នក។ ឧទាហរណ៍កំណត់ត្រាទិន្នន័យការហៅដែលប្រមូលបានដោយក្រុមហ៊ុនទូរស័ព្ទចល័តត្រូវបានរកឃើញទិន្នន័យពីទស្សនវិស័យរបស់អ្នកស្រាវជ្រាវម្នាក់។ ប៉ុន្តែទិន្នន័យពិតប្រាកដដូចគ្នានេះត្រូវបានបង្កើតឡើងតាមទិន្នន័យរបស់អ្នកដែលធ្វើការនៅក្នុងនាយកដ្ឋានទូទាត់ប្រាក់របស់ក្រុមហ៊ុនទូរស័ព្ទ។ ប្រភព: វិទ្យាសាស្រ្តប្រជាប្រិយប្រចាំខែ (1899) / Wikimedia Commons ។

ផ្តល់នូវឧទាហរណ៏នៃប្រភពទិន្នន័យដែលជាកន្លែងដែលឃើញវាទាំងពីរដែលបានរកឃើញនិងត្រូវបានរចនាឡើងគឺមានប្រយោជន៍នៅពេលប្រើប្រភពទិន្នន័យនោះសម្រាប់ការស្រាវជ្រាវ។
[ នៅក្នុងអត្ថបទដែលប្រកបដោយការចាប់អារម្មណ៍លោក Christian Sandvig និងលោក Eszter Hargittai (2015) បំបែកការស្រាវជ្រាវឌីជីថលជាពីរប្រភេទធំ ៗ ដោយអាស្រ័យលើថាតើប្រព័ន្ធឌីជីថលគឺជាឧបករណ៍ឬវត្ថុនៃការសិក្សា។ ឧទាហរណ៍នៃប្រភេទទីមួយដែលប្រព័ន្ធគឺ ឧបករណ៍មួយគឺការស្រាវជ្រាវដោយលោក Bengtsson និងសហសេវិក (2011) អំពីការប្រើប្រាស់ទិន្នន័យទូរស័ព្ទចល័តដើម្បីតាមដានការធ្វើចំណាកស្រុកបន្ទាប់ពីការរញ្ជួយដីនៅប្រទេសហៃទីក្នុងឆ្នាំ 2010 ។ ឧទាហរណ៏នៃប្រភេទទីពីរដែលប្រព័ន្ធនេះជាកម្មវត្ថុនៃការសិក្សាគឺការស្រាវជ្រាវដោយ Jensen (2007) អំពីរបៀបដែលការដាក់ឱ្យប្រើប្រាស់ទូរស័ព្ទចល័តនៅទូទាំង Kerala, ប្រទេសឥណ្ឌាបានប៉ះពាល់ដល់ដំណើរការនៃទីផ្សារត្រី។ ខ្ញុំដឹងថាភាពខុសគ្នានេះមានប្រយោជន៍ព្រោះវាបញ្ជាក់ថាការសិក្សាដែលប្រើប្រភពទិន្នន័យឌីជីថលអាចមានគោលដៅខុសគ្នាច្រើនបើទោះបីជាពួកគេកំពុងប្រើប្រភពទិន្នន័យដូចគ្នាក៏ដោយ។ ដើម្បីបញ្ជាក់ច្បាស់ពីភាពខុសគ្នានេះសូមពណ៌នាអំពីការសិក្សាបួនដែលអ្នកបានឃើញ: ពីរនាក់ប្រើប្រព័ន្ធឌីជីថលជាឧបករណ៍និងពីរដែលប្រើប្រព័ន្ធឌីជីថលជាវត្ថុនៃការសិក្សា។ អ្នកអាចប្រើឧទាហរណ៍ពីជំពូកនេះប្រសិនបើអ្នកចង់។