ទិន្នន័យធំត្រូវបានបង្កើតឡើងនិងបានប្រមូលដោយរដ្ឋាភិបាលសម្រាប់គោលបំណងផ្សេងទៀតជាងការស្រាវជ្រាវ។ ប្រើទិន្នន័យនេះសម្រាប់ការស្រាវជ្រាវដូច្នេះតម្រូវឱ្យមានការ repurposing ។
ទិដ្ឋភាព idealized ស្រមៃនៃការស្រាវជ្រាវវិទ្យាសាស្រ្តសង្គមដែលមានគំនិតមួយហើយបន្ទាប់មកប្រមូលទិន្នន័យដើម្បីសាកល្បងគំនិតនោះ។ រចនាប័ទ្មនៃការស្រាវជ្រាវនេះនឹងនាំឱ្យសមតឹងរវាងសំណួរស្រាវជ្រាវនិងទិន្នន័យនោះទេប៉ុន្តែវាត្រូវបានកំណត់ដោយសារតែអ្នកស្រាវជ្រាវបុគ្គលជាញឹកញាប់មិនមានធនធានដែលត្រូវការដើម្បីប្រមូលទិន្នន័យដែលពួកគេត្រូវការដូចជាទិន្នន័យធំ, សម្បូរបែប, និងតំណាងទូទាំងប្រទេស។ ហេតុនេះហើយបានជាច្រើននៃការស្រាវជ្រាវសង្គមនៅក្នុងអតីតកាលបានប្រើការស្ទង់មតិសង្គមទ្រង់ទ្រាយធំដូចជាការស្ទង់មតិទូទៅសង្គម (GSS) ដែលជាការបោះឆ្នោតជាតិអាមេរិចការសិក្សា (ANES) និងសិក្សាពីសក្ដានុពលចំណូលបន្ទះ (PSID) ។ ការស្ទង់មតិខ្នាតធំទាំងនេះត្រូវបានរត់ជាទូទៅដោយក្រុមអ្នកស្រាវជ្រាវមួយហើយពួកគេត្រូវបានរចនាឡើងដើម្បីបង្កើតទិន្នន័យដែលអាចត្រូវបានប្រើដោយអ្នកស្រាវជ្រាវជាច្រើន។ ដោយសារតែគោលដៅនៃការស្ទង់មតិខ្នាតធំទាំងនេះ, ការថែទាំយ៉ាងធំដាក់ចូលទៅក្នុងការរចនាការប្រមូលទិន្នន័យនិងរៀបចំទិន្នន័យជាលទ្ធផលសម្រាប់ប្រើដោយក្រុមអ្នកស្រាវជ្រាវ។ ទិន្នន័យទាំងនេះគឺដោយក្រុមអ្នកស្រាវជ្រាវនិងសម្រាប់អ្នកស្រាវជ្រាវ។
ការស្រាវជ្រាវសង្គមភាគច្រើនដោយប្រើប្រភពអាយុឌីជីថល, ទោះជាយ៉ាងណាភាពខុសប្លែកគ្នា។ ជំនួសឱ្យការប្រើទិន្នន័យដែលប្រមូលបានដោយក្រុមអ្នកស្រាវជ្រាវសម្រាប់អ្នកស្រាវជ្រាវវាប្រើប្រភពទិន្នន័យដែលត្រូវបានបង្កើតឡើងនិងបានប្រមូលដោយក្រុមហ៊ុនអាជីវកម្មនិងរដ្ឋាភិបាលសម្រាប់គោលបំណងផ្ទាល់ខ្លួនរបស់ពួកគេដូចជាការធ្វើឱ្យប្រាក់ចំណេញមួយ, ការផ្តល់សេវាឬគ្រប់គ្រងច្បាប់។ ប្រភពទិន្នន័យមុខជំនួញនិងរដ្ឋាភិបាលទាំងនេះបានមកដល់ត្រូវបានហៅទិន្នន័យធំ។ ធ្វើការស្រាវជ្រាវជាមួយនឹងទិន្នន័យធំគឺខុសគ្នាជាងធ្វើការស្រាវជ្រាវជាមួយនឹងទិន្នន័យដែលត្រូវបានបង្កើតឡើងដំបូងសម្រាប់ការស្រាវជ្រាវ។ ប្រៀបធៀប, ឧទាហរណ៍, គេហទំព័រសង្គមប្រព័ន្ធផ្សព្វផ្សាយ, ដូចជា Twitter, ជាមួយនឹងការស្ទង់មតិសាធារណៈប្រពៃណីដូចជាការស្ទង់មតិសង្គមទូទៅ (GSS) ។ គោលដៅសំខាន់របស់ Twitter គឺត្រូវឱ្យអ្នកប្រើប្រាស់ការផ្តល់សេវារបស់ខ្លួននិងដើម្បីធ្វើឱ្យប្រាក់ចំណេញ។ នៅក្នុងដំណើរការនៃការសម្រេចបាននូវគោលដៅទាំងនោះក្នុង Twitter បង្កើតទិន្នន័យដែលប្រហែលជាមានប្រយោជន៍សម្រាប់ការសិក្សាទិដ្ឋភាពមួយចំនួននៃមតិសាធារណៈ។ ប៉ុន្តែមិនដូចជាការស្ទង់មតិសង្គមទូទៅ (GSS), ក្នុង Twitter គឺមិនមែនជាចំបងផ្តោតលើការស្រាវជ្រាវសង្គម។
ទិន្នន័យធំរយៈពេលគឺមិនច្បាស់លាស់ Frustratingly, ហើយវាជាក្រុមជាមួយគ្នារឿងផ្សេងគ្នាជាច្រើន។ ចំពោះគោលបំណងនៃការស្រាវជ្រាវសង្គម, ខ្ញុំគិតថាវាគឺមានប្រយោជន៍ក្នុងការបែងចែករវាងពីរប្រភេទនៃប្រភពទិន្នន័យធំ: ។ កំណត់ត្រាផ្នែករដ្ឋបាលរបស់រដ្ឋាភិបាលនិងកំណត់ត្រារដ្ឋបាលអាជីវកម្មកំណត់ត្រារដ្ឋបាលរបស់រដ្ឋាភិបាលគឺមានទិន្នន័យដែលត្រូវបានបង្កើតឡើងដោយរដ្ឋាភិបាលជាផ្នែកមួយនៃសកម្មភាពទម្លាប់របស់ពួកគេ។ ប្រភេទនៃការកត់ត្រាទាំងនេះត្រូវបានប្រើដោយអ្នកស្រាវជ្រាវនៅអតីតកាលបែបនេះជាការសិក្សាពីប្រជាពលរដ្ឋបានសិក្សាអំពីកំណើតអាពាហ៍ពិពាហ៍និងការស្លាប់កំណត់ត្រាប៉ុន្តែរដ្ឋាភិបាលត្រូវបានកាន់តែខ្លាំងឡើងការប្រមូលនិងការបញ្ចេញកំណត់ត្រាលម្អិតនៅក្នុងទម្រង់ការវិភាគ។ ឧទាហរណ៍រដ្ឋាភិបាលទីក្រុង New York ដែលបានដំឡើងនៅក្នុងប្រព័ន្ធឌីជីថលម៉ែត្រនៃរាល់តាក់ស៊ីក្នុងទីក្រុងនេះ។ ម៉ែត្រទាំងនេះកត់ត្រាគ្រប់ប្រភេទនៃទិន្នន័យអំពីជិះតាក់ស៊ីគ្នារួមទាំងអ្នកបើកបរ, ពេលវេលាចាប់ផ្តើមនិងទីតាំងដែលជាពេលបញ្ឈប់និងទីតាំងនិងការបរិភោគនោះ។ នៅក្នុងការសិក្សាមួយដែលខ្ញុំនឹងប្រាប់នៅពេលក្រោយនៅក្នុងជំពូកនេះលោក Henry Farber (2015) យកមកកែច្នៃទិន្នន័យទាំងនេះដើម្បីដោះស្រាយការជជែកពិភាក្សាគ្នាជាមូលដ្ឋានក្នុងផ្នែកសេដ្ឋកិច្ចពលកម្មអំពីទំនាក់ទំនងរវាងប្រាក់ឈ្នួលអាទិត្យហើយចំនួនម៉ោងធ្វើការងារនេះ។
ប្រភេទសំខាន់ទីពីរនៃទិន្នន័យធំសម្រាប់ការស្រាវជ្រាវក្នុងសង្គមគឺជាកំណត់ត្រារដ្ឋបាលអាជីវកម្ម។ ទាំងនេះគឺជាទិន្នន័យដែលបានបង្កើតនិងប្រមូលអាជីវកម្មជាផ្នែកមួយនៃសកម្មភាពទម្លាប់របស់ពួកគេ។ កំណត់ត្រារដ្ឋបាលអាជីវកម្មទាំងនេះត្រូវបានហៅថាជាញឹកញាប់ដានឌីជីថលនិងរួមបញ្ចូលទាំងអ្វីដែលដូចជាសំណួរម៉ាស៊ីនស្វែងរកកំណត់ហេតុ, ប្រកាសប្រព័ន្ធផ្សព្វផ្សាយសង្គមនិងហៅថតពីទូរស័ព្ទចល័ត។ ប្រការសំខាន់គឺការកត់ត្រារដ្ឋបាលអាជីវកម្មទាំងនេះគឺមិនមែនគ្រាន់តែអំពីឥរិយាបថអនឡាញ។ ឧទាហរណ៍ដែលប្រើម៉ាស៊ីនស្កេនដែលហាងលក់ចេញគឺត្រូវពិនិត្យមើលវិធានការបង្កើតពេលវេលាពិតប្រាកដនៃការផលិតភាពកម្មករ។ នៅក្នុងការសិក្សាដែលខ្ញុំនឹងប្រាប់អ្នកអំពីពេលក្រោយនៅក្នុងជំពូកនេះអាម៉ាសនិងអង់រីកូ Moretti ឱ្យ (2009) យកមកកែច្នៃផ្សារទំនើបនេះទិន្នន័យពិនិត្យចេញដើម្បីសិក្សាពីរបៀបផលិតភាពកម្មករម្នាក់ត្រូវបានរងផលប៉ះពាល់ដោយផលិតភាពនៃមិត្តភក្តិរបស់ពួកគេ។
ជាទាំងពីរឧទាហរណ៍ទាំងនេះបង្ហាញពីគំនិតនៃការ repurposing គឺជាគ្រឹះដើម្បីរៀនពីទិន្នន័យធំ។ នៅក្នុងបទពិសោធរបស់ខ្ញុំ, អ្នកវិទ្យាសាស្ដ្រសង្គមនិងវិទ្យាសាស្រ្តបានទិន្នន័យខិតជិតទៅនេះ repurposing ខុសគ្នាខ្លាំងណាស់។ សង្គមវិទ្យាសាស្រ្តដែលត្រូវបានទម្លាប់ធ្វើការកត់សំគាល់ធ្វើការជាមួយទិន្នន័យដែលបានរចនាឡើងសម្រាប់ការស្រាវជ្រាវមានរហ័សដើម្បីចង្អុលបង្ហាញបញ្ហានេះជាមួយនឹងទិន្នន័យដែលយកមកកែច្នៃខណៈដែលមិនអើពើនឹងភាពខ្លាំងរបស់ខ្លួន។ នៅលើដៃផ្សេងទៀតអ្នកវិទ្យាសាស្ត្រទិន្នន័យដែលមានរហ័សដើម្បីចង្អុលបង្ហាញពីអត្ថប្រយោជន៍នៃទិន្នន័យដែលយកមកកែច្នៃមិនអើពើចំពោះភាពទន់ខ្សោយខណៈពេលដែលការរបស់ខ្លួន។ ជាធម្មតាការវិធីសាស្រ្តដែលល្អបំផុតនឹងត្រូវបានកូនកាត់មួយ។ នោះគឺជាក្រុមអ្នកស្រាវជ្រាវបានត្រូវយល់លក្ខណៈនៃប្រភពថ្មីទាំងនេះនៃទិន្នន័យទាំងល្អនិងអាក្រក់ហើយបន្ទាប់មករកវិធីដើម្បីរៀនពីពួកគេ។ ហើយនោះគឺជាផែនការសម្រាប់នៅសល់នៃជំពូកនេះ។ បន្ទាប់ខ្ញុំនឹងរៀបរាប់អំពីលក្ខណៈរួមទាំងដប់នៃទិន្នន័យរដ្ឋបាលជំនួញនិងរដ្ឋាភិបាល។ បន្ទាប់ពីនោះខ្ញុំនឹងរៀបរាប់អំពីវិធីសាស្រ្តស្រាវជ្រាវបីដែលអាចត្រូវបានប្រើជាមួយទិន្នន័យទាំងនេះ, វិធីសាស្រ្តដែលត្រូវបានសមយ៉ាងល្អទៅនឹងលក្ខណៈនៃទិន្នន័យនេះ។