මෙම ඇනලොග් යුගයේ දී, හැසිරීම-සිටින මිල අධික වන අතර මේ නිසා, සාපේක්ෂව දුර්ලභ-වූ විට කරන්නේ මොනවාද ගැන දත්ත එකතු. දැන්, ඩිජිටල් යුගයේ දී, බිලියන ගනන් මිනිසුන්ගේ හැසිරීම්, වාර්තා ගබඩා කර තබා analyzable ඇත. උදාහරණයක් ලෙස, ඔබ, වෙබ් අඩවියක් මත ක්ලික් කරන්න ඔබේ ෆෝන් මත ඇමතුමක් හෝ ඔබගේ ක්රෙඩිට් කාඩ් දෙයක් සඳහා ගෙවිය සෑම අවස්ථාවකදීම, ඔබේ හැසිරීම ඩිජිටල් වාර්තාවක් තියලා හා ව්යාපාරික විසින් ගබඩා කර ඇත. මෙම දත්ත අතුරු නිෂ්පාදනයක් ජනතාවගේ සෑම දිනකම ක්රියාවන් වන නිසා, ඔවුන් බොහෝ විට ඩිජිටල් අංශු මාත්ර ලෙස හැඳින්වේ. ව්යාපාර විසින් පවත්වන මෙම අංශු මාත්ර අමතරව, පාලන ආයතන ද ජනතාව හා ව්යාපාර දෙකෙහිම ගැන ඇදහිය නොහැකි තරම් ධනවත් දත්ත, බොහෝ විට ඩිජිටල් හා analyzable වන දත්ත ඇත. එකට ව්යාපාරික හා රජයේ වාර්තා බොහෝ විට විශාල දත්ත ලෙස හැඳින්වේ.
විශාල දත්ත නිරන්තරයෙන් ඉහළ යන ගංවතුර අපි චර්යාත්මක දත්ත චර්යාත්මක දත්ත බහුලව දක්නට ඇත ලෝකයක විරල විය ලෝකයක සිට ගෙන ඇති බවයි. එහෙත්, මේ ආකාරයේ දත්ත සාපේක්ෂව නව නිසා, ඒවා භාවිතා පර්යේෂණ අවාසනාවන්ත මුදල ලබා ගත හැකි දත්ත විද්යාඥයන් අන්ධ ලෙස හඹා වගේ. මෙම පරිච්ඡේදය, ඒ වෙනුවට, දත්ත සහ ඒවා කෙසේ භාවිතා කල හැක විවිධ මූලාශ්ර තේරුම් ගැනීමට මූලධර්මාත්මක ප්රවේශය ලබා දෙයි. මෙම යහපත් අවබෝධයක් ඔබට වඩාත් හොඳ දත්ත සුදුසු ආරංචි මාර්ග ඔබේ පර්යේෂණ ප්රශ්න ගැලපෙන උදව් කළ යුතුය. නැත්නම්, වැනි පවත්නා ආරංචි මාර්ග නොමැති නම්, අනාගත පරිච්ඡේද වල අදහස් භාවිතා ඔබේ ම දත්ත එකතු කිරීම, ඔබට ඒත්තු.
නිරීක්ෂණ දත්ත: ලොකු දත්ත ඉගෙන කිරීමට පළමු පියවර වසර ගණනාවක් සමාජ විද්යාත්මක පර්යේෂණ සඳහා භාවිතා කර ඇති බව දත්ත පුලුල් ප්රවර්ගය කොටසක් බව අවබෝධ කර ගැනීම ය. දළ වශයෙන් නිරීක්ෂණ දත්ත යම් ආකාරයකින් මැදිහත් තොරව සමාජ ක්රමය නිරීක්ෂණය නිසා ඇතිවන ඕනෑම දත්ත වේ. ඒ ගැන හිතන්න රළු ආකාරයෙන් නිරීක්ෂණ දත්ත ජනතාව (උදා, සමීක්ෂණ, 3 වන පරිච්ඡේදයේ මාතෘකාව) සමග කතා කිරීම හෝ ජනතා පරිසරය (උදා, පර්යේෂණ, 4 වන පරිච්ඡේදය යන මාතෘකාව) වෙනස් ඇතුළත් නොවේ හැම දෙයක්ම බව යි. මේ අනුව, ව්යාපාරික හා රජයේ වාර්තා කිරීමට අමතරව, නිරීක්ෂණ දත්ත ද පුවත්පත් ලිපි සහ චන්ද්රිකා ඡායාරූප පෙළ වැනි දේවල් ඇතුළත් වේ.
මෙම පරිච්ඡේදය කොටස් තුනක් ඇත. පළමුව, 2.2 වගන්තිය, මම ලොකු දත්ත වඩාත් විස්තර විස්තර හා එය හා සාමාන්යයෙන් අතීතයේ සමාජ විද්යාත්මක පර්යේෂණ සඳහා භාවිතා කර ඇති බව එම දත්ත අතර මූලික වෙනසක් පැහැදිලි. එවිට, 2.3 වගන්තිය, මම ලොකු දත්ත මූලාශ්ර පොදු ලක්ෂණ දහයක් විස්තර කරන්න. මේ ලක්ෂණ තේරුම් ඉක්මනින් පවතින ආරංචි මාර්ග ශක්තීන් සහ දුර්වලතා හඳුනා ගැනීමට අපට අනාගතයේ දී නිර්මාණය කළ බව නව ආරංචි මාර්ග ගැටගැසීම උපකාරී වනු ඇත හැකියාව ලැබෙනවා. ඡන්ද ගණන් කිරීමේ දේවල්, ප්රක්ෂේපනය දේවල්, සහ අත්හදා බැලීම ශූන්යයක් සන්නිකර්ෂණය: අවසාන වශයෙන්, 2.4 වගන්තිය මම ඔබට නිරීක්ෂණ දත්ත ඉගෙන භාවිතා කළ හැකි ප්රධාන පර්යේෂණ උපාය මාර්ග තුනක් විස්තර කරයි.