හැසිරීම් පිළිබඳ දත්ත එක්රැස් කිරීම, ඇලෙක්සැන්ඩර්හිදී, කවදාද, කවදාද, මිල අධිකය, එබැවින් සාපේක්ෂව දුර්ලභය. දැන්, ඩිජිටල් යුගයේ දී, බිලියන ගනන් ජනයාගේ හැසිරීම් වාර්තාගත, ගබඩා කර විශ්ලේෂණය කරති. නිදසුනක් ලෙස, ඔබ වෙබ් අඩවියක් මත ක්ලික් කළ සෑම මොහොතකම, ඔබගේ ජංගම දුරකතනයේ ඇමතුමක් ලබා ගන්න, හෝ ඔබේ ක්රෙඩිට් කාඩ් සමඟ යමක් ගෙවන්න, ඔබේ හැසිරීම පිළිබඳ ඩිජිටල් වාර්තාවක් ව්යාපාරයක් නිර්මාණය කොට ගබඩා කර තබයි. මෙම වර්ගයේ දත්ත මිනිසුන්ගේ එදිනෙදා ක්රියාකාරිත්වයේ අතුරු ඵලයකි, ඒවා බොහෝ විට ඩිජිටල් ලක්ෂණ ලෙස හැඳින්වේ. ව්යාපාරයන් විසින් පවත්වාගෙන යනු ලබන මෙම ලක්ෂණ වලට අමතරව, ජනතාව සහ ව්යාපාර යන දෙකටම ඉතා අත්යාවශ්ය පොත්වලට ආන්ඩු ද තිබේ. මෙම ව්යාපාර සහ රජයේ වාර්තා එකට එකතු වී විශාල දත්ත ලෙස හැඳින්වේ.
විශාල දත්තවල නිරන්තරයෙන් ඉහළ යන ගංවතුරක් යනු චර්යාත්මක දත්ත බහුලව පවතින ලෝකයට චර්යාත්මකව දත්ත හිඟ වන ලෝකයක සිට අප ගමන් කළ බවය. විශාල දත්ත වලින් ඉගෙන ගන්නා පළමු පියවර වන්නේ, වසර ගණනාවක් පුරා සමාජ පර්යේෂණ සඳහා භාවිතා කර ඇති පුළුල් දත්ත කාණ්ඩයේ කොටසකි. නිරීක්ෂණ දත්ත . නිරීක්ෂණයකින් තොරව කිසියම් ආකාරයකින් මැදිහත් නොවී සමාජ ක්රමයක් නිරීක්ෂණය කිරීමෙන් ඕනෑම දත්තයන් වේ. ඒ ගැන සිතීමට අපහසු මාර්ගයක් වන්නේ නිරීක්ෂණ දත්ත යනු මිනිසුන් සමඟ කතා කිරීම නොවේ (උදාහරණ වශයෙන් සමීක්ෂණ, පරිච්ඡේදයේ මාතෘකාව 3 මාතෘකාව) හෝ මිනිසුන්ගේ පරිසරය වෙනස් කිරීම (උදාහරණ වශයෙන්, පරික්ෂණ, පරිච්ඡේද 4 මාතෘකාව) නොවේ. මේ අනුව, ව්යාපාරික හා රජයේ වාර්තා වලට අමතරව, නිරීක්ෂණ දත්ත ද පුවත්පත් ලිපි සහ චන්ද්රිකා ඡායාරූප වැනි දේ ඇතුළත් ය.
මෙම පරිච්ඡේදයේ කොටස් තුනක් ඇත. පළමුව, 2.2 වගන්තියේ දී, මම විශාල දත්ත මූලාශ්රයන් වඩාත් විස්තරාත්මකව විස්තර කරමි. අතීතයේ සමාජ පර්යේෂණයන් සඳහා සාමාන්යයෙන් භාවිතා කර ඇති දත්ත සහ ඒවා අතර මූලික වෙනස්කමක් විස්තර කරමි. ඉන්පසුව, 2.3 වගන්තියෙහි, විශාල දත්ත මූලාශ්රවල පොදු ලක්ෂණ 10 ක් විස්තර කරමි. මෙම ලක්ෂණ අවබෝධ කර ගැනීම මගින් ඔබට පවතින මූලාශ්රවල ශක්තීන් හා දුර්වලතා ඉක්මණින් හඳුනා ගැනීමට සහ අනාගතයේ දී ලබාගත හැකි නව මූලාශ්ර උපයෝගී කර ගැනීමට උපකාරී වනු ඇත. අවසාන වශයෙන්, 2.4 වගන්තියේදී, නිරීක්ෂණ දත්තවලින් ඉගෙන ගැනීමට භාවිතා කළ හැකි ප්රධාන පර්යේෂණ ක්රම තුනක් මම විස්තර කරමි: දේවල් ගනන් කිරීම, දේවල් අනාවැකි සහ අත්හදා බැලීම ආසන්න කිරීම.