ඔබ හොඳ දත්ත සමඟ හොඳ ප්රශ්නයක් ඒකාබද්ධ නම් සරල ඡන්ද ගණන් කිරීමේ රසවත් විය හැක.
එය සංකීර්ණ වූ ශබ්දකෝෂයකින් පමනක් වුවත්, සමාජ පර්යේෂණ බොහොමයක් ඇත්ත වශයෙන්ම ගණනය කිරීමකි. විශාල දත්ත අවධියේදී, පර්යේෂකයන්ට වඩා වැඩි යමක් ගණන් ගත හැකි නමුත්, එයින් අදහස් නොකෙරේ. ඒ වෙනුවට, පර්යේෂකයන් ප්රශ්න කළ යුත්තේ: ගණන් කළ හැකි දේවල් මොනවාද? මෙය සම්පූර්ණයෙන්ම ආත්මීය කාරණයක් ලෙස පෙනෙන්නට ඇත, නමුත් සමහර සාමාන්ය රටා ඇත.
ශිෂ්යයින් බොහෝ විට ඔවුන්ගේ ගණන් කිරීමේ පර්යේෂණ සඳහා පෙලඹෙන්නේ මෙසේ කියමිනි: මම කිසිවෙකුට පෙර ගණන් නොකළ දෙයක් ගණනය කිරීමට යමි. නිදසුනක් වශයෙන්, බොහෝ ජනයා සංක්රමණිකයන් අධ්යයනය කර ඇති බව ශිෂ්යයෙකුට පැවසිය හැකි අතර බොහෝ අය නිවුන් දරුවන් අධ්යයනය කර ඇති නමුත් කිසිවෙකු විගමනික නිවුන් දරුවන් අධ්යයනය කර නැත. මාගේ අත්දැකීම්වලදී, මා විසින් නොපැමිණෙන අභිප්රේරණය ලෙස හැඳින්වෙන මෙම මූලෝපාය සාමාන්යයෙන් හොඳ පර්යේෂණ කිරීමට හේතු නොවේ. නොපැමිණීම නිසා ඇති වූ පෙළඹවීම හරියටම එහි සිදුරක් තිබෙන බවත්, එය පුරවා ගැනීමට ඉතා අසීරු කාර්යයක් කිරීමටත් යමි. නමුත් සෑම කුහරයම පිරවිය යුතුය.
නොපැමිණීම සඳහා අභිප්රේරණය කිරීම වෙනුවට, වඩා හොඳ උපාය මාර්ගයක් වන්නේ වැදගත් හෝ රසවත් පර්යේෂණාත්මක ප්රශ්න සඳහා (හෝ දෙදෙනාම) යන දෙකම සොයා ගැනීමයි. මෙම නියමයන් දෙකම අර්ථ දැක්වීමට බෙහෙවින් අපහසුය. එහෙත් වැදගත් පර්යේෂණ පිළිබඳව සිතිය හැකි එක් ක්රමයක් වන්නේ ප්රතිපත්ති සම්පාදකයන් විසින් වැදගත් තීරණයක් බවට යම් මිනිය හැකි බලපෑමක් හෝ පෝෂණය ඇති බවයි. උදාහරණ වශයෙන්, විරැකියා අනුපාතය ගණනය කිරීම වැදගත් වන අතර එය ප්රතිපත්තිමය තීරණ ගෙන යන්නේ ආර්ථිකයේ දර්ශකයකි. සාමාන්යයෙන්, මම හිතන්නේ පර්යේෂකයන්ට වැදගත් දේ ගැන හොඳ අවබෝධයක් ඇති බවය. ඉතිං, මේ කොටසෙහි ඉතිරි කොටස තුළ මම සිතන්නේ ගණනය කිරීම සිත්ගන්නා සුළු යැයි මම නිදසුන් දෙකක් ලබා දෙන්නෙමි. එක් එක් අවස්ථාවක දී, පර්යේෂකයින් හුදෙක් අවාසනාවන්ත ලෙස ගණන් නොගන්නා ලදී. ඒ වෙනුවට, සමාජ පද්ධතීන් ක්රියාත්මක වන ආකාරය පිළිබඳ වඩාත් පොදු අදහස් පිළිබඳ වැදගත් අවබෝධයක් හෙළි කරන ලද විශේෂිත සැකසුම් වලදී ඔවුහු ගණනය කරති. වෙනත් වචනවලින් කිවහොත්, මෙම සුවිශේෂී ගණන් කිරීමේ අභ්යවනයන් උත්සුක වන දේ බොහෝමයක් දත්ත නොවේ, එය වඩා සාමාන්ය අදහස් වලින්.
නිව්යෝර්ක් ටැක්සි රියදුරන්ගේ හැසිරීම පිළිබඳ හෙන්රි ෆාබර්ගේ (2015) අධ්යයනයේ සරල බලය පිළිබඳ නිදසුනක් සපයයි. මෙම කණ්ඩායම ආවේණිකව ආකර්ශනීය නොවන නමුත්, එය ශ්රම ආර්ථික විද්යාවෙහි තරඟකාරී න්යායන් දෙකක් පරීක්ෂා කිරීම සඳහා උපාය මාර්ගික පර්යේෂණ ස්ථානයකි . ෆාබර්ගේ පර්යේෂණය සඳහා, ටැක්සි රියදුරන්හි වැඩ පරිසරය පිළිබඳ වැදගත් ලක්ෂණ දෙකක් ඇත: (1) ඔවුන්ගේ පැයක වැටුප කාලගුණය වැනි සාධක මත පදනම්ව දවසේ සිට දිනෙන් දින වෙනස්වන අතර, (2) පැය ගණන ඔවුන්ගේ තීරණ මත පදනම්ව දිනපතා උච්චාවචනය කළ හැකිය. මෙම විශේෂාංගයන් පැයක වැටුප හා පැය ගණන අතර සම්බන්ධය පිළිබඳ ආකර්ශනීය ප්රශ්නයකි. ආර්ථික විද්යා අංශයේ නුඕක්ලැසික් ආකෘති අනාවැකි පවසන්නේ කුලී රියදුරන් වැඩිපුර පැයකට අඩු වැටුප් සහිත දිනවල වැඩ කරන බවයි. විකල්ප වශයෙන්, හැසිරීම් ආර්ථික විද්යාවෙහි මාදිලිය උපකල්පනය කරයි. රියදුරන් දිනකට වැඩිපුර ආදායමක් අපේක්ෂා කරන්නේ නම් දිනකට ඩොලර් 100 ක් වැය වන අතර එම ඉලක්කය සපුරාලන තෙක් වැඩ කරන විට රියදුරන් දිනකට වැඩ කරන පැය ගණන වැඩ කරන අතරම වැඩ කරති. උදාහරණයක් වශයෙන්, ඔබ ඉලක්ක කරගත් උපකරණයක් නම්, ඔබ සුභ දවසක පැය හතරක් (පැයකට ඩොලර් 25) සහ නරක දවසක් පැය පහක් (පැය 20) වැඩ කරන්නට පුළුවන්. ඉතින්, රියදුරන් විසින් හැසිරවූ ආර්ථික ආකෘති අනුව පුරෝකතනය කර ඇති පරිදි, පැයට අඩු පැය ගණනක වැටුපක් සහිත දිනවල පැය පැයකට වඩා වැඩිපුර පැයකට අධික කාලයක් (වැඩි නූතන සාම්ප්රදායික ආකෘතිවලින් පුරෝකථනය කර ඇති පරිදි) හෝ දිනකට පැය ගනනක් වැඩිපුර පැය ගණනක් වැඩ කරන රියදුරන් වැඩ කරන්නේද?
මෙම ප්රශ්නයට පිළිතුරු සැපයීම සඳහා 2009 සිට 2013 දක්වා නිව් යෝර්ක් නගරයේ කැබ් රථයෙන් ගෙන ඇති සෑම කුලී පන්තියේ දත්ත ෆාබර් විසින් දැන් ලබාගෙන තිබේ. එක් එක් සංචාරය සඳහා තොරතුරු ඇතුළත් ඉලෙක්ට්රොනික් මිනුම් මගින් ඉලෙක්ට්රොනික් මිනුම් විසින් එකතු කරන ලද මෙම දත්ත: ආරම්භක වේලාව, ආරම්භය ස්ථානය, අවසන් කාලය, අවසන් ස්ථානය, ගාස්තු, සහ ටයිප් (ටවුම ක්රෙඩිට් කාඩ්පතකින් ගෙවනු ලැබුවහොත්) . මෙම ටැක්සි මිනුම් දත්ත භාවිතා කරමින්, ෆේස්බුක් විසින් නව රියදුරු න්යායට අනුකූලව වැටුප් වැඩි වන විට බොහෝ රියදුරන් වැඩි වැඩියෙන් වැඩ කරන බව ෆාබර් සොයා ගත්තේය.
මෙම ප්රධාන සොයා ගැනීමට අමතරව, විවිධත්වය සහ ගතිකතාව පිළිබඳ වඩා හොඳ අවබෝධයක් සඳහා දත්තවල විශාලත්වය භාවිතා කිරීමට Farber හට හැකි විය. නවීන රියදුරන් විසින් වැඩි වැටුප් කාලයක් සඳහා වැඩිපුර පැය ගණනක් වැඩ කිරීමට ඉගෙන ගන්නා බව ඔහු සොයා ගත්තේය. උදාහරණ ලෙස, නව පැසිපික් මාදිලියේ පුරෝකථනය කරන පරිදි හැසිරීමට ඉගෙන ගනු ලැබේ. ඉලක්කය උපයන අය මෙන් හැසිරෙන නව රියදුරන් ටැක්සි රියදුරන් නතර කිරීමට ඉඩ තිබේ. වත්මන් ධාවකයේ නිරීක්ෂණය කළ හැසිරීම් විස්තර කිරීමට උපකාර වන මෙම වඩාත්ම සියුම් සොයාගැනීම් දෙකම දත්ත සමුදායේ විශාලත්වය නිසා විය හැකිය. ඉතා කෙටි කාලයක් තුළදී ටැක්සි රියදුරන්ගෙන් කුඩා සංඛ්යාවක් සිට කඩදාසි නැවතුම් පත්ර භාවිතා කළ මුල් අධ්යයනයන් හදුනා ගැනීමට නොහැකි විය (Camerer et al. 1997) .
ෆාබර්ගේ අධ්යයනය ඉතා විශාල දත්ත මූලාශ්රයක් භාවිතා කරමින් පර්යේෂණයක් සඳහා හොඳම තත්වයට ආසන්න විය. නගරය විසින් රැස් කරන ලද දත්ත ෆාබර් විසින් රැස් කරන ලද දත්ත වලට ඉතා සමීප වන හෙයින් ෆර්බර් හට සම්පූර්ණ දත්ත මත අවශ්ය විය හැකි වනු ඇත වැටුප් සඳහා ගාස්තු හා උපදෙස් - නමුත් නගර දත්ත පමණක් ක්රෙඩිට් කාඩ් විසින් ගෙවන ලද උපදෙස් ඇතුලත් විය). කෙසේ වෙතත්, දත්ත පමණක් ප්රමාණවත් නොවේ. ෆාබර්ගේ පර්යේෂණය සඳහා යතුර මෙම තොරතුරු සඳහා අතිශය වැදගත් ප්රශ්නයක් ගෙන ඒම, මෙම සුවිශේෂී සැකසුම ඉක්මවා විශාල ගම්යතාවයක් ඇති ප්රශ්නයකි.
ගරි කිංග්, ජෙනිෆර් පෑන් සහ මොලි රොබර්ට්ස් (2013) විසින් අන්තර්ජාලය පිලිබඳ වාරනයක් සම්බන්ධයෙන් චීන රජය විසින් සිදු කරන ලද පර්යේෂණයන්ගෙන් දෙවන කාරණය ගණනය කිරීමේ දෙවන උදාහරණයකි. කෙසේ වුවද, මෙම පර්යේෂකයන්ට තමන්ගේම විශාල දත්ත රැස්කිරීමට සිදු වූ අතර ඔවුන්ගේ දත්ත අසම්පූර්ණ බව ඔවුන් සමග කටයුතු කිරීමට සිදු විය.
රජු සහ සගයෝ අභිපේ්රරනය කෙරුනේ, සමාජ මාධ්ය පෝස්ටර්වලට චීනය විසින් බලපානු ලබන්නේ දස දහස් ගනනක් ජනයා ඇතුලත් කිරීමට සිතන දැවැන්ත රාජ්ය යන්ත්රයක් මගින් ය. පර්යේෂකයන්ට සහ පුරවැසියන්ට, කෙසේ වුවද, මෙම වාරණය මකා දැමිය යුත්තේ කුමන අන්තර්ගතයද යන්න තීරණය කරන ආකාරය පිළිබඳ කිසිදු හැඟීමක් නැත. චීනයේ විද්වතුන් ඇත්ත වශයෙන්ම මකා දැමිය හැකි කුමන ආකාරයේ තනතුරුද යන්න පිළිබඳව ගැටුම්කාරී බලාපොරොත්තු ඇත. ඇතැම් අය සිතන්නේ රාජ්යය පිලිබඳව විවේචනාත්මක වන ලිපි මත වාරණය යොමු කරන බවයි. සමහරු හිතන්නේ විරෝධතා වැනි සාමූහික හැසිරීම් දිරිගන්වන පෝස්ට් මතය. මෙම අපේක්ෂාවන් නිවැරදිව කොයි ආකාරයෙන්දැයි සොයා ගැනීම, පර්යේෂකයන් චීනය හා අනෙකුත් අධිකාරීවාදී ආන්ඩු පිලිබඳව අවබෝධ කර ගෙන ඇති ආකාරය පිලිබඳව ඇඟවුම් කර තිබේ. එම නිසා, රජු සහ සගයෝ ප්රකාශයට පත් කරන ලද ලිපි හා ඒවා කිසි විටෙක මකා දැමූ පෝස්ට් සමග මකා දැමූ ලිපි සන්සන්දනය කිරීමට අවශ්ය විය.
මෙම තනතුරු එකතු වෙනස් පිටුව පිරිසැලසුම්-සොයා අදාළ තනතුරු සමග චීන සමාජ මාධ්ය වෙබ් අඩවි-එක් එක් 1,000 කට වඩා බඩගා, පසුව අනතුරුව මකාදමා ලද බලන්න මෙම තනතුරු යොදාගැනීම පිළිබඳ පුදුමාකාර ඉංජිනේරු වාර්තාව තැබුවේ සම්බන්ධ. මහා පරිමාණ වෙබ්-පෙවීම් සමග සංෙයෝජිත සාමාන්ය ඉංජිනේරුමය ගැටලු වලට අමතරව, මෙම ව්යාපෘතිය බොහෝ වාරණය තනතුරු පැය 24 කට වඩා අඩු ලිවීමට ඇති නිසා එය අතිශය වේගයෙන් විය යුතු බව ද පෙන්වා දුන් අභියෝගය විය. වෙනත් වචන වලින් කිවහොත්, මන්දගාමී crawler වාරණය කරන ලද තනතුරු ගොඩක් අහිමි වීමයි. තවදුරටත්, ප්රවේශ අවහිර කරන හෝ අන්යාකාරයකින් අධ්යයනය කිරීමට ප්රතිචාර ප්රතිපත්ති වෙනස් සමාජ මාධ්ය වෙබ් අඩවි ඉඩහරිමින් හඳුනා බහින්බස්වීමක් අතර crawlers මේ සියල්ල දත්ත රැස් කිරීමට සිදු විය.
මෙම දැවැන්ත ඉංජිනේරු කර්තව්යය අවසන් වූ කාලය වන විට කිං සහ සගයන් විසින් විවිධාකාර පූර්ව නිශ්චිත මාතෘකා 85 ක් මත මිලියන 11 ක තනතුරු ලබා ගෙන ඇති අතර, එක් එක් සංවේදී මට්ටමක දී උපකල්පනය කර ඇත. නිදසුනක් වශයෙන් ඉහළ විවේචනාත්මක මාතෘකාවක් වන්නේ විසංදුන් කලාකරුවෙකු වන අඅයි වෙවීයි ය. මධ්යම සංවේදීතාවයේ මාතෘකාව වන්නේ චීන මුදල් අගය කිරීම හා අවප්රමාණය කිරීමයි. අවම සංවේදීතා මාතෘකාව වන්නේ ලෝක කුසලානයයි. මිලියන 11 ක තනතුරු අතරින් මිලියන 2 ක් පමණ වාරණය කෙරුනි. ඉතා සංවේදී මාතෘකා මත මධ්ය හා අඩු සංවේදී මාතෘකාවලට වඩා වැඩි වාර ගණනක් වාර ගණනකට වාර ගණනක් වාරණය කොට ඇති බව කිං සහ සගයන් සොයා ගත්හ. වෙනත් වචනවලින් කියතොත්, අයි වෙයිවීයි සඳහන් කරන්නේ ලෝක කුසලානය පිළිබඳ පෝස්ට් වශයෙන් සඳහන් කර ඇති තනතුරක වාරණයක් සිදුකිරීමට චීන සෙන්සර්ට හැකි බවයි. මෙම සොයාගැනීම්, සංවේදී මාතෘකා මත රජයේ තනතුරු සියල්ලම තනතුරු දරා ඇති බව යන අදහස සහාය නොදක්වයි.
මාතෘකාව අනුව මෙම වාරණ අනුපාතයන් මුළුමනින් ම නොමඟ යැවිය හැක. උදාහරණයක් වශයෙන්, Ai Weiwei සඳහා අනුග්රහ දක්වන තනතුරු ඉවහල් වනු ඇති බවටත්, ඔහු පිළිබඳව විවේචනාත්මක වන තනතුරුවලින් ඉවත දැමීමටත් ආණ්ඩුවට සිදුවනු ඇත. තනතුරු වඩාත් පරෙස්සමෙන් කිරීම, පර්යේෂකයන්ට එක් එක් තනතුරේ මනෝගතිය මැනීමට අවශ්ය විය. අවාසනාවකට මෙන්, බොහෝ කාර්යයන් නොතකා, පූර්වගාමී ශබ්දකෝෂයන් භාවිතයෙන් සම්පූර්ණයෙන්ම ස්වයංක්රීයවම මනෝභාවය හඳුනාගැනීමේ ක්රමවේදයන් බොහෝ අවස්ථා වලදී ඉතා හොඳ නැත. (2001.9 ඡේදය තුල විස්තර කර ඇති 2001 සැප්තැම්බර් 11 වන චිත්තවේගී කාල වකවානුවේදී ගැටළු ගැන සිතන්න). එම නිසා රජු සහ ඔවුන්ගේ සගයෝ රාජ්යයේ විවේචනාත්මක වූද, (2) ප්රාන්ත රාජ්යයට සහයෝගය දැක්වීම හෝ (3) සිදුවීම් පිළිබඳ අනදාල හෝ සත්ය කරුණු වාර්තා කිරීම සඳහා ඔවුන්ගේ සමාජ මාධ්ය පෝස්ටර් මිලියන 11 ක් ලේබල් කිරීම සඳහා ක්රමයක් අවශ්ය විය. මෙම දැවැන්ත කාර්යය වගේ, නමුත් ඔවුන් දත්ත විද්යාව පොදු එහෙත් සමාජ විද්යාව විරල බව බලගතු උපක්රමය භාවිතා කර විසඳා: අධීක්ෂණය ඉගෙනුම්, රූපය 2.5 බලන්න.
පළමුව, සම්ප්රේෂණය ලෙස හැඳින්වෙන පියවරක් ලෙස පර්යේෂකයෝ සමාජ මාධ්ය පෝස්ට් ලියකියවිලි මාලාවක් බවට පරිවර්තනය කළහ. එක් ලේඛනයකට එක පේළියක් හා එක් පෝරමයක් නිශ්චිත වචනයක් (උදා. විරෝධතා හෝ රථවාහන) ඇතුළත් කර තිබේදැයි සටහන් කරන ලද එක් තීරුවකි. . ඊළඟට, පර්යේෂක සහායක කණ්ඩායමක් විසින් පෝස්ට් එකක මනෝගතියට හසු කර ගත්තේය. අනතුරුව, ඔවුන් විසින් ගති ලක්ෂණ පදනම් කර ගත් මනෝවිද්යාත්මක ඉගෙනුම් ආකෘතියක් නිර්මාණය කිරීම සඳහා මෙම අතින් ලේබල් කළ දත්ත භාවිතා කළහ. අවසාන වශයෙන්, ඔවුන් මිලියන 11 ක තනතුරු හි මනෝගතිය තක්සේරු කිරීම සඳහා මෙම ආකෘතිය භාවිතා කළහ.
මෙලෙස, අතින් ගණනය කිරීම හා ප්රචලිත කිරීම සැපයුම් මිලියනයකට මිලියන 11 ක් පමන කියවීම හා ලේබල් කිරීමෙන් මිස කිං සහ සගයන් විසින් කුඩා තනතුරු ගණනක් ලේබල් කර ඇති අතර පසුව සියලුම තනතුරුවල මනෝභාවය තක්සේරු කිරීම සඳහා අධීක්ෂණය කරන ලද ඉගෙනුම භාවිතා කරනු ලැබීය. මෙම විශ්ලේෂණය සම්පූර්ණ කිරීමෙන් පසු, එය ඉවත් කරන ලද තනතුරක සම්භාවිතාවය, ප්රාන්ත රාජ්යයට හෝ රාජ්යයට විවේචනාත්මකද යන්න පිලිබඳව විවේචනාත්මකද යන්නට තරමක් පුදුමයට කාරණයක් විය.
අවසාන වශයෙන් රජු සහ සගයන් සොයාගත් පරිදි තනතුරු තුනක් නිශ්චිතවම වාරණය කරන ලදි: කාමුක දර්ශනය, වාරණය පිළිබඳ විවේචනය සහ සාමූහික ක්රියාකාරිත්වයේ ශක්යතාවන් ඇති (එනම් විශාල පරිමාණ විරෝධතා වලට තුඩු දුන් හැකියාව) ඇති බව. මකා දැමූ විශාල තනතුරු ගණනක් සහ මකා දැමූ නොවූ තනතුරු නිරීක්ෂණය කරමින්, සගයන් බලාගෙන සිටීම හා ගණනය කිරීමෙන් පමණක් රජු හා සගයන්ට ඉගෙන ගැනීමට හැකි විය. තවද, මෙම පොත පුරා මතු වන තේමාවක් පෙරදැරිව, ඔවුන් භාවිතා කළ අධීක්ෂිත ඉගෙනුම් ප්රවිෂ්ටය, අත්පත් කරගැනීමේ සමහර ප්රතිඵල හා අනෙකුත් ඒවාට ආලේප කිරීම සඳහා පරිගණක ඉගෙනුම් ආකෘතියක් ගොඩනඟා ගැනීම, ඩිජිටල් යුගයේ සමාජ පර්යේෂණයන්හි බහුලව දක්නට ලැබේ. . 3 වන පරිච්ඡේදයේ (ප්රශ්න අසන) සහ 5 (සංකීර්ණ සංයුතිය) නිර්මාණය කර ඇති පින්තූර ඔබට සමාන වනු ඇත. මෙය බහු පරිච්ෙඡ්ද වල දැක්ෙවන සුළු අදහස් අතුරින් එකකි.
මෙම උදාහරණ: නිව් යෝර්ක්හි කුලී රථ රියදුරන්ගේ ක්රියාකාරී හැසිරීම හා චීන රජයේ සමාජ මාධ්ය වාරන හැසිරීම - විශාල දත්ත දත්ත ප්රභවයන්ගේ සාපේක්ෂව සරල ගනන් බැලීම් සමහර අවස්ථාවලදී, රසවත් හා වැදගත් පර්යේෂණවලට මඟ පෑදිය හැකිය. කෙසේ වෙතත්, කෙසේ වෙතත්, පර්යේෂකයන්ට විශාල දත්ත මූලාශ්රයකට රසවත් ප්රශ්න ගෙන ඒමට සිදු විය. දත්තයන් පමණක් ප්රමාණවත් නොවේ.