මෙම පරිච්ඡේදයෙහි ඇතුළත් නොවන එක්තරා නිරීක්ෂණයක් නම් වාර්ගික ග්රන්ථයයි. ඩිජිටල් අවකාශයන්හි ජනවාර්ගික විද්යාව පිළිබඳ වැඩි විස්තර සඳහා Boellstorff et al. (2012) , සහ මිශ්රිත ඩිජිටල් සහ භෞතික ස්ථානවල ජනවාර්ගික විද්යාව පිළිබඳ වැඩි විස්තර සඳහා, Lane (2016) .
"විශාල දත්ත" පිළිබඳ තනි සම්මුති අර්ථ දැක්වීමක් නැත. නමුත් බොහෝ අර්ථකථන "3 Vs" මත අවධානය යොමු කර ඇත. උදා: Japec et al. (2015) ). De Mauro et al. (2015) නිර්වචන සමාලෝචනය සඳහා.
විශාල දත්ත කාණ්ඩයේ රජයේ පරිපාලන දත්ත ඇතුළත් කිරීම අසාමාන්ය ය. වෙනත් අය විසින් මෙම සිද්ධිය Legewie (2015) , Connelly et al. (2016) ද ඇතුලු මෙම කාරණය ඉදිරිපත් කර ඇත Connelly et al. (2016) සහ Einav and Levin (2014) . පර්යේෂණ සඳහා රජයේ පරිපාලන දත්ත වල වැඩි වටිනාකමක් සඳහා Card et al. (2010) , Adminstrative Data Taskforce (2012) සහ Grusky, Smeeding, and Snipp (2015) .
රජයේ සංඛ්යාලේඛන පද්ධතියේ විශේෂයෙන්ම එක්සත් ජනපද සංගණන කාර්යාංශය තුළ පරිපාලනමය පර්යේෂණ සඳහා වූ ආකල්පය අනුව Jarmin and O'Hara (2016) . සංඛ්යාලේඛී ස්වීඩනයේ පරිපාලන වාර්තා පිළිබඳ පර්යේෂණ පොතක දිගට බැලීම සඳහා Wallgren and Wallgren (2007) බලන්න Wallgren and Wallgren (2007) .
පරිච්ඡේදයේ දී, මම සාමාන්යයෙන් සමාජ සමීක්ෂණය (GSS) වැනි සමාජ සාඩම්බර සමීක්ෂණයක් සමීක්ෂණයක් සන්සන්දනය කළා. සාම්ප්රදායික සමීක්ෂණ සහ සමාජ මාධ්ය දත්ත අතර පූර්න හා ප්රවේශම් සැසඳීම් සඳහා Schober et al. (2016) බලන්න Schober et al. (2016) .
විශාල දත්තවල ගති ලක්ෂණ 10 ක් විවිධාකාර කතුවරුන් විසින් විවිධ ආකාරවලින් විස්තර කර ඇත. මේ කාරණා ගැන මගේ සිතුවිලි වලට බලපෑවා ලියා ඇති අතර Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) සහ Goldstone and Lupyan (2016) .
මෙම පරිච්ඡේදය පුරාම මම ඩිජිටල් ලුහුඬු සටහන් භාවිතා කළෙමි. ඩිජිටල් සංඥා සඳහා තවත් ජනප්රිය යෙදුමක් වන්නේ ඩිජිටල් පාද සටහන් (Golder and Macy 2014) , නමුත් හෙල් අබෙල්සන්, කෙන් ලෙඩීන් සහ හැරී ලුවිස් (2008) පෙන්වා දෙන පරිදි වඩා සුදුසු යෙදුම් සමහරවිට ඩිජිටල් ඇඟිලි සලකුණු වේ. ඔබ පියසටහන් නිර්මාණය කරන විට, සිදුවන්නේ කුමක් ද යන්නත්, ඔබේ පාද සටහන් සාමාන්යයෙන් ඔබට පෞද්ගලිකව සොයාගත නොහැකි වනු ඇත. ඔබේ ඩිජිටල් ලුහුඬුකම් සඳහා ද එසේ ම නොවේ. ඇත්ත වශයෙන්ම, ඔබ ඉතාම අල්ප දැනුමක් ඇති සෑම අවස්ථාවකම ඔබ ඉවත්ව යනවා. තවද, මෙම අක්ෂරවලින් ඔබේ නම ඔබට නොමැති වුවද, ඒවා බොහෝ විට ඔබ වෙතට සම්බන්ධ කළ හැකිය. වෙනත් වචන වලින් කිවහොත්, ඒවා ඇඟිලි සලකුණු මෙන් නොව, අදෘශ්යමාන හා පෞද්ගලිකව හඳුනාගත හැකිය.
විශාල දත්ත කට්ටල සංඛ්යාත්මක M. Lin, Lucas, and Shmueli (2013) ලබා දෙන්නේ ඇයි දැයි මත වැඩි විස්තර සඳහා බලන්න, M. Lin, Lucas, and Shmueli (2013) සහ McFarland and McFarland (2015) . මෙම ගැටළු පර්යේෂකයන් සංඛ්යානමය වැදගත්කමකින් තොරව ප්රායෝගික වැදගත්කම මත අවධානය යොමු කළ යුතුය.
රාජේ චෙට්ටි සහ සගයන් බදු වාර්තා වලට පිවිසීමේදී වැඩි විස්තර සඳහා Mervis (2014) .
විශාල දත්ත කට්ටලයක් සාමාන්යයෙන් තනි පරිගණකයක හැකියාවෙන් ඔබ්බට ඇති පරිගණකමය ගැටළු නිර්මාණය කළ හැකිය. එමනිසා, විශාල දත්ත කට්ටල පිළිබඳව ගණනය කරන පර්යේෂකයන් බොහෝ පරිගණක බොහෝමයක් ව්යාප්ත කර ඇත. ඒවා සමහර අවස්ථාවලදී සමාන්තර වැඩසටහන්කරණය ලෙස හැඳින්වේ. සමාන්තර වැඩසටහන්කරණය සඳහා හඳුන්වාදීම සඳහා, විශේෂයෙන් Hadoop ලෙස හඳුන්වන භාෂාවක් ලෙස, Vo and Silvia (2016) .
සෑම විටම දත්ත මත සැළකිලිමත් වන විට, ඔබ යම් කාලයකදී එකම පුද්ගලයකු සමඟ සසඳා තිබේද යන්නත්, ඔබ යම් වෙනස් වූ පිරිසක් සමඟ සැසඳේද යන්නත් සලකා බැලීම වැදගත් වේ. නිදසුනක් ලෙස, Diaz et al. (2016) .
අක්රිය නොවන පියවර පිළිබඳ සම්භාව්ය පොත Webb et al. (1966) . එම පොතේ උදාහරණ ඩිජිටල් යුගයට පෙරාතුව, නමුත් ඔවුන් තවමත් ආලෝකමත් කරයි. මහජන සුපරීක්ෂාකාරීත්වය නිසා ඔවුන්ගේ හැසිරීම වෙනස් වන අවස්ථාවන් සඳහා, Penney (2016) සහ Brayne (2014) .
ප්රතික්රියාශීලීත්වය ඉල්ලුමේ බලපෑම් ලෙස හැඳින්වේ (Orne 1962; Zizzo 2010) සහ Hawthorne effect (Adair 1984; Levitt and List 2011)
වාර්තාගත සබඳතාවයකට වැඩි විස්තර සඳහා Dunn (1946) සහ Fellegi and Sunter (1969) (ඓතිහාසික) සහ Larsen and Winkler (2014) (නවීන) බලන්න. දත්ත ඩිම්ප්ලිප්ලිටි, උදාහරණ හඳුනාගැනීම, නම ගැලපීම, අනු පිටපත් අනාවරණය සහ අනු පිටපත් වාර්තා හඳුනාගැනීම (Elmagarmid, Ipeirotis, and Verykios 2007) වැනි පරිගණක විද්යාවෙහි සමාන ප්රවේශයන් ද වර්ධනය කර ඇත. පුද්ගලික හඳුනාගැනීමේ තොරතුරු සම්ප්රේෂණය කිරීම අවශ්ය නොවේ (Schnell 2013) අවශ්ය නොවන වාර්තාගත සම්බන්ධතා සඳහා පුද්ගලිකත්ව සංරක්ෂණ ප්රවේශයන් ඇත. ෆේස්බුක් සිය වාර්තා ඔවුන්ගේ චරිතය හැසිරීමට සම්බන්ධ ක්රියාවලියක් වර්ධනය කර තිබේ; මෙය 4 වන පරිච්ඡේදයේ (Bond et al. 2012; Jones et al. 2013) ගැන ඔබට කියමි.
වලංගු භාවය පිළිබඳ වැඩි විස්තර සඳහා Shadish, Cook, and Campbell (2001) 3) පරිච්ඡේදයේ 3 වන පරිච්ඡේදය බලන්න.
AOL සෙවුම් ලඝු-සටහනේ දුර්වලය සඳහා වැඩි වශයෙන්, Ohm (2010) . පර්යේෂණවලින් විස්තර කරන විට 4 වන පරිච්ජේදයේ සමාගම් හා ආන්ඩු සමග හවුල් වීම පිළිබඳව උපදෙස් ලබා දෙනවා. Huberman (2012) දත්ත මත රඳා පවතින පර්යේෂණයන් පිළිබඳව කතුවරුන් ගණනාවක් ප්රකාශ කර ඇත. Huberman (2012) සහ boyd and Crawford (2012) .
විශ්වවිද්යාලයීය පර්යේෂකයන් දත්ත ප්රවේශ ලබා ගැනීම සඳහා එක් හොඳ ක්රමයක් ලෙස සීමාවාසික හෝ පැමිණ හෝ පර්යේෂකයෙකු ලෙස සමාගම වැඩ කිරීමයි. දත්ත ප්රවේශ හැකියාව අමතරව, මෙම ක්රියාවලිය ද පර්යේෂක දත්ත නිර්මාණය කරන ආකාරය ගැන වැඩි විස්තර දැනගැනීම සඳහා විශ්ලේෂණය සඳහා වැදගත් වන උපකාරී වනු ඇත.
රජයේ දත්තවලට ප්රවේශ වීමේ දී, Mervis (2014) සාකච්ඡා කරන්නේ රාජ චෙට්ටි සහ සගයන් සමාජ සංචලතාව මත ඔවුන්ගේ පර්යේෂණවල භාවිතා කරන ලද බදු වාර්තා වලට ප්රවේශය ලබා ගන්නේ කෙසේද යන්නයි.
සංකල්පයක් ලෙස " Kruskal and Mosteller (1979a) " ඉතිහාසය පිළිබඳ වැඩි විස්තර සඳහා Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , Kruskal and Mosteller (1980) .
ස්නෝගේ කාර්යය හා ඩොල් සහ හිල්ගේ කාර්යයන් මගේ කෙටි විස්තරයන් කෙටි විය. කොලරා හි හිම වල වැඩ ගැන වැඩි විස්තර සඳහා Freedman (1991) . බ්රිතාන්ය ඩොක්ටර් අධ්යයනය සඳහා වැඩි විස්තර සඳහා Doll et al. (2004) සහ Keating (2014) .
ඩොල්ල් සහ හිල් විසින් වෛද්යවරුන්ගෙන් 35 දෙනෙක් සහ වෛද්යවරුන්ගෙන් දත්ත ලබාගෙන තිබුණද, ඔවුන් සිය පළමු විශ්ලේෂණයට මෙම දත්තයන් යොදා නොගත් බව බොහෝ පර්යේෂකයන් පුදුම වනු ඇත. ඔවුන් මෙසේ තර්ක කළ පරිදි: "පෙනහළු පිළිකා සාපේක්ෂව දුර්ලභ ගණයේ ස්ත්රීන් හා පිරිමින් 35 ට වඩා අඩුය. වසර ගණනාවක් තිස්සේ මේ කණ්ඩායම්වල ප්රයෝජනවත් සංඛ්යාවන් ලබා ගැනීමට නොහැකි වනු ඇත. මෙම මූලික වාර්තාවේ දී අප 35 වන වියේ සිට වැඩිහිටියන් දක්වාම අපගේ අවධානය යොමු කර ඇත. " Rothman, Gallacher, and Hatch (2013) වැළැක්විය යුත්තේ ඇයි?" Rothman, Gallacher, and Hatch (2013) යන ප්රකෝපකාරී මාතෘකාව ඇති අතර, අභිප්රේරනාත්මක දත්ත නිර්මාණය කිරීම.
සමස්ත ජනගහනය ගැන ප්රකාශ නිකුත් කිරීමට බලාපොරොත්තු වන පර්යේෂකයන්ට සහ ආන්ඩු සඳහා නොසැසඳීමේ ස්වභාවය ප්රධාන ගැටලුවක්. මෙය සමාගම් සඳහා වන සැලකිල්ලෙන් අඩු වේ. ව්යාපාරික නෙදර්ලන්ත නෙදර්ලන්ත නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ Buelens et al. (2014) නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ Buelens et al. (2014) නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්තයේ නෙදර්ලන්ත Buelens et al. (2014) .
විශාල දත්ත මූලාශ්රවල නොපැහැදිලි ස්වභාවය පිළිබඳව සැලකිල්ල දක්වන පර්යේෂකයින් සඳහා උදාහරණ බලන්න, boyd and Crawford (2012) , K. Lewis (2015b) සහ Hargittai (2015) .
සමාජ සමීක්ෂණ හා වසංගත රෝග පර්යේෂණවල ඉලක්ක පිළිබඳ සවිස්තරාත්මක සැසඳීම සඳහා Keiding and Louis (2016) බලන්න Keiding and Louis (2016) .
Jungherr (2013) හා Jungherr (2015) බලන්න, විශේෂයෙන් ජර්මන් මැතිවරණයෙන් විශේෂයෙන් නඩු විභාගය සඳහා ඡන්දදායකයින් ගැන නියැදි නිරීක්ෂණ කිරීම සඳහා ට්විටර් භාවිතා කිරීම සඳහා වැඩි වැඩියෙන් උත්සාහ කිරීම සඳහා. Tumasjan et al. (2010) ලෝකයේ විවිධාකාර (Gayo-Avello 2013; Jungherr 2015, chap. 7.) ඇත්තේ විවිධ වර්ගයේ මැතිවරණ ගණනාවක් පුරෝකථනය කිරීම සඳහා ට්විටර් දත්තවල හැකියාව වැඩි දියුණු කිරීම සඳහා පක්ෂවල ධනාත්මක සහ ඍණාත්මක අදහස් අතර වෙනස හඳුනා ගැනීම සඳහා මනෝගතිය විශ්ලේෂණයන් භාවිතා කිරීම වැනි (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . මැතිවරන පිලිබඳව අනාවැකි පල කිරීම සඳහා මෙම උත්සහයන්ගේ ප්රතිඵල සාරාංශගත කර ඇත්තේ Huberty (2015)
"ඉදිරි අනාගත අපේක්ෂිත මැතිවරණ පුරෝකථනවල ඉල්ලීම්වලට යටත් වන විට සමාජ මාධ්ය මත පදනම් වූ සියලු ප්රක්ෂේපිත ක්රමෝපායන් අසාර්ථක වී තිබේ. මෙම අසමතුලිතතාවන් සමාජමය මාධ්යවල මූලික ගුණාංගවලට හේතු වී ඇත්තේ ක්රමවත්ව හෝ ඇල්ගොරිතමය දුෂ්කරතා වලට වඩා. කෙටියෙන් කියතොත්, සමාජ මාධ්ය විසින් ඡන්දදායකයාගේ ස්ථාවර, අපක්ෂපාතී, නියෝජනීය චිත්රයක් නොලැබෙන අතර, සමහරවිට කිසි විටෙකත් නැත. මෙම ගැටලු විසඳාගැනීමට සමාජ මාධ්යයන්ගේ පහසුව සහ ප්රමාණවත් සාම්පල ප්රමාණවත් නැත. "
3 වන පරිච්ෙඡ්දය, මම වඩා වැඩි විස්තර සඳහා නියැදීම් සහ තක්ෙසේරු විස්තර කරමි. දත්ත නිශ්චිත කොන්දේසි යටතේ වුවද, ඒවා ප්රමාණාත්මකව නිපදවීමට ඒවා බර තැබිය හැකිය.
පද්ධතිය පැදවීම බාහිරින් බැලීම ඉතා අපහසු වේ. කෙසේ වෙතත්, MovieLens ව්යාපෘතිය (4 වන පරිච්ෙඡ්දය තුල වැඩි දුරටත් සාකච්ඡා කර ඇත) අධ්යයන පර්ෙය්ෂණ කණ්ඩායමක් විසින් වසර 15 කට වැඩි කාලයක් පවත්වාෙගන යනු ඇත. මේ අනුව, කාලයත් සමග ක්රමයෙන් සංවර්ධනය වී ඇති ආකාරය සහ ඒවා විශ්ලේෂණයට බලපාන ආකාරය (Harper and Konstan 2015) පිළිබඳව තොරතුරු ලේඛනගත කර බෙදාහදා ගැනීමට ඔවුන්ට හැකි වී තිබේ.
ට්විටර් හි ට්විටර් Liu, Kliman-Silver, and Mislove (2014) වෙත අවධානය යොමු කර ඇති බොහෝ විද්වතුන්: Liu, Kliman-Silver, and Mislove (2014) සහ Tufekci (2014)
ජනගහන පැදවීම සමඟ කටයුතු කිරීමේ එක් ප්රවේශයක් වන්නේ පරිශීලකයන්ගේ මණ්ඩලයක් නිර්මාණය කිරීම සඳහා වන අතර, එමගින් පර්යේෂකයන්ට එම කාලයම එකම කාල පරිච්ඡේදයක්ම අධ්යනය කිරීමට ඉඩ දෙයි Diaz et al. (2016) .
කතාවක දී ජෝන් ක්ලයින්බර්ග් විසින් භාවිතා කරන ලද "ඇල්ගොරිතම වශයෙන් ව්යාකූල" යන යෙදුම පළමුවෙන් ඇසූ නමුත්, අවාසනාවකට මම කතාව ඉදිරිපත් කරන ලද්දේ කවදා හෝ කොහේද යන්න මට මතක නැත. මුද්රිත පදය මා දුටු පළමු අවස්ථාව Anderson et al. (2015) , ඩිජිටල් අඩවි භාවිතා කරන ඇල්ගොරිතම භාවිතා කරන ආකාරය පිළිබඳ ආකර්ශනීය සාකච්ඡාවක්, සමාජ මනාපයන් අධ්යයනය කිරීම සඳහා මෙම වෙබ් අඩවි දත්ත භාවිතා කිරීමට පර්යේෂකයන්ට ඇති හැකියාව සංකීර්ණ විය හැකිය. මෙම උත්සුකය මතු කරන ලද්දේ K. Lewis (2015a) විසින් Anderson et al. (2014) .
ෆේස්බුක් වලට අමතරව, ත්රිමාණ වසා දැමීමේ අදහස මත පදනම්ව පරිශීලකයන්ට අනුගමනය කිරීමට ට්විටර් නිර්දේශ කරයි; Su, Sharma, and Goel (2016) . ඉතින් ට්විටර්හි ත්රිත්ව ට්රක්රඩීකරණ ඍතුව වසා දැමීම ත්රිමාධ්ය වසා දැමීම කෙරෙහි යම් යම් මානව ප්රවණතාවක එකතුවක් වන අතර ත්රිකෝණමිතික වසා දැමීම ප්රවර්ධනය කිරීම සඳහා සමහර ඇල්ගොරිතම ප්රවණතාවයක් ඇත.
විශේෂයෙන් ප්රඥාව සඳහා විශේෂිතවම සමාජ විද්යාවේ න්යායන් "එන්ජින් නොවන කැමරාවන්" (එනම්, ඒවා විස්තර කිරීමට වඩා ලෝකය හැඩගස්වා ගනියි) - Mackenzie (2008) .
රජයේ සංඛ්යා ලේඛන ආයතන දත්ත පිරිසිදු කිරීම සංඛ්යාන දත්ත සංස්කරණය කැඳවයි. De Waal, Puts, and Daas (2014) සමීක්ෂණ දත්ත සඳහා සකස් කරන ලද සංඛ්යාත්මක දත්ත සංස්කරණ ශිල්ප ක්රම විස්තර කර විශාල දත්ත මූලාශ්රයන්ට අදාළ වන ප්රමාණය පරීක්ෂා කරති. Puts, Daas, and Waal (2015) වඩාත් පොදු ප්රේක්ෂකයක්.
සමාජ බට්ස් පිලිබඳ සමාලෝචනය සඳහා, Ferrara et al. (2016) . ට්විටර් වල ස්පෑම් සොයා ගැනීම පිළිබඳ අධ්යයනයන් හි සමහර උදාහරණ Clark et al. (2016) සහ Chu et al. (2012) . අවසාන වශයෙන්, Subrahmanian et al. (2016) ට්විටර් බොට්ස් අනාවරනය කිරීම සඳහා ප්රවේශයන් සංසන්දනය කිරීම සඳහා නිර්මාණය කර ඇති DARPA ට්විටර් බෝට් අභියෝගයේ ප්රතිඵල විස්තර කිරීම.
Ohm (2015) සංවේදී තොරතුරු පිළිබඳ අදහස පිළිබඳව කලින් පර්යේෂණ සිදු කළ අතර බහු සාධක පරීක්ෂණයක් ලබා දෙයි. ඔහු යෝජනා කරන සාධක හතර නම්, හානිවල සම්භාවිතාවය, රහස්ය සම්බන්ධතාවයක් තිබීම, හා බහුතරය පිළිබිඹු වන බහුතරය සැලකිල්ලට ගනී.
ෆර්බර් නිව් යෝර්ක් හි ටැක්සි අධ්යයනය පදනම් කරගත් Camerer et al. (1997) විසින් කලින් අධ්යයනයකට පාදක විය Camerer et al. (1997) , කඩදාසි නිශ්කාෂන පත්රවල විවිධ පහසුව සඳහා භාවිතා කරන ලදී. මෙම පූර්ව අධ්යයනය මගින් රියැදුරන් ඉලක්කගත ආදායම්ලාභීන් බව පෙනෙන්නට තිබුණි. ඔවුන්ගේ වැටුප් වැඩි වූ දිනවල ඔවුන් වැඩ කලහ.
පසු කාලීන වැඩ වලදී කිං සහ සගයන් චීනයේ දී මාර්ගගත වාරණයක් (King, Pan, and Roberts 2014, [@king_how_2016] ) තවදුරටත් අධ්යයනය කර ඇත. චීනයේ මාර්ගගත වාරණය මැනීම සඳහා අදාළ ප්රවේශයක් සඳහා, Bamman, O'Connor, and Smith (2012) . මිලියන 11 ක තනතුරු පිලිබඳ මනෝගතිය ඇස්තමේන්තු කිරීම සඳහා King, Pan, and Roberts (2013) භාවිතා කරන ලද සංඛ්යානමය ක්රම පිළිබඳ වැඩි විස්තර සඳහා Hopkins and King (2010) . අධීක්ෂණය කරන ලද ඉගෙනුම් පිළිබඳ වැඩි විස්තර සඳහා James et al. (2013) (අඩු තාක්ෂණික) සහ Hastie, Tibshirani, and Friedman (2009) (වඩා තාක්ෂණික).
අනාවැකි පල කිරීම කාර්මික දත්ත විද්යාවේ විශාල කොටසක් (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . සමාජ පර්යේෂකයන් විසින් පොදුවේ සිදුකරනු ලබන පුරෝකථන වර්ගයක් වන්නේ ජනගහන අනාවැකි; උදාහරණයක් ලෙස, Raftery et al. (2012) .
ගංවතුර උවදුරු ප්රවණතා වර්තමාන වෝල්ටීයතා ඉන්ෆ්ලුවෙන්සා පැතිරයාම සඳහා සෙවුම් දත්ත භාවිතා නොකළේ පළමු ව්යාපෘතිය නොවේ. ඇත්ත වශයෙන්ම, එක්සත් ජනපදයේ පර්යේෂකයන් (Polgreen et al. 2008; Ginsberg et al. 2009) හා ස්වීඩනය (Hulth, Rydevik, and Linde 2009) සොයාගෙන ඇති ඇතැම් සෙවුම් කොන්දේසි (උදා: "උණ") ජාතික සෞඛ්ය ආරක්ෂණ එය නිකුත් කිරීමට පෙර දත්තයන්. පසුකාලීනව බොහෝ ව්යාපෘති මගින් ඩෙංගු රෝගය පිළිබඳ පරීක්ෂාව හඳුනා ගැනීම සඳහා ඩිජිටල් සෙවීම් දත්ත භාවිතා කිරීමට උත්සාහ කර ඇත. Althouse et al. (2015) බලන්න Althouse et al. (2015) සමාලෝචනය සඳහා.
සෞඛ්ය ප්රතිඵලයන් පුරෝකථනය කිරීම සඳහා ඩිජිටල් සෙවුම් දත්ත භාවිතා කිරීමට අමතරව, මැතිවරණ ප්රතිපල අනාවැකි කිරීම සඳහා ට්විටර් දත්ත භාවිතා කරමින් විශාල වැඩ කොටසක් සිදු කර ඇත. සමාලෝචන සඳහා Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (7 වන පරිච්ඡේදය) සහ Huberty (2015) . දළ ජාතික නිෂ්පාදිතය (දදේනි) වැනි ආර්ථික දර්ශක පද්දති කිරීම, මධ්යම බැංකු වල බහුලව දක්නට ලැබේ Bańbura et al. (2013) . 2.8 වගුෙවන් ඇතුළත් වන අධ්යයන අවස්ථා කීපයක් ඇතුළත යම් ආකාරයක සිදුවීමක් ගැන අනාවැකි පළ කිරීමට ඩිජිටල් ලුහුඬු සටහන් භාවිතා කරයි.
ඩිජිටල් හැඩයක් | ප්රතිඵලය | උපුටනය |
---|---|---|
ට්විටර් | එක්සත් ජනපදයේ චිත්රපටි චිත්රපට ආදායම | Asur and Huberman (2010) |
සෙවුම් ලොග | එක්සත් ජනපදයේ චිත්රපට, සංගීතය, පොත් සහ වීඩියෝ ක්රීඩා විකිණීම | Goel et al. (2010) |
ට්විටර් | ඩව් ජෝන්ස් කාර්මික සාමාන්යය (එක්සත් ජනපද කොටස් වෙලඳ පොල) | Bollen, Mao, and Zeng (2011) |
සමාජ මාධ්ය සහ සෙවුම් ලොග | එක්සත් ජනපදය, එක්සත් රාජධානිය, කැනඩාව සහ චීනය තුළ ආයෝජකයින් මනෝභාවයන් හා කොටස් වෙළඳපොළ මැනුම් | Mao et al. (2015) |
සෙවුම් ලොග | සිංගප්පූරුව හා බැංකොක් වල ඩෙංගු උණ පැතිරීම | Althouse, Ng, and Cummings (2011) |
අවසාන වශයෙන්, ජොන් ක්ලයින්බර්ග් සහ සගයන් (2015) පෙන්වා දී ඇත්තේ ගැටළු පිලිබඳ අනාවැකි ගැටළු දෙකකට බෙහෙවින් වෙනස් වන අතර සමාජ විද්යාඥයන් විසින් අවධානය යොමු කර ඇති අතර අනෙක් තැනැත්තා නොසලකා හරින බවය. එක් ප්රතිපත්ති සම්පාදකයෙක් සිතන්න. මම නියඟයෙන් මුහුණට සිටින ඇනා ඇයට කතා කරන්නෙමි. වැසි අවස්ථාවක් වැඩි කිරීම සඳහා වැස්ස නර්තනයක් ලබා දීමට තීරණය කළ යුතු ය. තවත් ප්රතිපත්ති සම්පාදකයෙක්, මම ඇගේ බියටි කියමි, ගෙදර දොරේ තෙත්වීම වැළැක්වීම සඳහා වැඩ කිරීම සඳහා කුඩයක් ගන්නවාදැයි තීරණය කළ යුතුය. කාලගුණය වටහා ගැනීමෙන් ඇනා සහ බීතට වඩා හොඳ තීරණයක් ගත හැකි වුවත්, ඔවුන් විවිධ දේවල් දැන සිටිය යුතුය. වැසි නැටුම් වැසි නිසා ඇනාට තේරුම් ගත යුතුයි. අනෙක් අතට, බෙටීට සාපේක්ෂතාව පිලිබඳ කිසිවක් තේරුම් ගැනීමට අවශ්ය නැත. ඇයට නිවැරදි අනාවැකියක් අවශ්යයි. සමාජ පර්යේෂකයන් බොහෝ විට කේනාන්බර්ග් සහ සගයන් විසින් "වැහි නැටුම් වැනි" ප්රතිපත්තිමය ගැටලු ලෙස හඳුන්වන ඇනා මුහුණට මුහුණ දෙන ගැටළු වලට අවධානය යොමු කරති. ක්ලීන්බර්ග් හා සගයන් විසින් "ගැටුම් සහිත" ප්රතිපත්ති ගැටලූ ලෙස හඳුන්වන බීතිට මුහුණ දෙන ප්රශ්න වැනි ප්රශ්න ද වැදගත් ය. එහෙත් සමාජ පර්යේෂකයන්ගෙන් වැඩි අවධානයක් ලැබී ඇත.
මහා විද්යා දත්ත පත්රිකාවක් වන PS දේශපාලන විද්යාව , විශාල දත්ත පිළිබඳ සංකල්පයක්, හේතු කාරණා සහ විධිමත් න්යාය සහ Clark and Golder (2015) විය. අමෙරිකා එක්සත් ජනපදයේ ජාතික විද්යා ඇකඩමියේ ජර්නල් ඔෆ් Shiffrin (2016) සහ විශාල දත්ත පිළිබඳ සංක්ෂිප්තයක් ඇති අතර Shiffrin (2016) සෑම දායකත්වයක්ම සාරාංශ කරයි. විශාල දත්ත මූලාශ්රයන් තුල ස්වභාවික අත්හදා බැලීම් ස්වයංක්රියව සොයා ගැනීමට උත්සාහ කරන යාන්ත්රික ඉගෙනුම් ප්රවේශයන් සඳහා Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) සහ Sharma, Hofman, and Watts (2016) .
ස්වභාවික අත්හදා බැලීම් අනුව Dunning (2012) මගින් උදාහරණ සහිතව හඳුන්වාදී, පොත්-දිගු ප්රතිකාරයක් සපයයි. ස්වාභාවික අත්හදා බැලීම් පිලිබඳ සංශයවාදී ආකල්පයක් සඳහා Rosenzweig and Wolpin (2000) (ආර්ථික විද්යාව) හෝ Sekhon and Titiunik (2012) (දේශපාලන විද්යාව) බලන්න. Deaton (2010) හා Heckman and Urzúa (2010) තර්ක කරන්නේ ස්වභාවික අත්හදා බැලීම් කෙරෙහි අවධානය යොමු කිරීම මගින් පර්යේෂකයන්ට අනවශ්ය හේතුකාරක බලපෑම් තක්සේරු කිරීමට යොමු කළ හැකි බවයි. Imbens (2010) ස්වාභාවික අත්හදා බැලීමේ වටිනාකම පිළිබඳ වඩා සුබවාදී ආකල්පයකින් මෙම තර්ක ගනන් කරයි.
පර්යේෂකයන්ට සේවය සැපයීමේ ප්රතිඵලයක් ලෙස කෙටුම්පත් කිරීමේ ප්රතිඵල ඇස්තමේන්තු කළ හැකි ආකාරය විස්තර කිරීමේදී, මම උපයෝගීතා විචල්යයන් ලෙස හැඳින්වෙන තාක්ෂණ ක්රමයක් විස්තර කරමි. Imbens and Rubin (2015) , ඔවුන්ගේ පරිච්ඡේද 23 සහ 24 යන පරිච්ඡේද තුළ, හඳුන්වාදීම හා Imbens and Rubin (2015) ලොතරැයි උදාහරණයක් ලෙස භාවිතා කරන්න. කොලරිස් මත හමුදා සේවයේ බලපෑම සමහර විට සංතර්පිත සාමාන්ය හේතු සාධක (CAcE) සහ ඇතැම් විට දේශීය සාමාන්ය ප්රතිකාර ප්රතිඵල (LATE) යනුවෙන් හැඳින්වේ. Sovey and Green (2011) , Angrist and Krueger (2001) සහ Bollen (2012) දේශපාලන විද්යාව, ආර්ථික විද්යාව හා සමාජ විද්යාවෙහි ආයුධ විචල්යයන් භාවිතා කිරීම පිළිබඳ සමාලෝචන ඉදිරිපත් කරන අතර, Sovey and Green (2011) "පාඨකයාගේ පිරික්සුම් ලැයිස්තුව" සාධක විචල්යයන් භාවිතා කරමින් අධ්යයනය කිරීම.
1970 ටෙස්ට් ලොතරැයිය සැබවින්ම නිසි පරිදි සසම්භාවී නොවන බව පෙනී යයි. පිරිසිදු අහඹු සිදුවීම් වලින් කුඩා පරිහානිය (Fienberg 1971) . Berinsky and Chatfield (2015) තර්ක කරයි මෙම කුඩා අපගමනය සැලකිය යුතු වැදගත් නොවන අතර නිසි පරිදි සිදු කරනු ලබන අහඹු සිදුවීම් පිළිබඳ වැදගත්කම සාකච්ඡා කරයි.
ගැලපීම් අනුව, Stuart (2010) සුභවාදී සමාලෝචනයක් සඳහා, සහ Sekhon (2009) අශුභවාදී සමාලෝචනයක් සඳහා බලන්න. කප්පාදු කිරීමක් ලෙස ගැලපීම සඳහා වැඩි විස්තර සඳහා Ho et al. (2007) . එක් පුද්ගලයෙකු සඳහා තනි පරිපූර්ණ තරඟයක් සොයා ගැනීම බොහෝ විට අපහසුය. මෙය සංකීර්ණ ක්රම හඳුන්වා දෙයි. පළමුව, නිසි තරඟ නොලැබූ විට, ඒකක දෙක අතර දුර මැනීම සඳහා පර්යේෂකයන්ට තීරණය කළ යුතු අතර දී ඇති දුර ප්රමාණය ඉතා ආසන්න නම්. පර්යේෂකයන්ට ප්රතිකාර ක්රමයේ එක් එක් සිද්ධිය සඳහා විවිධ තරඟ භාවිතා කිරීමට අවශ්ය නම්, දෙවන සංකීර්ණත්වය පැන නංවයි. මෙය වඩාත් නිවැරදි තක්සේරුවක් කිරීමට හේතු විය හැක. මෙම ගැටලු දෙකම මෙන්ම අනෙක් අය මෙන්ම Imbens and Rubin (2015) 18) පරිච්ඡේදයේ විස්තර කර ඇත. II වන කොටස ද බලන්න ( ??? ) .
සසම්භාවී ක්රම මගින් අහඹු ලෙස පාලනය කරන ලද පරීක්ෂණ වලින් සමාන ඇස්තමේන්තු Dehejia and Wahba (1999) බලන්න. එහෙත්, Arceneaux, Gerber, and Green (2006) සහ Arceneaux, Gerber, and Green (2010) ක්රම අනුගමනය කළ අත්හදා බැලීම්වල ප්රමිතිය ප්රතිනිෂ්පාදනය කිරීමට අසමත් විය.
Rosenbaum (2015) සහ Hernán and Robins (2016) විශාල දත්ත ප්රභවයන් තුල ප්රයෝජනවත් සැසඳීම් සොයා ගැනීම සඳහා වෙනත් උපදෙස් ලබා දෙයි.