2.4.1.3 တရုတ်အစိုးရအားဖြင့်လူမှုရေးမီဒီယာများ၏ဆင်ဆာ

သုတေသီတွေကဆင်ဆာလေ့လာဖို့တရုတ်ဆိုရှယ်မီဒီယာဆိုဒ်များခြစ်။ သူတို့ကငုပ်လျှိုးနေ-ရိုအခြနှင့်အတူမပြည့်စုံနှင့်အတူကိုင်တွယ်ဖြေရှင်း။

အံ့ဩဘွယ်သောဂယ်ရီရှငျဘုရငျ, ဂျနီဖာပန်နှင့် Molly Roberts သည် '' ဖွငျ့ဖျောပွခဲ့သကဲ့သို့နှစ်ဦးသည်ယခင်ဥပမာတွင်အသုံးပြုကြီးတွေဒေတာအပြင်, သုတေသီများလည်း, မိမိတို့ကိုယ်ပိုင်စူးစမ်းဒေတာစုဆောင်းနိုင် (2013) တရုတ်အစိုးရကဆင်ဆာဖြတ်တောက်မှုအပေါ်သုတေသနပြု။

တရုတ်နိုင်ငံမှာလူမှုရေးမီဒီယာ၏ရေးသားချက်များသောင်းချီလူမျိုး၏ထောင်ပေါင်းများစွာ၏ထည့်သွင်းရန်စဉ်းစားကြောင်းတခုကြီးမားပြည်နယ်ယန္တရားအားဖြင့်ဆင်ဆာကြသည်။ သုတေသီများနှင့်နိုင်ငံသားများ, ဒါပေမဲ့, အဲဒီဆင်ဆာအကြောင်းအရာလူမှုရေးမီဒီယာကနေဖျက်ပစ်သင့်ပါတယ်အဘယျအဆုံးဖြတ်မည်သို့နည်းနည်းသဘောရှိသည်။ တရုတ်ပညာရှင်များအမှန်တကယ်ရေးသားချက်များမျိုးဖျက်ပစ်ရအများဆုံးများပါတယ်သောအကြောင်းကွဲလွဲမျှော်လင့်ရှိသည်။ တချို့ကဆင်ဆာအခြားသူများကိုသူတို့ဒီလိုဆန္ဒပြမှုတွေအဖြစ်စုပေါင်းအပြုအမူကိုအားပေးကြောင်းပို့စ်များ, အာရုံစိုက်စဉ်းစားနေစဉ်ပြည်နယ်၏အရေးပါဖြစ်ကြောင်းရေးသားချက်များအပေါ်အာရုံစူးစိုက်ကြောင်းထင်တယ်။ မှန်ကန်သည်ဤမျှော်လင့်ချက်များများရာမှထွက်ရှာဖွေသုတေသနပညာရှင်များကတရုတ်နှင့်ဆင်ဆာဖြတ်တောက်မှုအတွက်ထိတွေ့ဆက်ဆံသောအခြားအာဏာရှင်အစိုးရများနားလည်သလဲဆိုတာအဘို့အသက်ရောက်မှုတွေရှိပါတယ်။ သို့ဖြစ်. ထိုဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကပုံနှိပ်ထုတ်ဝေနှင့်နောက်ပိုင်းတွင်ပုံနှိပ်ထုတ်ဝေနှင့်ဘယ်တော့မှဖျက်ပစ်ခဲ့ကြကြောင်းရေးသားချက်များမှပယ်ဖျက်လိုက်တဲ့ခဲ့ရေးသားချက်များကိုနှိုင်းယှဉ်ချင်တယ်။

ဤသူရေးသားချက်များစုဆောင်းကွဲပြားခြားနားသောစာမျက်နှာအပြင်အဆင်ရှာဖွေရေးသက်ဆိုင်ရာရေးသားချက်များနှင့်အတူ 1000 ကျော်တရုတ်ဆိုရှယ်မီဒီယာဝက်ဘ်ဆိုက်များ-တစ်ခုချင်းစီတွား, ပြီးတော့နောက်ပိုင်းတွင်ပယ်ဖျက်လိုက်တဲ့ခဲ့ပြီးသောမြင်ဤပို့စ်များကိုပြန်လည်ဆွေးနွေးရန်၏အံ့သြဖွယ်အင်ဂျင်နီယာ feat ပါဝင်ပတ်သက်။ အကြီးစား Web-တွားနှင့်ဆက်စပ်ပုံမှန်အင်ဂျင်နီယာပြဿနာတွေအပြင်, ဤစီမံကိန်းအများအပြားဆင်ဆာရေးသားချက်များထက်နည်း 24 နာရီအတွင်းချယူကြသည်ကြောင့်အလွန်အမင်းအစာရှောင်ခြင်းဖြစ်ဖို့လိုအပျသောကဆက်ပြောသည်စိန်ခေါ်မှုရှိခဲ့ပါတယ်။ တစ်နည်းတစ်နှေးကွေးဝဘ်ဆိုက် crawler ဆင်ဆာခဲ့ရေးသားချက်များအများကြီးလက်လွတ်လိမ့်မယ်။ access ကို block သို့မဟုတ်မဟုတ်ရင်လေ့လာမှုမှတုန့်ပြန်မှာသူတို့ရဲ့မူဝါဒတွေပြောင်းလဲဆိုရှယ်မီဒီယာဝက်ဘ်ဆိုက်များ စိုးရိမ်. ထောက်လှမ်း evading စဉ်ထပ်မံခြင်း, crawler ဤအမှုအလုံးစုံတို့ကိုဒေတာစုဆောင်းလုပ်ဖို့ခဲ့ရသည်။

ဒီကြီးမားတဲ့အင်ဂျင်နီယာလုပ်ငန်းတာဝန်ပြီးစီးခဲ့သည်နှင့်တပြိုင်နက်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များ sensitivity ကိုမိမိတို့မျှော်လင့်ထားသည့်အဆင့်တွင်အခြေစိုက် Pre-သတ်မှတ်ထားသောခဲ့ကြကြောင်း 85 ကွဲပြားခြားနားသောအကြောင်းအရာများအပေါ် ပတ်သက်. 11 သန်းရေးသားချက်များရရှိသောခဲ့သည်။ ဥပမာအားဖြင့်မြင့်မားသော sensitivity ကိုတစ်ဦးခေါင်းစဉ်အိုင်ဝေခြင်း, အတိုက်အခံအနုပညာရှင်၏, အလယ်တန်း sensitivity ကိုတစ်ဦးခေါင်းစဉ်တရုတ်ငွေကြေး၏ကြေးဇူးတငျကွောငျးနှင့်တန်ဖိုးသည်, အနိမ့် sensitivity ကိုတစ်ဦးခေါင်းစဉ်ကမ္ဘာ့ဖလားဖြစ်ပါတယ်။ 2 သန်းအကြောင်းကိုဤသူ 11 သန်း၏ရေးသားချက်များ၏ဆင်ဆာခဲ့ပေမယ့်အလွန်အမင်းထိခိုက်မခံတဲ့အကြောင်းအရာများအပေါ်ရေးသားချက်များသာအနည်းငယ်ပိုပြီးမကြာခဏအလယ်တန်းနှင့်အနိမ့် sensitivity ကိုအကြောင်းအရာများအပေါ်ရေးသားချက်များထက်ဆင်ဆာခဲ့ကြသည်။ တစ်နည်းအားဖြင့်တရုတ်ဆင်ဆာကမ္ဘာ့ဖလားဖျောပွထားသတဲ့ပို့စ်အဖြစ်အိုင်ဝေဖျောပွထားသတဲ့ post ကိုဆင်ဆာနဲ့ပတ်သက်ပြီးအဖြစ်များပါတယ်။ ဤရွေ့ကားတွေ့ရှိချက်ကိုအစိုးရကအထိခိုက်မခံသည့်အကြောင်းအရာများပေါ်မှာရှိသမျှပို့စ်များကို censor လုပ်သောရိုးရှင်းတဲ့အိုင်ဒီယာမကိုက်ညီပါ။

ခေါင်းစဉ်အားဖြင့်ဆင်ဆာမှုနှုန်း၏ဤရိုးရှင်းသောတွက်ချက်မှုသို့သော်အထင်မြင်မှားစေသောဖြစ်နိုင်ပါတယ်။ ဥပမာ, အစိုးရအိုင်ဝေ၏ထောက်ခံဖြစ်ကြောင်းရေးသားချက်များဆင်ဆာ, ဒါပေမယ့်သူ့ကိုဝေဖန်ဖြစ်ကြောင်းရေးသားချက်များထွက်သွားပေလိမ့်မည်။ ပိုပြီးဂရုတစိုက်ရေးသားချက်များအကြားခွဲခြားနိုင်ဖို့အတွက်သုတေသီတစ်ဦးချင်းစီဘလော့ခ်ပို့စ်ရဲ့စိတ်ဓာတ်တွေကိုတိုင်းတာဖို့လိုအပ်ပါတယ်။ ထို့ကြောင့်သူကစဉ်းစားရန်တလမ်းတည်းဖြင့်အသီးအသီးပို့စ်၏အရေးပါသောငုပ်လျှိုးနေအင်္ဂါရပ်ထဲမှာအသီးအသီးပို့စ်၏သောစိတ်ဓါတ်များဖြစ်ပါတယ်။ ကံမကောင်းစွာပဲ, အပြည့်အဝကို pre-ရှိပြီးသားအဘိဓါန်သုံးပြီးစိတ်ဓါတ်များထောက်လှမ်း၏နည်းစနစ် automated အများကြီးအလုပ်, နေသော်လည်းများစွာသောအခြေအနေများတွင်နေဆဲအလွန်ကောင်းသောမဟုတ် (ပုဒ်မ 2.3.2.6 မှစက်တင်ဘာလ 11, 2001 တစ်စိတ်ခံစားမှုအချိန်ဇယားဖန်တီးခြင်းပြန်ပြဿနာများထင်) ။ သို့ဖြစ်. ထိုဘုရင်နှင့်လုပ်ဖော်ကိုင်ဘက်ပြည်နယ်၏ 2) ထောက်ခံဒါမှမဟုတ်ဖြစ်ရပ်များနှင့် ပတ်သက်. 3) ဆီလျှော်သို့မဟုတ် factual အစီရင်ခံစာများ, ပြည်နယ်၏အရေးပါ) သူတို့ 1 ခဲ့ကြခြင်းရှိမရှိအဖြစ်၎င်းတို့၏ 11 သန်းဆိုရှယ်မီဒီယာ၏ရေးသားချက်များတံဆိပ်ကပ်ဖို့လမ်းလိုအပ်ခဲ့ပါတယ်။ ဒါကကြီးမားတဲ့အလုပ်တူအသံ, ဒါပေမယ့်သူတို့တစ်တွေအစွမ်းထက်လှည့်ကွက်သုံးပြီးကြောင့်ဖြေရှင်းနိုင်; ဒေတာသိပ္ပံဘုံဒါပေမဲ့လူမှုရေးသိပ္ပံလက်ရှိအတော်လေးရှားပါးကြောင်းတည်း။

ပထမဦးစွာပုံမှန်အားဖြင့် Pre-အပြောင်းအလဲနဲ့ဟုခေါ်သည့်ခြေလှမ်းအတွက်, သုတေသီ, တစ်တန်းလွန်တိကျတဲ့စကားလုံး (ဥပမာ, ဆန္ဒပြပါရှိသောရှိမရှိမှတျတမျးတငျထားကြောင်းချင်းစီ document နဲ့တစ်ကော်လံအဲဒီမှာရှိရာတစ်ဦးစာရွက်စာတမ်း-သက်တမ်း matrix ကိုသို့လူမှုမီဒီယာ၏ရေးသားချက်များကူးပြောင်း အသွားအလာ, etc) ။ Next ကို, သုတေသနလက်ထောက်၏အုပ်စုတစုပို့စ်တစ်ခုနမူနာများ၏စိတ်ဓါတ်များလက်-တံဆိပ်ကပ်။ ထိုအခါဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များက၎င်း၏ဝိသေသလက္ခဏာများအပေါ်အခြေခံတဲ့ဘလော့ခ်ပို့စ်ရဲ့စိတ်ဓါတ်များအခြနိုင်ကြောင်းစက်သင်ယူမှုပုံစံကိုခန့်မှန်းရန်ဒီလက်-label တပ်ထားသောဒေတာများအသုံးပြုခဲ့သည်။ နောက်ဆုံးတော့သူတို့ကအားလုံး 11 သန်းရေးသားချက်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်ဒီစက်သင်ယူမှုပုံစံကိုအသုံးပြုခဲ့သည်။ ထို့ကြောင့်အစားကို manually (ဖြစ်ဖြစ်မဖြစ်နိုင်လိမ့်မည်သည့်) 11 သန်းရေးသားချက်များကိုဖတ်ရှုခြင်းနှင့် labeling ထက်, သူတို့ကိုယ်တိုင်ရေးသားချက်များ၏သေးငယ်တဲ့အရေအတွက်တံဆိပ်ကပ်ပြီးတော့သိပ္ပံပညာရှင်များအားလုံးတိုင်များ၏အမျိုးအစားများကိုခန့်မှန်းရန်ကြီးကြပ်သင်ယူမှုအဘယ်သို့ခေါ်ဝေါ်သဒေတာအသုံးပြုခဲ့သည်။ ဒီခွဲခြမ်းစိတ်ဖြာဖြည့်ပြီးနောက်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကကောက်ချက်ချနိုင်ခဲ့ကြတယ်, အတန်ငယ်အံ့သြစရာကောင်းလောက်အောင်, ဖျက်ပစ်ခံတစ်ဦးရာထူးများ၏ဖြစ်နိုင်ခြေကပြည်နယ်၏အရေးပါသို့မဟုတ်ပြည်နယ်၏ထောက်ခံခဲ့သည်ဖြစ်စေဖို့သက်ဆိုင်တဲ့ခဲ့သည်။

ပုံ 2.3: 11 သန်းတရုတ်ဆိုရှယ်မီဒီယာ၏ရေးသားချက်များ၏စိတ်ဓါတ်များခန့်မှန်းဖို့ဘုရင်ပန်နှင့် Roberts သည် (2013) တွင်အသုံးပြုသည့်လုပ်ထုံးလုပ်နည်းအဘို့ရိုးရှင်းသိထား။ ပထမဦးစွာပုံမှန်အားဖြင့် Pre-အပြောင်းအလဲနဲ့လို့ခေါ်တဲ့ခြေလှမ်းအတွက်, သုတေသီ (အသေးစိတ်သတင်းအချက်အလက်များအဘို့အ Grimmer နှင့် Stewart က (2013 မြင်)) တစ်ဦးစာရွက်စာတမ်း-သက်တမ်း matrix ကိုထဲသို့ဆိုရှယ်မီဒီယာ၏ရေးသားချက်များကူးပြောင်း။ ဒုတိယအချက်မှာသုတေသီရေးသားချက်များ၏သေးငယ်တဲ့နမူနာများ၏စိတ်ဓါတ်များလက်-coded ။ တတိယအချက်သုတေသီရေးသားချက်များ၏စိတ်ဓါတ်များခွဲခြားဖို့ကြီးကြပ်သင်ယူမှုပုံစံလေ့ကျင့်သင်ကြား။ စတုတ္ထ, သုတေသီအားလုံးတိုင်များ၏စိတ်ဓါတ်များခန့်မှန်းဖို့ကြီးကြပ်သင်ယူမှုပုံစံကိုအသုံးပြုခဲ့သည်။ တစ်ဦးထက်ပိုအသေးစိတ်ဖော်ပြချက်များအတွက်ဘုရင်ပန်နှင့် Roberts သည် (2013), နောကျဆကျတှဲ B ကိုကြည့်ရှုပါ။

ပုံ 2.3 in: အသုံးပြုသောလုပ်ထုံးလုပ်နည်းအဘို့ရိုးရှင်းသိထား King, Pan, and Roberts (2013) 11 သန်းတရုတ်ဆိုရှယ်မီဒီယာ၏ရေးသားချက်များ၏စိတ်ဓါတ်များခန့်မှန်းရန်။ ပထမဦးစွာပုံမှန်အားဖြင့် Pre-အပြောင်းအလဲနဲ့လို့ခေါ်တဲ့ခြေလှမ်းအတွက်, သုတေသီ (မြင် document တစ်ခု-သက်တမ်း matrix ကိုထဲသို့ဆိုရှယ်မီဒီယာ၏ရေးသားချက်များကူးပြောင်း Grimmer and Stewart (2013) ပိုမိုသောအချက်အလက်များအတွက်) ။ ဒုတိယအချက်မှာသုတေသီရေးသားချက်များ၏သေးငယ်တဲ့နမူနာများ၏စိတ်ဓါတ်များလက်-coded ။ တတိယအချက်သုတေသီရေးသားချက်များ၏စိတ်ဓါတ်များခွဲခြားဖို့ကြီးကြပ်သင်ယူမှုပုံစံလေ့ကျင့်သင်ကြား။ စတုတ္ထ, သုတေသီအားလုံးတိုင်များ၏စိတ်ဓါတ်များခန့်မှန်းဖို့ကြီးကြပ်သင်ယူမှုပုံစံကိုအသုံးပြုခဲ့သည်။ ကြည့်ရှုပါ King, Pan, and Roberts (2013) တစ်ဦးထက်ပိုအသေးစိတ်ဖော်ပြချက်အဘို့, နောကျဆကျတှဲ B က။

အဆုံး၌, ဘုရငျနှငျ့လုပ်ဖော်ကိုင်ဖက်များရေးသားချက်များကိုသာသုံးမျိုးမှန်မှန်ဆင်ဆာခဲ့ကြကြောင်းရှာဖွေတွေ့ရှိ: ညစ်ညမ်း, ဆင်ဆာ၏ဝေဖန်မှုများနှင့်စုပေါင်းလှုပ်ရှားမှုအလားအလာခဲ့သောသူတို့သည်လည်းထို (အကြီးစားဆန္ဒပြပွဲများအားဦးဆောင်၏ဆိုလိုသည်မှာဖြစ်နိုင်ခြေ) ။ မဖျက်ခဲ့ဖျက်ပစ်ခဲ့၏ရေးသားချက်များနှင့်ရေးသားချက်များ၏ကြီးမားသောအရေအတွက်စောင့်ကြည့်ခြင်းအားဖြင့်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကိုဆင်ဆာကြည့်ရှုခြင်းနှင့်ရေတွက်ခြင်းဖြင့်ကိုယ့်အလုပ်လုပ်ပုံကိုလေ့လာသင်ယူနိုင်ခဲ့ကြတယ်။ နောက်ဆက်တွဲသုတေသနလုပ်ငန်းအတွက်, သူတို့ကတကယ်တော့တိုက်ရိုက်ဆင်ဆာရသည့်စနစ်တကျကွဲပြားခြားနားသောအကြောင်းအရာနှင့်တိုင်းနှင့်အတူရေးသားချက်များအတွက်တရုတ်လူမှုရေးမီဒီယာဂေဟစနစ်သို့ကြားဝင် (King, Pan, and Roberts 2014) ။ ကျွန်တော်တို့သည်ထိုစာအုပ်တစ်လျှောက်လုံးပေါ်ပေါက်လိမ့်မယ်တဲ့ဆောင်ပုဒ်ကွို, ထို့ပြင်အခန်း 4. အတွက်စမ်းသပ်ချဉ်းကပ်မှုအကြောင်းကိုဤသူငုပ်လျှိုးနေ-attribute ကိုအခြပြဿနာတွေ-သောတခါတရံအတွက်လူမှုရေးသုတေသနတွင်ကြီးကြပ်အလွန်ဘုံဖြစ်ထွက်သင်ယူမှု-လှည့်နှင့်အတူဖြေရှင်းနိုင်ပါသည်ပိုမိုလေ့လာပါလိမ့်မယ် ဒီဂျစ်တယ်ခေတ်။ သငျသညျ (အစုလိုက်အပြုံလိုက်ပူးပေါင်း Creating) (မေးခွန်းများကိုမေး) အခနျး 3 မှာ 2.3 ပုံဓါတ်ပုံတွေကိုအလွန်ဆင်တူတွေ့မြင်နှင့် 5 လိမ့်မည်; ကမျိုးစုံအခန်းကြီးထဲမှာပေါ်လာအနည်းငယ်စိတ်ကူးများတစ်ခုဖြစ်သည်။

ဤဥပမာ-The New York မှာတက္ကစီယာဉ်မောင်း၏အလုပ်လုပ်ကိုင်အပြုအမူအားလုံးသည်သုံး, ကျောင်းသားများနှင့်စူးစမ်းအချက်အလက်များ၏အတော်လေးရိုးရှင်းတဲ့ရေတွက်သီအိုရီဟောကိန်းများကိုစမ်းသပ်ဖို့သုတေသီများကို enable နိုငျသောတရုတ်အစိုးရ-ပြပွဲ၏ဆိုရှယ်မီဒီယာဆင်ဆာဖြတ်တောက်မှုအပြုအမူအားဖြင့်ချစ်ကြည်ရင်းနှီးမှုဖွဲ့စည်းခြင်း။ အချို့ကိစ္စများတွင်ကြီးမားသော data ကိုသငျသညျ (နယူးယောက်မီတာတက္ကစီ၏အမှု၌ကဲ့သို့) အတော်လေးတိုက်ရိုက်ဒီရေတွက်လုပ်ဖို့အဆင်ပြေနိုင်ပါတယ်။ အခြားကိစ္စများတွင်သုတေသီများ (တရုတ်ဆင်ဆာဖြတ်တောက်မှု၏အမှု၌ကဲ့သို့) သူတို့ရဲ့ကိုယ်ပိုင်စူးစမ်းဒေတာစုဆောင်းဖို့လိုအပ်ပါလိမ့်မည်, (ကွန်ယက်ကိုဆင့်ကဲဖြစ်စဉ်၏အမှု၌ကဲ့သို့) အတူတူဒေတာပေါင်းစည်းအားဖြင့်မပြည့်စုံနှင့်အတူကိုင်တွယ်ဖြေရှင်း; သို့မဟုတ် (တရုတ်ဆင်ဆာဖြတ်တောက်မှု၏အမှု၌ကဲ့သို့) ငုပ်လျှိုးနေ-ရိုအခြအချို့ကိုပုံစံကိုဖျော်ဖြေ။ ဒီဥပမာကိုပြသမယ်လို့မျှော်လင့်သည့်အတိုင်းစိတ်ဝင်စားစရာမေးခွန်းများမေးနိုင်နေသောသုတေသီများအဘို့, ကြီးမားတဲ့အလွန်ကြီးစွာသောဂတိတော်ကိုရရှိထားပါသည်။