2.4.1 မဲရေတွက်မှုအရာ

သငျသညျကောငျးကြိုးဒေတာနဲ့ကောငျးတဲ့မေးခွန်းပေါင်းစပ်လျှင်ရိုးရှင်းသောရေတွက်စိတ်ဝင်စားစရာဖြစ်နိုင်ပါတယ်။

ဒါဟာခေတ်မီ-မြည်ဘာသာစကားမှာ၎င်းသော်လည်း, လူမှုရေးသုတေသနအများကြီးတကယ်မယ့်အမှုအရာရေတွက်သည်။ ကြီးမားသောအချက်အလက်များ၏အသက်အရွယ်မှာတော့သုတေသီများအစဉ်အဆက်ထက်ပိုပြီးရေတွက်နိုင်ပါသည်, သို့သော်သူတို့ပဲ haphazardly ရေတွက် start သင့်ကြောင်းမဆိုလိုပါ။ အဲဒီအစား, သုတေသီများကိုမေးသင့်တယ်: အမှုအရာရေတွက်တန်ဖိုးရှိများမှာအဘယ်သို့နည်း, ဒါကတစ်ဦးလုံးဝပုဂ္ဂလဒိဋ္ကိစ္စနှင့်တူပုံရပေမည်, သို့သော်အချို့ယေဘုယျပုံစံများရှိပါတယ်။

ငါမ-One အစဉ်အဆက်မတိုင်မီရေတွက်တော်မူကြောင်းကိုအရာတစ်ခုခုရေတွက်မယ်: မကြာခဏကျောင်းသားများကိုဟုသူတို့ရဲ့ရေတွက်သုတေသနလှုံ့ဆော်။ ဥပမာအားဖြင့်, ကျောင်းသားတစ်ဦးများစွာသောလူရွှေ့ပြောင်းလုပ်သားများကိုလေ့လာခဲ့ကြပြီးလူအတော်များများအမွှာလေ့လာခဲ့ကြပါပြီ, ဒါပေမယ့်ဘယ်သူမှရွှေ့ပြောင်းအမွှာလေ့လာခဲ့သည်ဟုဆိုရပေလိမ့်မည်။ ကြှနျတေျာ့အတှေ့အကွုံ၌ငါမရှိခြင်းတို့ကလှုံ့ဆျောမှုမခေါ်သောဤမဟာဗျူဟာ, များသောအားဖြင့်ကောင်းသောသုတေသနဖို့ဦးဆောင်လမ်းပြမပေးပါဘူး။ မရှိခြင်းအားဖြင့်လှုံ့ဆျောမှုမျိုးအပေါက်တစ်ပေါက်ကျော်ရှိပါတယ်ရှိပါတယ်ဟု, ငါကတက်ဖြည့်ရန်အလွန်ခဲယဉ်းအလုပ်လုပ်သွားမယ်ကဲ့သို့ဖြစ်၏။ သို့သော်မရတိုင်းအပေါက်ဖြည့်ရန်လိုအပ်ပါသည်။

အဲဒီအစားမရှိခြင်းတို့ကလှုံ့ဆျော၏, ငါပိုကောင်းတဲ့မဟာဗျူဟာအရေးကြီးသောသို့မဟုတ်စိတ်ဝင်စားဖွယ် (သို့မဟုတ်ထွက်ရှိသောနှစ်ဦးစလုံး) ဖြစ်ကြောင်းသုတေသနမေးခွန်းများကိုရှာဖို့ဖြစ်ပါတယ်ထင်ပါတယ်။ အရေးကြီးသောသုတေသနစဉ်းစားရန်သတ်မှတ်ဖို့နည်းနည်းခက်သည်ဤဝေါဟာရများကိုနှစ်ယောက်စလုံး, ဒါပေမယ့်တလမ်းတည်းဖြင့်အချို့တိုင်းတာသက်ရောက်မှုရှိပါတယ်သို့မဟုတ်မူဝါဒချမှတ်သူများနေဖြင့်အရေးပါသောဆုံးဖြတ်ချက်သို့ feeds သောကွောငျ့ဖွစျသညျ။ ဒါကြောင့်မူဝါဒအားဆုံးဖြတ်ချက်များကိုမောင်းသောစီးပွားရေးတစ်ခုညွှန်ပြချက်ကြောင့်ဥပမာအားဖြင့်, အလုပ်လက်မဲ့နှုန်းကိုတိုင်းတာရန်အရေးကြီးပါသည်။ ယေဘုယျအားဖြင့်ငါသုတေသီများအရေးကြီးတဲ့အရာကိုတစ်ဦးတော်တော်လေးဥာဏ်ကောင်းသောရှိသည်ထင်ပါတယ်။ ဒါကြောင့်ဤအပိုင်း၏ကျန်အတွက်ငါရေတွက်စိတ်ဝင်စားစရာကောင်းသည်ထင်ဘယ်မှာဥပမာနှစ်ခုကိုပေးသွားမယ်။ တစ်ခုချင်းစီကိုအမှု၌, သုတေသီများ haphazardly မတွက်ကြသည် ဟူ. ၎င်း, မဟုတ်ဘဲသူတို့စနစ်များကိုမည်သို့အလုပ်လုပ်လူမှုရေးအကြောင်းပိုမိုယေဘုယျစိတ်ကူးများသို့အရေးကြီးသောထိုးထွင်းသိမြင်မှုကိုထင်ရှားစေသည်အလွန်အထူးသဖြင့် setting တွင်ရေတွက်ခဲ့သည်။ တစ်နည်းအားဖြင့်အဲဒီအထူးသဖြင့်ရေတွက်လေ့ကျင့်ခန်းစိတ်ဝင်စားဖို့စေသည်ဘယ်အရာကိုအများကြီးဒေတာသူ့ဟာသူသည်မဟုတ်, ဤပိုပြီးယေဘုယျအတွေးအခေါ်များကနေလာပါတယ်။

ရေတွက်၏ရိုးရှင်းသောအာဏာကိုဥပမာတစျခုဟင်နရီ Farber ရဲ့ထံမှလာ (2015) နယူးယောက်စီးတီးတက္ကစီယာဉ်မောင်းများ၏အပြုအမူ၏လေ့လာမှု။ ဒီအဖွဲ့ကိုမူလကပင်စိတ်ဝင်စားစရာကောင်းတဲ့အသံမပြုစေခြင်းငှါသော်လည်းအလုပ်သမားဘောဂဗေဒနှစ်ခုယှဉ်ပြိုင်သီအိုရီစမ်းသပ်ဘို့မဟာဗျူဟာသုတေသန site ကိုဖြစ်ပါတယ်။ ရာသီဥတုတူသောအချက်များပေါ်တွင်တစ်စိတ်တစ်ပိုင်းအခြေစိုက် (1) မိမိတို့၏အလုပ်ချိန်နာရီလုပ်အားခနေ့ နေ့မှစ. fluctuates, နှင့်နာရီများ (2) အရေအတွက်ကသူတို့: Farber ရဲ့သုတေသန၏ရည်ရွယ်ချက်နှစ်ခုအရေးကြီးသောတက္ကစီယာဉ်မောင်း၏လုပျငနျးပတ်ဝန်းကျင်နှင့် ပတ်သက်. အင်္ဂါရပ်တွေရှိပါတယ် အလုပ်၎င်းတို့၏ဆုံးဖြတ်ချက်များအပေါ်အခြေခံပြီးနေ့ရက်တိုင်းသာအတက်အကျနိုင်ပါတယ်။ ဤအင်္ဂါရပ်အလုပ်လုပ်ခဲ့အလုပ်ချိန်နာရီလုပ်အားခနှင့်နာရီအကြားဆက်ဆံရေးနှင့် ပတ်သက်. စိတ်ဝင်စားစရာကောင်းတဲ့မေးခွန်းတစ်ခုကိုဦးတည်သွားစေ။ ဘောဂဗေဒအတွက် Neoclassical မော်ဒယ်များတက္ကစီယာဉ်မောင်းကိုသူတို့ပိုမိုမြင့်မားအလုပ်ချိန်နာရီလုပ်အားခရှိသည်ဘယ်မှာရက်ပိုပြီးအလုပ်လုပ်လိမ့်မည်ဟုကြိုတင်ခန့်မှန်း။ တနည်းအားဖြင့်အမူအကျင့်ဘောဂဗေဒထံမှမော်ဒယ်များအတိအကျဆန့်ကျင်ဘက်ကြိုတင်ခန့်မှန်း။ ယာဉ်မောင်းနေ့က-နှင့်အလုပ်နှုန်းဟာအထူးသဖြင့်ဝင်ငွေပစ်မှတ်-လို့ပြော $ 100 ကိုမသတ်မှတ်လိုလျှင်ကြောင့်ပစ်မှတ်တွေ့ဆုံခဲ့ပြီးဖြစ်ပါတယ်သည်အထိ, ထို့နောက်ယာဉ်မောင်းသူတို့ကပိုဝင်ငွေဖြစ်ကြောင်းရက်နည်းပါးလာနာရီအလုပ်လုပ်တက်အဆုံးသတ်ပါလိမ့်မယ်။ သင်တစ်ဦးပစ်မှတ်ရရှိဖြစ်လျှင်ဥပမာ, သင်ကမကောင်းတဲ့နေ့ရက်ကို (တစ်နာရီလျှင် $ 20) ရက်နေ့တွင်အကောင်းတစ်နေ့၌လေးနာရီ (တစ်နာရီလျှင် $ 25) နဲ့ငါးနာရီအလုပ်လုပ်တက်အဆုံးသတ်ပေလိမ့်မည်။ ဒါကြောင့်ယာဉ်မောင်း (အပြုအမူစီးပွားရေးမော်ဒယ်အားဖြင့်ခန့်မှန်းကဲ့သို့) အနိမ့်အလုပ်ချိန်နာရီလုပ်အားခနှင့်အတူရက်ပေါင်းအပေါ်ပိုမိုမြင့်မားအလုပ်ချိန်နာရီလုပ်အားခကို (neoclassical မော်ဒယ်များအားဖြင့်ခန့်မှန်းကဲ့သို့) သို့မဟုတ်ထို့ထက် ပို. နာရီနှင့်အတူရက်ပေါင်းအပေါ်ပိုပြီးနာရီအလုပ်လုပ်သလဲ?

ဤမေးခွန်းကိုဖြေဆိုရန် Farber 2013 မှ 2009 ကနေနယူးယောက်စီးတီး cabs အားဖြင့်ခေါ်ဆောင်သွားသည်ကိုတက္ကစီခရီးစဉ်အပေါ်ဒေတာ, ယခုလူသိရှင်ကြားမရရှိနိုင်ဖြစ်ကြောင်း data ကိုရရှိခဲ့သည်။ ဤရွေ့ကားဒေတာ-သောမြို့ကိုအသုံးပြုဖို့-ထည့်သွင်းရန်တစ်ဦးချင်းစီခရီးစဉ်အကြောင်းသတင်းအချက်အလက်တက္ကစီလိုအပ်သည်အီလက်ထရောနစ်မီတာအားဖြင့်ကောက်ယူခဲ့သည်: တည်နေရာ, အဆုံးအချိန်, အဆုံးတည်နေရာ, ခနှင့်အစွန်အဖျားကိုစတင်ရန်, အချိန် start (ပျဉ်းမယ့်ခရက်ဒစ်ကဒ်နှင့်အတူပေးခဲ့လျှင်) ။ ဒီတက္ကစီမီတာဒေတာအသုံးပြုခြင်း, Farber အများဆုံး drivers တွေကိုလုပ်ခ, မြင့် neoclassical သီအိုရီနှင့်ကိုက်ညီသည့်အခါရက်ပေါင်းပိုမိုအလုပ်လုပ်သောတွေ့ရှိခဲ့ပါတယ်။

ဒီအဓိကတွေ့ရှိချက်အပြင်, Farber သောင်းပြောင်းထွေလာရောနှောခြင်းနှင့်ဒိုင်းနမစ်၏ပိုကောင်းတဲ့နားလည်မှုများအတွက်အချက်အလက်များ၏အရွယ်အစားကိုအသုံးပြုရန်နိုင်ခဲ့သည်။ သူဟာ (ဥပမာ, သူတို့ neoclassical မော်ဒယ်ခန့်မှန်းထားသည်အဖြစ်ပြုမူတတ်ရန်သင်ယူ) အချိန်ကြာလာတာနဲ့အမျှ, အသစ်များ drivers တွေကိုတဖြည်းဖြည်းမြင့်မားသောလုပ်ခရက်ပိုပြီးနာရီလုပ်ကိုင်ဖို့သင်ယူတွေ့ရှိခဲ့ပါတယ်။ နှင့်ပိုပြီးပစ်မှတ််ငွေရရှိသူတွေလိုပဲအလုပ်လုပ်တယ်သူကိုသစ်ကိုယာဉ်မောင်းတက္ကစီယာဉ်မောင်းဖြစ်ခြင်းဆေးလိပ်ဖြတ်ဖို့ပိုများပါတယ်။ လက်ရှိယာဉ်မောင်းများ၏လေ့လာအပြုအမူကိုရှင်းပြကူညီသောဤပိုပြီးသိမ်မွေ့တွေ့ရှိချက်, နှစ်ယောက်စလုံးကြောင့် Datasets ၏အရွယ်အစားသာဖြစ်နိုင်သောခဲ့ကြသည်။ သူတို့ကအချိန်တိုတောင်းတဲ့ကာလကျော်တက္ကစီယာဉ်မောင်းတစ်ဦးသေးငယ်တဲ့အရေအတွက်ကိုကနေစက္ကူခရီးစဉ်စာရွက်များကိုအသုံးပြုကြောင်းအစောပိုင်းလေ့လာမှုများအတွက် detect လုပ်ဖို့မဖြစ်နိုင်ခဲ့ကြ (Camerer et al. 1997)

Farber ရဲ့လေ့လာမှုမြို့ကောက်ယူသောဒေတာများ Farber စုဆောင်းခဲ့ကြလိမ့်မယ်လို့ဒေတာမှတော်တော်နီးကပ်သောကြောင့်ကြီးမားတဲ့ data တွေကိုအရင်းအမြစ်ကို အသုံးပြု. သုတေသနများအတွက်အကောင်းဆုံးအမှုမြင်ကွင်းနီးစပ်ခဲ့ (တဦးတည်းခြားနားချက် Farber စုစုပေါင်းအပေါ်ဒေတာလိုချင်ကြလိမ့်မယ်လို့ဖြစ်ပါသည် လုပ်ခ-ကိုပုံမှန်အတိုင်းပေါင်းအကြံပေးချက်များ-ပေမယ့်ဒေတာများကိုသာခရက်ဒစ်ကဒ်အားဖြင့်ပေးဆောင်အကြံပေးချက်များပါဝင်သည်တမြို့) ။ သို့သော်တစ်ဦးတည်း၏ဒေတာမလုံလောက်ဘူးဖြစ်ကြသည်။ Farber ရဲ့သုတေသနဖို့သော့ဒေတာမှပဲဒီတိကျတဲ့ setting ကို ကျော်လွန်. ပိုမိုကြီးမားသက်ရောက်မှုတွေရှိတယ်ဆိုတာမေးခွန်းတစ်ခုစိတ်ဝင်စားဖွယ်မေးခွန်းတစ်ခုကိုယူလာခဲ့ပါသည်။

ရေတွက်မှုအရာတို့ကိုတစ်ဦးကဒုတိယဥပမာဂယ်ရီဘုရင်ဂျနီဖာပန်နှင့် Molly Roberts သည်အားဖြင့်သုတေသနမှလာ (2013) တရုတ်အစိုးရတို့ကအွန်လိုင်းဆင်ဆာဖြတ်တောက်မှုပေါ်။ ဤကိစ္စတွင်ခုနှစ်, သို့သော်သုတေသီများမိမိတို့ကိုယ်ပိုင်ကြီးတွေဒေတာစုဆောင်းခဲ့ကြပြီးသူတို့ရဲ့ဒေတာမပြည့်စုံသောတကယ်တော့ကိုင်တွယ်ဖြေရှင်းခဲ့ရတယ်။

ရှင်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကတရုတ်အတွက်လူမှုမီဒီယာ၏ရေးသားချက်များသောင်းချီသောလူထောင်ပေါင်းများစွာ၏ထည့်သွင်းရန်စဉ်းစားကြောင်းတစ်ခုကြီးမားပြည်နယ်ယန္တရားအားဖြင့်ဆင်ဆာနေကြတယ်ဆိုတဲ့အချက်ကိုအားဖြင့်လှုံ့ဆော်ခဲ့ကြသည်။ သုတေသီများနှင့်နိုင်ငံသားများ, သို့သော်ဤဆင်ဆာအကြောင်းအရာဖျက်ပစ်ရပါမည်အဘယ်အရာကိုဆုံးဖြတ်မည်သို့နည်းနည်းအဓိပ္ပာယ်ရှိသည်။ တရုတ်ပညာရှင်များအမှန်တကယ်ပို့စ်မျိုးကိုဖျက်ပစ်ရအများဆုံးဖွယ်ရှိသောအကြောင်းကိုပဋိပက္ခဖြစ်မျှော်လင့်ချက်များရှိသည်။ တချို့ကအခြားသူများကိုသူတို့ထိုကဲ့သို့သောဆန္ဒပြမှုတွေအဖြစ်စုပေါင်းအပြုအမူအားပေးကြောင်းပို့စ်များ, အာရုံစိုက်ကြောင်းထင်နေချိန်တွင်ဆင်ဆာ, ပြည်နယ်၏အရေးပါဖြစ်ကြောင်းပို့စ်များကိုအာရုံစိုက်ကြောင်းထင်ပါတယ်။ မှန်ကန်သည်ဤမျှော်လင့်ချက်များများရာမှထွက်ရှာဖွေသုတေသီများတရုတ်နှင့်ဆင်ဆာဖြတ်တောက်မှုအတွက်ထိတွေ့ဆက်ဆံသောအခြားအာဏာရှင်အစိုးရများနားလည်ဘယ်လောက်များအတွက်သက်ရောက်မှုရှိပါတယ်။ ထို့ကြောင့်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဘက်များထုတ်ဝေခြင်းနှင့်နောက်ပိုင်းတွင်ပုံနှိပ်ထုတ်ဝေနှင့်ဘယ်တော့မှဖျက်ပစ်ခဲ့၏ရေးသားချက်များနှင့်အတူဖျက်ပစ်ခဲ့ပို့စ်များကိုနှိုင်းယှဉ်ချင်တယ်။

ဤသူရေးသားချက်များစုဆောင်းကွဲပြားခြားနားသောစာမျက်နှာအပြင်အဆင်ရှာဖွေရေးသက်ဆိုင်ရာရေးသားချက်များနှင့်အတူ 1000 ကျော်တရုတ်ဆိုရှယ်မီဒီယာဝက်ဘ်ဆိုက်များ-တစ်ခုချင်းစီတွား, ပြီးတော့နောက်ပိုင်းတွင်ပယ်ဖျက်လိုက်တဲ့ခဲ့ပြီးသောမြင်ဤပို့စ်များကိုပြန်လည်ဆွေးနွေးရန်၏အံ့သြဖွယ်အင်ဂျင်နီယာ feat ပါဝင်ပတ်သက်။ အကြီးစား Web-တွားနှင့်ဆက်စပ်ပုံမှန်အင်ဂျင်နီယာပြဿနာတွေအပြင်, ဤစီမံကိန်းအများအပြားဆင်ဆာရေးသားချက်များထက်နည်း 24 နာရီအတွင်းချယူကြသည်ကြောင့်အလွန်အမင်းအစာရှောင်ခြင်းဖြစ်ဖို့လိုအပျသောကဆက်ပြောသည်စိန်ခေါ်မှုရှိခဲ့ပါတယ်။ တစ်နည်းတစ်နှေးကွေးဝဘ်ဆိုက် crawler ဆင်ဆာခဲ့ရေးသားချက်များအများကြီးလက်လွတ်လိမ့်မယ်။ access ကို block သို့မဟုတ်မဟုတ်ရင်လေ့လာမှုမှတုန့်ပြန်မှာသူတို့ရဲ့မူဝါဒတွေပြောင်းလဲဆိုရှယ်မီဒီယာဝက်ဘ်ဆိုက်များ စိုးရိမ်. ထောက်လှမ်း evading စဉ်ထပ်မံခြင်း, crawler ဤအမှုအလုံးစုံတို့ကိုဒေတာစုဆောင်းလုပ်ဖို့ခဲ့ရသည်။

ဒီကြီးမားတဲ့အင်ဂျင်နီယာလုပ်ငန်းတာဝန်ပြီးစီးခဲ့ကြောင်းသောအချိန်အားဖြင့်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဘက်များ, sensitivity ကိုတစ်ဦး assumed Level ဖြင့်တစ်ဦးချင်းစီ 85 ကွဲပြားခြားနားသော prespecified သည့်အကြောင်းအရာများအပေါ်အကြောင်းကို 11 သန်းပို့စ်များကိုရယူခဲ့သည်။ ဥပမာအားဖြင့်, မြင့်သော sensitivity ကိုတစ်ဦးခေါင်းစဉ်အိုင်ဝေ, အအတိုက်အခံအနုပညာရှင်ဖြစ်၏ အလယ်တန်း sensitivity ကိုတစ်ဦးခေါင်းစဉ်တရုတ်ငွေကြေး၏ကြေးဇူးတငျကွောငျးနှင့်တန်ဖိုးဖြစ်ပြီး, အနိမ့် sensitivity ကိုတစ်ဦးခေါင်းစဉ်ကမ္ဘာ့ဖလားဖြစ်ပါတယ်။ ဤအ 11 သန်းပို့စ်, 2 သန်းဆင်ဆာခဲ့သညျ။ အတန်ငယ်အံ့သြစရာကောင်းလောက်အောင်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဘက်များအလွန်အမင်းထိခိုက်မခံသည့်အကြောင်းအရာများအပေါ်ရေးသားချက်များသာအနည်းငယ်ပိုပြီးမကြာခဏအလယ်အလတ်နှင့်အနိမ့် sensitivity ကိုအကြောင်းအရာများအပေါ်ရေးသားချက်များထက်ဆင်ဆာခဲ့ကြသည်ကိုတွေ့ရှိခဲ့ပါတယ်။ တစ်နည်းအားဖြင့်တရုတ်ဆင်ဆာကမ္ဘာ့ဖလားဖျောပွထားသတဲ့ post ကိုအဖြစ်အိုင်ဝေဖျောပွထားသတဲ့ post ကိုဆင်ဆာနဲ့ပတ်သက်ပြီးအဖြစ်များပါတယ်။ ဤရွေ့ကားတွေ့ရှိချက်ကိုအစိုးရကအထိခိုက်မခံသည့်အကြောင်းအရာများပေါ်မှာရှိသမျှပို့စ်များကို censor လုပ်သောစိတ်ကူးကိုထောကျပံ့မပေးပါဘူး။

ခေါင်းစဉ်အားဖြင့်ဆင်ဆာမှုနှုန်း၏ဤရိုးရှင်းသောတွက်ချက်မှုသို့သော်အထင်မြင်မှားစေသောဖြစ်နိုင်ပါတယ်။ ဥပမာ, အစိုးရအိုင်ဝေထောက်ခံဖြစ်ကြောင်းပို့စ်များကိုဆင်ဆာ, ဒါပေမယ့်သူ့ကိုဝေဖန်ဖြစ်ကြောင်းပို့စ်များကိုစွန့်ခွာလိမ့်မယ်။ ပိုပြီးဂရုတစိုက်ရေးသားချက်များအကြားခွဲခြားနိုင်ဖို့အတွက်သုတေသီတစ်ဦးချင်းစီဘလော့ခ်ပို့စ်ရဲ့စိတ်ဓာတ်တွေကိုတိုင်းတာရန်လိုအပ်ခဲ့ပါတယ်။ ကံမကောင်းစွာပဲအများကြီးအလုပ်ရှိနေသော်လည်း Pre-တည်ဆဲအဘိဓါနျသုံးပြီးစိတ်ဓါတ်များထောက်လှမ်း၏အပြည့်အဝ automated နည်းလမ်းများအများအပြားအခြေအနေများတွင်နေဆဲအလွန်ကောင်းသောမဟုတ် (နောက်ကျောအပိုင်း 2.3.9 မှာဖော်ပြထားတဲ့စက်တင်ဘာလ 11, 2001 တစ်ခုစိတ်ခံစားမှုအချိန်ဇယားကိုပြဿနာထင်) ။ ထို့ကြောင့်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဘက်ပြည်နယ်၏ (2) ထောက်ခံသူတို့ပြည်နယ် (1) ဝေဖန်ခဲ့ကြသည်ရှိမရှိအဖြစ်၎င်းတို့၏ 11 သန်းလူမှုမီဒီယာ၏ရေးသားချက်များတံဆိပ်ကပ်ဖို့လမ်းလိုအပ်ဒါမှမဟုတ်ဖြစ်ရပ်များနှင့် ပတ်သက်. (3) ဆီလျှော်သို့မဟုတ်လိုက်ဖို့အစီရင်ခံစာများ။ ဒါကကြီးမားတဲ့အလုပ်တူသောအသံ, ဒါပေမဲ့သူတို့ဒေတာသိပ္ပံဘုံပေမယ့်လူမှုရေးသိပ္ပံအတော်လေးရှားပါးသောအစွမ်းထက်လှည့်ကွက်သုံးပြီးကဖြေရှင်း: ကြီးကြပ်သင်ယူမှု; ကိန်းဂဏန်း 2.5 ကြည့်ပါ။

ပထမဦးစွာပုံမှန်အား preprocessing လို့ခေါ်တဲ့ခြေလှမ်းအတွက်, သုတေသီတဦးတည်းအတန်းပို့စ်တိကျတဲ့စကားလုံး (ဥပမာဆန္ဒပြမှုသို့မဟုတ်အသွားအလာ) ပါရှိသောရှိမရှိမှတ်တမ်းတင်ထားသောကြောင့်တစ်ဦးချင်းစီစာရွက်စာတမ်းများနှင့်တဦးတည်းကော်လံများအတွက်ရှိခဲ့ရာစာရွက်စာတမ်း-သက်တမ်း matrix, သို့လူမှုမီဒီယာ၏ရေးသားချက်များကူးပြောင်း ။ ထို့နောက်သုတေသနလက်ထောက်၏အုပ်စုတစုပို့စ်များကိုတစ်နမူနာများ၏စိတ်ဓါတ်များလက်တံဆိပ်ကပ်။ ထို့နောက်သူတို့က၎င်း၏ဝိသေသလက္ခဏာများပေါ်အခြေခံပြီးတစ်ဘလော့ခ်ပို့စ်ရဲ့စိတ်ဓါတ်များအခြနိုင်မယ့်စက်သင်ယူမှုပုံစံကိုဖန်တီးရန်ဒီလက်-label တပ်ထားသောဒေတာများကိုအသုံးပြုခဲ့သည်။ နောက်ဆုံးအနေနဲ့ထိုလူအပေါင်းတို့သည် 11 သန်းရေးသားချက်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်ဒီမော်ဒယ်ကိုအသုံးပြုခဲ့သည်။

ထို့ကြောင့်မဟုတ်ဘဲကိုယ်တိုင် 11 သန်းပို့ဆောင်ထောက်ပံ့ရေးဆိုင်ရာကိစ္စရပ်များမဖြစ်နိုင်-ရှင်ဘုရင်ဖြစ်လိမ့်မည်ဟုအရာပို့စ်များကို-နှင့်လုပ်ဖော်ကိုင်ဘက်များဖတ်ရှုခြင်းနှင့် labeling ထက်ကိုယ်တိုင်ရေးသားချက်များ၏သေးငယ်တဲ့အရေအတွက်ကတံဆိပ်ကပ်ပြီးတော့အားလုံးတိုင်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်ကြီးကြပ်သင်ယူမှုကိုအသုံးပြုခဲ့သည်။ ဒီခွဲခြမ်းစိတ်ဖြာပြီးသွားချိန်သူတို့ကောက်ချက်ချနိုင်ခဲ့ကြတယ်, အတန်ငယ်အံ့သြစရာကောင်းလောက်အောင်, ဖျက်ပစ်ခံရမယ့်ဘလော့ခ်ပို့စ်ရဲ့ဖြစ်နိုင်ခြေကပြည်နယ်၏အရေးပါသို့မဟုတ်ပြည်နယ်၏ထောက်ခံခဲ့ရှိမရှိမသက်ဆိုင်သောဖြစ်ခဲ့သည်။

ပုံ 2.5: 11 သန်းတရုတ်ဆိုရှယ်မီဒီယာ၏ရေးသားချက်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်ဘုရင်ပန်နှင့် Roberts သည် (2013) အသုံးပြုတဲ့လုပ်ထုံးလုပ်နည်း၏ရိုးရှင်းသိထား။ ပထမဦးစွာတစ်ဦး preprocessing ခြေလှမ်းအတွက်သုတေသီ (နောက်ထပ်သတင်းအချက်အလက်များအဘို့အ Grimmer နှင့် Stewart က (2013 တွေ့မြင်)) တစ်ဦးစာရွက်စာတမ်း-သက်တမ်း matrix သို့လူမှုမီဒီယာ၏ရေးသားချက်များကူးပြောင်း။ ဒုတိယအချက်မှာသူတို့ရေးသားချက်များ၏သေးငယ်တဲ့နမူနာများ၏သဘောထားလက်-coded ။ တတိယ, သူတို့ရေးသားချက်များ၏စိတ်ဓါတ်များခွဲခြားဖို့ကြီးကြပ်သင်ယူမှုပုံစံလေ့ကျင့်သင်ကြား။ စတုတ္ထ, သူတို့ကအားလုံးတိုင်များ၏စိတ်ဓါတ်များခန့်မှန်းဖို့ကြီးကြပ်သင်ယူမှုပုံစံကိုအသုံးပြုခဲ့သည်။ ရှငျဘုရငျ, ပန်နှင့် Roberts သည် (2013) တစ်ဦးထက်ပိုသောအသေးစိတ်ဖော်ပြချက်များအတွက်နောက်ဆက်တွဲ B ကိုကြည့်ရှုပါ။

ပုံ 2.5: အသုံးပြုတဲ့လုပ်ထုံးလုပ်နည်း၏ရိုးရှင်းသိထား King, Pan, and Roberts (2013) 11 သန်းတရုတ်ဆိုရှယ်မီဒီယာ၏ရေးသားချက်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်။ ပထမဦးစွာတစ်ဦး preprocessing ခြေလှမ်းအတွက်သုတေသီ (ကြည့်ရှုနေတဲ့စာရွက်စာတမ်း-သက်တမ်း matrix သို့လူမှုမီဒီယာ၏ရေးသားချက်များကူးပြောင်း Grimmer and Stewart (2013) ပိုမိုသောအချက်အလက်များအတွက်) ။ ဒုတိယအချက်မှာသူတို့ရေးသားချက်များ၏သေးငယ်တဲ့နမူနာများ၏သဘောထားလက်-coded ။ တတိယ, သူတို့ရေးသားချက်များ၏စိတ်ဓါတ်များခွဲခြားဖို့ကြီးကြပ်သင်ယူမှုပုံစံလေ့ကျင့်သင်ကြား။ စတုတ္ထ, သူတို့ကအားလုံးတိုင်များ၏စိတ်ဓါတ်များခန့်မှန်းဖို့ကြီးကြပ်သင်ယူမှုပုံစံကိုအသုံးပြုခဲ့သည်။ ကြည့်ရှုပါ King, Pan, and Roberts (2013) တစ်ဦးထက်ပိုသောအသေးစိတ်ဖော်ပြချက်များအတွက်နောက်ဆက်တွဲ B က။

အဆုံး၌ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များပို့စ်များကိုသာသုံးမျိုးမှန်မှန်ဆင်ဆာခဲ့ရှာဖွေတွေ့ရှိ: ညစ်ညမ်းဆင်ဆာ၏ဝေဖန်မှုများနှင့်စုပေါင်းအရေးယူအလားအလာရှိခဲ့သောသူတို့ (အကြီးစားဆန္ဒပြမှုများမှဦးဆောင်၏ဆိုလိုသည်မှာဖြစ်နိုင်ခြေ) ။ ဖျက်ပစ်မခံခဲ့ရကြောင်းဖျက်ပစ်ခဲ့၏ရေးသားချက်များနှင့်ပို့စ်များကြီးမားတဲ့အရေအတွက်ကစောင့်ကြည့်ခြင်းအားဖြင့်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကဆင်ဆာကြည့်ရှုရေတွက်ခြင်းဖြင့်ကိုယ့်အလုပ်လုပ်ပုံကိုလေ့လာသင်ယူနိုင်ခဲ့ကြတယ်။ ထို့ပြင်၎င်းတို့သည်အခြို့သောရလဒ်များ labeling-လက်ကိုအသုံးပြုပြီးတော့ဒီဂျစ်တယ်ခေတ်များတွင်လူမှုရေးသုတေသနအတွက်အလွန်ဘုံဖြစ်ထဲက-လှည့်အရာကြွင်းသမျှတံဆိပ်ကပ်ဖို့စက်သင်ယူမှုပုံစံကိုတည်ဆောက်သောဤစာအုပ်တွင်တစ်လျှောက်လုံးပေါ်ပေါက်လိမ့်မယ်တဲ့ဆောင်ပုဒ်သည်ကြီးကြပ်သင်ယူမှုချဉ်းကပ်နည်းကွို ။ သငျသညျ (အစုလိုက်အပြုံလိုက်ပူးပေါင်း Creating) (မေးခွန်းများကိုမေး) အခန်းကြီး 3 2.5 တွက်ဆဖို့ဓါတ်ပုံတွေကိုအလွန်ဆင်တူတွေ့မြင်နှင့် 5 လိမ့်မည် ဒီမျိုးစုံအခန်းကြီးထဲမှာပေါ်လာအနည်းငယ်စိတ်ကူးများတစ်ခုဖြစ်သည်။

ဤဥပမာ-The New York မှာတက္ကစီယာဉ်မောင်း၏အလုပ်လုပ်ကိုင်အပြုအမူများနှင့်ကြီးမားသောဒေတာအရင်းအမြစ်အတော်လေးရိုးရှင်းတဲ့ရေတွက်အချို့အခြေအနေတွေမှာ, စိတ်ဝင်စားစရာကောင်းနှင့်အရေးကြီးသောသုတေသနပြုဖို့ဦးဆောင်လမ်းပြနိုင်သောတရုတ်အစိုးရ-ပြပွဲ၏ဆိုရှယ်မီဒီယာဆင်ဆာဖြတ်တောက်မှုအပြုအမူ။ နှစ်ဦးစလုံးကိစ္စများတွင်, သို့သော်, သုတေသီကြီးတွေဒေတာအရင်းအမြစ်မှစိတ်ဝင်စားဖို့မေးခွန်းများကိုဆောင်ကြဉ်းခဲ့; သူ့ဟာသူနေဖြင့်ဒေတာများမလုံလောကျခဲ့သညျ။