, ပုံမှန်အားဖြင့်ကျွမ်းကျင်ပညာရှင်များအားဖြင့်ပြုသောအမှုအရာတစ်ခုခုကနိုင်ငံရေးကြေညာစာတမ်း coding, သာ. ကြီးမြတ် reproducibility နှင့်ပြောင်းလွယ်ပြင်လွယ်ရှိရရှိလာတဲ့လူသားတစ်ဦးတွက်ချက်မှုစီမံကိန်းကြောင့်ဖျော်ဖြေနိုင်ပါသည်။
က Galaxy တိရစ္ဆာန်ရုံဆင်တူ, လူမှုရေးသုတေသီများ, code ခွဲခြား, ဒါမှမဟုတ်စာသားပုံရိပ်တစ်ခုသို့မဟုတ်အပိုင်းအစတံဆိပ်ကပ်ချင်ဘယ်မှာအများအပြားအခြေအနေများရှိနေပါသည်။ သုတေသနဒီလိုမျိုးတခုရဲ့ဥပမာကနိုင်ငံရေးကြေညာစာတမ်း၏နိုင်တဲ့ coding ဖြစ်ပါတယ်။ ရွေးကောက်ပွဲများစဉ်အတွင်းနိုင်ငံရေးပါတီများစာတမ်းတွင်၎င်းတို့၏မူဝါဒအားရာထူးဖော်ပြနှင့်အတွေးအခေါ်များလမ်းညွှန်ထုတ်လုပ်ရန်။ ဥပမာအားဖြင့်, ဒီနေရာမှာ 2010 ကနေယူနိုက်တက်ကင်းဒမ်းအတွက်အလုပ်သမားပါတီ၏စာတမ်းတွင်တစ်ဖဲ့ကိုရခြင်းရဲ့:
"ကျွန်တော်တို့ရဲ့ပြည်သူ့ဝန်ဆောင်မှုလုပ်ငန်းများအတွက်အလုပ်လုပ်လူသနျးပေါငျးမိမိတို့အပေါ်ကိုခံရဖို့ရှိသည်မဖြစ်သင့်အန္တရာယ်များမှသူတို့ကိုကာကွယ်စောင့်ရှောက်စဉ်မိမိတို့ကိုယ်ပိုင်ဘဝတွေကို၏ဆုံးအောင်လူတွေလုပ်ပိုင်ခွင့်ပေးရန်ကူညီပေးနေ, ဗြိတိန်၏အကောင်းဆုံးတန်ဖိုးများကိုရုပ်လုံးဖော်ထားတယ်။ ကျနော်တို့စျေးကွက်မျှမျှတတအလုပ်လုပ်အောင်အတွက်အစိုးရ၏အခန်းကဏ္ဍနှင့် ပတ်သက်. ပိုပြီးခက်ခဲတဲ့ရောက်ထားရန်လိုအပ်ပါတယ်သကဲ့သို့ငါတို့သည်လည်းအစိုးရ၏ရဲရင့်ပြုပြင်ပြောင်းလဲရေးသမားဖြစ်ဖို့လိုပါတယ်။ "
ဤရွေ့ကားစာတမ်းတွင်ကနိုင်ငံရေးသိပ္ပံပညာရှင်များ, အထူးသဖြင့်သူတို့အားလေ့လာနေရွေးကောက်ပွဲများနှင့်မူဝါဒဆွေးနွေးငြင်းခုံ၏ဒိုင်းနမစ်များအတွက်တန်ဖိုးရှိတဲ့ဒေတာဆံ့။ စနစ်တကျသည်ဤစာတမ်းတွင်မှသတင်းအချက်အလက် extract ရန်အလို့ငှာ, သုတေသီများ 50 နိုင်ငံများအတွက် 1000 နီးပါးပါတီများအနေဖြင့် 4000 စာတမ်းတွင်စုဆောင်းပြီးတော့စနစ်တကျသူတို့ကို code နိုင်ငံရေးသိပ္ပံပညာရှင်များဖွဲ့စည်းထားသည့်ကြေညာစာတမ်းစီမံကိန်း, ဖန်တီးခဲ့သည်။ တစ်ဦးချင်းစီစာတမ်းတွင်အတွက်တစ်ဦးချင်းစီဝါကျတစ်ဦး 56-အမျိုးအစားအစီအစဉ်ကို အသုံးပြု. ကျွမ်းကျင်သူတစ်ဦးတို့က coded ခဲ့သည်။ ဒီပူးပေါင်းဆောင်ရွက်မှုအားထုတ်မှုရဲ့ရလဒ်ကဤစာတမ်းတွင်အတွက် embedded သတင်းအချက်အလက်များစုစည်းတင်ပြရန်အကြီးအကျယ် Datasets ဖြစ်ပါသည်, ဤ Datasets 200 ကျော်သိပ္ပံနည်းကျစာတမ်းများအတွက်အသုံးပြုခဲ့တာဖြစ်ပါတယ်။
ကက်နက် Benoit နှင့်လုပ်ဖော်ကိုင်ဖက်များက (2016) ယခင်ကကျွမ်းကျင်သူများအားဖြင့်ဖျော်ဖြေခြင်းနှင့်လူသားတစ်ဦးကွန်ပျူတာစီမံကိန်းကိုသို့လှည့်ခဲ့သောစာတမ်းတွင်နိုင်တဲ့ coding တာဝန်ယူရန်ဆုံးဖြတ်ခဲ့သည်။ ရလဒ်အနေနဲ့သူတို့စျေးနှုန်းချိုသာခြင်းနှင့်ပိုမြန်ဖော်ပြခြင်းမပို reproducible နှင့်ပိုပြီးပြောင်းလွယ်ပြင်လွယ်သောနိုင်တဲ့ coding ဖြစ်စဉ်ကိုဖန်တီးခဲ့သည်။
ယူနိုက်တက်ကင်းဒမ်း, Benoit နှင့်လုပ်ဖော်ကိုင်ဘက်ခြောက်မကြာသေးမီရွေးကောက်ပွဲများကာလအတွင်းထုတ်ပေး 18 စာတမ်းတွင်အတူလုပ်ကိုင် (အမေဇုံစက်မှု Turk နှင့် CrowdFlower microtask အလုပ်သမားစျေးကွက်၏ဥပမာများမှာတစ်ဦး microtask လုပ်အားစျေးကွက်ကနေအလုပျသမားမြားနှငျ့ split-လျှောက်ထား-ပေါင်းစပ်နည်းဗျူဟာကိုအသုံးပြု; ထိုကဲ့သို့သောစျေးကွက်အပေါ်ပိုပြီးများအတွက် ) အခန်း 4 ကိုကြည့်ပါ။ အဆိုပါသုတေသီများအသီးအသီးစာတမ်းတွင် ယူ. စာကြောင်းများထဲသို့ခွဲ။ ထို့နောက်ပုဂ္ဂိုလ်တစ်ဦးချင်းစီဝါကျဖို့နိုင်တဲ့ coding အစီအစဉ်လျှောက်လွှာတင်ခဲ့တယ်။ အထူးသဖြင့်, စာဖတ်သူတွေ (လစ်ဘရယ်သို့မဟုတ်ရှေးရိုးစွဲ) လူမှုရေးမူဝါဒ, ဒါမှမဟုတ်မ (ပုံ 5.5) မှ (လက်ဝဲသို့မဟုတ်ညာ) စီးပွားရေးမူဝါဒရည်ညွှန်းအဖြစ်တစ်ဦးချင်းစီဝါကျခွဲခြားဖို့တောင်းခံခဲ့ရသည်။ တစ်ခုချင်းစီကိုဝါကျအကြောင်းကိုငါးခုကွဲပြားခြားနားသောလူများက coded ခဲ့သည်။ နောက်ဆုံးတော့အဲဒီ ratings တစ်ဦးချင်းစီ-အဆင့်သတ်မှတ်သူဆိုးကျိုးများနှင့်အခက်အခဲ-of ဝါကျသက်ရောက်မှုနှစ်ဦးစလုံးအတှကျအမှတ်တဲ့စာရင်းအင်းမော်ဒယ်ကို အသုံးပြု. ပေါင်းစပ်ခဲ့သည်။ အားလုံးအတွက်, Benoit နှင့်လုပ်ဖော်ကိုင်ဘက်များနှင့်ပတ်သက်ပြီး 1500 ကလူကနေ 200,000 ratings စုဆောင်း။
လူအစုအဝေးနိုင်တဲ့ coding ၏အရည်အသွေးအကဲဖြတ်နိုင်ရန်အတွက်, Benoit နှင့်လုပ်ဖော်ကိုင်ဘက်လည်းအလားတူလုပ်ထုံးလုပ်နည်းသုံးပြီးနိုင်ငံရေးသိပ္ပံ-မှုနှုန်း၌တူညီသောစာတမ်းတွင် 10 ကျွမ်းကျင်သူများက-ပါမောက္ခများနှင့်ဘွဲ့ရကျောင်းသားများကိုရှိခဲ့ပါတယ်။ လူအစုအဝေးအဖွဲ့ဝင်များအနေဖြင့် ratings ပညာရှင်တွေရဲ့ထံမှ ratings ထက်ပို variable ကိုကြပေမဲ့, အများသဘောတူညီမှုလူအစုအဝေးအဆင့်သတ်မှတ်ချက်အတွက်သဘောတူညီမှုကျွမ်းကျင်သူအဆင့်သတ်မှတ်ချက် (ပုံ 5.6) နဲ့ထူးခြားတဲ့သဘောတူညီချက်ရှိခဲ့ပါတယ်။ ဒီနှိုင်းယှဉ်က Galaxy တိရစ္ဆာန်ရုံနှင့်ဝသကဲ့သို့, လူ့တွက်ချက်မှုစီမံကိန်းများအရည်အသွေးမြင့်ရလဒ်များကိုထုတ်လုပ်နိုင်သည်, ထိုပြသထားတယ်။
ဒီရလဒ်အပေါ်အဆောက်အအုံ, Benoit နှင့်လုပ်ဖော်ကိုင်ဖက်များကကြေညာစာတမ်း Project မှအသုံးပြုတဲ့ကျွမ်းကျင်သူ-ပြေး coding စနစ်ဖြင့်မဖြစ်နိုင်ခဲ့ကြောင်းသုတေသနလုပ်ဖို့သူတို့ရဲ့လူအစုအဝေး-coding system ကိုအသုံးပြုခဲ့သည်။ တစ်ဦးအဓိကခေါင်းစဉ်မဟုတ်ခဲ့ကြောင့်နိုင်တဲ့ coding အစီအစဉ်အလယ်ပိုင်း 1980 ခုနှစ်ဖွံ့ဖြိုးပြီးသောအခါဥပမာ, ကြေညာစာတမ်းစီမံကိန်းလူဝင်မှုကြီးကြပ်ရေး၏ခေါင်းစဉ်အပေါ်စာတမ်းတွင် code မပေးခဲ့ပါဘူး။ အဆိုပါကြေညာစာတမ်းစီမံကိန်းပြန်သွားပြီးဤအချက်အလက်ဖမ်းယူဖို့သူတို့ရဲ့စာတမ်းတွင် recode ရန်အဘို့အ, ဤအချက်မှာ, ကပို့ဆောင်ထောက်ပံ့ရေးဆိုင်ရာကိစ္စရပ်များ infeasible ဖြစ်ပါတယ်။ ဒါကြောင့်လူဝင်မှုကြီးကြပ်ရေး၏နိုင်ငံရေးကိုလေ့လာနေစိတ်ဝင်စားသုတေသီများကံကောင်းပါစေထဲကဖြစ်ကြောင်းပေါ်လာလိမ့်မယ်။ သို့သော် Benoit နှင့်လုပ်ဖော်ကိုင်ဘက်များကသူတို့သုတေသနပြုဆိုတဲ့မေးခွန်းကို-မြန်မြန်ဆန်ဆန်နဲ့လွယ်လွယ်ကူကူဤနိုင်တဲ့ coding-စိတ်ကြိုက်လုပ်ဖို့သူတို့ရဲ့လူ့ကွန်ပျူတာ system များကိုအသုံးပြုနိုင်ခဲ့ကြတယ်။
လူဝင်မှုကြီးကြပ်ရေးမူဝါဒအလေ့လာဖို့နိုင်ရန်အတွက်သူတို့ဟာယူနိုက်တက်ကင်းဒမ်းအတွက် 2010 အထွေထွေရွေးကောက်ပွဲအတွက်ရှစ်ပါတီများများအတွက်စာတမ်းတွင် coded ။ ဒါကြောင့်ပါလျှင်တစ်ဦးချင်းစီစာတမ်းတွင်အတွက်တစ်ဦးချင်းစီဝါကျကလိုလားတဲ့လူဝင်မှုကြီးကြပ်ရေး, ကြားနေ, ဒါမှမဟုတ်ဆန့်ကျင်လူဝင်မှုကြီးကြပ်ရေးခဲ့သည်ဖြစ်စေ, လူဝင်မှုကြီးကြပ်ရေးနှင့်ဆက်စပ်သောရှိမရှိအဖြစ် coded နှင့်ခံခဲ့ရသည်။ သူတို့စီမံကိန်းစတင် 5 နာရီအတွင်း, ရလဒ်များရှိကြ၏။ သူတို့က $ 360 စုစုပေါင်းကုန်ကျစားရိတ်မှာထက်ပိုမို 22,000 တုံ့ပြန်မှုစုဆောင်းခဲ့သည်။ ထို့ပြင်လူအစုအဝေးအနေဖြင့်ခန့်မှန်းတွက်ချက်မှုကျွမ်းကျင်သူတစ်ဦးအစောပိုင်းကစစ်တမ်းနှင့်အတူထူးခြားတဲ့သဘောတူညီချက်ပြသခဲ့သည်။ ထို့နောက်တစ်တွေနောက်ဆုံးနှုတ်ဆက်ခြင်းစမ်းသပ်မှုအဖြစ်နှစ်လအကြာမှာသုတေသီသူတို့ရဲ့လူအစုအဝေး-coding ပြန်ထုတ်ပေး။ နာရီအနည်းငယ်အတွင်းမှာပဲသူတို့အနီးကပ်၎င်းတို့၏မူလလူအစုအဝေး-coded ဒေတာအစုကိုက်ညီကြောင်းအသစ်တခုလူအစုအဝေး-coded Datasets ဖန်တီးခဲ့ပါတယ်။ တနည်းအားဖြင့်လူ့ကွန်ပျူတာကျွမ်းကျင်သူအကဲဖြတ်နှင့်အတူသဘောတူ reproducible ဖြစ်ခဲ့သည်နိုင်ငံရေးကျမ်း၏နိုင်တဲ့ coding generate သူတို့ကို enabled ။ လူ့ကွန်ပျူတာမြန်ဆန်စျေးပေါသောကြောင့်သူတို့ကိုလူဝင်မှုကြီးကြပ်ရေးနှင့် ပတ်သက်. ၎င်းတို့၏တိကျတဲ့သုတေသနမေးခွန်းဟာသူတို့ရဲ့ဒေတာစုဆောင်းခြင်းကိုစိတ်ကြိုက်ရန်အဘို့အထို့ပြင်, ကလွယ်ကူခဲ့ပါတယ်။