ဤအပိုင်းကိုတစ်ဦးဇာတ်ကြောင်းအဖြစ်ဖတ်ခံရဖို့မဟုတ်ဘဲထက်, တစ်ဦးကိုကိုးကားအဖြစ်အသုံးပြုခံရဖို့ဒီဇိုင်းပြုလုပ်ထားသည်။
ကြောင်းလေ့လာတစ်ခုမှာကြင်နာဤအခနျးတှငျမပါဝင်ဖြစ်ပါတယ် ethnography ဖြစ်ပါတယ်။ ဒစ်ဂျစ်တယ်နေရာများအတွက် ethnography အပေါ်ပိုမိုတွေ့မြင် Boellstorff et al. (2012) နှင့် ethnography အပေါ်ပိုပြီးအဘို့ရောထွေးဒစ်ဂျစ်တယ်နှင့်ရုပ်ပိုင်းဆိုင်ရာနေရာများအတွက်မြင် Lane (2016) ။
သငျသညျဒေတာ repurposing ကြသောအခါ, သင်ကြုံတွေ့ရစေခြင်းငှါဖြစ်နိုင်ချေပြဿနာတွေကိုနားလည်ကူညီပေးနိုင်ပါသည်နှစ်ခုစိတ်ပိုင်းဆိုင်ရာလှည့်ကွက်ရှိပါတယ်။ ပထမဦးစွာ, သင်သည်သင်၏ပြဿနာများအတွက်စံပြ Datasets စိတ်ကူးနှင့်သင်အသုံးပြုနေသောသော Datasets ကိုနှိုင်းယှဉ်ဖို့ကြိုးစားနိုင်ပါ။ သူတို့ဘယ်လိုဆင်တူနှင့်မည်သို့သူတို့ကွဲပြားခြားနားသောရှိပါသလဲ သင်ကိုယ်တိုင်သင့်ဒေတာစုဆောင်းဘဲနေလျှင်, သင်သည်အဘယ်သို့ချင်တယ်နှင့်အဘယ်သို့သင့်ရှိသည်အကြားခြားနားချက်ဖြစ်နိုင်ဖွယ်ရှိပါတယ်။ သို့သော်သင်တို့သည်ဤကွဲပြားခြားနားမှုအသေးစားသို့မဟုတ်အဓိကလျှင်ဆုံးဖြတ်ရန်ရှိသည်။
ဒုတိယအချက်မှာတစ်စုံတစ်ဦးကအချို့သောအကြောင်းပြချက်များအတွက်သင့်ဒေတာဖန်တီးစုဆောင်းသတိရပါ။ သင်သည်သူတို့၏ဆင်ခြင်ခြင်းနားလည်ရန်ကြိုးစားသင့်ပါသည်။ ပြောင်းပြန်-အင်ဂျင်နီယာ၏ဤသို့သောသင်သည်သင်၏ repurposed ဒေတာအတွက်ဖြစ်နိုင်သမျှပြဿနာတွေနဲ့ဘက်လိုက်ခွဲခြားသတ်မှတ်ကူညီပေးနိုင်သည်။
အဲဒီမှာ "ကြီးမားတဲ့ data တွေကို" ၏အဘယ်သူမျှမတစ်ခုတည်းသဘောတူချက်နှင့်အဓိပ္ပါယ်ဖြစ်ပါတယ်, ဒါပေမယ့်အများအပြားအဓိပ္ပာယ် 3 Vs အပေါ်အာရုံစူးစိုက်ဟန်: volume အ, အမျိုးမျိုးနှင့်အလျင် (ဥပမာ, Japec et al. (2015) ) ။ အဲဒီအစားအအချက်အလက်များ၏ဝိသေသလက္ခဏာများအပေါ်အာရုံစူးစိုက်ခြင်းထက်, ငါ့ချက်နှင့်အဓိပ္ပါယ်ပိုဒေတာဖန်တီးခဲ့ဘာကြောင့်အပေါ်အာရုံစိုက်။
ကြီးမားသောအချက်အလက်များ၏အမျိုးအစားအတွင်း၌အစိုးရအုပ်ချုပ်ရေးအချက်အလက်များ၏အကြှနျုပျ၏ပါဝင်နည်းနည်းပုံမှန်မဟုတ်ဖြစ်ပါတယ်။ ဤကိစ္စတွင်လုပ်ကြသူအချို့တို့က, ပါဝင် Legewie (2015) , Connelly et al. (2016) နှင့် Einav and Levin (2014) ။ သုတေသနအတွက်အစိုးရအုပ်ချုပ်ရေးအချက်အလက်များ၏တန်ဖိုးကိုအကြောင်းပိုမိုအဘို့အတွေ့ Card et al. (2010) , Taskforce (2012) နှင့် Grusky, Smeeding, and Snipp (2015) ။
အစိုးရအစာရင်းအင်းစနစ်, အထူးသဖြင့်အမေရိကန်သန်းခေါင်စာရင်းဗျူရိုအတွင်းမှအုပ်ချုပ်ရေးသုတေသနတစ်ဦးအမြင်သည်အတွေ့ Jarmin and O'Hara (2016) ။ စာရင်းအင်းဆွီဒင်နိုင်ငံမှာအုပ်ချုပ်ရေးမှတ်တမ်းများသုတေသနစာအုပ်အရှည်ကုသမှုများအတွက်တွေ့ Wallgren and Wallgren (2007) ။
အခန်း၌ငါသည်အကျဉ်းချုပ်ထိုကဲ့သို့သောတွစ်တာကဲ့သို့သောလူမှုရေးမီဒီယာဒေတာအရင်းအမြစ်တို့အားဤသို့သောအထွေထွေလူမှုစစ်တမ်း (GSS) တို့ကဲ့သို့သောရိုးရာစစ်တမ်းနဲ့နှိုင်းယှဉ်။ အစဉ်အလာစစ်တမ်းများနှင့်လူမှုရေးမီဒီယာဒေတာများအကြားတစ်ဦးနှံ့နှံ့စပ်စပ်နဲ့သတိထားနှိုင်းယှဉ်လျှင်အဘို့, မြင် Schober et al. (2016) ။
ကြီးမားသောအချက်အလက်များ၏အဆိုပါ 10 ဝိသေသလက္ခဏာများကွဲပြားခြားနားသောစာရေးဆရာများအမျိုးမျိုးအားဖြင့်ကွဲပြားခြားနားတဲ့နည်းလမ်းတွေအမျိုးမျိုးမှာဖော်ပြထားတဲ့ကြပြီ။ အဆိုပါကိစ္စရပ်များကိုပေါ်မှာငါ့စဉ်းစားတွေးခေါ်လွှမ်းမိုးမှုကြောင့်အရေးအသားပါဝင်: Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , Lewis (2015) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) နှင့် Goldstone and Lupyan (2016) ။
ဒီအခန်းမှာတစ်လျှောက်လုံးကျွန်မအတော်လေးကြားနေသည်ထင်သောသက်တမ်းဒစ်ဂျစ်တယ်ခြေရာတွေသုံးပါဘူး။ ဒစ်ဂျစ်တယ်သဲလွန်စတွေကိုရှင်းလင်းဘို့နောက်ထပ်လူကြိုက်များသက်တမ်းဒစ်ဂျစ်တယ်ခြေရာများသည် (Golder and Macy 2014) , ဒါပေမယ့် Hal Abelson, Ken Ledeen နှင့်ဟယ်ရီ Lewis ကအဖြစ် (2008) ထုတ်ထောက်ပြ, တစ်ဦးထက်ပိုသောသင့်လျော်သည့်သက်တမ်းဖြစ်နိုင်ဒစ်ဂျစ်တယ်လက်ဗွေရာဖြစ်ပါတယ်။ သငျသညျခြေရာများဖန်တီးတဲ့အခါ, သငျသညျအဘယ်အရာဖြစ်ပျက်သတိပြုမိကြသည်နှင့်သင်၏ခြေရာယေဘုယျအားဖြင့်ပုဂ္ဂိုလ်ရေးအရသင်တို့ဆီသို့ခြေရာခံလို့မရပါ။ အလားတူသင့်ရဲ့ဒစ်ဂျစ်တယ်သဲလွန်စတွေကိုရှင်းလင်းဘို့စစ်မှန်တဲ့မဟုတ်ပါဘူး။ တကယ်တော့သင်ခြေရာတွေကိုသင်အနည်းငယ်သာအသိပညာရှိသည်သောအကြောင်းလူအပေါင်းတို့သည်အချိန်ထွက်ခွာကြသည်။ ဤအခြေရာတွေသူတို့အပေါ်မှာသင့်ရဲ့နာမကိုရှိသည်မဟုတ်ကြဘူးပေမဲ့, ထိုသူတို့ကမကြာခဏသင်ပြန်နှင့်ဆက်စပ်နိုင်ပါတယ်။ မမြင်ရတဲ့နှင့်ပုဂ္ဂိုလ်ရေးအရဖော်ထုတ်: တစ်နည်း, သူတို့ကပိုလက်ဗွေရာကဲ့သို့ဖြစ်ကြ၏။
ကြီးမားသော
ပြဿနာစာရင်းအင်းစမ်းသပ်မှုတွေဆပ်ဘာကြောင့်ကြီးမားတဲ့ဒေတာအစု, အပေါ်ပိုမိုတွေ့ Lin, Lucas, and Shmueli (2013) နှင့် McFarland and McFarland (2015) ။ အဆိုပါကိစ္စရပ်များကိုလက်တွေ့ကျတဲ့အရေးပါမှုကိုအစားထက်စာရင်းအင်းအရေးပါမှုကိုအာရုံစိုက်ဖို့သုတေသီများဦးဆောင်သင့်ပါတယ်။
အမြဲတမ်း-On
အမြဲ-အပေါ်စဉ်းစားတဲ့အခါမှာဒေတာ, ဒါကြောင့်သင်အချိန်ကျော်အတိအကျတူညီလူတွေကိုနှိုင်းယှဉ်ကြသည်ဖြစ်စေဒါမှမဟုတ်သင်ကလူအချို့ကိုပြောင်းလဲအုပ်စုနှိုင်းယှဉ်ကြသည်ရှိမရှိထည့်သွင်းစဉ်းစားရန်အရေးကြီးပါသည်, ဥပမာအားတွေ့မြင် Diaz et al. (2016) ။
non-reactive
Non-reactive အစီအမံအပေါ်တစ်ဦးဂန္စာအုပ်ဖြစ်ပါတယ် Webb et al. (1966) ။ အဆိုပါစာအုပ်ကို pre-date ဖြစ်အောင်အတွက်ဥပမာဒစ်ဂျစ်တယ်အသက်အရွယ်, ဒါပေမဲ့သူတို့နေဆဲ illuminating ကြသည်။ သောကွောငျ့အစုလိုက်အပြုံလိုက်စောင့်ကြည့်၏ရှေ့မှောက်တွင်မိမိတို့အပြုအမူကိုပြောင်းလဲလူမျိုး၏ဥပမာသည်အတွေ့ Penney (2016) နှင့် Brayne (2014) ။
မစုံလင်သော
စံချိန်ချိတ်ဆက်အပေါ်ပိုမိုတွေ့ Dunn (1946) နှင့် Fellegi and Sunter (1969) (သမိုင်းဆိုင်ရာ) နှင့် Larsen and Winkler (2014) (ခေတ်သစ်) ။ ချဉ်းကပ်ဗမာတွင်ပုံစံတူလည်းထောက်လှမ်းပွား, ထိုကဲ့သို့သောဒေတာ deduplication, ဥပမာအားဖြင့်ဖော်ထုတ်ခြင်း, နာမည်ကိုက်ညီခြင်းအဖြစ်အမည်များအောက်မှာကွန်ပျူတာသိပ္ပံမှာဖွံ့ဖြိုးပြီးနှင့်စံချိန်ထောက်လှမ်းပွားခဲ့ကြ (Elmagarmid, Ipeirotis, and Verykios 2007) ။ ပုဂ္ဂိုလ်ရေးအရသတင်းအချက်အလက်ဖော်ထုတ်၏ထုတ်လွှင့်မလိုအပ်ပါဘူးသောစံချိန်ချိတ်ဆက်ဖို့ချဉ်းကပ်မှုထိန်းသိမ်းစောင့်ရှောက် privacy ကိုလည်းရှိပါတယ် (Schnell 2013) ။ Facebook ကစတဲ့အမူအကျင့်မဲပေး၎င်းတို့၏မှတ်တမ်းများလင့်ထားသည်မှဆက်လက်ဆောင်ရွက်ဖွံ့ဖြိုးပြီ ငါအခန်း 4 မှာအကြောင်းကိုသင်ပြောပြလိမ့်မယ်ကြောင်းစမ်းသပ်မှုတစ်ခုအကဲဖြတ်ရန်ပြုခဲ့သည် (Bond et al. 2012; Jones et al. 2013) ။
Construction တရားဝင်မှုအပေါ်ပိုမိုတွေ့ Shadish, Cook, and Campbell (2001) , အခန်း 3 ။
မရရှိနိုင်သော
အ AOL ရှာဖွေရေးမှတ်တမ်း debacle အပေါ်ပိုမိုတွေ့ Ohm (2010) ။ ငါစမ်းသပ်ချက်ဖော်ပြရန်လာသောအခါအခန်း 4 မှာကုမ္ပဏီများနှင့်အစိုးရများနှင့်တွဲဖက်လုပ်ငန်းနှင့် ပတ်သက်. အကွံဉာဏျပူဇျော။ စာရေးဆရာတစ်အရေအတွက်တပိုင်တနိုင်ဒေတာအပေါ်မှီခိုကြောင်းသုတေသနပြုမှုနှင့် ပတ်သက်. စိုးရိမ်ပူပန်မှုများတွေ့ထုတ်ဖော်ပြောဆိုခဲ့ကြ Huberman (2012) နှင့် boyd and Crawford (2012) ။
တက္ကသိုလ်သုတေသီတွေက data ကို access ကိုဆည်းပူးရန်အဘို့အတစ်ခုမှာကောင်းသောလမ်းတစ်အလုပ်သင်ဆရာဝန်သို့မဟုတ်လာရောက်လည်ပတ်သုတေသီအဖြစ်ကုမ္ပဏီတစ်ခုမှာအလုပ်လုပ်ကိုင်ဖို့ဖြစ်ပါတယ်။ ဒေတာ access ကို enable လုပ်ထားခြင်းအပြင်, ဤဖြစ်စဉ်ကိုလည်းဆန်းစစ်ဘို့အရေးကြီးပါတယ်တည်းဟူသော, သုတေသီ data ကိုဖန်တီးခဲ့ပုံကိုအကြောင်းပိုမိုလေ့လာသင်ယူကူညီပေးပါမည်။
non-ကိုယ်စားလှယ်
non-ကိုယ်စားပြုမှုတစ်ခုလုံးလူဦးရေ၏ ပတ်သက်. ထုတ်ပြန်ချက်များလုပ်လိုသူသုတေသီများနှင့်အစိုးရများအဘို့ဟာအဓိကပြဿနာဖြစ်ပါတယ်။ ဤသည်ပုံမှန်အားဖြင့်သူတို့ရဲ့သုံးစွဲသူတွေကိုအာရုံစိုက်ကြသည်ကုမ္ပဏီများအတွက်စိုးရိမ်စရာလျော့နည်းသည်။ စာရင်းအင်းနယ်သာလန်စီးပွားရေးသည် non-ကိုယ်စားပြုမှုကြီးမားသောအချက်အလက်များ၏ပြဿနာစဉ်းစားပုံကိုအပေါ်ပိုမိုတွေ့ Buelens et al. (2014) ။
အခန်း 3 မှာကျွန်မအများကြီးကြီးမြတ်အသေးစိတ်နမူနာများနှင့်ခန့်မှန်းချက်ကိုဖော်ပြရန်ပါလိမ့်မယ်။ ဒေတာမဟုတ်တဲ့ကိုယ်စားလှယ်များမှာရင်တောင်အချို့သောအခြေအနေများအောက်တွင်သူတို့ကောင်းသောခန့်မှန်းချက်ထုတ်လုပ်ရန်တွက်ချက်နိုင်ပါတယ်။
မျော
System ကိုပျံ့ပြင်ပကနေကြည့်ရှုရန်အလွန်ခဲယဉ်းသည်။ သို့သော်, (ပိုပြီးအခန်း 4 မှာဆွေးနွေးကြသည်) ကို MovieLens စီမံကိန်းကိုတစ်ဦးပညာသင်နှစ်သုတေသနလုပ်ငန်းအဖွဲ့ကထက်ပိုမို 15 နှစ်ကို run သိရသည်။ ထို့ကြောင့်သူတို့စနစ်အချိန်ကျော်ပြောင်းလဲခဲ့သည်နှင့်မည်သို့ဒီခွဲခြမ်းစိတ်ဖြာ impact အံ့သောငှါအလမ်းနှင့် ပတ်သက်. သတင်းအချက်အလက်များမှတ်တမ်းပြုစုခြင်းနှင့်မျှဝေခဲ့ကြ (Harper and Konstan 2015) ။
ပညာရှင်တစ်ဦးကအရေအတွက်တွစ်တာထဲမှာပျံ့အပေါ်အာရုံစူးစိုက်ကြပြီ Liu, Kliman-Silver, and Mislove (2014) နှင့် Tufekci (2014) ။
algorithm သည်ရှက်ကြောက်
ငါပထမဦးဆုံးသက်တမ်းတစ်ဆွေးနွေးချက်ထဲမှာ Jon Kleinberg အသုံးပြုသော "Algorithm ကိုရှက်ကြောက်" ငါကြား၏။ Performance နောက်ကွယ်မှအဓိကစိတ်ကူးအချို့သောလူမှုရေးသိပ္ပံပညာသီအိုရီ "အင်ဂျင်မဟုတ်ကင်မရာများ" ဖြစ်ပါတယ် (Mackenzie 2008) ။ ဒါကသူတို့ကတကယ်တော့ကမ္ဘာ့အပုံဖော်မယ့်အစားကိုယ့်ကြောင့်ဖမ်းသည်။
ညစ်သော
အစိုးရမဟုတ်သောစာရင်းအင်းအေဂျင်စီများ။ ဒေတာသန့်ရှင်းရေး, စာရင်းအင်းဒေတာတည်းဖြတ်တာမခေါ် De Waal, Puts, and Daas (2014) စစ်တမ်းဒေတာအတွက်ဖွံ့ဖြိုးပြီးစာရင်းအင်းဒေတာတည်းဖြတ်ရေးနည်းပညာတွေကိုဖော်ပြရန်နှင့်သူတို့ကြီးမားတဲ့ data တွေကိုသတင်းရပ်ကွက်များနှင့်သက်ဆိုင်နေသောအတိုင်းအတာအထိဆနျးစစျ Puts, Daas, and Waal (2015) တစ်ဦးထက်ပိုယေဘုယျပရိသတ်ကိုများအတွက်တူညီသောစိတ်ကူးများအချို့ကိုတင်ပြသွားပါသည်။
တွစ်တာထဲမှာ spam များကိုအာရုံစိုက်လေ့လာမှုများအချို့ကိုဥပမာအဘို့, Clark et al. (2016) နှင့် Chu et al. (2012) ။ နောက်ဆုံးအနေနဲ့ Subrahmanian et al. (2016) အ DARPA က Twitter ကိုအောက်ခြေစိနျချေါမှု၏ရလဒ်များဖော်ပြသည်။
အထိခိုက်မခံ
Ohm (2015) အထိခိုက်မခံအချက်အလက်များ၏အယူအဆကိုအပေါ်အစောပိုင်းကသုတေသနလုပ်ငန်းသုံးသပ်ပြီးနှင့် multi-အချက်တစ်ချက်စမ်းသပ်ပေးထားပါတယ်။ သူအဆိုတင်သွင်းလေးပါးအချက်များနေသောခေါင်းစဉ်: ထိခိုက်မှု၏ဖြစ်နိုင်ခြေ; ထိခိုက်မှု၏ဖြစ်နိုင်ခြေ; လျှို့ဝှက်ဆက်ဆံရေးအထံ; နှင့်ဖြစ်စေအန္တရာယ်အများစုစိုးရိမ်ပူပန်မှုများရောင်ပြန်ဟပ်။
New York မှာတက္ကစီ၏ Farber ရဲ့လေ့လာချက်ကအစောပိုင်းကလေ့လာမှုအပေါ်အခြေခံခဲ့ Camerer et al. (1997) အချိန်, အဆုံးအချိန်နှင့်ခစတင်ခရီးစဉ်မှတ်တမ်းတင်ဖို့ drivers တွေကိုအသုံးပြုတဲ့စက္ကူခရီးစဉ်စာရွက်များ-စက္ကူပုံစံသုံးမျိုးကွဲပြားခြားနားသောအဆင်ပြေစေရန်နမူနာအသုံးပြုခဲ့တဲ့။ သူတို့လျော့နည်းအလုပ်လုပ်ခဲ့၎င်းတို့၏လုပ်ခလစာမြင့်မားခဲ့ကြဘယ်မှာရက်: ဒီအစောပိုင်းကလေ့လာမှု drivers တွေကိုပစ်မှတ််ငွေရရှိသူတွေဖြစ်ပုံရကြောင်းတွေ့ရှိခဲ့ပါတယ်။
Kossinets and Watts (2009) လူမှုရေးကွန်ရက်မှာ homophily ၏ဇစ်မြစ်အပေါ်အာရုံစူးစိုက်ခဲ့သည်။ ကြည့်ရှုပါ Wimmer and Lewis (2010) ကို Facebook မှဒေတာများကိုအသုံးပြုရသောတူညီတဲ့ပြဿနာမှတစ်ဦးကွဲပြားခြားနားချဉ်းကပ်သည်။
နောက်ဆက်တွဲအလုပ်များတွင်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကနောက်ထပ်တရုတ်တွင်အွန်လိုင်းဆင်ဆာဖြတ်တောက်မှုစူးစမ်းကြပါပြီ (King, Pan, and Roberts 2014; King, Pan, and Roberts 2016) ။ တရုတ်နိုင်ငံတွင်အွန်လိုင်းဆင်ဆာဖြတ်တောက်မှုကိုတိုင်းတာတဲ့ဆက်စပ်ချဉ်းကပ်ဘို့အတွေ့ Bamman, O'Connor, and Smith (2012) ။ မှာအသုံးပြုတဲ့တတူစာရင်းအင်းနည်းလမ်းများအပေါ်ပိုမို King, Pan, and Roberts (2013) 11 သန်းရေးသားချက်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်တွေ့ Hopkins and King (2010) ။ ကြီးကြပ်သင်ယူမှုအပေါ်မှာပိုပြီးအဘို့အတွေ့ James et al. (2013) (လျော့နည်းနည်းပညာပိုင်းဆိုင်ရာ) နှင့် Hastie, Tibshirani, and Friedman (2009) (ပိုနည်းပညာပိုင်းဆိုင်ရာ) ။
ကြိုတင်ခန့်မှန်းစက်မှုဇုန်ဒေတာသိပ္ပံပညာ၏ကြီးမားသောအစိတ်အပိုင်းတစ်ခုဖြစ်ပါသည် (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) ။ သာမန်လူမှုရေးသုတေသီများကပြုသောအမှုကြောင့်ကြိုတင်ခန့်မှန်းတစ်ခုမှာအမျိုးအစားဥပမာလူဦးရေဆိုင်ရာကြိုတင်ခန့်မှန်းဖြစ်ကြ၏ Raftery et al. (2012) ။
Google ကတုပ်ကွေး Trends တုပ်ကွေးရောဂါပျံ့နှံ့ nowcast မှရှာဖွေရေးဒေတာသုံးစွဲဖို့ပထမဦးဆုံးစီမံကိန်းကမဟုတ်ခဲ့ပေ။ တကယ်တော့, United States မှာသုတေသီများ (Polgreen et al. 2008; Ginsberg et al. 2009) နှင့်ဆွီဒင်နိုင်ငံ (Hulth, Rydevik, and Linde 2009) အချို့သောရှာဖွေရေးဝေါဟာရများကြောင်းတွေ့ပြီ (ဥပမာ, "တုပ်ကွေး") အမျိုးသားရေးပြည်သူ့ကျန်းမာရေးစောင့်ကြည့်ခန့်မှန်း ဒါကြောင့်ပြန်လွတ်လာခင်ဒေတာ။ နောက်ပိုင်းတွင်အများကြီးအခြားစီမံကိန်းများမြင်, ရောဂါစောင့်ကြည့်ထောက်လှမ်းဘို့ဒစ်ဂျစ်တယ်သဲလွန်စဒေတာသုံးစွဲဖို့ကြိုးစားခဲ့ကြ Althouse et al. (2015) ပြန်လည်သုံးသပ်သည်။
ကနျြးမာရေးရလဒ်များခန့်မှန်းဖို့ဒစ်ဂျစ်တယ်သဲလွန်စဒေတာအသုံးပြုခြင်းအပြင်ကိုလည်းရွေးကောက်ပွဲရလဒ်များခန့်မှန်းရန် Twitter ကိုဒေတာကို အသုံးပြု. အလုပ်၏ကြီးမားသောငွေပမာဏရှိခဲ့; ပြန်လည်သုံးသပ်ခြင်းဘို့မြင် Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (Ch ။ 7), နှင့် Huberty (2015) ။
တုပ်ကွေးရောဂါပျံ့နှံ့မှုခန့်မှန်းခြင်းနှင့်ရွေးကောက်ပွဲများကိုကမ္ဘာ့အဖြစ်အပျက်အချို့ကိုမျိုးကိုကြိုတင်ခန့်မှန်းဖို့ဒစ်ဂျစ်တယ်သဲလွန်စအချို့ကိုမျိုးကိုသုံးပြီးနှစ်ယောက်စလုံးဥပမာကြိုတင်ခန့်မှန်းဖို့ Twitter ကိုဒေတာသုံးရှာဖွေရေးဒေတာကိုသုံးနိုင်သည်။ အဲဒီမှာဒီယေဘုယျဖွဲ့စည်းပုံရှိသည်သောလေ့လာမှုတစ်ခုကြီးမားအရေအတွက်။ စားပွဲတင် 2.5 အနည်းငယ်အခြားဥပမာများပါဝင်သည်။
ဒစ်ဂျစ်တယ်သဲလွန်စ | အကျိုး | ဆင့်ခေါ်ချက် |
---|---|---|
တွစ်တာ | US မှာရုပ်ရှင်၏ box office ဝင်ငွေ | Asur and Huberman (2010) |
ရှာရန်သစ်လုံး | US မှာရုပ်ရှင်, ဂီတ, စာအုပ်တွေနဲ့ဗီဒီယိုဂိမ်း၏အရောင်း | Goel et al. (2010) |
တွစ်တာ | Dow Jones စက်မှုပျှမ်းမျှ (အမေရိကန်စတော့ရှယ်ယာဈေးကွက်) | Bollen, Mao, and Zeng (2011) |
အဆိုပါဂျာနယ်သည် PS နိုင်ငံရေးသိပ္ပံကြီးမားတဲ့ဒေတာ, ကြောင်းကျိုးဆက်စပ်အခြနှင့်တရားဝင်သီအိုရီအပေါ်တစ်ဦးစာတမ်းဖတ်ပွဲခဲ့, နှင့် Clark and Golder (2015) တစ်ဦးချင်းစီအလှူငွေအကျဉ်း။ အမေရိကတိုက်၏အမေရိကန်ပြည်ထောင်စု၏သိပ္ပံအမျိုးသားအကယ်ဒမီ၏ဂျာနယ်တရားစွဲဆိုထားကြောင်းကျိုးဆက်စပ်အခြနှင့်ကြီးမားသောဒေတာအပေါ်တစ်ဦးစာတမ်းဖတ်ပွဲခဲ့, နှင့် Shiffrin (2016) တစ်ဦးချင်းစီအလှူငွေအကျဉ်း။
သဘာဝကစမ်းသပ်ချက်၏စည်းကမ်းချက်များ၌, Dunning (2012) အကောင်းဆုံးစာအုပ်အရှည်ကုသပေးပါသည်။ သဘာဝစမ်းသပ်မှုအဖြစ်ဗီယက်နမ်မူကြမ်းထီကို အသုံးပြု. အပေါ်ပိုမိုတွေ့ Berinsky and Chatfield (2015) ။ ကြီးမားတဲ့ data တွေကိုသတင်းရပ်ကွက်၏အတွင်းပိုင်းကသဘာဝစမ်းသပ်ချက်အလိုအလျှောက်ရှာဖွေတွေ့ရှိရန်ကြိုးစားကြောင်းစက်သင်ယူမှုချဉ်းကပ်ဘို့အတွေ့ Jensen et al. (2008) နှင့် Sharma, Hofman, and Watts (2015) ။
ကိုက်ညီခြင်း၏စည်းကမ်းချက်များ၌တစ်ဦးအကောင်းမြင်ပြန်လည်သုံးသပ်တွေ့ Stuart (2010) နှင့်အဆိုးမြင်ပြန်သုံးသပ်ကြည့်ရှု Sekhon (2009) ။ တံစဉ်များကိုတစ်ဦးကြင်ကြင်နာနာအဖြစ်ကိုက်ညီတဲ့အပေါ်ပိုမိုတွေ့ Ho et al. (2007) ။ ကိုက်ညီခြင်း၏မြတ်သောကုသမှုပေးသောစာအုပ်များသည်ကိုတွေ့ Rosenbaum (2002) , Rosenbaum (2009) , Morgan and Winship (2014) နှင့် Imbens and Rubin (2015) ။