နောက်ထပ်မှတ်ချက်ပြု

ဤအပိုင်းကိုတစ်ဦးဇာတ်ကြောင်းအဖြစ်ဖတ်ခံရဖို့မဟုတ်ဘဲထက်, တစ်ဦးကိုကိုးကားအဖြစ်အသုံးပြုခံရဖို့ဒီဇိုင်းပြုလုပ်ထားသည်။

  • နိဒါန်း (ပုဒ်မ 2.1)

ကြောင်းလေ့လာတစ်ခုမှာကြင်နာဤအခနျးတှငျမပါဝင်ဖြစ်ပါတယ် ethnography ဖြစ်ပါတယ်။ ဒစ်ဂျစ်တယ်နေရာများအတွက် ethnography အပေါ်ပိုမိုတွေ့မြင် Boellstorff et al. (2012) နှင့် ethnography အပေါ်ပိုပြီးအဘို့ရောထွေးဒစ်ဂျစ်တယ်နှင့်ရုပ်ပိုင်းဆိုင်ရာနေရာများအတွက်မြင် Lane (2016)

  • ကြီးမားတဲ့ဒေတာ (ပုဒ်မ 2.2)

သငျသညျဒေတာ repurposing ကြသောအခါ, သင်ကြုံတွေ့ရစေခြင်းငှါဖြစ်နိုင်ချေပြဿနာတွေကိုနားလည်ကူညီပေးနိုင်ပါသည်နှစ်ခုစိတ်ပိုင်းဆိုင်ရာလှည့်ကွက်ရှိပါတယ်။ ပထမဦးစွာ, သင်သည်သင်၏ပြဿနာများအတွက်စံပြ Datasets စိတ်ကူးနှင့်သင်အသုံးပြုနေသောသော Datasets ကိုနှိုင်းယှဉ်ဖို့ကြိုးစားနိုင်ပါ။ သူတို့ဘယ်လိုဆင်တူနှင့်မည်သို့သူတို့ကွဲပြားခြားနားသောရှိပါသလဲ သင်ကိုယ်တိုင်သင့်ဒေတာစုဆောင်းဘဲနေလျှင်, သင်သည်အဘယ်သို့ချင်တယ်နှင့်အဘယ်သို့သင့်ရှိသည်အကြားခြားနားချက်ဖြစ်နိုင်ဖွယ်ရှိပါတယ်။ သို့သော်သင်တို့သည်ဤကွဲပြားခြားနားမှုအသေးစားသို့မဟုတ်အဓိကလျှင်ဆုံးဖြတ်ရန်ရှိသည်။

ဒုတိယအချက်မှာတစ်စုံတစ်ဦးကအချို့သောအကြောင်းပြချက်များအတွက်သင့်ဒေတာဖန်တီးစုဆောင်းသတိရပါ။ သင်သည်သူတို့၏ဆင်ခြင်ခြင်းနာ​​းလည်ရန်ကြိုးစားသင့်ပါသည်။ ပြောင်းပြန်-အင်ဂျင်နီယာ၏ဤသို့သောသင်သည်သင်၏ repurposed ဒေတာအတွက်ဖြစ်နိုင်သမျှပြဿနာတွေနဲ့ဘက်လိုက်ခွဲခြားသတ်မှတ်ကူညီပေးနိုင်သည်။

အဲဒီမှာ "ကြီးမားတဲ့ data တွေကို" ၏အဘယ်သူမျှမတစ်ခုတည်းသဘောတူချက်နှင့်အဓိပ္ပါယ်ဖြစ်ပါတယ်, ဒါပေမယ့်အများအပြားအဓိပ္ပာယ် 3 Vs အပေါ်အာရုံစူးစိုက်ဟန်: volume အ, အမျိုးမျိုးနှင့်အလျင် (ဥပမာ, Japec et al. (2015) ) ။ အဲဒီအစားအအချက်အလက်များ၏ဝိသေသလက္ခဏာများအပေါ်အာရုံစူးစိုက်ခြင်းထက်, ငါ့ချက်နှင့်အဓိပ္ပါယ်ပိုဒေတာဖန်တီးခဲ့ဘာကြောင့်အပေါ်အာရုံစိုက်။

ကြီးမားသောအချက်အလက်များ၏အမျိုးအစားအတွင်း၌အစိုးရအုပ်ချုပ်ရေးအချက်အလက်များ၏အကြှနျုပျ၏ပါဝင်နည်းနည်းပုံမှန်မဟုတ်ဖြစ်ပါတယ်။ ဤကိစ္စတွင်လုပ်ကြသူအချို့တို့က, ပါဝင် Legewie (2015) , Connelly et al. (2016) နှင့် Einav and Levin (2014) ။ သုတေသနအတွက်အစိုးရအုပ်ချုပ်ရေးအချက်အလက်များ၏တန်ဖိုးကိုအကြောင်းပိုမိုအဘို့အတွေ့ Card et al. (2010) , Taskforce (2012) နှင့် Grusky, Smeeding, and Snipp (2015)

အစိုးရအစာရင်းအင်းစနစ်, အထူးသဖြင့်အမေရိကန်သန်းခေါင်စာရင်းဗျူရိုအတွင်းမှအုပ်ချုပ်ရေးသုတေသနတစ်ဦးအမြင်သည်အတွေ့ Jarmin and O'Hara (2016) ။ စာရင်းအင်းဆွီဒင်နိုင်ငံမှာအုပ်ချုပ်ရေးမှတ်တမ်းများသုတေသနစာအုပ်အရှည်ကုသမှုများအတွက်တွေ့ Wallgren and Wallgren (2007)

အခန်း၌ငါသည်အကျဉ်းချုပ်ထိုကဲ့သို့သောတွစ်တာကဲ့သို့သောလူမှုရေးမီဒီယာဒေတာအရင်းအမြစ်တို့အားဤသို့သောအထွေထွေလူမှုစစ်တမ်း (GSS) တို့ကဲ့သို့သောရိုးရာစစ်တမ်းနဲ့နှိုင်းယှဉ်။ အစဉ်အလာစစ်တမ်းများနှင့်လူမှုရေးမီဒီယာဒေတာများအကြားတစ်ဦးနှံ့နှံ့စပ်စပ်နဲ့သတိထားနှိုင်းယှဉ်လျှင်အဘို့, မြင် Schober et al. (2016)

  • ကြီးမားသောအချက်အလက်များ၏အဖြစ်များသည့်ဝိသေသလက္ခဏာများ (ပုဒ်မ 2.3)

ကြီးမားသောအချက်အလက်များ၏အဆိုပါ 10 ဝိသေသလက္ခဏာများကွဲပြားခြားနားသောစာရေးဆရာများအမျိုးမျိုးအားဖြင့်ကွဲပြားခြားနားတဲ့နည်းလမ်းတွေအမျိုးမျိုးမှာဖော်ပြထားတဲ့ကြပြီ။ အဆိုပါကိစ္စရပ်များကိုပေါ်မှာငါ့စဉ်းစားတွေးခေါ်လွှမ်းမိုးမှုကြောင့်အရေးအသားပါဝင်: Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , Lewis (2015) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) နှင့် Goldstone and Lupyan (2016)

ဒီအခန်းမှာတစ်လျှောက်လုံးကျွန်မအတော်လေးကြားနေသည်ထင်သောသက်တမ်းဒစ်ဂျစ်တယ်ခြေရာတွေသုံးပါဘူး။ ဒစ်ဂျစ်တယ်သဲလွန်စတွေကိုရှင်းလင်းဘို့နောက်ထပ်လူကြိုက်များသက်တမ်းဒစ်ဂျစ်တယ်ခြေရာများသည် (Golder and Macy 2014) , ဒါပေမယ့် Hal Abelson, Ken Ledeen နှင့်ဟယ်ရီ Lewis ကအဖြစ် (2008) ထုတ်ထောက်ပြ, တစ်ဦးထက်ပိုသောသင့်လျော်သည့်သက်တမ်းဖြစ်နိုင်ဒစ်ဂျစ်တယ်လက်ဗွေရာဖြစ်ပါတယ်။ သငျသညျခြေရာများဖန်တီးတဲ့အခါ, သငျသညျအဘယ်အရာဖြစ်ပျက်သတိပြုမိကြသည်နှင့်သင်၏ခြေရာယေဘုယျအားဖြင့်ပုဂ္ဂိုလ်ရေးအရသင်တ​​ို့ဆီသို့ခြေရာခံလို့မရပါ။ အလားတူသင့်ရဲ့ဒစ်ဂျစ်တယ်သဲလွန်စတွေကိုရှင်းလင်းဘို့စစ်မှန်တဲ့မဟုတ်ပါဘူး။ တကယ်တော့သင်ခြေရာတွေကိုသင်အနည်းငယ်သာအသိပညာရှိသည်သောအကြောင်းလူအပေါင်းတို့သည်အချိန်ထွက်ခွာကြသည်။ ဤအခြေရာတွေသူတို့အပေါ်မှာသင့်ရဲ့နာမကိုရှိသည်မဟုတ်ကြဘူးပေမဲ့, ထိုသူတို့ကမကြာခဏသင်ပြန်နှင့်ဆက်စပ်နိုင်ပါတယ်။ မမြင်ရတဲ့နှင့်ပုဂ္ဂိုလ်ရေးအရဖော်ထုတ်: တစ်နည်း, သူတို့ကပိုလက်ဗွေရာကဲ့သို့ဖြစ်ကြ၏။

ကြီးမားသော

ပြဿနာစာရင်းအင်းစမ်းသပ်မှုတွေဆပ်ဘာကြောင့်ကြီးမားတဲ့ဒေတာအစု, အပေါ်ပိုမိုတွေ့ Lin, Lucas, and Shmueli (2013) နှင့် McFarland and McFarland (2015) ။ အဆိုပါကိစ္စရပ်များကိုလက်တွေ့ကျတဲ့အရေးပါမှုကိုအစားထက်စာရင်းအင်းအရေးပါမှုကိုအာရုံစိုက်ဖို့သုတေသီများဦးဆောင်သင့်ပါတယ်။

အမြဲတမ်း-On

အမြဲ-အပေါ်စဉ်းစားတဲ့အခါမှာဒေတာ, ဒါကြောင့်သင်အချိန်ကျော်အတိအကျတူညီလူတွေကိုနှိုင်းယှဉ်ကြသည်ဖြစ်စေဒါမှမဟုတ်သင်ကလူအချို့ကိုပြောင်းလဲအုပ်စုနှိုင်းယှဉ်ကြသည်ရှိမရှိထည့်သွင်းစဉ်းစားရန်အရေးကြီးပါသည်, ဥပမာအားတွေ့မြင် Diaz et al. (2016)

non-reactive

Non-reactive အစီအမံအပေါ်တစ်ဦးဂန္စာအုပ်ဖြစ်ပါတယ် Webb et al. (1966) ။ အဆိုပါစာအုပ်ကို pre-date ဖြစ်အောင်အတွက်ဥပမာဒစ်ဂျစ်တယ်အသက်အရွယ်, ဒါပေမဲ့သူတို့နေဆဲ illuminating ကြသည်။ သောကွောငျ့အစုလိုက်အပြုံလိုက်စောင့်ကြည့်၏ရှေ့မှောက်တွင်မိမိတို့အပြုအမူကိုပြောင်းလဲလူမျိုး၏ဥပမာသည်အတွေ့ Penney (2016) နှင့် Brayne (2014)

မစုံလင်သော

စံချိန်ချိတ်ဆက်အပေါ်ပိုမိုတွေ့ Dunn (1946) နှင့် Fellegi and Sunter (1969) (သမိုင်းဆိုင်ရာ) နှင့် Larsen and Winkler (2014) (ခေတ်သစ်) ။ ချဉ်းကပ်ဗမာတွင်ပုံစံတူလည်းထောက်လှမ်းပွား, ထိုကဲ့သို့သောဒေတာ deduplication, ဥပမာအားဖြင့်ဖော်ထုတ်ခြင်း, နာမည်ကိုက်ညီခြင်းအဖြစ်အမည်များအောက်မှာကွန်ပျူတာသိပ္ပံမှာဖွံ့ဖြိုးပြီးနှင့်စံချိန်ထောက်လှမ်းပွားခဲ့ကြ (Elmagarmid, Ipeirotis, and Verykios 2007) ။ ပုဂ္ဂိုလ်ရေးအရသတင်းအချက်အလက်ဖော်ထုတ်၏ထုတ်လွှင့်မလိုအပ်ပါဘူးသောစံချိန်ချိတ်ဆက်ဖို့ချဉ်းကပ်မှုထိန်းသိမ်းစောင့်ရှောက် privacy ကိုလည်းရှိပါတယ် (Schnell 2013) ။ Facebook ကစတဲ့အမူအကျင့်မဲပေး၎င်းတို့၏မှတ်တမ်းများလင့်ထားသည်မှဆက်လက်ဆောင်ရွက်ဖွံ့ဖြိုးပြီ ငါအခန်း 4 မှာအကြောင်းကိုသင်ပြောပြလိမ့်မယ်ကြောင်းစမ်းသပ်မှုတစ်ခုအကဲဖြတ်ရန်ပြုခဲ့သည် (Bond et al. 2012; Jones et al. 2013)

Construction တရားဝင်မှုအပေါ်ပိုမိုတွေ့ Shadish, Cook, and Campbell (2001) , အခန်း 3 ။

မရရှိနိုင်သော

အ AOL ရှာဖွေရေးမှတ်တမ်း debacle အပေါ်ပိုမိုတွေ့ Ohm (2010) ။ ငါစမ်းသပ်ချက်ဖော်ပြရန်လာသောအခါအခန်း 4 မှာကုမ္ပဏီများနှင့်အစိုးရများနှင့်တွဲဖက်လုပ်ငန်းနှင့် ပတ်သက်. အကွံဉာဏျပူဇျော။ စာရေးဆရာတစ်အရေအတွက်တပိုင်တနိုင်ဒေတာအပေါ်မှီခိုကြောင်းသုတေသနပြုမှုနှင့် ပတ်သက်. စိုးရိမ်ပူပန်မှုများတွေ့ထုတ်ဖော်ပြောဆိုခဲ့ကြ Huberman (2012) နှင့် boyd and Crawford (2012)

တက္ကသိုလ်သုတေသီတွေက data ကို access ကိုဆည်းပူးရန်အဘို့အတစ်ခုမှာကောင်းသောလမ်းတစ်အလုပ်သင်ဆရာဝန်သို့မဟုတ်လာရောက်လည်ပတ်သုတေသီအဖြစ်ကုမ္ပဏီတစ်ခုမှာအလုပ်လုပ်ကိုင်ဖို့ဖြစ်ပါတယ်။ ဒေတာ access ကို enable လုပ်ထားခြင်းအပြင်, ဤဖြစ်စဉ်ကိုလည်းဆန်းစစ်ဘို့အရေးကြီးပါတယ်တည်းဟူသော, သုတေသီ data ကိုဖန်တီးခဲ့ပုံကိုအကြောင်းပိုမိုလေ့လာသင်ယူကူညီပေးပါမည်။

non-ကိုယ်စားလှယ်

non-ကိုယ်စားပြုမှုတစ်ခုလုံးလူဦးရေ၏ ပတ်သက်. ထုတ်ပြန်ချက်များလုပ်လိုသူသုတေသီများနှင့်အစိုးရများအဘို့ဟာအဓိကပြဿနာဖြစ်ပါတယ်။ ဤသည်ပုံမှန်အားဖြင့်သူတို့ရဲ့သုံးစွဲသူတွေကိုအာရုံစိုက်ကြသည်ကုမ္ပဏီများအတွက်စိုးရိမ်စရာလျော့နည်းသည်။ စာရင်းအင်းနယ်သာလန်စီးပွားရေးသည် non-ကိုယ်စားပြုမှုကြီးမားသောအချက်အလက်များ၏ပြဿနာစဉ်းစားပုံကိုအပေါ်ပိုမိုတွေ့ Buelens et al. (2014)

အခန်း 3 မှာကျွန်မအများကြီးကြီးမြတ်အသေးစိတ်နမူနာများနှင့်ခန့်မှန်းချက်ကိုဖော်ပြရန်ပါလိမ့်မယ်။ ဒေတာမဟုတ်တဲ့ကိုယ်စားလှယ်များမှာရင်တောင်အချို့သောအခြေအနေများအောက်တွင်သူတို့ကောင်းသောခန့်မှန်းချက်ထုတ်လုပ်ရန်တွက်ချက်နိုင်ပါတယ်။

မျော

System ကိုပျံ့ပြင်ပကနေကြည့်ရှုရန်အလွန်ခဲယဉ်းသည်။ သို့သော်, (ပိုပြီးအခန်း 4 မှာဆွေးနွေးကြသည်) ကို MovieLens စီမံကိန်းကိုတစ်ဦးပညာသင်နှစ်သုတေသနလုပ်ငန်းအဖွဲ့ကထက်ပိုမို 15 နှစ်ကို run သိရသည်။ ထို့ကြောင့်သူတို့စနစ်အချိန်ကျော်ပြောင်းလဲခဲ့သည်နှင့်မည်သို့ဒီခွဲခြမ်းစိတ်ဖြာ impact အံ့သောငှါအလမ်းနှင့် ပတ်သက်. သတင်းအချက်အလက်များမှတ်တမ်းပြုစုခြင်းနှင့်မျှဝေခဲ့ကြ (Harper and Konstan 2015)

ပညာရှင်တစ်ဦးကအရေအတွက်တွစ်တာထဲမှာပျံ့အပေါ်အာရုံစူးစိုက်ကြပြီ Liu, Kliman-Silver, and Mislove (2014) နှင့် Tufekci (2014)

algorithm သည်ရှက်ကြောက်

ငါပထမဦးဆုံးသက်တမ်းတစ်ဆွေးနွေးချက်ထဲမှာ Jon Kleinberg အသုံးပြုသော "Algorithm ကိုရှက်ကြောက်" ငါကြား၏။ Performance နောက်ကွယ်မှအဓိကစိတ်ကူးအချို့သောလူမှုရေးသိပ္ပံပညာသီအိုရီ "အင်ဂျင်မဟုတ်ကင်မရာများ" ဖြစ်ပါတယ် (Mackenzie 2008) ။ ဒါကသူတို့ကတကယ်တော့ကမ္ဘာ့အပုံဖော်မယ့်အစားကိုယ့်ကြောင့်ဖမ်းသည်။

ညစ်သော

အစိုးရမဟုတ်သောစာရင်းအင်းအေဂျင်စီများ။ ဒေတာသန့်ရှင်းရေး, စာရင်းအင်းဒေတာတည်းဖြတ်တာမခေါ် De Waal, Puts, and Daas (2014) စစ်တမ်းဒေတာအတွက်ဖွံ့ဖြိုးပြီးစာရင်းအင်းဒေတာတည်းဖြတ်ရေးနည်းပညာတွေကိုဖော်ပြရန်နှင့်သူတို့ကြီးမားတဲ့ data တွေကိုသတင်းရပ်ကွက်များနှင့်သက်ဆိုင်နေသောအတိုင်းအတာအထိဆနျးစစျ Puts, Daas, and Waal (2015) တစ်ဦးထက်ပိုယေဘုယျပရိသတ်ကိုများအတွက်တူညီသောစိတ်ကူးများအချို့ကိုတင်ပြသွားပါသည်။

တွစ်တာထဲမှာ spam များကိုအာရုံစိုက်လေ့လာမှုများအချို့ကိုဥပမာအဘို့, Clark et al. (2016) နှင့် Chu et al. (2012) ။ နောက်ဆုံးအနေနဲ့ Subrahmanian et al. (2016) အ DARPA က Twitter ကိုအောက်ခြေစိနျချေါမှု၏ရလဒ်များဖော်ပြသည်။

အထိခိုက်မခံ

Ohm (2015) အထိခိုက်မခံအချက်အလက်များ၏အယူအဆကိုအပေါ်အစောပိုင်းကသုတေသနလုပ်ငန်းသုံးသပ်ပြီးနှင့် multi-အချက်တစ်ချက်စမ်းသပ်ပေးထားပါတယ်။ သူအဆိုတင်သွင်းလေးပါးအချက်များနေသောခေါင်းစဉ်: ထိခိုက်မှု၏ဖြစ်နိုင်ခြေ; ထိခိုက်မှု၏ဖြစ်နိုင်ခြေ; လျှို့ဝှက်ဆက်ဆံရေးအထံ; နှင့်ဖြစ်စေအန္တရာယ်အများစုစိုးရိမ်ပူပန်မှုများရောင်ပြန်ဟပ်။

  • ရေတွက်ခြင်းအမှုအရာ (ပုဒ်မ 2.4.1)

New York မှာတက္ကစီ၏ Farber ရဲ့လေ့လာချက်ကအစောပိုင်းကလေ့လာမှုအပေါ်အခြေခံခဲ့ Camerer et al. (1997) အချိန်, အဆုံးအချိန်နှင့်ခစတင်ခရီးစဉ်မှတ်တမ်းတင်ဖို့ drivers တွေကိုအသုံးပြုတဲ့စက္ကူခရီးစဉ်စာရွက်များ-စက္ကူပုံစံသုံးမျိုးကွဲပြားခြားနားသောအဆင်ပြေစေရန်နမူနာအသုံးပြုခဲ့တဲ့။ သူတို့လျော့နည်းအလုပ်လုပ်ခဲ့၎င်းတို့၏လုပ်ခလစာမြင့်မားခဲ့ကြဘယ်မှာရက်: ဒီအစောပိုင်းကလေ့လာမှု drivers တွေကိုပစ်မှတ််ငွေရရှိသူတွေဖြစ်ပုံရကြောင်းတွေ့ရှိခဲ့ပါတယ်။

Kossinets and Watts (2009) လူမှုရေးကွန်ရက်မှာ homophily ၏ဇစ်မြစ်အပေါ်အာရုံစူးစိုက်ခဲ့သည်။ ကြည့်ရှုပါ Wimmer and Lewis (2010) ကို Facebook မှဒေတာများကိုအသုံးပြုရသောတူညီတဲ့ပြဿနာမှတစ်ဦးကွဲပြားခြားနားချဉ်းကပ်သည်။

နောက်ဆက်တွဲအလုပ်များတွင်ဘုရင်နှင့်လုပ်ဖော်ကိုင်ဖက်များကနောက်ထပ်တရုတ်တွင်အွန်လိုင်းဆင်ဆာဖြတ်တောက်မှုစူးစမ်းကြပါပြီ (King, Pan, and Roberts 2014; King, Pan, and Roberts 2016) ။ တရုတ်နိုင်ငံတွင်အွန်လိုင်းဆင်ဆာဖြတ်တောက်မှုကိုတိုင်းတာတဲ့ဆက်စပ်ချဉ်းကပ်ဘို့အတွေ့ Bamman, O'Connor, and Smith (2012) ။ မှာအသုံးပြုတဲ့တတူစာရင်းအင်းနည်းလမ်းများအပေါ်ပိုမို King, Pan, and Roberts (2013) 11 သန်းရေးသားချက်များ၏စိတ်ဓါတ်များကိုခန့်မှန်းရန်တွေ့ Hopkins and King (2010) ။ ကြီးကြပ်သင်ယူမှုအပေါ်မှာပိုပြီးအဘို့အတွေ့ James et al. (2013) (လျော့နည်းနည်းပညာပိုင်းဆိုင်ရာ) နှင့် Hastie, Tibshirani, and Friedman (2009) (ပိုနည်းပညာပိုင်းဆိုင်ရာ) ။

  • ကြိုတင်ခန့်မှန်း (ပုဒ်မ 2.4.2)

ကြိုတင်ခန့်မှန်းစက်မှုဇုန်ဒေတာသိပ္ပံပညာ၏ကြီးမားသောအစိတ်အပိုင်းတစ်ခုဖြစ်ပါသည် (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) ။ သာမန်လူမှုရေးသုတေသီများကပြုသောအမှုကြောင့်ကြိုတင်ခန့်မှန်းတစ်ခုမှာအမျိုးအစားဥပမာလူဦးရေဆိုင်ရာကြိုတင်ခန့်မှန်းဖြစ်ကြ၏ Raftery et al. (2012)

Google ကတုပ်ကွေး Trends တုပ်ကွေးရောဂါပျံ့နှံ့ nowcast မှရှာဖွေရေးဒေတာသုံးစွဲဖို့ပထမဦးဆုံးစီမံကိန်းကမဟုတ်ခဲ့ပေ။ တကယ်တော့, United States မှာသုတေသီများ (Polgreen et al. 2008; Ginsberg et al. 2009) နှင့်ဆွီဒင်နိုင်ငံ (Hulth, Rydevik, and Linde 2009) အချို့သောရှာဖွေရေးဝေါဟာရများကြောင်းတွေ့ပြီ (ဥပမာ, "တုပ်ကွေး") အမျိုးသားရေးပြည်သူ့ကျန်းမာရေးစောင့်ကြည့်ခန့်မှန်း ဒါကြောင့်ပြန်လွတ်လာခင်ဒေတာ။ နောက်ပိုင်းတွင်အများကြီးအခြားစီမံကိန်းများမြင်, ရောဂါစောင့်ကြည့်ထောက်လှမ်းဘို့ဒစ်ဂျစ်တယ်သဲလွန်စဒေတာသုံးစွဲဖို့ကြိုးစားခဲ့ကြ Althouse et al. (2015) ပြန်လည်သုံးသပ်သည်။

ကနျြးမာရေးရလဒ်များခန့်မှန်းဖို့ဒစ်ဂျစ်တယ်သဲလွန်စဒေတာအသုံးပြုခြင်းအပြင်ကိုလည်းရွေးကောက်ပွဲရလဒ်များခန့်မှန်းရန် Twitter ကိုဒေတာကို အသုံးပြု. အလုပ်၏ကြီးမားသောငွေပမာဏရှိခဲ့; ပြန်လည်သုံးသပ်ခြင်းဘို့မြင် Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (Ch ။ 7), နှင့် Huberty (2015)

တုပ်ကွေးရောဂါပျံ့နှံ့မှုခန့်မှန်းခြင်းနှင့်ရွေးကောက်ပွဲများကိုကမ္ဘာ့အဖြစ်အပျက်အချို့ကိုမျိုးကိုကြိုတင်ခန့်မှန်းဖို့ဒစ်ဂျစ်တယ်သဲလွန်စအချို့ကိုမျိုးကိုသုံးပြီးနှစ်ယောက်စလုံးဥပမာကြိုတင်ခန့်မှန်းဖို့ Twitter ကိုဒေတာသုံးရှာဖွေရေးဒေတာကိုသုံးနိုင်သည်။ အဲဒီမှာဒီယေဘုယျဖွဲ့စည်းပုံရှိသည်သောလေ့လာမှုတစ်ခုကြီးမားအရေအတွက်။ စားပွဲတင် 2.5 အနည်းငယ်အခြားဥပမာများပါဝင်သည်။

စားပွဲတင် 2.5: အချို့သောဖြစ်ရပ်ကြိုတင်ခန့်မှန်းဖို့အချို့သောဒစ်ဂျစ်တယ်သဲလွန်စကိုသုံးလေ့လာမှုများ၏တစိတ်တပိုင်းစာရင်း။
ဒစ်ဂျစ်တယ်သဲလွန်စ အကျိုး ဆင့်ခေါ်ချက်
တွစ်တာ US မှာရုပ်ရှင်၏ box office ဝင်ငွေ Asur and Huberman (2010)
ရှာရန်သစ်လုံး US မှာရုပ်ရှင်, ဂီတ, စာအုပ်တွေနဲ့ဗီဒီယိုဂိမ်း၏အရောင်း Goel et al. (2010)
တွစ်တာ Dow Jones စက်မှုပျှမ်းမျှ (အမေရိကန်စတော့ရှယ်ယာဈေးကွက်) Bollen, Mao, and Zeng (2011)
  • approximating စမ်းသပ်ချက် (ပုဒ်မ 2.4.3)

အဆိုပါဂျာနယ်သည် PS နိုင်ငံရေးသိပ္ပံကြီးမားတဲ့ဒေတာ, ကြောင်းကျိုးဆက်စပ်အခြနှင့်တရားဝင်သီအိုရီအပေါ်တစ်ဦးစာတမ်းဖတ်ပွဲခဲ့, နှင့် Clark and Golder (2015) တစ်ဦးချင်းစီအလှူငွေအကျဉ်း။ အမေရိကတိုက်၏အမေရိကန်ပြည်ထောင်စု၏သိပ္ပံအမျိုးသားအကယ်ဒမီ၏ဂျာနယ်တရားစွဲဆိုထားကြောင်းကျိုးဆက်စပ်အခြနှင့်ကြီးမားသောဒေတာအပေါ်တစ်ဦးစာတမ်းဖတ်ပွဲခဲ့, နှင့် Shiffrin (2016) တစ်ဦးချင်းစီအလှူငွေအကျဉ်း။

သဘာဝကစမ်းသပ်ချက်၏စည်းကမ်းချက်များ၌, Dunning (2012) အကောင်းဆုံးစာအုပ်အရှည်ကုသပေးပါသည်။ သဘာဝစမ်းသပ်မှုအဖြစ်ဗီယက်နမ်မူကြမ်းထီကို အသုံးပြု. အပေါ်ပိုမိုတွေ့ Berinsky and Chatfield (2015) ။ ကြီးမားတဲ့ data တွေကိုသတင်းရပ်ကွက်၏အတွင်းပိုင်းကသဘာဝစမ်းသပ်ချက်အလိုအလျှောက်ရှာဖွေတွေ့ရှိရန်ကြိုးစားကြောင်းစက်သင်ယူမှုချဉ်းကပ်ဘို့အတွေ့ Jensen et al. (2008) နှင့် Sharma, Hofman, and Watts (2015)

ကိုက်ညီခြင်း၏စည်းကမ်းချက်များ၌တစ်ဦးအကောင်းမြင်ပြန်လည်သုံးသပ်တွေ့ Stuart (2010) နှင့်အဆိုးမြင်ပြန်သုံးသပ်ကြည့်ရှု Sekhon (2009) ။ တံစဉ်များကိုတစ်ဦးကြင်ကြင်နာနာအဖြစ်ကိုက်ညီတဲ့အပေါ်ပိုမိုတွေ့ Ho et al. (2007) ။ ကိုက်ညီခြင်း၏မြတ်သောကုသမှုပေးသောစာအုပ်များသည်ကိုတွေ့ Rosenbaum (2002) , Rosenbaum (2009) , Morgan and Winship (2014) နှင့် Imbens and Rubin (2015)