2.3大数据的共同特征

大数据源往往有十大特点;一些有利于社会的研究,有些是坏。

如果研究人员打算从大数据学习,他们没有创造或收集,那么他们必须了解它的一般特性。而不是通过平台的做法采取了一个平台(例如,这里就是你需要知道的关于Twitter是什么,这里就是你需要知道的关于谷歌搜索数据等什么),我将介绍大数据十个一般特征,出现的特性因为数据没有为社会研究的目的而创建。通过从每个特定系统的细节退一步,看着这些常规特性,研究人员可以迅速了解现有的数据源,并有一个坚定的一套想法应用到未来的数据源。

我发现它有助于群体的特点分为两类:

  • 总体上是好的研究:大,永远在线,无反应
  • 普遍不好研究:不全,交通不便,不​​具有代表性,漂流,算法混淆,人迹罕至,脏,敏感

从广义上讲,政府的行政记录是不具有代表性,少算法混淆,少漂流。另一方面,业务管理记录往往更大,更始终保持接通。