常時オンのビッグデータは、予期しないイベントやリアルタイム測定の研究を可能にします。
多くのビッグデータシステムは、 常時オンで す。彼らは常にデータを収集しています。この常時オンの特徴は、長手方向のデータと研究者を提供(すなわち、時間の経過とともにデータ)。常時オンであることは、研究のための2つの重要な意味を持ちます。
まず、常時オンのデータ収集は、以前は不可能だった方法で、予期しないイベントを研究する研究者を可能にします。例えば、2013年の夏にトルコでゲズィ抗議を占拠勉強に興味を持って研究者は、通常、イベント中にデモ隊の行動に焦点を当てることになります。・セレンBudakとダンカンワッツ(2015) 、イベント後の間に、前のTwitter-使用してデモ隊を研究するために、常時オンのTwitterの性質を利用して複数の操作を行いますすることができました。そして、彼らは中、およびイベント(図2.1)の後に、前に(抗議についてのつぶやきませんでしたか、参加者)非参加者の比較グループを作成することができました。合計では、それらの事後パネルには、2年間で3万人のつぶやきが含まれていました。彼らはゲズィ抗議行動に参加するとの態度の変化を推定する可能性が高かった人々の種類を推定することができました。この他の情報と抗議から一般的に使用されるデータを増大させることにより、Budakとワッツは、多くの詳細を学ぶことができました参加者と非参加者は、両方の短期的には(ゲズィの間にプリゲズィを比較)し、長期的に( - ゲズィを投稿する前ゲズィを比較します)。
3万人のためのそのようなデータ収集が非常に高価であったであろうが、これらの推定値のいくつかは、データ収集源(例えば、姿勢変化の長期推計)常時オンすることなく行われている可能性は事実です。そして、さえ無制限の予算を与えられ、私は基本的に研究者が時間内に戻って旅行して 、直接、過去の参加者の行動を観察することを可能にする他の方法を考えることはできません。最も近い代替は、行動の遡及的なレポートを収集することであろうが、これらの報告は限られた粒度と疑わしい精度であろう。表2.1は、予期しないイベントを研究するために、常時オンのデータソースを使用した研究の他の例を提供します。
予期せぬ出来事 | 常時オンのデータソース | 引用 |
---|---|---|
トルコゲズィ運動を占めます | ツイッター | Budak and Watts (2015) |
香港の傘抗議 | Zhang (2016) | |
ニューヨーク市警察の発砲事件 | ストップ・アンド・フリスクレポート | Legewie (2016) |
ISISに参加した人 | ツイッター | Magdy, Darwish, and Weber (2016) |
2001年9月11日の攻撃 | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
2001年9月11日の攻撃 | ポケベルメッセージ | Back, Küfner, and Egloff (2010) Pury (2011) Back, Küfner, and Egloff (2011) |
第二に、常時オンのデータ収集は、政策立案者は、単に既存の動作から学ぶだけでなく、それに応答しないようにする設定において重要であり得るリアルタイム測定を生成するために研究者を可能にします。例えば、ソーシャルメディアデータは、自然災害への応答案内するために使用することができる(Castillo 2016)
結論として、常時オンのデータシステムは、予期しないイベントを研究し、政策立案者にリアルタイムの情報を提供するために、研究者を有効にします。私は、しかし、その常時オンデータシステムは、長期間にわたって変更を追跡する研究者を有効にすることを提案していませんでした。多くのビッグデータシステムは常にプロセスと呼ばれるドリフト (セクション2.3.2.4)、変化しているためです。