2.3.3反応性

ビッグデータソースでの測定では、動作を変更する可能性はほとんどありません。

社会調査の課題の1つは、人々が研究者によって観察されていることを知ったときに行動を変えることができるということです。社会科学者は一般的にこの反応性を呼んでいる(Webb et al. 1966) 。例えば、人々は、野外調査よりも研究室での研究にもっと寛大である可能性があります。なぜなら、前者では、観察されていることを非常に意識しているからです(Levitt and List 2007a) 。多くの研究者が期待しているビッグデータの1つの側面は、参加者は一般的にデータがキャプチャされていることを意識していないか、参加者は非反応性であるため、ビッグデータの多くのソースを使用して、過去の正確な測定に適さなかった行動を研究することができます。たとえば、 Stephens-Davidowitz (2014)は、米国のさまざまな地域で人種的な敵を測定するために検索エンジンのクエリで人種差別的な用語の流行を使用しました。検索データの非反応性と大きな(セクション2.3.1参照)性質は、調査などの他の方法を使用することが困難な測定を可能にしました。

しかし、非反応性は、これらのデータが何らかの形で人々の行動や態度を直接反映していることを保証するものではありません。たとえば、インタビューに基づいた調査の回答者の1人が「問題がないわけではなく、Facebookに載せていない」と述べている(Newman et al. 2011) 。言い換えれば、一部の大きなデータソースが非反応性であっても、社会的望ましさの偏見、つまり人々が可能な限り最良の方法で自分自身を提示したい傾向がないわけではありません。さらに、この章の後半で説明するように、大きなデータソースで取り込まれた動作は、プラットフォーム所有者の目標に影響を受けることがあります。これは、 アルゴリズムの混乱と呼ばれる問題です。最後に、非反応性は研究には有益だが、同意なしに人々の行動を追跡することは、第6章で詳しく説明する倫理的懸念を提起する。

私が今説明した3つのプロパティーは、社会的研究にとっては一般的ではありませんが、常にそうであるとは限りません。次に、大きなデータソースの7つのプロパティ(不完全、アクセス不能、非代表、漂流、アルゴリズム的混乱、汚い、敏感なもの)に目を向ける。