2.1はじめに

アナログ時代に、行動高価なので、比較的稀であったときに何をするに関するデータを収集します。今、デジタル時代に、数十億人の行動は、記録保存されている、と分析可能されています。たとえば、あなたがウェブサイト上でクリックするたびに、あなたの携帯電話に電話をかける、またはクレジットカードで何かを支払う、あなたの行動のデジタル記録が作成され、事業が格納されています。これらのデータは、人々の日々の行動の副産物であるので、それらは、しばしばデジタル・トレースと呼ばれます。企業が保有するこれらのトレースに加えて、政府はまた、多くの場合、デジタル化して解析可能であるデータを人々と企業の両方についての信じられないほど豊富なデータを持っています。一緒にこれらの企業と政府の記録は、多くの場合、 ビッグデータと呼ばれます

ビッグデータの絶えず上昇洪水は、我々は行動データは、行動データが豊富である世界に不足した世界から移動したことを意味します。これらのタイプのデータは比較的新しいので、しかし、それらを用いた研究の不幸な量は、盲目的に利用可能なデータを追いかけ科学者のように見えます。この章では、代わりに、データの異なるソースを理解するための原理的なアプローチを提供し、それらがどのように使用することができます。この豊かな理解は、あなたがより良いデータの適切な情報源にあなたの研究の質問に一致して助けるべきです。または、そのような既存のソースが不足している場合、将来の章でアイデアを使用して、独自のデータを収集するためにあなたを説得。

観測データ :ビッグデータから学習するための最初のステップは、長年にわたり社会調査のために使用されてきたデータのより広範なカテゴリの一部であることを実現することです。大体、観測データは、いくつかの方法で介入することなく、社会システムを観察することから得られる任意のデータです。それについて考えるために、粗方法は、観測データは、人々(例えば、調査、第3章のトピック)や人々の環境(例えば、実験、第4章のトピック)を変えると話し関与しないあらゆるものであるということです。このように、企業と政府の記録に加えて、観測データはまた、新聞記事や衛星写真のテキストのようなものが含まれています。

この章では、3つの部分があります。まず、2.2節では、私はより詳細にビッグデータを記述し、それと一般的に、過去に社会調査のために使用されているデータの基本的な違いを明らかにする。次に、2.3節で、私は大きなデータソースの10共通の特性を記述します。これらの特性を理解することは、すぐに既存のソースの強みと弱みを認識し、私たちは将来的に作成される新しいソースを活用するのに役立ちます私たちを可能にします。数える事、予測の事、および実験を近似:最後に、2.4節では、私はあなたが観測データから学ぶために使用できる3つの主な研究戦略について説明します。