序文

この本は2005年にコロンビア大学の地下室で始まりました。当時私は大学院生でしたが、私は最終的に私の論文になるオンライン実験を行っていました。私は第4章でその実験の科学的な部分について皆さんにお話ししますが、今では私の論文や論文の中にはないものについてあなたに話していきます。それは、私が研究についてどのように考えているかを根本的に変えたものです。ある朝、私が地下室に入ったとき、私はブラジルの約100人の人々が私の実験に参加していたことを発見しました。このシンプルな経験は私に大きな影響を与えました。当時、私は伝統的な実験室の実験を行っていた友人がいました。私は、これらの実験に参加する人々を募集し、監督し、賄うためにどれくらい苦労しなければならないか分かっていました。彼らが1日に10人を動かすことができれば、それは良い進歩でした。しかし、私のオンライン実験では、 私が寝ている間に 100人が参加しました 。あなたが眠っている間にあなたの研究をすることは、あまりにも良いと思うかもしれませんが、そうではありません。テクノロジーの変化、特にアナログ時代からデジタル時代への移行は、ソーシャルデータを新しい方法で収集して分析できるようになりました。この本は、これらの新しい方法で社会調査を行うことについてです。

この本は、より多くのデータ科学、より多くの社会科学をしたいデータ科学者、そしてこれらの2つの分野のハイブリッドに関心を持つ人のためのものです。この本が誰のためであるかを考えれば、学生や教授だけではないことは言うまでもない。私は現在、大学(プリンストン)で働いていますが、私は政府(米国国勢調査局)とハイテク産業(マイクロソフトリサーチ)で働いていますので、興味深い研究がたくさんあります大学。あなたがソーシャルリサーチとしてやっていることを考えるなら、あなたが現在働いている場所や現在どのようなテクニックを使っていても、この本はあなたのためのものです。

あなたがすでに気づいているように、この本の音色は、他の多くの学術書とは少し異なります。それは意図的です。この本は、私が2007年から社会学科のPrincetonで教えてきたコンピュータ社会科学の大学院セミナーから出てきたもので、そのセミナーのエネルギーと興奮の一部を捉えたいと思っています。特に、私はこの本に3つの特徴を持たせたいと思っています。私は、それが有用で、未来志向で、楽観的であることを望んでいます。

役立つ :私の目標はあなたに役立つ本を書くことです。したがって、私はオープンで非公式で、事例主導のスタイルで書くつもりです。私が伝えたいと思う最も重要なことは、社会調査についてある種の考え方であるからです。そして私の経験から、このような考え方を伝える最良の方法は、非公式かつ多くの例があることを示唆しています。また、各章の最後には、私が紹介する多くのトピックのより詳細で技術的な読み方に移行するのに役立つ「次に読むもの」というセクションがあります。最後に、この本があなたに研究を行い、他者の研究を評価するのに役立つことを願っています。

未来志向 :この本はデジタル今日存在するシステム 、将来的に作成されたものを使用して社会的な研究を行うのに役立ちます。私は2004年にこの種の研究を始めました。それ以来、私は多くの変化を見てきました。あなたのキャリアの過程で多くの変化が見られると確信しています。変化に直面して関連性を維持するというトリックは抽象です。たとえば、これは今日のTwitter APIの使い方を正確に教える本ではありません。代わりに、大きなデータソースから学ぶ方法を教えていきます(第2章)。これはAmazon Mechanical Turkで実験を実行するための段階的な手順を説明する本にはなりません。代わりに、デジタル時代のインフラストラクチャに依存する実験の設計と解釈方法を教えていきます(第4章)。抽象化を使用することで、タイムリーなトピックで時代遅れの本になることを願っています。

楽観的 :この本が関与する2つのコミュニティー(社会科学者とデータ科学者)は、非常に異なる背景と興味を持っています。私がこの本で話すこれらの科学関連の違いに加えて、私はまた、これらの2つのコミュニティが異なるスタイルを持っていることに気付きました。データ科学者は一般的に興奮している。それらはガラスが半分いっぱいに見える傾向があります。一方、社会科学者は一般的により重要です。それらはガラスが半分空に見える傾向があります。この本では、私はデータ科学者の楽観的な調子を取るつもりです。だから、私が例を提示するとき、私はこれらの例について私が愛していることを教えてくれるでしょう。そして、私が例題の問題を指摘したとき、研究は完璧ではないので、私はそれを行います。私はこれらの問題を肯定的で楽観的な方法で指摘しようとしています。私は批判的であるために批判的になるつもりはありません。私はあなたがより良い研究を生み出すのを助けるために批判的になるでしょう。

私たちはデジタル時代のソーシャルリサーチの初期段階にありますが、あまりにも多くの誤解がありましたので、ここでは序文で取り上げることが理にかなっています。データ科学者から、私は2つの一般的な誤解を見た。最初は、より多くのデータが自動的に問題を解決すると考えています。しかし、社会調査のために、それは私の経験ではありません。実際、社会調査では、より多くのデータとは対照的に、より良いデータが役立つようです。私がデータ科学者から見た2番目の誤解は、社会科学は常識を包み込んだ単なる話であると考えていることです。もちろん、社会科学者 - より具体的には社会学者 - として私はそれに同意しません。スマートな人々は、長い間、人間の行動を理解するために努力してきました。そして、この努力によって蓄積された知恵を無視するのは賢明ではないようです。私の希望は、この本はあなたにその知恵の一部を理解しやすい方法で提供することです。

社会科学者からは、2つのよくある誤解も見てきました。まず、いくつかの悪い論文のために、デジタル時代のツールを使って社会調査のアイデアを書き留めている人もいます。この本を読んでいるならば、あなたはたぶんすでに、ソーシャルメディアのデータを使い慣れた、あるいは間違った(あるいはその両方の)方法で、たくさんの論文を読んでいるでしょう。私も持っています。しかし、これらの例から、すべてのデジタル時代社会研究が悪いと結論づけることは、重大な間違いである。実際には、調査データを慎重に、または間違った方法で使用する多数の論文を読んでいるかもしれませんが、アンケートを使用してすべての調査を書き留めてはいけません。これは、調査データで行われた素晴らしい研究があることを知っているからです。この本では、デジタル時代のツールを使って行われた素晴らしい調査もあることをご紹介します。

私が社会科学者から見た2番目の一般的な誤解は、現在と将来を混同することです。デジタル時代のソーシャルリサーチを評価する際には、これから説明するリサーチでは、「今の研究スタイルはどれくらいうまく機能していますか」と「このスタイルは研究者は最初の質問に答えるように訓練されていますが、この本では2番目の質問が重要だと思います。つまり、デジタル時代の社会調査では、パラダイム変化の著しい知的貢献はまだ発生していませんが、デジタル時代の研究の改善率は信じられないほど急速です。現在のレベルを上回るこの変化率は、デジタル時代の研究を私にとってとてもエキサイティングなものにしています。

その最後のパラグラフでは、将来何らかの不特定の時間に潜在的な富を提供するように見えるかもしれませんが、私の目標は、特定のタイプの研究についてあなたを売ることではありません。 Twitter、Facebook、Google、Microsoft、Apple、または他のハイテク企業で個人的に株式を所有しているわけではありません(完全開示のために、Microsoftから研究資金を受け取り、グーグル、そしてFacebook)。したがって、本書を通して、私の目標は信じられないナレーション者であり、可能なすべてのエキサイティングな新しいものについてあなたに伝えながら、他の人が陥っている(そして自分自身に落ちることがある) 。

社会科学とデータ科学の共通点は、計算的社会科学と呼ばれることもあります。一部はこれを技術分野とみなしていますが、これは伝統的な意味での技術的な本ではありません。例えば、本文中に方程式はありません。大きなデータソース、調査、実験、大規模な共同作業、倫理など、デジタル時代のソーシャルリサーチの包括的な見方を提供したかったので、私はこの方法で本を書くことにしました。これらのトピックをすべてカバーし、それぞれの技術的な詳細を提供することは不可能であることが判明しました。代わりに、各章の最後にある「次に読むもの」セクションに、より技術的な資料へのポインタがあります。言い換えれば、この本は特定の計算を行う方法を教えるようには設計されていません。むしろ、社会調査の考え方を変えるように設計されています。

コースでこの本を使用する方法

私が以前に述べたように、この本は、プリンストンで2007年以来教えてきたコンピュータ社会科学に関する大学院セミナーの一部に出てきました。あなたがコースを教えるためにこの本を使うことを考えているかもしれないので、私はそれが私のコースからどのように成長し、それが他のコースで使われていると想像しているかを説明することが役に立ちます。

数年の間、私は本なしでコースを教えました。私は記事のコレクションを割り当てるだけです。学生はこれらの記事から学ぶことができましたが、記事だけでは私が作りたいと思っていた概念の変化につながっていませんでした。だから私は、生徒が大きな絵を見るのを助けるために、視点、文脈、アドバイスを提供するクラスでほとんどの時間を過ごすでしょう。この本は、社会科学やデータ科学の前提条件をもたない方法で、すべての観点、文脈、アドバイスを書き留めようとする私の試みです。

学期の長いコースでは、この書籍とさまざまな追加情報を組み合わせることをおすすめします。例えば、そのようなコースは実験に2週間を費やすかもしれませんし、第4章と、実験の設計と分析における治療前情報の役割などの話題に関する読書とを組み合わせることもできます。企業における大規模A / Bテストによってもたらされる統計的および計算上の問題。特にメカニズムに焦点を当てた実験の設計。 Amazon Mechanical Turkなどのオンライン労働市場からの参加者の使用に関連した実践的、科学的、倫理的な問題が含まれます。また、プログラミングに関する読書や活動と組み合わせることもできます。これらの多くの可能なペアリングの適切な選択は、あなたのコース(例:学部、修士、博士)の学生、その背景、および彼らの目標に依存します。

セメスター・レングス・コースには、毎週の問題セットも含まれています。各章には難易度で分類されたさまざまなアクティビティがあります:簡単( 簡単 )、培地( 中 )、ハード( ハード )、非常に難しい( とても厳しい )。また、私は各問題に必要なスキルを付けました:数学( 数学が必要です )、コーディング( コーディングが必要 )、データ収集( データ収集 )。最後に、個人的なお気に入りの活動のいくつかにラベルを付けました( お気に入り )。私はこの多様な活動の中で、あなたの学生に適したものを見つけることを願っています。

コースでこの本を使用するのを助けるために、シラバス、スライド、各章の推奨ペアリング、いくつかの活動の解決策などの教材のコレクションを始めました。これらの資料は、http://www.bitbybitbook.comから入手できます。