活動

キー:

  • 難易度:簡単簡単に 、 ミディアムミディアム 、ハードハード 、非常に難しいです一生懸命
  • (数学を必要とします数学を必要とします
  • (コーディングが必要ですコー​​ディングが必要です
  • データ収集 ( データ収集
  1. [ 一生懸命コー​​ディングが必要ですデータ収集 ]から最もエキサイティングなクレームの一つBenoit et al. (2015)政治的マニフェストの観客コーディングには。結果が再現可能であるということですMerz, Regel, and Lewandowski (2016)マニフェストコーパスへのアクセスを提供します。図2を再現してみてくださいBenoit et al. (2015)アマゾン機械トルコ人からの労働者を使用します。あなたの結果はどのように類似していましたか?

  2. [ ミディアム ] InfluenzaNetプロジェクトで人のボランティアパネルは、インフルエンザ様疾患(ILI)に関連する罹患率、罹患率、および健康を求める行動報告(Tilston et al. 2010; Noort et al. 2015)

    1. デザイン、コスト、およびInfluenzaNet、Googleインフルトレンド、および伝統的なインフルエンザの追跡システムで可能性が高いエラーを比較対照。
    2. このような豚インフルエンザの流行として、不安定な時間を考慮してください。各システムでの可能性のあるエラーを説明してください。
  3. [ ハードコー​​ディングが必要ですデータ収集 ] エコノミストは、ニュース週刊誌です。表紙に男性に女性の割合が経時的に増加しているかどうかを確認するために、人間の計算プロジェクトを作成します。

    1. 雑誌は、8つの異なる領域(アフリカ、アジア太平洋、ヨーロッパ、欧州連合(EU)、ラテンアメリカ、中東、北米、英国)で別のカバーを持つことができ、それらはすべてのウェブサイトからダウンロードすることができエコノミスト 。これらの領域の1つを選択し、分析を行います。彼らは他の誰かによって複製することができることを十分に詳細にあなたの手順を記述してください。

    この質問はジャスティンテヌート、クラウドソーシング会社でのデータ科学者によって同様のプロジェクトに触発されたCrowdFlower 、参照してください"タイム誌は本当に野郎どもがお好き」

  4. [ 一生懸命コー​​ディングが必要ですデータ収集 ]上記の質問を踏まえ、現在すべての8つの領域のための分析を行います。

    1. あなたは地域全体でどのような違いを見つけましたか?
    2. どのくらいの余分な時間とお金それがスケールアップするためにあなたの分析をすべての領域8にかかりましたか?
    3. エコノミストは、毎週100種類のカバーを持っていることを想像してみてください。それはスケールアップするためにあなたの分析を週100カバーを取るだろうどのくらいの余分な時間とお金見積もります。
  5. [ ハードコー​​ディングが必要です ] [Kaggle](https://www.kaggle.com/)公募プロジェクトをホストするWebサイトです。これらのプロジェクトの一つに参加しています。

  6. [ ミディアム ]あなたの分野における雑誌の最新号に目を通します。オープンコール・プロジェクトとして再定式化されている可能性のある論文はありますか?その理由は?

  7. [ 簡単に ] Purdam (2014)ロンドンで物乞いについての分散データ収集を説明しました。この研究デザインの長所と短所をまとめます。

  8. [ ミディアム ]の冗長性は、分散データ収集の質を評価するための重要な方法です。 Windt and Humphreys (2016) 、東コンゴの人々からの競合イベントのレポートを収集するシステムを開発し、テストします。紙を読みます。

    1. どのように彼らのデザインは、冗長性を確保するのですか?
    2. 彼らはプロジェクトから収集したデータを検証するために、いくつかのアプローチを提供します。それらをまとめます。あなたに最も説得力のありましたか?
    3. データを検証することができた新しい方法を提案します。提案では、費用対効果および倫理的な方法でデータを持っていることになる信頼を高めるようにしてください。
  9. [ ミディアム ]カリムLakhaniや同僚(2013)計算生物学の問題点を解決するための新しいアルゴリズムを勧誘するためにオープン呼び出しを作成しました。彼らは、89の新規計算アプローチを含む600以上の提出を受けました。提出、彼らは健康のMegaBLASTの米国国立研究所の性能を超えて30を受け、最高の提出は、より高い精度と速度(千倍の速さ)の両方を達成しました。

    1. 彼らの論文を読み、[オープンコンテストの同じ種類を使用することができ、社会的研究課題を提案します。特に、オープンコンテストのこの種の高速化及び既存のアルゴリズムの性能を向上させることに焦点を当てています。あなたの分野でこのような問題を考えることができない場合は、なぜ説明しよう。
  10. [ ミディアム多くの人間の計算のプロジェクトは、Amazonメカニカルタークからの参加者に依存しています。サインアップアマゾンメカニカルターク上の労働者になること。そこに働く一時間をお過ごしください。どのようにこの影響はデザイン、品質、人間compuationプロジェクトの倫理についてのお考えでしょうか?