活動

  • 難易度:簡単簡単 、培地中 、ハードハード 、 とても厳しいとても厳しい
  • 数学を必要とする( 数学が必要です
  • コーディングが必要( コーディングが必要
  • データ収集 ( データ収集
  • 私のお気に入り ( お気に入り
  1. [ とても厳しいコーディングが必要データ収集お気に入り ] Benoitと同僚の(2016)政治マニフェストの群集コーディングに関する最も刺激的な主張の1つは、結果が再現可能であるということです。 Merz, Regel, and Lewandowski (2016)は、マニフェストコーパスへのアクセスを提供する。 Benoit et al. (2016)図2を再現してみてくださいBenoit et al. (2016)をAmazon Mechanical Turkの労働者を使用して実施しました。結果はどれくらい似ていましたか?

  2. [ 中 ] InfluenzaNetプロジェクトでは、ボランティアの人々のパネルが、インフルエンザ様の病気に関連する発生率、有病率、および健康追求行動を報告している(Tilston et al. 2010; Noort et al. 2015)

    1. InfluenzaNet、Googleインフルエンザの動向、伝統的なインフルエンザ追跡システムの設計、コスト、および間違いの可能性を比較し、比較します。
    2. 新しい形のインフルエンザの発生など、不安定な時期を考えてみましょう。各システムで発生する可能性のあるエラーを記述します。
  3. [ ハードコーディングが必要データ収集 ] エコノミストは週刊ニュースマガジンです。人間の計算プロジェクトを作成して、カバーの男性と女性の比率が時間の経過とともに変化しているかどうかを確認します。

    1. 雑誌は8つの異なる地域(アフリカ、アジア太平洋、ヨーロッパ、欧州連合、中南米、中東、北米、英国)で異なるカバーを持つことができ、それらはすべて雑誌のウェブサイトからダウンロードすることができます。これらの領域の1つを選択し、分析を実行します。あなたの手続きを他人が複製できるように十分詳細に記述してください。

    この質問は、CrowdsFlowerのデータ科学者、Justin Tenutoによる同様のプロジェクトからインスピレーションを得ました。「Time Magazineが本当に好きな人たち」(http://www.crowdflower.com/blog/time-magazine-cover-data)を参照してください。 。

  4. [ とても厳しいコーディングが必要データ収集 ]前の質問に基づいて、8つの地域すべてについて分析を実行します。

    1. 地域間でどのような違いがありましたか?
    2. 分析を8つの地域すべてに拡大するには、どれくらいの時間と費用がかかりましたか?
    3. エコノミストが毎週100種類のカバーを持っているとします。あなたの分析を1週間に100カバーに拡大するには、余分な時間とお金をどれくらいかかりますか?
  5. [ ハードコーディングが必要 ] Kaggleのようなオープンコールプロジェクトを主催するいくつかのウェブサイトがあります。それらのプロジェクトの1つに参加して、その特定のプロジェクトについての知識と一般的なオープンコールについて説明します。

  6. [ 中 ]あなたの分野の雑誌の最近の号を見てください。オープン・コール・プロジェクトとして改訂された論文はありますか?なぜ、なぜそうではないのですか?

  7. [ 簡単 ] Purdam (2014)は、ロンドンでの募集についての分散データ収集について説明しています。この研究デザインの長所と短所を要約する。

  8. [ 中 ]冗長性は、分散データ収集の品質を評価する重要な方法です。 Windt and Humphreys (2016)は、コンゴ東部の人々からの紛争事件の報告を収集するシステムを開発し、テストしました。論文を読む。

    1. 彼らのデザインはどのように冗長性を確保していますか
    2. 彼らは、プロジェクトから収集したデータを検証するためにいくつかのアプローチを提案しました。それらを要約する。あなたに最も納得したのはどれですか?
    3. データを検証する新しい方法を提案する。提案は、費用対効果の高い、倫理的な方法で、データにあると思われる信頼を高めるように努めるべきです。
  9. [ 中カリム・ラカニ(2013) Karim Lakhani (2013)(2013)は、計算生物学の問題を解決するための新しいアルゴリズムを求めています。彼らは、89の新しい計算手法を含む600以上の提出を受けました。この提出物のうち30件は米国国立衛生研究所のMegaBLASTの性能を上回り、最高の提出はより高い精度とスピード(1,000倍の速さ)を実現しました。

    1. 彼らの論文を読んで、同じ種類のオープンコンテストを使うことができる社会調査の問題を提案してください。特に、この種のオープンコンテストは、既存のアルゴリズムの高速化とパフォーマンスの向上に重点を置いています。あなたの分野でこのような問題を考えることができないなら、なぜそうしないのか説明してみてください。
  10. [ 中お気に入り ]多くの人間の計算プロジェクトは、Amazon Mechanical Turkの参加者に依存しています。 Amazon Mechanical Turkの労働者になるためにサインアップしてください。そこで働く1時間を過ごす。これは、人間の計算プロジェクトの設計、品質、倫理に関するあなたの考えにどのように影響しますか?