Aktivitäten

Schlüssel:

  • Schwierigkeitsgrad: leicht einfach , Mittel Mittel , hart hart , sehr schwer sehr schwer
  • erfordert Mathematik ( erfordert Mathe )
  • erfordert Codierung ( erfordert Codierung )
  • Datensammlung ( Datensammlung )
  1. [ sehr schwer . erfordert Codierung . Datensammlung ] Eines der spannendsten Ansprüche von Benoit et al. (2015) auf Masse Codierung von politischen Manifeste ist , dass die Ergebnisse reproduzierbar sind. Merz, Regel, and Lewandowski (2016) ermöglicht den Zugriff auf das Manifest Corpus. Versuchen Sie , Bild 2 von reproduzieren Benoit et al. (2015) Arbeiter von Amazon Mechanical Turk verwenden. Wie ähnlich waren Ihre Ergebnisse?

  2. [ Mittel ] Im InfluenzaNet Projekt berichten eine freiwillige Gruppe von Menschen die Inzidenz, Prävalenz, und die Suche nach Gesundheitsverhalten zu grippeähnliche Erkrankung (ILI) bezogen (Tilston et al. 2010; Noort et al. 2015) .

    1. Vergleichen Sie und kontrastieren das Design, Kosten, und wahrscheinlich Fehler in InfluenzaNet, Google Grippe-Trends und traditionelle Influenza-Tracking-Systeme.
    2. Betrachten wir ein unstetes Zeit, wie der Ausbruch der Schweinegrippe. Beschreiben Sie die möglichen Fehler in jedem System.
  3. [ hart . erfordert Codierung . Datensammlung ] The Economist ist eine wöchentliche Nachrichtenmagazin. Erstellen Sie ein menschlicher Berechnung Projekt zu sehen, ob das Verhältnis von Frauen auf dem Cover zu den Männern im Laufe der Zeit zugenommen hat.

    1. Das Magazin kann verschiedene Cover haben in acht verschiedenen Regionen (Afrika, Asien - Pazifik, Europa, Europäische Union, Lateinamerika, dem Nahen Osten, Nordamerika und Großbritannien) und sie können alle von der Website heruntergeladen werden von The Economist . Wählen Sie eine dieser Regionen und die Analyse durchzuführen. Seien Sie sicher, dass Ihr Verfahren mit ausreichend detailliert zu beschreiben, dass sie von jemand anderem repliziert werden konnte.

    Diese Frage nach einem ähnlichen Projekt von Justin Tenuto, einem Datenwissenschaftler an der Crowdsourcing - Unternehmen inspiriert wurde CrowdFlower finden "Time Magazine wirklich mag Dudes" .

  4. [ sehr schwer . erfordert Codierung . Datensammlung ] Oben auf die Frage, Gebäude, jetzt die Analyse für alle acht Regionen durchzuführen.

    1. Welche Unterschiede haben Sie zwischen den Regionen?
    2. Wie viel mehr Zeit und Geld hat es gedauert, die Analyse auf alle acht der Regionen zu Scale-up?
    3. Stellen Sie sich vor, dass der Economist hat 100 verschiedene Abdeckungen jede Woche. Schätzen Sie, wie viel zusätzliche Zeit und Geld würde es Ihre Analyse zu 100 Briefe pro Woche zu Scale-up nehmen.
  5. [ hart . erfordert Codierung ] [Kaggle] (https://www.kaggle.com/) ist eine Website, die offenen Call-Projekte verwalten. in einer jener Projekten teilnehmen.

  6. [ Mittel ] In Ihrem Bereich eine aktuelle Ausgabe einer Zeitschrift schauen. Gibt es irgendwelche Papiere, die als offene Aufforderung Projekte neu formuliert worden sein könnte? Warum oder warum nicht?

  7. [ einfach ] Purdam (2014) beschrieben eine verteilte Datensammlung in London zu betteln. Fassen Sie die Stärken und Schwächen dieser Forschungsdesign.

  8. [ Mittel Redundanz] ist ein wichtiger Weg , um die Qualität der verteilten Datensammlung zu bewerten. Windt and Humphreys (2016) entwickeln und ein System testen , Berichte über Konfliktereignisse von Menschen im Ostkongo zu sammeln. Lies das Dokument.

    1. Wie kommt ihr Design Redundanz zu gewährleisten?
    2. Sie bieten verschiedene Ansätze, um die Daten aus ihrem Projekt gesammelt zu validieren. Fassen Sie sie. Welches war am überzeugendsten für Sie?
    3. Schlagen Sie einen neuen Weg, dass die Daten validiert werden konnten. Vorschläge sollten versuchen, das Vertrauen zu erhöhen, dass Sie in den Daten in einer Art und Weise haben würde, die kostengünstige und ethisch ist.
  9. [ Mittel ] Karim Lakhani und Kollegen (2013) erstellt ein Problem in der Bioinformatik zu lösen einen offenen Aufruf zu neuen Algorithmen zu erbitten. Sie erhielten mehr als 600 Einreichungen 89 neue Berechnungsansätze enthalten. Von den Einreichungen erhielten sie 30, die die Leistung der US-amerikanischen National Institutes of Health Megablast überschritten und die beste Vorlage erreicht sowohl eine höhere Genauigkeit und Geschwindigkeit (1000-mal schneller).

    1. Lesen Sie ihre Papier, und dann schlagen eine Sozialforschung Problem, das die gleiche Art von offenen Wettbewerb nutzen könnten. Insbesondere ist diese Art der offenen Wettbewerb konzentrierte sich auf die Beschleunigung und die Leistung eines vorhandenen Algorithmus zu verbessern. Wenn Sie nicht von Problem wie dieses in Ihrem Bereich denken kann, warum nicht versuchen zu erklären.
  10. [ Mittel ] Viele menschliche Berechnung Projekte stützen sich auf Teilnehmer aus Amazon Mechanical Turk. Registrieren Sie sich auf ein Arbeiter auf Amazon Mechanical Turk zu werden. Verbringen Sie eine Stunde, um dorthin zu arbeiten. Wie wirkt sich das auf Ihre Gedanken über das Design, Qualität und Ethik der menschlichen compuation Projekte?