Aktivitäten

  • Schwierigkeitsgrad: einfach einfach , Mittel Mittel , hart hart , sehr schwer sehr schwer
  • erfordert Mathematik ( erfordert Mathematik )
  • erfordert Codierung ( erfordert Codierung )
  • Datensammlung ( Datensammlung )
  • meine Favoriten ( mein Liebling )
  1. [ sehr schwer , erfordert Codierung , Datensammlung , mein Liebling ] Eine der aufregendsten Behauptungen von Benoits und Kollegen (2016) Crowd-Kodierung von politischen Manifesten zu erforschen, ist, dass die Ergebnisse reproduzierbar sind. Merz, Regel, and Lewandowski (2016) bieten Zugang zum Manifest Corpus. Versuchen Sie, Abbildung 2 von Benoit et al. (2016) mit Arbeitern von Amazon Mechanical Turk. Wie ähnlich waren deine Ergebnisse?

  2. [ Mittel ] Im InfluenzaNet-Projekt berichten Freiwillige über Inzidenz, Prävalenz und gesundheitsbezogenes Verhalten im Zusammenhang mit grippeähnlichen Erkrankungen (Tilston et al. 2010; Noort et al. 2015) .

    1. Vergleichen und kontrastieren Sie das Design, die Kosten und die wahrscheinlichen Fehler bei InfluenzaNet, Google Grippe-Trends und herkömmlichen Influenza-Verfolgungssystemen.
    2. Betrachten Sie eine ungeklärte Zeit, etwa den Ausbruch einer neuartigen Influenza. Beschreiben Sie die möglichen Fehler in jedem System.
  3. [ hart , erfordert Codierung , Datensammlung ] The Economist ist ein wöchentliches Nachrichtenmagazin. Erstellen Sie ein menschliches Berechnungsprojekt, um festzustellen, ob sich das Verhältnis von Frauen zu Männern auf dem Cover im Laufe der Zeit verändert hat.

    1. Das Magazin kann in acht verschiedenen Regionen (Afrika, Asien-Pazifik, Europa, Europäische Union, Lateinamerika, Mittlerer Osten, Nordamerika und Vereinigtes Königreich) verschiedene Titel enthalten und kann von der Website des Magazins heruntergeladen werden. Wählen Sie eine dieser Regionen aus und führen Sie die Analyse durch. Stellen Sie sicher, dass Sie Ihre Verfahren so detailliert beschreiben, dass sie von anderen Personen repliziert werden können.

    Diese Frage wurde von einem ähnlichen Projekt von Justin Tenuto, einem Data Scientist der Crowdsourcing-Firma CrowdFlower, inspiriert: siehe "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ sehr schwer , erfordert Codierung , Datensammlung ] Aufbauend auf der vorherigen Frage, führen Sie nun die Analyse für alle acht Regionen durch.

    1. Welche Unterschiede haben Sie in den Regionen gefunden?
    2. Wie viel Zeit und Geld haben Sie benötigt, um Ihre Analyse auf alle acht Regionen auszudehnen?
    3. Stellen Sie sich vor, dass der Economist jede Woche 100 verschiedene Abdeckungen hat. Schätzen Sie, wie viel Zeit und Geld Sie benötigen, um Ihre Analyse auf 100 Abdeckungen pro Woche zu erweitern.
  5. [ hart , erfordert Codierung ] Es gibt mehrere Websites, die offene Aufrufprojekte hosten, z. B. Kaggle. Nehmen Sie an einem dieser Projekte teil und beschreiben Sie, was Sie über das jeweilige Projekt und über offene Anrufe im Allgemeinen erfahren.

  6. [ Mittel ] Sehen Sie sich eine aktuelle Ausgabe eines Journals in Ihrem Bereich an. Gibt es Papiere, die als Open-Call-Projekte hätten umformuliert werden können? Warum oder warum nicht?

  7. [ einfach ] Purdam (2014) beschreibt eine verteilte Datensammlung über Betteln in London. Fassen Sie die Stärken und Schwächen dieses Forschungsdesigns zusammen.

  8. [ Mittel ] Redundanz ist ein wichtiger Weg, um die Qualität der verteilten Datenerfassung zu bewerten. Windt and Humphreys (2016) entwickelten und testeten ein System zur Erfassung von Konflikten von Menschen im Ostkongo. Lies das Dokument.

    1. Wie sorgt ihr Design für Redundanz?
    2. Sie boten verschiedene Ansätze an, um die aus ihrem Projekt gesammelten Daten zu validieren. Fasse sie zusammen. Was überzeugte dich am meisten?
    3. Schlagen Sie einen neuen Weg vor, wie die Daten validiert werden können. Vorschläge sollten versuchen, das Vertrauen zu stärken, das Sie in den Daten auf kosteneffiziente und ethische Weise haben würden.
  9. [ Mittel ] Karim Lakhani und Kollegen (2013) haben einen offenen Aufruf zur Erlangung neuer Algorithmen zur Lösung eines Problems in der Computerbiologie erstellt. Sie erhielten mehr als 600 Einsendungen mit 89 neuartigen Berechnungsansätzen. Von den Einreichungen übertrafen 30 die Leistung des MegaBLAST der US-amerikanischen National Institute of Health, und die beste Einreichung erreichte sowohl eine höhere Genauigkeit als auch eine höhere Geschwindigkeit (1.000-mal schneller).

    1. Lesen Sie ihre Arbeit und schlagen Sie dann ein soziales Forschungsproblem vor, das denselben offenen Wettbewerb verwenden könnte. Insbesondere ist diese Art von offenem Wettbewerb darauf ausgerichtet, die Leistung eines bestehenden Algorithmus zu beschleunigen und zu verbessern. Wenn Sie in Ihrem Bereich nicht an ein solches Problem denken können, versuchen Sie zu erklären, warum nicht.
  10. [ Mittel , mein Liebling ] Viele menschliche Berechnungsprojekte sind auf Teilnehmer von Amazon Mechanical Turk angewiesen. Melden Sie sich an um ein Arbeiter bei Amazon Mechanical Turk zu werden. Verbringen Sie eine Stunde dort. Wie wirkt sich das auf Ihre Vorstellungen von Design, Qualität und Ethik menschlicher Berechnungsprojekte aus?