мероприятия

Условные обозначения:

  • Степень сложности: легкий легко , средний средний , жесткий жесткий , очень сложно очень сложно
  • требует математику ( требует математику )
  • требует кодирования ( требует кодирования )
  • Сбор данных ( Сбор данных )
  1. [ очень сложно , требует кодирования , Сбор данных ] Одним из самых захватывающих претензий со стороны Benoit et al. (2015) и Benoit et al. (2015) на толпы кодирования политических манифестов является то , что результаты являются воспроизводимыми. Merz, Regel, and Lewandowski (2016) обеспечивает доступ к манифесту корпус. Попробуйте воспроизвести рис 2 из Benoit et al. (2015) и Benoit et al. (2015) с помощью рабочих из Amazon Механический турок. Как похожи были ваши результаты?

  2. [ средний ] В проекте InfluenzaNet добровольцем панель людей сообщают о заболеваемости, распространенности и здоровья ищет поведения , связанных с гриппоподобных заболеваниях (ГПЗ) (Tilston et al. 2010; Noort et al. 2015) и (Tilston et al. 2010; Noort et al. 2015) и (Tilston et al. 2010; Noort et al. 2015) .

    1. Сравните и дизайн, стоимость и возможные ошибки в InfluenzaNet, Google Flu Trends, а также традиционные системы слежения за гриппом.
    2. Рассмотрим нерешенного время, например, вспышки свиного гриппа. Опишите возможные ошибки в каждой системе.
  3. [ жесткий , требует кодирования , Сбор данных ] The Economist является еженедельный журнал новостей. Создать человеческий проект вычисления, чтобы увидеть, если отношение женщин к мужчинам на крышке увеличилось с течением времени.

    1. Журнал может иметь различные покрытия в восьми различных регионах (Африка, Азия Тихоокеанского региона, Европы, Европейского Союза, Латинской Америки, Ближнего Востока, Северной Америки, и Соединенное Королевство) , и все они могут быть загружены с сайта The Economist . Выберите один из этих регионов и провести анализ. Обязательно опишите ваши процедуры достаточно подробно, чтобы они могли быть воспроизведен кем-то другим.

    Этот вопрос был вдохновлен аналогичный проект , Джастин Tenuto, ученый данных на краудсорсинга компании CrowdFlower см "Time Magazine действительно любит Dudes" .

  4. [ очень сложно , требует кодирования , Сбор данных ] Опираясь на поставленный выше вопрос, теперь выполнить анализ для всех восьми регионов.

    1. Какие различия вы нашли в разных регионах?
    2. Сколько дополнительных денег и времени потребовалось для расширения масштабов ваш анализ на все восемь регионов?
    3. Представьте себе, что экономист 100 различных охватывает каждую неделю. Оцените, сколько дополнительного времени и денег потребуется, чтобы масштабировать свой анализ до 100 крышек в неделю.
  5. [ жесткий , требует кодирования ] [Kaggle] (https://www.kaggle.com/) является веб-сайт на котором размещены проекты открытых вызовов. Примите участие в одном из этих проектов.

  6. [ средний ] Посмотреть недавнем выпуске журнала в своей области. Существуют ли какие-либо документы, которые могли бы перефразировать проекты открытых вызовов? Почему или почему нет?

  7. [ легко ] Purdam (2014) описал коллекцию распределенных данных о попрошайничества в Лондоне. Обобщить сильные и слабые стороны этого исследовательского проекта.

  8. [ средний ] Избыточность является важным средством для оценки качества распределенного сбора данных. Windt and Humphreys (2016) разработать и протестировать систему для сбора сообщений о конфликтных событий от людей в Восточном Конго. Читать газету.

    1. Как их конструкция обеспечивают избыточность?
    2. Они предлагают несколько подходов для проверки достоверности данных, полученных от их проекта. Обобщить их. Что было самым убедительным для вас?
    3. Предложен новый способ, которым данные могут быть подтверждены. Предложения должны попытаться увеличить уверенность, что вы имели бы в данных таким образом, что является экономически эффективным и этическим.
  9. [ средний ] Карим Лакхани и его коллеги (2013) создали открытый вызов запрашивать новые алгоритмы для решения задачи в области вычислительной биологии. Они получили более 600 представлений, содержащих 89 новые вычислительные подходы. Из представленных материалов, они получили 30, что превысило показатели США Национальных институтов здравоохранения Megablast, и лучшее представление достигается как большую точность и скорость (в 1000 раз быстрее).

    1. Прочитайте их бумагу, а затем предложить социальную проблему исследований, которые могли бы использовать тот же самый вид открытого конкурса. В частности, этот вид открытого конкурса ориентирована на ускорение и повышение эффективности существующего алгоритма. Если вы не можете думать о проблеме, как это в вашей области, попытайтесь объяснить, почему нет.
  10. [ средний ] Многие проекты вычислений человека полагаются на участников из Amazon Механический турок. Войдите в систему, чтобы стать рабочим на Amazon Механический турок. Проведите один час работы там. Как это повлияет на ваши мысли по поводу дизайна, качества и этики проектов compuation человека?