활동

  • 어려움의 정도 : 쉬운 쉬운 , 중간 매질 , 열심히 단단한 , 열심히 열심히
  • 수학이 필요하다. 수학이 필요하다. )
  • 코딩이 필요함 ( 코딩이 필요하다 )
  • 데이터 수집 ( 데이터 수집 )
  • 내가 좋아하는 것들 ( 내가 좋아하는 것 )
  1. [ 열심히 , 코딩이 필요하다 , 데이터 수집 , 내가 좋아하는 것 ] Benoit과 동료 (2016) 의 정치적 선언문에 대한 군중 조율에 관한 가장 흥미로운 주장 중 하나는 결과가 재현 가능하다는 것입니다. Merz, Regel, and Lewandowski (2016) 는 Manifesto Corpus에 대한 액세스를 제공합니다. Benoit et al. (2016) 그림 2를 재현 해보십시오 Benoit et al. (2016) 아마존 기계적 터크에서 노동자를 사용합니다. 결과가 얼마나 비슷한가요?

  2. [ 매질 ] InfluenzaNet 프로젝트에서 자원 봉사자 패널은 인플루엔자와 같은 질병과 관련된 발생률, 유행 및 건강 추구 행동을보고합니다 (Tilston et al. 2010; Noort et al. 2015) .

    1. InfluenzaNet, Google 독감 트렌드 및 기존 인플루엔자 추적 시스템의 설계, 비용 및 오류 가능성을 비교하고 대조하십시오.
    2. 새로운 형태의 인플루엔자와 같은 불안한 시간을 생각해보십시오. 각 시스템에서 발생할 수있는 오류를 설명하십시오.
  3. [ 단단한 , 코딩이 필요하다 , 데이터 수집 ] 이코노미스트 는 주간지입니다. 인간 계산 프로젝트를 만들어 시간이 지남에 따라 여성의 남성 대 여성 비율이 바뀌 었는지 확인하십시오.

    1. 이 잡지는 8 개 지역 (아프리카, 아시아 태평양, 유럽, 유럽 연합, 중남미, 중동, 북미 및 영국)에서 서로 다른 표지를 가질 수 있으며 잡지의 웹 사이트에서 모두 다운로드 할 수 있습니다. 이 지역 중 하나를 선택하고 분석을 수행하십시오. 다른 사람이 복제 할 수 있도록 충분한 세부 사항을 설명하는 절차를 설명하십시오.

    이 질문은 crowdsourcing 회사 인 CrowdFlower의 데이터 과학자 인 Justin Tenuto와 유사한 프로젝트에서 영감을 받았습니다. "Time Magazine이 정말로 멋쟁이를 좋아합니다"(http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ 열심히 , 코딩이 필요하다 , 데이터 수집 ] 이전 질문을 바탕으로 이제 8 개 지역 모두에 대해 분석을 수행하십시오.

    1. 지역별로 어떤 차이점이 있습니까?
    2. 분석을 8 개 지역 모두로 확대하는 데 추가 시간과 비용이 얼마나 들었습니까?
    3. 이코노미스트 가 매주 100 가지 다른 표지를 가지고 있다고 상상해보십시오. 분석을 주당 100 커버로 확대하는 데 얼마나 많은 시간과 비용이 소요되는지 예상하십시오.
  5. [ 단단한 , 코딩이 필요하다 ] Kaggle과 같은 공개 통화 프로젝트를 호스팅하는 여러 웹 사이트가 있습니다. 이 프로젝트 중 하나에 참여하고 특정 프로젝트에 대해 알게 된 내용과 일반적으로 열린 통화에 대해 설명하십시오.

  6. [ 매질 ] 귀하의 분야에서 최근 저널을 찾아보십시오. 공개 통화 프로젝트로 재구성 될 수있는 서류가 있습니까? 그 이유는 무엇?

  7. [ 쉬운 Purdam (2014) 은 런던에서 구걸하는 것에 관한 분산 데이터 수집을 설명합니다. 이 연구 설계의 강점과 약점을 요약하십시오.

  8. [ 매질 ] 중복성은 분산 데이터 수집의 품질을 평가하는 중요한 방법입니다. Windt and Humphreys (2016) 는 콩고 동부 사람들의 갈등 사건에 대한 보고서를 수집하기위한 시스템을 개발하고 테스트했습니다. 종이 읽으십시오.

    1. 그들의 디자인은 어떻게 중복을 보장합니까?
    2. 이들은 프로젝트에서 수집 한 데이터의 유효성을 확인하기위한 여러 가지 접근 방식을 제시했습니다. 그들을 요약하십시오. 어느 것이 당신에게 가장 설득력이 있었습니까?
    3. 데이터를 검증 할 수있는 새로운 방법을 제안하십시오. 제안은 비용 효율적이고 윤리적 인 방법으로 데이터에 대한 자신감을 높이 려 노력해야합니다.
  9. [ 매질 ] Karim Lakhani와 동료들 (2013) 은 전산 생물학에서의 문제를 해결하기 위해 새로운 알고리즘을 요구하는 공개 호를 창안했다. 그들은 89 건의 새로운 전산 접근법을 포함하는 600 건이 넘는 논문을 받았습니다. 제출물 중 30 개는 미국 국립 보건원 (National Institutes of Health)의 MegaBLAST 성능을 초과했으며 최고의 제출은 정확도와 속도 (1,000 배 더 빠름)를 모두 달성했습니다.

    1. 논문을 읽고 동일한 종류의 공개 경연 대회를 사용할 수있는 사회 연구 문제를 제안하십시오. 특히, 이러한 종류의 공개 콘테스트는 기존 알고리즘의 속도를 높이고 성능을 향상시키는 데 중점을 둡니다. 당신의 분야에서 이와 같은 문제를 생각할 수 없다면, 왜 설명하지 않겠습니까?
  10. [ 매질 , 내가 좋아하는 것 ] 많은 인간 계산 프로젝트는 Amazon Mechanical Turk의 참가자에게 의존합니다. 아마존 메카닉 터크 (United Mechanical Turk)에서 일하기 위해 가입하십시오. 거기에서 1 시간을 보내십시오. 이것이 인간의 계산 프로젝트의 디자인, 품질 및 윤리에 대한 귀하의 생각에 어떤 영향을 미칩니 까?