활동

키:

  • 난이도 : 쉬운 쉬운 중간 매질 하드 단단한 , 열심히 열심히
  • (수학을 필요로 수학이 필요합니다 )
  • (코딩이 필요합니다 코딩이 필요합니다 )
  • 데이터 수집 ( 데이터 수집 )
  • 내가 좋아하는 것들 ( 내가 좋아하는 것 )
  1. [ 단단한 , 수학이 필요합니다 ] 장에서 필자는 사후 층화에 대해 매우 긍정적이었다. 그러나, 항상 추정의 품질을 향상시키지 않는다. - 게시 계층화가 수 추정의 품질을 줄일 수있는 상황을 구축합니다. (힌트에 대한 내용은 Thomsen (1973) ).

  2. [ 단단한 , 데이터 수집 , 코딩이 필요합니다 ] 디자인 및 총 소유에 대해 물어 아마존 MTurk에 비 확률 조사를 실시 ( "인가? 총, 소총을 소유하고, 당신을 수행하거나 가정에서 누군가를 수행하거나 권총이 당신이나 당신의 가족 중 다른 사람?") 및 총기 규제에 대한 태도 ( "당신은 어떻게 생각하십니까은 총을 소유하거나 총기 소유권을 제어하는​​ 미국인의 권리를 보호하는 더 중요-입니까?").

    1. 설문 조사는 얼마나 걸리나요? 비용은 얼마입니까? 어떻게 샘플의 인구 통계는 미국 인구의 인구 통계에 비교합니까?
    2. 샘플을 사용하여 총 소유 원시 추정치는 무엇입니까?
    3. 사후 층화 또는 다른 기술을 사용하여 샘​​플의 비 대표성에 대한 올바른. 이제 총 소유의 추정치는 무엇인가?
    4. 어떻게 예상 퓨 리서치 센터의 최근 추정치와 비교할 때 어떻습니까? 어떤이있는 경우에는, 불일치를 설명 어떻게 생각하십니까?
    5. 총기 규제에 대한 태도에 대한 운동 2-5를 반복합니다. 당신의 결과는 어떻게 다릅니 까?
  3. [ 열심히 , 데이터 수집 , 코딩이 필요합니다 ] 고엘 및 동료 (2016) 아마존 MTurk의 퓨 리서치 센터가 일반 사회 조사 (GSS)를 선택 설문 조사에서 도출 49 객관식 태도 질문으로 구성된 비 확률 기반 설문 조사를 투여. 그런 다음 모델 기반의 사후 층화 (미스터 P)를 사용하여 데이터의 비 대표성을 조정하고, 확률 기반의 GSS / 퓨 조사를 이용하여 추정 된 것과 조정 된 추정치를 비교합니다. MTurk에서 동일한 설문 조사를 실시하고 GSS / 퓨의 최신 라운드에서 추정하여 조정 된 추정치를 비교하여도 2a 및도 2b를 복제하려고 (49 질문 목록은 부록 표 A2 참조).

    1. 비교 퓨 및 GSS의 결과로 결과를 대조.
    2. 비교에서 MTurk 설문 조사의 결과에 결과를 대조 Goel, Obeng, and Rothschild (2016) .
  4. [ 매질 , 데이터 수집 , 코딩이 필요합니다 ] 많은 연구 휴대폰 활동 데이터의 자기보고 방법을 사용한다. 이 연구자들은 기록 된 동작과 자기보고 동작을 비교할 수 있습니다 흥미로운 설정 (예 참조 Boase and Ling (2013) ). 전화와 문자 메시지, 2 개의 공통 시간 프레임됩니다에 대해 문의하는 두 가지 일반적인 행동은 "지난 주에." "어제"및

    1. 당신이 더 정확하다고 생각 하는가 자기 보고서의 측정 데이터를 수집하기 전에? 왜?
    2. 설문 조사에있을 친구의 5를 모집. 간단히이 5 친구가 샘플링 된 방법을 요약하여주십시오. 이 샘플링 절차는 추정 특정 편견을 유도 할 수 있는가?
    3. 그 다음 마이크로 설문 조사에 문의하시기 바랍니다 :
    • "얼마나 많은 시간을 당신은 어제 다른 전화 휴대 전화를 사용 했습니까?"
    • "얼마나 많은 문자 메시지 어제 보내나요?"
    • "얼마나 많은 시간을 당신은 지난 7 일 다른 전화 휴대 전화를 사용 했습니까?"
    • 자신의 휴대 전화 또는 서비스 제공 업체에 의해 기록으로 설문 조사가 완료되면 "많은 시간을 보내거나 지난 7 일 문자 메시지 / SMS를받을? 귀하의 휴대 전화를 사용했던 방법", 자신의 사용 데이터를 확인 부탁드립니다.
    1. 어떻게 자기보고 사용 데이터를 기록하는 비교합니까? 어느 이상 정확하다, 가장 정확?
    2. 지금 (당신이 클래스에 대한이 활동을하고있는 경우) 클래스에서 다른 사람의 데이터로 수집 한 데이터를 결합. 이 큰 데이터 세트로, 부분 (d)를 반복합니다.
  5. [ 매질 , 데이터 수집 ] 슈만과 프렛 (1996) 그 질문 주문이 질문의 관계의 두 가지 유형의 문제 것이라고 주장 : 두 가지 질문이 특이 동일한 수준에 부분 부분의 질문 (예를 들어 두 대통령 후보의 평가) 및 일반적인 질문은보다 구체적인 질문을 다음 부분 - 전체 질문 (예를 들어 "당신의 일에 당신을 얼마나 만족?"를 묻는 다음 "당신의 인생에 당신을 얼마나 만족?").

    그들은 상기 질문 순서 효과 두 종류의 특징 : 무결성 효과 나중에 질문 응답 (그들이 그렇지 않은 것보다) 더 가까운 이전 질문에 주어진 것들 가져온 때 발생; 두 가지 질문에 대한 응답 사이에 큰 차이가있을 때 발생하는 효과를 대조.

    1. 당신은 큰 질문 순서 효과가 큰 순서 영향을 미칠 것이라고 생각 부분 - 전체 질문 한 쌍의 순서는 중요하지 것이라고 생각 질문의 또 다른 한 쌍을 생각 파트 부분을 질문 한 쌍을 만듭니다. 질문을 테스트하는 MTurk에 조사 실험을 실행합니다.
    2. 부분 부분의 효과를 만들 수 있었다 얼마입니까? 그것은 일관성 또는 대비 효과 되었습니까?
    3. 부분 - 전체 효과를 만들 수 있었다 얼마입니까? 그것은 일관성 또는 대비 효과 되었습니까?
    4. 당신은 순서가 중요 것이라고 생각하지 않았다 당신 쌍의 질문 순서 효과가 되었습니까?
  6. [ 매질 , 데이터 수집 ] 슈만과 프렛의 작업을 바탕 Moore (2002) 가색과 감색 : 질문 순서 효과의 별도의 차원을 설명합니다. 반대로 일관성 효과는 서로 첨가제에 관하여 두 항목 응답자의 평가의 결과로서 생성되고, 응답자는 의문이 제기되는 내에 큰 틀에 더 민감했다 때 감산 효과를 생성하는 동안. 읽기 Moore (2002) , 다음 설계 및 첨가제 또는 감산 효과를 입증하기 위해 MTurk에 조사 실험을 실행합니다.

  7. [ 단단한 , 데이터 수집 ] 크리스토퍼 Antoun 및 동료 (2015) MTurk, 크레이그리스트, Google 애드워즈와 페이스 북 : 네 가지 온라인 채용 매체에서 편의 샘플을 비교하는 연구를 실시했다. 간단한 조사를 설계하고 적어도 두 개의 서로 다른 온라인 채용 소스를 통해 참가자를 모집 (그들에 사용되는 네 개의 소스로부터 다른 소스가 될 수 Antoun et al. (2015) ).

    1. 다른 소스를, 돈과 시간의 측면에서 모집 당 비용을 비교합니다.
    2. 다른 소스로부터 얻은 샘플의 조성을 비교한다.
    3. 샘플 사이의 데이터 품질을 비교한다. 응답자의 데이터 품질을 측정하는 방법에 대한 아이디어를 참조 Schober et al. (2015) .
    4. 원하는 소스는 무엇입니까? 왜?
  8. [ 매질 ] 유고 브, 인터넷 기반의 시장 조사 회사 인 영국에서 약 80 응답자의 패널의 온라인 설문 조사를 실시하고, 영국의 유권자들이 투표 중 하나 남아 EU의 국민 투표 (즉, Brexit)의 결과를 예측하는 씨 P. 사용 또는에서 유럽 연합 (EU)을 둡니다.

    유고 브의 통계 모델에 대한 자세한 설명은 여기 (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). 대략 말하기, 유고 브는 2015 총선 투표 선택, 연령, 자격, 성별, 인터뷰 날짜뿐만 아니라 그 사이에 추정하기가 첫째로, 그들은 유고 브의 패널에서 수집 된 데이터를 사용했다. 살고있는 선거구에 기초 유형으로 유권자 파티션 투표 사람, 휴가 투표하려는 각 유권자 유형의 사람들의 비율. 그들은 2015 년 영국의 선거 연구 (BES) 선거 롤에서 투표율을 확인 후 선거 대면 설문 조사를 사용하여 각 유권자 유형의 투표율을 예상하고있다. 마지막으로, 그들은 총선, 정보 주위에서 유고 브의 조사 자료 많은 사람들이 투표 방법에 BES에서 몇 가지 추가 정보와 최신 인구 및 연간 인구 조사 (에 따라 유권자의 각 유권자 유형의 얼마나 많은 사람들 추정 각 선거구에서 각 당사자).

    사흘 투표하기 전에, 유고 브는 휴가위한 2 점 리드를 보여 주었다. 투표 직전에, 여론 조사 (49-51가 남아) 전화를 너무 가까이 보여 주었다. 마지막에 - 일 연구 (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/) 남아 찬성 48/52을 예측했다. 사실,이 추정치는 네 % 포인트 최종 결과 (52-48 남기기)를 놓쳤다.

    1. 잘못 갈 수 있는지 평가하기 위해이 장에서 논의 된 총 조사 오류 프레임 워크를 사용합니다.
    2. 선거 (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) 이후 유고 브의 반응은 설명했다 : "이 때문에 투표율에 큰 부분에 보인다 - 뭔가를 그 우리는 미세하게 균형 잡힌 경쟁의 결과에 중요한 것 모두 함께 말했다. 응답자 여부를 지난 총선에서 투표와 총선의 위의 투표율 수준은 특히 북한의 모델을 화나게 한 우리의 투표율 모델은 부분적으로 근거했다. "이 부분 (A)에 대한 답을 변경합니까?
  9. [ 매질 , 코딩이 필요합니다 도 3.1 표현의 오류를 각각 설명하기 위해 시뮬레이션을 작성합니다.

    1. 이러한 오류가 실제로 상쇄 상황을 만듭니다.
    2. 오류가 서로 복잡하게 상황을 만듭니다.
  10. [ 열심히 , 코딩이 필요합니다 ] Blumenstock와 동료들의 연구 (2015) 조사 응답을 예측하는 디지털 추적 데이터를 사용할 수있는 기계 학습 모델 구축을 포함했다. 이제 다른 데이터 세트와 같은 일을 시도 할 것입니다. Kosinski, Stillwell, and Graepel (2013) 페이스 북이 개인의 특성과 속성을 예측할 수 좋아하는 것을 발견했다. 놀랍게도, 이러한 예측은 더욱 정확하고 친구 및 동료에 비해 될 수 있습니다 (Youyou, Kosinski, and Stillwell 2015) .

    1. 읽기 Kosinski, Stillwell, and Graepel (2013) http://mypersonality.org/ : 그들의 데이터가 여기에 사용할 수 있으며, 그림 2를 복제
    2. 이제 그림 3을 복제합니다.
    3. http://applymagicsauce.com/ : 마지막으로, 자신의 페이스 북 데이터를 자신의 모델을 시도합니다. 얼마나 잘 당신을 위해 작동합니까?
  11. [ 매질 ] Toole et al. (2015) 휴대 전화에서 사용하는 통화 상세 기록 (CDR은)는 총 실업 동향을 예측합니다.

    1. 비교의 디자인 대조 Toole et al. (2015)Blumenstock, Cadamuro, and On (2015) .
    2. 당신의 CDR은, 기존의 설문 조사를 교체를 보완 또는 실업을 추적하기 위해 정부 정책에 대한 모든에서 사용할 수 없습니다 생각하십니까? 왜?
    3. 어떤 증거 CDR을 완전히 실업률의 전통적인 방법을 대체 할 수 있음을 설득 할 것인가?