活动

键:

  • 难度:容易简单 ,中中硬 , 很难很难
  • 需要数学( 需要数学
  • 需要编码( 需要进行编码
  • 数据采集​​ ( 数据采集
  • 我最喜欢的 ( 我的最爱
  1. [ 硬需要数学在这一章,我正要后分层非常积极的。然而,它并不总是提高估值的质量。构造的情况下可以事后分层可降低估计的质量。 (对于一个提示,请参阅Thomsen (1973)

  2. [ 硬数据采集需要进行编码 ]开展亚马逊MTurk非概率调查设计和询问枪支所有权(“你,或有没有人在你的家庭,拥有一支枪,步枪或手枪?那是你或你的家庭别的吗?”),并对枪支管制的态度(“那你觉得更重要的是,以保护美国人拥有枪支,或控制拥有枪支的权利?”)。

    1. 多长时间您的调查需要?它要多少钱?如何样品的人口统计数据比较了美国人口的变动?
    2. 什么是使用你的样品拥有枪支的粗略估计?
    3. 正确使用事后分层或其他技术样品的非代表性。那么什么是拥有枪支的估计?
    4. 如何你的估计比较从皮尤研究中心的最新估计是多少?你认为解释的差异,如果有任何?
    5. 重复对枪支管制的态度行使2-5。如何你的发现有什么不同?
  3. [ 很难数据采集需要进行编码 ]戈埃尔和他的同事(2016)投与由亚马逊MTurk皮尤研究中心从综合社会调查(GSS),并选择调查得出49多项选择题态度问题,基于非概率调查。然后,他们调整用于使用基于模型的后分层(P先生)的数据的非代表性,并比较与那些使用基于概率的GSS /皮尤调查所估计的调整的估计值。开展关于MTurk同样的调查,并尝试通过从最近几轮GSS /皮尤的估计比较调整后的估计复制图2a和图2b(见附录表A2为49问题的列表)。

    1. 比较和对比你的结果与皮尤和GSS的结果。
    2. 比较和对比你的结果从MTurk调查结果Goel, Obeng, and Rothschild (2016)
  4. [ 中数据采集需要进行编码许多研究使用手机的活动数据的自我报告的措施。这是一个有趣的环境,研究人员可以比较记录的行为自我报告的行为(见例如, Boase and Ling (2013)两种常见的行为,询问是打电话和发短信和两个共同的时间框架是“昨天”和“过去一周”。

    1. 收集的任何数据,你认为哪自我报告的措施,更准确过吗?为什么?
    2. 招募你的朋友5在你的调查。请简要地总结这5个朋友是如何取样。可能这个抽样程序诱导特异性偏见的估计?
    3. 请询问他们以下的微调查:
    • “多少次你用手机拨打他人昨天?”
    • “有多少短信你昨天送?”
    • “多少次你用你的手机拨打他人在过去七天?”
    • “很多时候你怎么会用你的手机发送或在过去七天内接收短信/ SMS?”一旦调查完成后,请检查其使用的数据通过自己的手机或服务提供商的身份登录。
    1. 如何自我报告的使用比较日志数据?这是最准确的,这是不准确的?
    2. 下面结合您已经与其他人在你的类收集的数据(如果你正在做这个活动的一类)的数据。有了这个大的数据集,重复(d)部分。
  5. [ 中数据采集 ]舒曼和压(1996)认为,问题的订单将此事两类问题之间的关系的:一部分部分问题,其中两个问题是在特异性相同的水平(例如两位总统候选人的评级);并在一个一般性的问题如下一个更具体的问题部分与整体的问题(例如:问:“是否满意你的工作?”,其次是“满意度如何,你有你的生活?”)。

    他们进一步刻画两类问题顺序效应:当到以后的问题的回答被带到接近(比他们原本定)给前面一个问题的出现一致性效果;对比时,有两个问题响应之间有较大的差异产生的影响。

    1. 创建一个对您认为将有一个大的问题顺序的影响,一副你认为将有一个大订单影响部分 - 整体的问题,和另一对的顺序您认为无关紧要的问题部分的部分问题。在MTurk运行的调查实验,以测试你的问题。
    2. 如何大是部分部分效果是你能够创建?这是一场一致性和对比度的效果呢?
    3. 如何大是部分与整体的效果是你能够创建?这是一场一致性和对比度的效果呢?
    4. 有没有在你对一个问题顺序的影响,你没有想到的秩序将有关系吗?
  6. [ 中数据采集 ]建立在舒曼和压,工作Moore (2002)描述的问题顺序影响一个单独的维度:加分和扣分。而对比度和一致性效果产生为受访者的两个项目的评价的结果在相对于彼此,添加剂和当受访者作出在其内的问题是所带来的更大的框架更敏感减色效应产生的。阅读Moore (2002) ,然后设计和MTurk进行问卷调查实验来证明相加或相减的效果。

  7. [ 硬数据采集 ]克里斯托弗Antoun先生和他的同事(2015)进行了一项研究,比较了来自四个不同的网络招聘渠道获得的便利性样本:MTurk,Craigslist网站,谷歌的AdWords和Facebook。设计简单的调查,并通过在至少两个不同网络招聘源招募参加者(它们可以是从所用的四个来源不同来源Antoun et al. (2015)

    1. 比较每招的费用,在金钱和时间上,不同来源之间。
    2. 比较不同来源获得的样品的组合物。
    3. 比较样品之间的数据的质量。有关如何衡量受访者数据质量的想法,看到Schober et al. (2015)
    4. 什么是您的首选来源?为什么?
  8. [ 中 ] YouGov的,基于互联网的市场研究公司,进行了在英国约有80万受访面板的网上投票和使用P.先生预测欧盟的公投(即Brexit)的结果中,英国选民投票要么留在或离开欧盟。

    YouGov的的统计模型的详细描述在这里(https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/)。粗略地说,YouGov的划分选民到基于2015年大选中投票选择,年龄,学历,性别,面试的日期,以及他们居住。首先,他们用从YouGov的小组成员收集的数据选区来估算,这些中间类型谁投票,是谁打算投票离开每个选民类型的人的比例。他们利用2015年的英国选举研究(BES)选举后的脸对脸调查,确认投票从选民名册估计每个选民型道岔。最后,他们估计有多少人在选民每个选民类型的基于最新的人口普查和年度人口调查(从BES一些附加信息,来自各地的换届选举,以及信息YouGov的调查数据上有多少人投了赞成票在每个选区每个政党)。

    在投票前三天,YouGov的表现请假两分的领先优势。在投票前夕,民调显示分不出(49-51保留)。最后上了天的研究有利于余绪(https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)预测48/52。事实上,这种估计四个百分点之差无缘决赛的结果(52-48假期)。

    1. 使用本章中所讨论的调查总误差框架来评估什么可能出了错。
    2. 选(https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/)后YouGov的响应解释说:“这似乎在很大程度上是由于投票率 - 这是我们一直说会是这样一个微妙平衡的比赛的结果至关重要。我们的投票率模型是基于,部分是否在受访者在上次大选投了赞成票,并高于大选的投票率水平打乱模型,特别是在北方。“这是否你的答案更改为(a)部分?
  9. [ 中需要进行编码 ]撰写模拟演示图3.1每一代表错误。

    1. 创建的情况下,这些错误实际上抵消。
    2. 创建的情况下的错误化合物彼此。
  10. [ 很难需要进行编码 ] Blumenstock和他的同事的研究(2015)参与建设,可以利用数字跟踪数据来预测调查的答复机器学习模型。现在,你要尝试用不同的数据集同样的事情。 Kosinski, Stillwell, and Graepel (2013)发现,Facebook的喜欢可以预测个人特质和属性。出人意料的是,这些预测可能比那些朋友和同事更准确(Youyou, Kosinski, and Stillwell 2015)

    1. 阅读Kosinski, Stillwell, and Graepel (2013) ,并复制图2.他们的数据都可以在这里:http://mypersonality.org/
    2. 现在,复制如图3所示。
    3. 最后,尝试他们对自己的Facebook数据模型:http://applymagicsauce.com/。它是如何为你工作?
  11. [ 中 ] Toole et al. (2015)使用呼叫细节从手机记录(CDR)来预测总失业率的趋势。

    1. 比较和对比的设计Toole et al. (2015)Blumenstock, Cadamuro, and On (2015)
    2. 你认为应该的CDR取代传统的调查,补充他们或不是为政府决策者用来追踪失业?为什么?
    3. 什么证据来说服你的CDR可以完全替代失业率的传统措施?