5.2.2政治宣言的人群编码

编码政治宣言,一些通常由专家完成的,可以通过产生更大的再现性和柔软性的人计算项目来执行。

类似星系动物园,存在社会研究者要代码,分类或标记的图像或文本片段许多情况。这种研究的一个例子是政治宣言的编码。在选举中,政党产生描述他们的政策立场和指导哲学宣言。例如,这里是一片工党在英国从2010年的宣言:

“数以百万计的人在我们的公共服务工作体现英国的最佳值,从而有助于使人们充分利用他们自己的生活,同时保护他们免受他们不应该承担自己的风险。正如我们需要有关政府在使市场公平工作中的作用更大胆,我们还需要政府的大胆改革。“

这些宣言包含政治学家有价值的数据,特别是研究选举和政策辩论的动态。为了系统地提取这些信息的宣言,研究人员创建了该宣言项目 ,其中有组织的政治科学家从近1000方在50个国家代码4000的宣言。在每个宣言每个句子已使用56类方案的专家进行编码。这一合作努力的结果是一个巨大的数据集,总结嵌入在这些宣言的信息,此数据集已在200多篇科学论文被使用。

肯尼斯·贝努瓦和他的同事(2015)决定把此前已通过专家执行的宣言编码任务,并把它变成一个人的计算项目。其结果是,他们创造的编码处理是更可再现的和更灵活的,更不用说更便宜和更快。

同期间,最近在英国6选举产生的18宣言的工作中,Benoit和他的同事使用的拆分申请,结合了来自微任务劳动力市场的劳动者策略(亚马逊的Mechanical Turk和CrowdFlower有微任务劳动力市场的例子;有关详细微任务的劳动力市场,见第四章)。研究人员把每一个宣言,并将其分割成句子。接着,人的评级被施加到每个句子。特别是,如果这句话涉及政策声明,它是沿着两个维度编码:经济(从最左到最右侧)和社会(从自由派到保守派)(图5.5)。每个句子是由约5不同的人编码。最后,这些评级被使用的占为个人评价者效果和句子效果难以统计模型相结合 。在所有中,Benoit和他的同事收集了约1500工人20万的收视率。

图5.5:从伯努瓦等编码方案。 (2015)(图1)。

图5.5:从编码方案Benoit et al. (2015)图1)。

为了评估人群编码的质量中,Benoit和他的同事还对10名专家,教授和研究生政治学率用类似方法相同的宣言。尽管从人群成员的收视率比专家的收视率更变的共识人群评级曾与共识专家评价(图5.6),显着的协议。这一比较显示,与星系动物园,人类的计算项目可以生产出高品质的结果。

图5.6:专家估计(X轴)和人群估计数(Y轴)的编码从英国18党宣言时(伯努瓦等2015)均显着一致。编码的宣言来自三个政党(保守党,工党,自由民主党)和六个选举(1987年,1992年,1997年,2001年,2005年,2010年)。

图5.6:专家估计(X轴)和人群估计数(Y轴)的编码从英国18党的宣言时,均显着协议(Benoit et al. 2015) 。编码的宣言来自三个政党(保守党,工党,自由民主党)和六个选举(1987年,1992年,1997年,2001年,2005年,2010年)。

这个结果的基础上,贝努瓦和同事们用他们的人群编码系统做研究,与宣言项目是不可能的。例如,宣言项目没有移民的话题,因为当编码方案在80年代中期被开发,这不是一个突出的话题编写的宣言。并且,在这一点上,它是后勤不可行的宣言项目回去重新编码其宣言来捕获该信息。因此,这样看来,对研究移民的政治研究者的运气。然而,伯努瓦和他的同事们能够利用自己的人脑运算系统来做到这一点的编码定制自己的研究问题,迅速和容易。

为了研究移民政策,他们的编码宣言8个缔约方在2010年大选在英国。在每个宣言每个句子被编码为它是否涉及移民,如果是这样,无论是亲移民,中性或反移民。在5小时内推出自己的项目,结果。他们已经为$ 360总成本收集超过22000的反应。此外,从人群的测算结果显示有专家早期的调查显着的协议。然后,作为最终的测试,两个月后,研究者再现他们的人群编码。在几个小时内,他们已经创造了一个新的人群编码的数据集紧密匹配其原始人群编码的数据集。换句话说,人类计算使他们能够产生与专家评估一致并且是可重复的政治文本的编码。此外,由于人类的计算是快,价格便宜,很容易为他们定制自己的数据收集到关于移民其具体的研究问题。