Clé:
[ , ] Dans le chapitre, je suis très positif au sujet de post-stratification. Cependant, il n'améliore pas toujours la qualité des estimations. Construire une situation où peut post-stratification peut diminuer la qualité des estimations. (Pour un indice, voir Thomsen (1973) ).
[ , , ] Concevoir et mener une enquête non probabiliste sur Amazon MTurk poser des questions sur la possession d'armes ( «Avez-vous, ou est-ce que quelqu'un dans votre ménage, posséder une arme à feu, fusil ou pistolet? Est-ce que vous ou quelqu'un d'autre dans votre ménage?») Et les attitudes envers le contrôle des armes à feu ( «Que pensez-vous est plus important pour protéger le droit des Américains à posséder des armes, ou pour contrôler la possession d'armes?»).
[ , , ] Goel et ses collègues (2016) ont administré un sondage sur le non probabiliste composé de 49 questions à choix multiples attitudes tirées de l'Enquête sociale générale (ESG) et sélectionnez enquêtes par le Pew Research Center sur Amazon MTurk. Ils ajustent ensuite pour la non-représentativité des données à l'aide basée sur un modèle post-stratification (M. P), et de comparer les estimations ajustées avec celles estimées à l'aide des enquêtes ESG / Pew probabilistes. Effectuer la même enquête sur MTurk et essayer de reproduire la figure 2a et la figure 2b en comparant vos estimations ajustées avec les estimations des séries les plus récentes de l'ESG / Pew (Voir tableau annexe A2 pour la liste des 49 questions).
[ , , ] De nombreuses études utilisent des mesures de données sur les activités de téléphonie mobile d'auto-évaluation. Ceci est un paramètre intéressant où les chercheurs peuvent comparer les comportements auto-rapportés avec le comportement consignées (voir par exemple, Boase and Ling (2013) ). Deux comportements communs à poser au sujet sont appels et SMS, et deux cadres de temps commun sont "hier" et "la semaine dernière."
[ , ] Schuman et Presser (1996) font valoir que les ordonnances de question seraient d' importance pour les deux types de relations entre les questions: questions partiel partie où deux questions sont au même niveau de spécificité (par exemple notation de deux candidats à la présidence); et les questions partiel entières où une question générale suit une question plus précise (par exemple, demandent «Comment êtes-vous satisfait de votre travail?» suivi de «Comment êtes-vous satisfait de votre vie?»).
Ils caractérisent en outre deux types d'effets question d'ordre: les effets de cohérence se produisent lorsque les réponses à une question plus tard sont rapprochés (qu'ils ne le seraient autrement) à ceux donnés à une question précédente; contraster les effets se produisent quand il y a de plus grandes différences entre les réponses à deux questions.
[ , ] Construire sur les travaux de Schuman et Presser, Moore (2002) décrit une dimension distincte de l' effet question d'ordre: additif et soustractif. Bien que le contraste et la cohérence des effets sont produits à la suite des évaluations des deux éléments des répondants par rapport à l'autre, les effets additifs et soustractifs sont produits lorsque les répondants sont rendus plus sensibles au cadre plus large dans lequel les questions sont posées. Lire Moore (2002) , puis de concevoir et exécuter une expérience d'enquête sur MTurk pour démontrer additives ou soustractives effets.
[ , ] Christopher Antoun et ses collègues (2015) ont mené une étude comparant les échantillons de commodité obtenus à partir de quatre sources de recrutement en ligne différents: MTurk, Craigslist, Google AdWords et Facebook. Concevoir une enquête simple et recruter des participants à travers au moins deux sources de recrutement en ligne différents (ils peuvent être des sources différentes des quatre sources utilisées dans Antoun et al. (2015) ).
[ ] YouGov, une firme de recherche de marché basée sur Internet, a mené des sondages en ligne d'un groupe d'environ 800.000 personnes interrogées au Royaume-Uni et utilisé MP pour prédire le résultat du référendum de l'UE (par exemple, Brexit) où les électeurs britanniques votent soit pour rester ou quitter l'Union européenne.
Une description détaillée du modèle statistique de YouGov est ici (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grosso modo, YouGov partitionne électeurs en types basés sur 2015 élections générales choix de vote, l'âge, les qualifications, le sexe, la date de l'interview, ainsi que la circonscription où ils vivent. D'abord, ils ont utilisé les données recueillies auprès des panélistes YouGov pour estimer, parmi ceux qui votent, la proportion de personnes de chaque type des électeurs qui ont l'intention de voter congé. Ils estiment le taux de participation de chaque type d'électeur en utilisant l'étude de 2015 British Election (BES) post-électorale face-à-face enquête, qui a validé la participation des listes électorales. Enfin, ils estiment combien de personnes il y a de chaque type d'électeurs dans l'électorat basée sur le dernier recensement et l'Enquête démographique annuelle (avec des informations d'addition des BES, des données d'enquête YouGov de partout dans l'élection générale, et de l'information sur la façon dont beaucoup de gens ont voté pour chaque parti dans chaque circonscription).
Trois jours avant le vote, YouGov a montré une avance de deux points pour le congé. A la veille du vote, le sondage a montré trop proche de l'appel (49-51 Remain). La dernière étude sur le jour prédit 48/52 en faveur de rester (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). En fait, cette estimation a raté le résultat final (52-48 Congé) par quatre points de pourcentage.
[ , ] Ecrire une simulation pour illustrer chacune des erreurs de représentation dans la figure 3.1.
[ , ] La recherche de Blumenstock et ses collègues (2015) consiste à construire un modèle d'apprentissage de la machine qui pourrait utiliser les données de trace numérique pour prédire les réponses au sondage. Maintenant, vous allez essayer la même chose avec un ensemble de données différent. Kosinski, Stillwell, and Graepel (2013) a révélé que Facebook aime peut prédire les traits et les attributs individuels. Étonnamment, ces prévisions peuvent être encore plus précis que ceux des amis et des collègues (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) détail l' utilisation d'appel des enregistrements (CDR) à partir de téléphones mobiles pour prédire les tendances globales sur le chômage.