[ , Trong chương này, tôi rất lạc quan về phân tầng sau. Tuy nhiên, điều này không phải lúc nào cũng cải thiện chất lượng ước tính. Xây dựng một tình huống mà phân tầng sau có thể làm giảm chất lượng của các ước tính. (Để biết gợi ý, xem Thomsen (1973) .)
[ , , ] Thiết kế và tiến hành một cuộc khảo sát không xác suất trên Amazon Mechanical Turk để hỏi về quyền sở hữu súng và thái độ đối với việc kiểm soát súng. Để bạn có thể so sánh ước tính của mình với những ước tính từ mẫu xác suất, vui lòng sao chép văn bản câu hỏi và tùy chọn phản hồi trực tiếp từ cuộc khảo sát chất lượng cao như khảo sát do Trung tâm nghiên cứu Pew điều hành.
[ , , Goel và cộng sự (2016) quản lý 49 câu hỏi trắc nghiệm thu được từ Khảo sát xã hội chung (GSS) và các khảo sát chọn từ Trung tâm nghiên cứu Pew đến mẫu không xác suất của người trả lời được lấy từ Amazon Mechanical Turk. Sau đó, họ điều chỉnh tính không đại diện của dữ liệu bằng cách sử dụng phân tầng sau dựa trên mô hình và so sánh các ước tính được điều chỉnh của chúng với các ước tính từ các khảo sát GSS và Pew dựa trên xác suất. Tiến hành khảo sát tương tự trên Amazon Mechanical Turk và cố gắng nhân rộng hình 2a và hình 2b bằng cách so sánh các ước tính được điều chỉnh của bạn với các ước tính từ các vòng khảo sát gần đây nhất của các khảo sát GSS và Pew. (Xem bảng phụ lục A2 để biết danh sách 49 câu hỏi.)
[ , , ] Nhiều nghiên cứu sử dụng các biện pháp tự báo cáo về việc sử dụng điện thoại di động. Đây là một thiết lập thú vị trong đó các nhà nghiên cứu có thể so sánh hành vi tự báo cáo với hành vi đã đăng nhập (xem ví dụ, Boase and Ling (2013) ). Hai hành vi phổ biến để hỏi về gọi điện và nhắn tin và hai khung thời gian chung là “ngày hôm qua” và “trong tuần qua”.
[ , ] Schuman và Presser (1996) cho rằng các đơn đặt hàng câu hỏi sẽ là vấn đề đối với hai loại câu hỏi: các câu hỏi bán phần mà hai câu hỏi có cùng mức độ cụ thể (ví dụ, xếp hạng của hai ứng cử viên tổng thống); và toàn bộ câu hỏi trong đó một câu hỏi chung sau một câu hỏi cụ thể hơn (ví dụ: hỏi “Bạn hài lòng với công việc của mình như thế nào?” theo sau là “Bạn hài lòng với cuộc sống của mình như thế nào?”).
Chúng tiếp tục mô tả hai loại hiệu ứng thứ tự câu hỏi: các hiệu ứng nhất quán xảy ra khi các câu trả lời cho một câu hỏi sau đó được đưa tới gần hơn (so với các câu hỏi trước); hiệu ứng tương phản xảy ra khi có sự khác biệt lớn hơn giữa các câu trả lời cho hai câu hỏi.
[ , ] Xây dựng trên công trình của Schuman và Presser, Moore (2002) mô tả một chiều hướng riêng biệt của hiệu ứng thứ tự câu hỏi: các hiệu ứng cộng và trừ. Trong khi các hiệu ứng tương phản và nhất quán được tạo ra như là kết quả của các đánh giá của người trả lời về hai mục liên quan đến nhau, các hiệu ứng cộng và trừ được tạo ra khi người trả lời nhạy cảm hơn với khung lớn hơn trong đó các câu hỏi được đặt ra. Đọc Moore (2002) , sau đó thiết kế và chạy thử nghiệm khảo sát trên MTurk để chứng minh các hiệu ứng cộng hoặc trừ.
[ , ] Christopher Antoun và cộng sự (2015) đã tiến hành một nghiên cứu so sánh các mẫu tiện lợi thu được từ bốn nguồn tuyển dụng trực tuyến khác nhau: MTurk, Craigslist, Google AdWords và Facebook. Thiết kế một cuộc khảo sát đơn giản và tuyển dụng người tham gia thông qua ít nhất hai nguồn tuyển dụng trực tuyến khác nhau (các nguồn này có thể khác với bốn nguồn được sử dụng trong Antoun et al. (2015) ).
[ ] Trong một nỗ lực để dự đoán kết quả của cuộc trưng cầu dân ý EU năm 2016 (tức là Brexit), YouGov - một công ty nghiên cứu thị trường dựa trên Internet - đã tiến hành các cuộc thăm dò trực tuyến của một bảng điều khiển khoảng 800.000 người trả lời tại Vương quốc Anh.
Bạn có thể tìm thấy mô tả chi tiết về mô hình thống kê của YouGov tại https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Nói chung, YouGov phân chia các cử tri thành các loại dựa trên lựa chọn bầu cử tổng quát năm 2015, tuổi tác, trình độ, giới tính và ngày phỏng vấn, cũng như cử tri mà họ đã sống. Đầu tiên, họ sử dụng dữ liệu thu thập từ các tham luận viên YouGov để ước tính, trong số những người đã bỏ phiếu, tỷ lệ người thuộc từng loại cử tri có ý định bỏ phiếu Rời bỏ. Họ ước tính số cử tri đi bầu của từng cử tri bằng cách sử dụng Nghiên cứu Bầu cử Anh năm 2015 (BES), một cuộc khảo sát mặt đối mặt sau cuộc bầu cử, xác nhận cử tri đi bầu từ các cuộc bầu cử cử tri. Cuối cùng, họ ước tính có bao nhiêu người có từng loại cử tri trong cử tri, dựa trên Điều tra Dân số và Điều tra dân số hàng năm (với một số thông tin bổ sung từ các nguồn dữ liệu khác).
Ba ngày trước ngày bỏ phiếu, YouGov đã cho thấy một điểm dẫn hai điểm cho Rời. Vào đêm trước bầu cử, cuộc thăm dò cho thấy kết quả quá gần để gọi (49/51 còn lại). Nghiên cứu cuối cùng được dự đoán vào ngày 48/52 ủng hộ cho Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Trong thực tế, ước tính này đã bỏ lỡ kết quả cuối cùng (52/48 Leave) bởi bốn điểm phần trăm.
[ , ] Viết một mô phỏng để minh họa từng lỗi biểu diễn trong hình 3.2.
[ , ] Nghiên cứu của Blumenstock và cộng sự (2015) liên quan đến việc xây dựng một mô hình học máy có thể sử dụng dữ liệu theo dõi kỹ thuật số để dự đoán các phản ứng khảo sát. Bây giờ, bạn sẽ thử cùng một điều với một tập dữ liệu khác. Kosinski, Stillwell, and Graepel (2013) nhận thấy rằng Facebook thích có thể dự đoán các đặc điểm và đặc điểm riêng lẻ. Đáng ngạc nhiên, những dự đoán này thậm chí còn chính xác hơn những dự đoán của bạn bè và đồng nghiệp (Youyou, Kosinski, and Stillwell 2015) .
[ Toole et al. (2015) sử dụng các bản ghi chi tiết cuộc gọi (CDR) từ điện thoại di động để dự đoán xu hướng thất nghiệp tổng thể.