Nhiều chủ đề trong chương này cũng đã được lặp lại trong các địa chỉ tổng thống gần đây tại Hiệp hội Nghiên cứu Ý kiến Công cộng Hoa Kỳ (AAPOR), như Dillman (2002) , Newport (2011) , Santos (2014) và Link (2015) .
Để biết thêm về sự khác biệt giữa nghiên cứu khảo sát và phỏng vấn sâu, xem Small (2009) . Liên quan đến các cuộc phỏng vấn sâu là một họ của các phương pháp được gọi là dân tộc học. Trong nghiên cứu dân tộc học, các nhà nghiên cứu thường dành nhiều thời gian hơn với những người tham gia trong môi trường tự nhiên của họ. Để biết thêm về sự khác biệt giữa dân tộc học và phỏng vấn sâu, xem Jerolmack and Khan (2014) . Để biết thêm về dân tộc học kỹ thuật số, xem Pink et al. (2015) .
Mô tả của tôi về lịch sử nghiên cứu khảo sát là quá ngắn gọn để bao gồm nhiều phát triển thú vị đã diễn ra. Để biết thêm về lịch sử, xem Smith (1976) , Converse (1987) và Igo (2008) . Để biết thêm về ý tưởng của ba thời đại nghiên cứu khảo sát, xem Groves (2011) và Dillman, Smyth, and Christian (2008) (mà chia ra ba thời đại hơi khác nhau).
Groves and Kahn (1979) đưa ra một cái nhìn sâu sắc trong quá trình chuyển đổi từ lần đầu tiên đến giai đoạn thứ hai trong nghiên cứu khảo sát bằng cách so sánh chi tiết so sánh trực tiếp giữa cuộc khảo sát trực tiếp và điện thoại. ( ??? ) nhìn lại sự phát triển lịch sử của các phương pháp lấy mẫu quay số ngẫu nhiên.
Để biết thêm về cách nghiên cứu khảo sát đã thay đổi trong quá khứ để đáp ứng với những thay đổi trong xã hội, xem Tourangeau (2004) , ( ??? ) , và Couper (2011) .
Điểm mạnh và điểm yếu của việc hỏi và quan sát đã được các nhà tâm lý tranh luận (ví dụ, Baumeister, Vohs, and Funder (2007) ) và các nhà xã hội học (ví dụ Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) , Jerolmack and Khan (2014) ] Sự khác biệt giữa yêu cầu và quan sát cũng phát sinh trong kinh tế, nơi các nhà nghiên cứu nói về các ưu tiên đã nêu và tiết lộ. (sở thích đã nêu), hoặc có thể quan sát tần suất mọi người ăn kem và đi đến phòng tập thể dục (những sở thích được tiết lộ) Có một số hoài nghi sâu sắc về một số loại dữ liệu ưu tiên đã nêu trong kinh tế như mô tả trong Hausman (2012) .
Một chủ đề chính từ các cuộc tranh luận này là hành vi được báo cáo không phải lúc nào cũng chính xác. Nhưng, như đã được mô tả trong chương 2, các nguồn dữ liệu lớn có thể không chính xác, chúng có thể không được thu thập trên một mẫu quan tâm, và chúng có thể không được các nhà nghiên cứu tiếp cận. Vì vậy, tôi nghĩ rằng, trong một số trường hợp, hành vi được báo cáo có thể hữu ích. Hơn nữa, chủ đề chính thứ hai từ các cuộc tranh luận này là các báo cáo về cảm xúc, kiến thức, kỳ vọng và ý kiến không phải lúc nào cũng chính xác. Nhưng, nếu thông tin về các trạng thái bên trong này là cần thiết bởi các nhà nghiên cứu - hoặc để giúp giải thích một số hành vi hoặc là điều cần giải thích - thì yêu cầu có thể thích hợp. Tất nhiên, việc học về các trạng thái nội tại bằng cách đặt câu hỏi có thể có vấn đề bởi vì đôi khi bản thân người trả lời không nhận thức được trạng thái bên trong của họ (Nisbett and Wilson 1977) .
Chương 1 của Groves (2004) thực hiện một công việc tuyệt vời đối chiếu các thuật ngữ không nhất quán đôi khi được các nhà nghiên cứu khảo sát sử dụng để mô tả khung tổng số lỗi khảo sát. Đối với một điều trị cuốn sách dài của khuôn khổ tổng số lỗi khảo sát, xem Groves et al. (2009) , và cho một tổng quan lịch sử, xem Groves and Lyberg (2010) .
Ý tưởng phân tách lỗi thành sai lệch và phương sai cũng xuất hiện trong học máy; xem, ví dụ, phần 7.3 của Hastie, Tibshirani, and Friedman (2009) . Điều này thường dẫn các nhà nghiên cứu nói về một sự khác biệt "thiên lệch".
Về mặt biểu diễn, một giới thiệu tuyệt vời về các vấn đề về thiên vị không phản hồi và không phản hồi là báo cáo của Hội đồng Nghiên cứu Quốc gia Nonresponse trong Khảo sát Khoa học Xã hội: Chương trình Nghiên cứu (2013) . Một tổng quan hữu ích khác được Groves (2006) cung cấp. Ngoài ra, toàn bộ các vấn đề đặc biệt của Tạp chí Thống kê chính thức , Tạp chí công luận hàng quý và Biên niên sử của Học viện Khoa học Chính trị và Xã hội Hoa Kỳ đã được công bố về chủ đề không phản hồi. Cuối cùng, có nhiều cách khác nhau để tính toán tỷ lệ đáp ứng; những cách tiếp cận này được mô tả chi tiết trong một báo cáo của Hiệp hội các nhà nghiên cứu ý kiến công chúng Hoa Kỳ (AAPOR) ( ??? ) .
Để biết thêm về cuộc thăm dò văn học năm 1936, xem Bryson (1976) , Squire (1988) , Cahalan (1989) , và Lusinchi (2012) . Đối với một cuộc thảo luận khác của cuộc thăm dò này như là một cảnh báo ngụ ngôn chống lại việc thu thập dữ liệu ngẫu nhiên, xem Gayo-Avello (2011) . Năm 1936, George Gallup sử dụng một mẫu lấy mẫu phức tạp hơn và có thể đưa ra các ước tính chính xác hơn với một mẫu nhỏ hơn nhiều. Sự thành công của Gallup về Văn học tiêu hóa là một cột mốc quan trọng trong việc phát triển nghiên cứu khảo sát như được mô tả trong chương 3 của @ converse_survey_1987; chương 4 của Ohmer (2006) ; và chương 3 của @ igo_averaged_2008.
Về mặt đo lường, một nguồn tài nguyên đầu tiên cho việc thiết kế bảng câu hỏi là Bradburn, Sudman, and Wansink (2004) . Đối với các phương pháp điều trị tiên tiến hơn, xem Schuman and Presser (1996) , đặc biệt tập trung vào các câu hỏi về thái độ, và Saris and Gallhofer (2014) , tổng quát hơn. Một cách tiếp cận hơi khác nhau để đo lường được thực hiện trong psychometrics, như mô tả trong ( ??? ) . Thông tin thêm về pretesting có sẵn trong Presser and Blair (1994) , Presser et al. (2004) , và chương 8 của Groves et al. (2009) . Để biết thêm về các thí nghiệm khảo sát, hãy xem Mutz (2011) .
Về mặt chi phí, việc xử lý sách cổ điển về sự cân bằng giữa chi phí khảo sát và các lỗi khảo sát là Groves (2004) .
Hai phương pháp điều trị độ dài cuốn sách cổ điển của việc lấy mẫu và ước lượng chuẩn là Lohr (2009) (giới thiệu nhiều hơn) và Särndal, Swensson, and Wretman (2003) (nâng cao hơn). Một phương pháp điều trị theo chiều dài cuốn sách cổ điển về phân tầng sau và các phương pháp liên quan là Särndal and Lundström (2005) . Trong một số thiết lập thời đại kỹ thuật số, các nhà nghiên cứu biết khá nhiều về những người không có điều kiện, điều này thường không đúng trong quá khứ. Các hình thức điều chỉnh nonresponse khác nhau có thể xảy ra khi các nhà nghiên cứu có thông tin về những người không đáp ứng, như được mô tả bởi Kalton and Flores-Cervantes (2003) và Smith (2011) .
Nghiên cứu Xbox của W. Wang et al. (2015) sử dụng một kỹ thuật gọi là hồi quy đa tầng và phân tầng sau (“Mr. P.”) cho phép các nhà nghiên cứu ước lượng nhóm nghĩa là ngay cả khi có nhiều, nhiều nhóm. Mặc dù có một số cuộc tranh luận về chất lượng của các ước tính từ kỹ thuật này, nó có vẻ giống như một khu vực đầy hứa hẹn để khám phá. Kỹ thuật này lần đầu tiên được sử dụng trong Park, Gelman, and Bafumi (2004) , và sau đó đã được sử dụng và tranh luận (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Để biết thêm về kết nối giữa trọng lượng riêng và trọng lượng nhóm, xem Gelman (2007) .
Đối với các cách tiếp cận khác để điều tra trọng lượng web, xem Schonlau et al. (2009) , Bethlehem (2010) , và Valliant and Dever (2011) . Các bảng trực tuyến có thể sử dụng lấy mẫu xác suất hoặc lấy mẫu không xác suất. Để biết thêm thông tin về các bảng trực tuyến, xem Callegaro et al. (2014) .
Đôi khi, các nhà nghiên cứu đã phát hiện rằng các mẫu xác suất và các mẫu không xác suất đưa ra các ước tính có chất lượng tương tự (Ansolabehere and Schaffner 2014) , nhưng các so sánh khác đã phát hiện ra rằng các mẫu không xác suất kém hơn (Malhotra and Krosnick 2007; Yeager et al. 2011) . Một lý do có thể cho những khác biệt này là các mẫu không xác suất đã được cải thiện theo thời gian. Để có cái nhìn bi quan hơn về các phương pháp lấy mẫu không xác suất, hãy xem Nhóm tác vụ AAPOR về Lấy mẫu Không Xác suất (Baker et al. 2013) , và tôi cũng khuyên bạn nên đọc bài bình luận sau báo cáo tóm tắt.
Conrad and Schober (2008) là một khối lượng đã được chỉnh sửa có tên Envisioning Interview Survey of the Future , và nó cung cấp một loạt các quan điểm về tương lai của việc đặt câu hỏi. Couper (2011) đề cập đến các chủ đề tương tự, và Schober et al. (2015) đưa ra một ví dụ điển hình về cách các phương pháp thu thập dữ liệu được điều chỉnh theo một cài đặt mới có thể dẫn đến dữ liệu chất lượng cao hơn. Schober and Conrad (2015) đưa ra một lập luận chung hơn về việc tiếp tục điều chỉnh quá trình nghiên cứu khảo sát để phù hợp với những thay đổi trong xã hội.
Tourangeau and Yan (2007) xem xét các vấn đề về xu hướng mong muốn xã hội trong các câu hỏi nhạy cảm, và Lind et al. (2013) đưa ra một số lý do có thể khiến mọi người có thể tiết lộ thêm thông tin nhạy cảm trong cuộc phỏng vấn do máy tính quản lý. Để biết thêm về vai trò của người phỏng vấn con người trong việc tăng tỷ lệ tham gia trong các cuộc điều tra, xem Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , và Schaeffer et al. (2013) . Để biết thêm thông tin về các khảo sát về chế độ hỗn hợp, xem Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) đưa ra một phương pháp điều trị dài hạn về cuốn sách đánh giá tạm thời về sinh thái và các phương pháp liên quan.
Để có thêm lời khuyên về việc thực hiện khảo sát một trải nghiệm thú vị và có giá trị cho người tham gia, hãy xem công việc về Phương pháp thiết kế được điều chỉnh (Dillman, Smyth, and Christian 2014) . Để có một ví dụ thú vị khác về việc sử dụng các ứng dụng Facebook cho các khảo sát khoa học xã hội, hãy xem Bail (2015) .
Judson (2007) mô tả quá trình kết hợp các cuộc điều tra và dữ liệu hành chính là “tích hợp thông tin” và thảo luận một số ưu điểm của phương pháp này, cũng như đưa ra một số ví dụ.
Về yêu cầu làm giàu, đã có nhiều nỗ lực trước đây để xác thực biểu quyết. Để biết tổng quan về tài liệu đó, xem Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , và Berent, Krosnick, and Lupia (2016) . Xem Berent, Krosnick, and Lupia (2016) để có cái nhìn hoài nghi hơn về kết quả được trình bày trong Ansolabehere and Hersh (2012) .
Điều quan trọng cần lưu ý là mặc dù Ansolabehere và Hersh được khuyến khích bởi chất lượng dữ liệu từ Catalist, các đánh giá khác của các nhà cung cấp thương mại đã ít nhiệt tình hơn. Pasek et al. (2014) tìm thấy chất lượng kém khi dữ liệu từ một cuộc khảo sát được so sánh với một tập tin người tiêu dùng từ Marketing Systems Group (mà chính nó sáp nhập với nhau dữ liệu từ ba nhà cung cấp: Acxiom, Experian, và InfoUSA). Tức là, tệp dữ liệu không phù hợp với phản hồi khảo sát mà các nhà nghiên cứu mong đợi là đúng, tệp người tiêu dùng thiếu dữ liệu cho một số lượng lớn câu hỏi và mẫu dữ liệu bị thiếu tương quan với giá trị khảo sát được báo cáo (nói cách khác là thiếu dữ liệu có hệ thống, không phải ngẫu nhiên).
Để biết thêm về liên kết hồ sơ giữa các cuộc điều tra và dữ liệu hành chính, xem Sakshaug and Kreuter (2012) và Schnell (2013) . Để biết thêm về liên kết ghi lại nói chung, xem Dunn (1946) và Fellegi and Sunter (1969) (lịch sử) và Larsen and Winkler (2014) (hiện đại). Các phương pháp tương tự cũng được phát triển trong khoa học máy tính dưới các tên như dữ liệu trùng lặp, nhận dạng cá thể, trùng khớp tên, phát hiện trùng lặp và phát hiện bản ghi trùng lặp (Elmagarmid, Ipeirotis, and Verykios 2007) . Ngoài ra còn có các cách tiếp cận bảo mật riêng tư để ghi lại liên kết không yêu cầu truyền thông tin nhận dạng cá nhân (Schnell 2013) . Các nhà nghiên cứu tại Facebook đã phát triển một quy trình để liên kết xác suất hồ sơ của họ với hành vi bỏ phiếu (Jones et al. 2013) ; liên kết này đã được thực hiện để đánh giá một thử nghiệm mà tôi sẽ cho bạn biết trong chương 4 (Bond et al. 2012) . Để biết thêm thông tin về việc có được sự chấp thuận cho liên kết ghi lại, xem Sakshaug et al. (2012) .
Một ví dụ khác về việc liên kết một cuộc khảo sát xã hội quy mô lớn với các hồ sơ hành chính của chính phủ đến từ Điều tra Y tế và Hưu trí và Cơ quan An sinh Xã hội. Để biết thêm về nghiên cứu đó, bao gồm thông tin về thủ tục phê duyệt, xem Olson (1996, 1999) .
Quá trình kết hợp nhiều nguồn hồ sơ hành chính vào một datafile chính - quá trình mà Catalist sử dụng - là phổ biến trong các văn phòng thống kê của một số chính phủ quốc gia. Hai nhà nghiên cứu từ Thống kê Thụy Điển đã viết một cuốn sách chi tiết về chủ đề này (Wallgren and Wallgren 2007) . Ví dụ về cách tiếp cận này trong một hạt duy nhất ở Hoa Kỳ (Olmstead County, Minnesota; nhà của Mayo Clinic), xem Sauver et al. (2011) . Để biết thêm về lỗi có thể xuất hiện trong hồ sơ quản trị, hãy xem Groen (2012) .
Một cách khác mà các nhà nghiên cứu có thể sử dụng các nguồn dữ liệu lớn trong nghiên cứu khảo sát là một khung lấy mẫu cho những người có đặc điểm cụ thể. Thật không may, cách tiếp cận này có thể nêu lên các câu hỏi liên quan đến quyền riêng tư (Beskow, Sandler, and Weinberger 2006) .
Về yêu cầu khuếch đại, cách tiếp cận này không phải là mới vì nó có thể xuất hiện từ cách tôi đã mô tả nó. Nó có kết nối sâu với ba khu vực lớn trong thống kê: phân tầng sau dựa trên mô hình (Little 1993) , imputation (Rubin 2004) , và ước tính diện tích nhỏ (Rao and Molina 2015) . Nó cũng liên quan đến việc sử dụng các biến thay thế trong nghiên cứu y học (Pepe 1992) .
Ước tính chi phí và thời gian ở Blumenstock, Cadamuro, and On (2015) đề cập nhiều hơn đến chi phí biến đổi — chi phí của một cuộc khảo sát bổ sung — và không bao gồm các chi phí cố định như chi phí làm sạch và xử lý dữ liệu cuộc gọi. Nói chung, yêu cầu khuếch đại có thể sẽ có chi phí cố định cao và chi phí biến đổi thấp tương tự như chi phí của các thí nghiệm kỹ thuật số (xem chương 4). Để biết thêm thông tin về khảo sát dựa trên điện thoại di động ở các nước đang phát triển, xem Dabalen et al. (2016) .
Đối với những ý tưởng về làm thế nào để làm khuếch đại yêu cầu tốt hơn, tôi khuyên bạn nên tìm hiểu thêm về nhiều imputation (Rubin 2004) . Ngoài ra, nếu các nhà nghiên cứu tăng cường yêu cầu quan tâm về tổng số, chứ không phải là các đặc điểm cá nhân, thì các phương pháp tiếp cận ở King and Lu (2008) và Hopkins and King (2010) có thể hữu ích. Cuối cùng, để biết thêm về các phương pháp học máy tại Blumenstock, Cadamuro, and On (2015) , xem James et al. (2013) (giới thiệu nhiều hơn) hoặc Hastie, Tibshirani, and Friedman (2009) (nâng cao hơn).
Một vấn đề đạo đức về yêu cầu khuếch đại là nó có thể được sử dụng để suy ra những đặc điểm nhạy cảm mà mọi người có thể không chọn tiết lộ trong một cuộc khảo sát như được mô tả trong Kosinski, Stillwell, and Graepel (2013) .