Многу од темите во ова поглавје, исто така, беа повторени на неодамнешните претседателски обраќања во Американската асоцијација за истражување на јавното мислење (AAPOR), како оние од Dillman (2002) , Newport (2011) , Santos (2014) и Link (2015) .
За повеќе информации за разликите помеѓу истражувањето и длабинските интервјуа, видете Small (2009) . Поврзани со длабинските интервјуа е семејство на пристапи наречени етнографии. Во етнографските истражувања, истражувачите генерално поминуваат многу повеќе време со учесниците во нивната природна околина. За повеќе информации за разликите помеѓу етнографијата и деталните интервјуа, видете Jerolmack and Khan (2014) . За повеќе информации за дигиталната етнографија, погледнете во Pink et al. (2015) .
Мојот опис на историјата на истражувањето е премногу краток за да се вклучат многу од возбудливите случувања што се случија. За повеќе историски позадини, видете Smith (1976) , Converse (1987) и Igo (2008) . За повеќе информации за идејата за три ери на истражувањето, видете Groves (2011) и Dillman, Smyth, and Christian (2008) (што малку ги разликува три гревови).
Groves and Kahn (1979) нудат ѕиркање во транзицијата од првата до втората ера во истражувањето на истражувањето, правејќи детална споредба од лице-в-лице меѓу лице-в-лице и телефонска анкета. ( ??? ) Вратете се на историскиот развој на методите за земање примероци со случаен избор со бирање.
За повеќе информации како се променило истражувањето во минатото како одговор на промените во општеството, види Tourangeau (2004) , ( ??? ) и Couper (2011) .
Предностите и слабостите на барање и набљудување беа дискутирани од страна на психолози (на пример, Jerolmack and Khan (2014) , Jerolmack and Khan (2014) Baumeister, Vohs, and Funder (2007) ) и социолози (на пример, Jerolmack and Khan (2014) , Maynard (2014) , Cerulo (2014) , Vaisey (2014) , Jerolmack and Khan (2014) ] Разликата помеѓу поставувањето и набљудувањето, исто така, се јавува во економијата, каде што истражувачите зборуваат за наведените и откриените преференци.На пример, истражувачот може да побара од испитаниците дали сакаат да јадат сладолед или да одат во фитнес салата (наведени параметри), или може да се забележи колку често луѓето јадат сладолед и одат во салата (откриени параметри). Постои длабок скептицизам во врска со одредени видови на наведени преференцијални податоци во економијата како што е опишано во Hausman (2012) .
Главната тема од овие дебати е дека пријавеното однесување не е секогаш точно. Но, како што беше опишано во поглавјето 2, големите извори на податоци можеби не се точни, тие не можат да се собираат на примерок од интерес, и тие можеби нема да бидат достапни за истражувачите. Така, мислам дека во некои ситуации пријавеното однесување може да биде корисно. Понатаму, втората главна тема од овие дебати е дека извештаите за емоциите, знаењата, очекувањата и мислењата не се секогаш точни. Но, ако информациите за овие внатрешни состојби се потребни од страна на истражувачите - или да помогнат да се објасни некое однесување или како нешто што треба да се објасни - тогаш прашањето може да биде соодветно. Секако, учењето за внатрешни држави преку поставување прашања може да биде проблематично, бидејќи понекогаш самите испитаници не се свесни за нивните внатрешни состојби (Nisbett and Wilson 1977) .
Поглавјето 1 од Groves (2004) прави одлична работа во согласност со повремената неконзистентна терминологија што ја користат анкетираните истражувачи за да се опише целокупната рамка за грешка во истражувањето. За третман на должината на обемот на целокупната рамка за грешка, видете Groves et al. (2009) , и за историски преглед, види Groves and Lyberg (2010) .
Идејата за распаѓање на грешките во пристрасност и варијанса, исто така, доаѓа во машинско учење; види, на пример, дел 7.3 од Hastie, Tibshirani, and Friedman (2009) . Ова често пати ги тера истражувачите да разговараат за "компромис".
Во однос на застапеноста, одличен вовед во прашањата за неприфаќањето и нереагираните предрасуди е извештајот на Националниот истражувачки совет Неиспитување во анкетите за општествени науки: Агенда за истражување (2013) . Друг корисен преглед е обезбеден од Groves (2006) . Исто така, беа објавени цели специјални изданија на Службениот весник на официјални статистики , Квартален извештај за јавното мислење и аналите на Американската академија за политички и општествени науки на тема неодговор. Конечно, всушност има многу различни начини на пресметување на стапката на одговор; овие пристапи се детално опишани во извештајот на Американската асоцијација на истражувачи за јавното мислење (AAPOR) ( ??? ) .
За повеќе информации за Анкетата за литературен билборд во 1936, видете Bryson (1976) , Squire (1988) , Cahalan (1989) и Lusinchi (2012) . За уште една дискусија за оваа анкета како предупредувачка парабола против собирање на податоци од случаен избор, видете Gayo-Avello (2011) . Во 1936 година, Џорџ Галуп користел пософистицирана форма на земање мостри и бил во можност да произведе поточни проценки со многу помал примерок. Успехот на Галуп над книжевното досие беше пресвртница во развојот на истражувањето, како што е опишано во поглавје 3 од @ converse_survey_1987; поглавје 4 од Ohmer (2006) ; и поглавје 3 од @ igo_averaged_2008.
Во однос на мерењето, одличен прв ресурс за дизајнирање на прашалници е Bradburn, Sudman, and Wansink (2004) . За понапредни третмани, видете Schuman and Presser (1996) , кој е специјално фокусиран на прашањата за поставеност, и Saris and Gallhofer (2014) , што е поопшта. Нешто поинаков пристап кон мерењето се зема во психометриката, како што е опишано во ( ??? ) . Повеќе за претестирање е достапно во Presser and Blair (1994) , Presser et al. (2004) и поглавје 8 од Groves et al. (2009) . За повеќе информации за експериментите, видете Mutz (2011) .
Во однос на трошоците, класичниот третман на трошоците за испитување и грешките во истражувањето е Groves (2004) должина на книгите Groves (2004) .
Две класични третмани на должина на книги со стандардна веројатност за земање мостри и проценка се Lohr (2009) (повеќе воведни) и Särndal, Swensson, and Wretman (2003) (понапредни). Класичен третман на пост-стратификација и сродни методи е Särndal and Lundström (2005) . Во некои поставувања за дигитална возраст, истражувачите знаат сосема малку за доселениците, што во минатото често не било точно. Различни форми на приспособување без одговор се можни кога истражувачите имаат информации за доселениците, како што е опишано од Kalton and Flores-Cervantes (2003) и Smith (2011) .
Студијата на Xbox од W. Wang et al. (2015) користи техника наречена повеќерелевантна регресија и пост-стратификација ("г. П.") која им овозможува на истражувачите да ги проценат групните средства дури и кога има многу, многу групи. Иако постои дебата за квалитетот на проценките од оваа техника, изгледа како ветувачка област за истражување. Техниката за првпат беше користена во Park, Gelman, and Bafumi (2004) , а подоцна се користеше и дебата (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . За повеќе информации за врска помеѓу поединечни тежини и групни тежини, видете Gelman (2007) .
За други пристапи за пондерирање на веб-анкети, видете Schonlau et al. (2009) , Bethlehem (2010) и Valliant and Dever (2011) . Онлајн панели можат да користат или земање мостри со веројатност или земање примероци од не-веројатност. За повеќе информации за онлајн панели, види Callegaro et al. (2014) .
Понекогаш, истражувачите откриле дека примероците за веројатност и примероците со неверојатност даваат проценка на сличен квалитет (Ansolabehere and Schaffner 2014) , но споредбите покажаа дека примероците со неверојатна веројатност се влошуваат (Malhotra and Krosnick 2007; Yeager et al. 2011) . Една можна причина за овие разлики е дека примероците со неверојатна веројатност се подобрија со текот на времето. За попесимистичко гледиште за методите за земање примероци кои не се веројатни, видете ја AAPOR Task Force за земање на примероци од не-веројатност (Baker et al. 2013) , а јас исто така препорачувам да го прочитате коментарот кој следи по резимираниот извештај.
Conrad and Schober (2008) е изменето издание насловено како " Предвидување на анкетен интервју за иднината" , и нуди различни гледишта за иднината на поставување прашања. Couper (2011) осврнува на слични теми, и Schober et al. (2015) нудат убав пример за тоа како методите за собирање на податоци кои се приспособени на ново поставување може да резултираат со повисок квалитет на податоци. Schober and Conrad (2015) нудат поопшта аргумент за продолжување со прилагодување на процесот на истражување на истражувања за да одговорат на промените во општеството.
Tourangeau and Yan (2007) разгледуваат прашањата за пристрасност кон социјалната пожелност во осетливи прашања, и Lind et al. (2013) нудат некои можни причини зошто луѓето може да откријат повеќе чувствителни информации во интервјуто што го спроведува компјутер. За повеќе информации за улогата на човековите анкетари во зголемувањето на стапките на учество во анкетите, види Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) и Schaeffer et al. (2013) . За повеќе информации за анкети со мешан режим, видете Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) нудат книга со должина на третман на еколошки моментални проценки и сродни методи.
За повеќе совети за правење истражувања пријатно и драгоцено искуство за учесниците, погледнете ја работата за методот на прилагодена конструкција (Dillman, Smyth, and Christian 2014) . За уште еден интересен пример за користење на Фејсбук апликации за анкети за општествени науки, видете Bail (2015) .
Judson (2007) опишува процесот на комбинирање на истражувања и административни податоци како "интеграција на информации" и дискутира за некои предности на овој пристап, како и за понудување на некои примери.
Во врска со збогатеното прашање, имаше многу претходни обиди за валидација на гласањето. За преглед на таа литература, видете Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , и Berent, Krosnick, and Lupia (2016) . Види Berent, Krosnick, and Lupia (2016) за повеќе скептични поглед на резултатите презентирани во Ansolabehere and Hersh (2012) .
Важно е да се напомене дека иако Ansolabehere и Hersh биле охрабрени од квалитетот на податоците од Катализатор, други оценки на трговски добавувачи биле помалку ентузијасти. Pasek et al. (2014) покажаа лош квалитет кога податоците од анкетата беа споредувани со потрошувачки досие од Групацијата Маркетинг Системи (која заедно ги здружи податоците од тројца провајдери: Acxiom, Experian и InfoUSA). Односно, податочната датотека не одговара на одговорите на анкетите кои истражувачите очекуваа да бидат точни, потрошувачката датотека ги немаше податоците за голем број прашања, а моделот за исчезнати податоци беше во корелација со пријавената вредност на истражувањето (со други зборови, исчезнатите податоците беа систематски, а не случајни).
За повеќе информации за Sakshaug and Kreuter (2012) помеѓу анкетите и административните податоци, видете Sakshaug and Kreuter (2012) и Schnell (2013) . За повеќе информации за врска воопшто, видете Dunn (1946) и Fellegi and Sunter (1969) (историски) и Larsen and Winkler (2014) (модерна). Слични пристапи, исто така, се развиени во компјутерската наука под имиња како што се дедупликација на податоци, идентификација на инстанца, совпаѓање на името, дупликат откривање и дупликат откривање на записите (Elmagarmid, Ipeirotis, and Verykios 2007) . Исто така, постојат пристапи за зачувување на приватноста за снимање на поврзување кое не бара пренос на информации за лично идентификување (Schnell 2013) . Истражувачите на Фејсбук развија постапка за веројатно врската на нивните записи со гласачкото однесување (Jones et al. 2013) ; оваа поврзаност беше направена за да се оцени експериментот што ќе ви го кажам во поглавје 4 (Bond et al. 2012) . За повеќе информации за добивање дозвола за поврзување на снимки, види Sakshaug et al. (2012) .
Друг пример за поврзување на големо општествено истражување со државните административни досиеја доаѓа од Анкетата за здравство и пензионирање и од администрацијата за социјално осигурување. За повеќе информации за оваа студија, вклучувајќи и информации за постапката за согласност, видете Олсон (1996, 1999) .
Процесот на комбинирање на многу извори на административни досиеја во матичната датотека за податоци - процесот што го вработува Катализатор - е вообичаен во статистичките канцеларии на некои национални влади. Двајца истражувачи од Статистиката Шведска напишале детална книга на оваа тема (Wallgren and Wallgren 2007) . За пример на овој пристап во една област во Соединетите Американски Држави (округот Олмстед, Минесота, дом на клиниката Мајо), погледнете го Sauver et al. (2011) . За повеќе грешки кои можат да се појават во административните записи, видете Groen (2012) .
Друг начин на кој истражувачите можат да користат големи извори на податоци во истражувањето на истражувањето е како рамка за земање примероци за луѓе со специфични карактеристики. За жал, овој пристап може да покрене прашања поврзани со приватноста (Beskow, Sandler, and Weinberger 2006) .
Што се однесува до засиленото барање, овој пристап не е толку нов како што може да се појави од начинот на кој јас го опишав. Таа има длабоки врски со три големи области во статистиката: пост-стратификација базирана на модел (Little 1993) , импутација (Rubin 2004) и проценка на мал простор (Rao and Molina 2015) . Таа е исто така поврзана со употребата на сурогатни варијабли во медицинските истражувања (Pepe 1992) .
Проценките на трошоците и времето во Blumenstock, Cadamuro, and On (2015) повеќе се однесуваат на варијабилни трошоци - цената на едно дополнително истражување - и не вклучуваат фиксни трошоци, како што се трошоците за чистење и обработка на податоците за повикот. Општо земено, засиленото поставување веројатно ќе има високи фиксни трошоци и ниски променливи трошоци слични на оние на дигиталните експерименти (види поглавје 4). За повеќе информации за истражувањата базирани на мобилни телефони во земјите во развој, види Dabalen et al. (2016) .
За идеи за тоа како да се засили прашањето подобро, би му препорачал да научам повеќе за повеќекратна импутација (Rubin 2004) . Исто така, ако истражувачите прават засилена, барајќи грижа за агрегатните броеви, наместо поединечни карактеристики, тогаш пристапите во King and Lu (2008) и Hopkins and King (2010) може да бидат корисни. Конечно, за повеќе информации за пристапите за машинско учење во Blumenstock, Cadamuro, and On (2015) , види James et al. (2013) (повеќе воведни) или Hastie, Tibshirani, and Friedman (2009) (понапредни).
Едно етичко прашање во врска со засиленото барање е дека може да се користи за да се изведе чувствителни особини кои луѓето не би можеле да ги откријат во истражувањето како што е опишано во Kosinski, Stillwell, and Graepel (2013) .