சமூக ஆராய்ச்சியில் ஏற்படும் தன்மை குறித்த கேள்விகள் பெரும்பாலும் சிக்கலான மற்றும் சிக்கலானவை. காரண விளக்கங்களை அடிப்படையாகக் கொண்ட காரணத்திற்கான அடிப்படை அணுகுமுறைக்கு, Pearl (2009) மற்றும் சாத்தியமான விளைவுகளை அடிப்படையாகக் கொண்ட ஒரு அடித்தள அணுகுமுறைக்காக, Imbens and Rubin (2015) . இந்த இரண்டு அணுகுமுறைகளுக்கும் இடையே ஒரு ஒப்பீடாக, Morgan and Winship (2014) . ஒரு குழப்பத்தை வரையறுக்க ஒரு முறையான அணுகுமுறைக்கு, பார்க்க VanderWeele and Shpitser (2013) .
இந்த அத்தியாயத்தில், சோதனை மற்றும் பரிசோதனை அல்லாத தரவுகளிலிருந்து காரண காரியங்களை மதிப்பீடு செய்வதற்கான எமது திறனைப் பொறுத்தவரை பிரகாசமான கோணத்தை நான் உருவாக்கியிருக்கிறேன். எனினும், உண்மையில், வேறுபாடு இன்னும் மங்கலாக உள்ளது என்று நான் நினைக்கிறேன். உதாரணமாக, புகைப்பிடிப்பவர்களுக்கு புற்றுநோயை ஏற்படுத்துவதால், புகைப்பழக்கம் புற்றுநோயை ஏற்படுத்துவதாக எல்லோரும் ஒப்புக்கொள்கிறார்கள். Rosenbaum (2002) , ( ??? ) , Shadish, Cook, and Campbell (2001) மற்றும் Dunning (2012) Rosenbaum (2002) , அல்லாத சோதனைத் தரவுகளிலிருந்து தயாரிப்பதற்கான சிறந்த புத்தக நீள சிகிச்சைகள்.
Freedman, Pisani, and Purves (2007) 1 மற்றும் 2 அதிகாரங்களை பரிசோதனைகள், கட்டுப்பாட்டு பரிசோதனைகள் மற்றும் சீரற்ற கட்டுப்பாட்டு பரிசோதனைகள் ஆகியவற்றிற்கு இடையே உள்ள வேறுபாடுகளுக்கு தெளிவான அறிமுகத்தை வழங்குகின்றன.
Manzi (2012) தற்சார்புடைய கட்டுப்பாட்டு பரிசோதனையின் தத்துவ மற்றும் புள்ளியியல் அடித்தளத்தில் ஒரு கவர்ச்சிகரமான மற்றும் படிக்கக்கூடிய அறிமுகத்தை வழங்குகிறது. வியாபாரத்தில் சோதனைகளின் சக்தி பற்றிய சுவாரஸ்யமான நிஜ உலக உதாரணங்கள் இது வழங்குகிறது. Issenberg (2012) அரசியல் பிரச்சாரங்களில் சோதனைகளை பயன்படுத்துவதற்கு ஒரு கண்கவர் அறிமுகம் அளிக்கிறார்.
Box, Hunter, and Hunter (2005) , @ காசெல்லா_ஸ்டாடிஸ்டிகல்_2008, மற்றும் Athey and Imbens (2016b) சோதனை வடிவமைப்பு மற்றும் பகுப்பாய்வு புள்ளிவிவர அம்சங்களுக்கு நல்ல அறிமுகங்களை வழங்குகின்றன. பொருளியல் (Bardsley et al. 2009) , சமூகவியல் (Willer and Walker 2007; Jackson and Cox 2013) , உளவியலாளர் (Aronson et al. 1989) , அரசியல் அறிவியல் (Morton and Williams 2010) அறிவியல் (Aronson et al. 1989) (Morton and Williams 2010) , மற்றும் சமூக கொள்கை (Glennerster and Takavarasha 2013) .
பங்கேற்பாளர் ஆட்சேர்ப்பின் முக்கியத்துவம் (எ.கா., மாதிரியாக்கம்) பெரும்பாலும் சோதனை ஆராய்ச்சியில் பாராட்டுக்குரியது. இருப்பினும், சிகிச்சையின் விளைபொருளானது மக்கள்தொகையில் பன்முகத்தன்மை உடையதாக இருந்தால், பிறகு மாதிரி முக்கியமானது. Longford (1999) , ஆராய்ச்சியாளர்கள் சோதனைகள் பற்றி நினைக்கும்போது, அனேகமாக ஒழுங்குபடுத்தப்பட்ட மாதிரியுடனான மக்கள்தொகை கணக்கெடுப்பு என வாதிடுகிறார்.
ஆய்வக மற்றும் துறையில் சோதனைகள் இடையே ஒரு தொடர்ச்சியை உள்ளது என்று நான் பரிந்துரைத்துள்ளேன், மேலும் மற்ற ஆராய்ச்சியாளர்கள் பல்வேறு வகையான (Harrison and List 2004; Charness, Gneezy, and Kuhn 2013) சோதனைகள் (Harrison and List 2004; Charness, Gneezy, and Kuhn 2013) இன்னும் விரிவான வகைப்பாடுகளை முன்வைத்துள்ளனர்.
பல விஞ்ஞானிகள் ஆய்வகத்தில் ஆய்வு மற்றும் புலத்தில் சோதனைகள் (Falk and Heckman 2009; Cialdini 2009) மற்றும் அரசியல் விஞ்ஞானத்தில் (Coppock and Green 2015) , பொருளியல் (Levitt and List 2007a, 2007b; Camerer 2011; Al-Ubaydli and List 2013) , மற்றும் உளவியல் (Mitchell 2012) . Jerit, Barabas, and Clifford (2013) ஆய்வக மற்றும் துறையில் சோதனைகள் முடிவு ஒப்பிட்டு ஒரு நல்ல ஆராய்ச்சி வடிவமைப்பு வழங்குகின்றன. Parigi, Santana, and Cook (2017) ஆன்லைன் துறையில் சோதனைகள் எவ்வாறு ஆய்வு மற்றும் புல சோதனைகளின் சிறப்பியல்புகளை இணைக்கலாம் என்பதை விளக்குகிறது.
பங்கேற்பாளர்கள் தங்கள் நடத்தையை மாற்றிக்கொண்டிருப்பதைப் பற்றி கவலைப்படுவதால், அவர்கள் நெருக்கமாக கவனித்துக் கொண்டிருப்பதை அறிந்திருக்கிறார்கள், சிலநேரங்களில் கோரிக்கை விளைவுகள் என்று அழைக்கப்படுகின்றன, மேலும் அவை உளவியல் (Orne 1962) மற்றும் பொருளாதாரம் (Zizzo 2010) . ஆய்வக சோதனையுடன் பெரும்பாலும் தொடர்புடையதாக இருந்தாலும், அதே சிக்கல்களும் புலத்தில் சோதனைகள் ஏற்படலாம். உண்மையில், தேவையற்ற விளைவுகளை சிலநேரங்களில் ஹொத்தோர்ன் விளைவுகளாக அழைக்கின்றனர், இது 1924 ஆம் ஆண்டில் வெஸ்டர்ன் எலக்ட்ரிக் கம்பெனி (Adair 1984; Levitt and List 2011) ஹொத்தோர்ன் வொர்க்ஸில் ஆரம்பிக்கப்பட்ட புகழ்பெற்ற ஒளிக்கதிர் பரிசோதனையைப் பெற்றது. இரண்டு கோரிக்கை விளைவுகள் மற்றும் ஹாத்தோர்ன் விளைவுகள் நெருக்கமாக 2 வது அத்தியாயத்தில் விவாதிக்கப்படும் எதிர்வினை அளவீடு என்ற கருத்துடன் தொடர்புடையது ( Webb et al. (1966) ).
பொருளாதார அறிவியலில் (Levitt and List 2009) , அரசியல் விஞ்ஞானம் (Green and Gerber 2003; Druckman et al. 2006; Druckman and Lupia 2012) , உளவியல் (Shadish 2002) மற்றும் பொது கொள்கை (Shadish and Cook 2009) . சமூக விஞ்ஞானத்தின் ஒரு பகுதியானது புலத்தில் சோதனைகள் விரைவாக பிரபலமாகி, சர்வதேச அபிவிருத்தி ஆகும். பொருளாதாரத்தில் அந்த வேலை நேர்மறையான மறுஆய்வுக்கு Banerjee and Duflo (2009) , மற்றும் விமர்சன மதிப்பீட்டிற்காக Deaton (2010) . அரசியல் விஞ்ஞானத்தில் இந்த வேலையை மறுபரிசீலனை செய்ய Humphreys and Weinstein (2009) . இறுதியாக, புலவியல் சோதனைகள் மூலம் எழும் நெறிமுறை சவால்கள் அரசியல் விஞ்ஞானத்தின் சூழலில் (Humphreys 2015; Desposato 2016b) மற்றும் அபிவிருத்தி பொருளியல் (Baele 2013) .
இந்த பிரிவில், நான் முன் சிகிச்சை தகவல் மதிப்பீடு சிகிச்சை விளைவுகளை துல்லியமாக மேம்படுத்த பயன்படுத்தப்படுகிறது, ஆனால் இந்த அணுகுமுறை பற்றி சில விவாதம் உள்ளது; Freedman (2008) , W. Lin (2013) , Berk et al. (2013) , மற்றும் Bloniarz et al. (2016) மேலும் தகவலுக்கு.
இறுதியாக, சமூக விஞ்ஞானிகளால் நிகழ்த்தப்பட்ட இரண்டு வகையான சோதனைகளும் ஆய்வக-துறையில் பரிமாணத்திற்குள் சரியாக பொருந்தவில்லை: ஆய்வு சோதனைகள் மற்றும் சமூக சோதனைகள். சர்வே பரிசோதனைகள் தற்போதுள்ள ஆய்வுகள் உள்கட்டமைப்பைப் பயன்படுத்தி பரிசோதிக்கின்றன மற்றும் அதே கேள்விகளின் மாற்றீட்டு பதில்களுக்கு பதில்களை ஒப்பிடுகின்றன (சில ஆய்வு சோதனைகள் பாடம் 3 இல் வழங்கப்படுகின்றன); மேலும் சர்வே பரிசோதனைக்கு Mutz (2011) . சமூக பரிசோதனைகள் என்பது ஒரு சமூகத்தால் மட்டுமே செயல்படுத்தப்படக்கூடிய சில சமூகக் கொள்கைகள் ஆகும். சமூக பரிசோதனைகள் நிரல் மதிப்பீட்டிற்கு நெருக்கமாக தொடர்பு கொண்டுள்ளன. பாலிசியின் சோதனைகள் குறித்து Heckman and Smith (1995) , Orr (1998) , மற்றும் @ க்ளெனெர்ஸ்டெர்_ஆர்ஜி_2013 ஆகியவற்றைக் காண்க.
மூன்று கருத்துக்கள் மீது கவனம் செலுத்த நான் தேர்ந்தெடுத்திருக்கிறேன்: செல்லுபடியாக்கம், சிகிச்சையளிக்கும் விளைவுகளின் பல்வகைமை மற்றும் இயக்கவியல்கள். இந்த கருத்துக்களுக்கு பல்வேறு துறைகளில் வெவ்வேறு பெயர்கள் உள்ளன. உதாரணமாக, உளவியலாளர்கள் மத்தியஸ்தர்களாலும் , நடுவர்களிடமிருந்தும் (Baron and Kenny 1986) கவனம் செலுத்துவதன் மூலம் எளிய சோதனையைத் தாண்டிச் செல்வது (Baron and Kenny 1986) . மத்தியஸ்தர்களின் யோசனை நான் வழிமுறைகள் என்று அழைக்கப்படுவதன் மூலம் கைப்பற்றப்படுகிறது, மேலும் நான் மதிப்பீட்டாளர்களின் யோசனை நான் வெளி செல்லுபடியாகும் (எ.கா., சோதனைகளின் முடிவுகள் வேறுபட்ட சூழ்நிலைகளில் இயங்கினால் வேறுபட்டதாக இருக்கும்) மற்றும் சிகிச்சையின் விளைவுகளை எ.கா., சிலருக்கு மற்றவர்களை விட அதிகமான விளைவுகளை ஏற்படுத்துகிறது).
Schultz et al. (2007) சமூக தத்துவங்களை எவ்வாறு பயனுள்ள தலையீடுகளை வடிவமைக்க பயன்படுத்தலாம் என்பதைக் காட்டுகிறது. பயனுள்ள தலையீடுகளை வடிவமைப்பதில் கோட்பாட்டின் பங்கு பற்றிய பொதுவான வாதத்திற்கு Walton (2014) .
உள் மற்றும் வெளிப்புற செல்லுபடியாக்கத்தின் கருத்துக்கள் முதலில் Campbell (1957) அறிமுகப்படுத்தப்பட்டது. மேலும் விரிவான வரலாறு மற்றும் புள்ளியியல் முடிவடைதல் செல்லுபடியை, உள் செல்லுபடியை, கட்டமைப்பை செல்லுபடியாகும் மற்றும் வெளிப்புற செல்லுபடியை கவனமாக விரிவாக்குவதற்காக Shadish, Cook, and Campbell (2001) ஆகியவற்றைப் பார்க்கவும்.
பரிசோதனையில் புள்ளியியல் முடிவை செல்லுபடியாக்க தொடர்பான சிக்கல்களின் கண்ணோட்டத்தில் Gerber and Green (2012) (ஒரு சமூக அறிவியல் கண்ணோட்டத்தில்) மற்றும் Imbens and Rubin (2015) (புள்ளியியல் கண்ணோட்டத்தில்) பார்க்கவும். ஆன்லைன் துறையில் சோதனைகள் குறிப்பாக எழும் புள்ளியியல் முடிவை செல்லுபடியாகும் சில சிக்கல்கள் போன்ற நம்பக இடைவெளிகள் நம்பக இடைவெளிகளை உருவாக்க கணக்கீட்டு திறமையான முறைகள் போன்ற சிக்கல்கள் (Bakshy and Eckles 2013) .
சிக்கலான சோதனையில் சோதனையை உறுதி செய்ய கடினமாக இருக்க முடியும். எடுத்துக்காட்டாக, Gerber and Green (2000) , Imai (2005) , மற்றும் Gerber and Green (2005) . Kohavi et al. (2012) மற்றும் Kohavi et al. (2013) ஆன்லைன் துறையில் சோதனைகள் இடைவெளி செல்லுபடியாகும் சவால்களை ஒரு அறிமுகம் வழங்கும்.
உள் செல்லுபடியாகும் ஒரு பெரிய அச்சுறுத்தல் சீரற்ற தோல்வி சாத்தியம் உள்ளது. சீரற்றமயமாக்கலுடன் பிரச்சினைகளைக் கண்டறிய ஒரு சாத்தியமான வழி, காணக்கூடிய பண்புகளில் சிகிச்சை மற்றும் கட்டுப்பாட்டு குழுக்களை ஒப்பிடுவதாகும். இந்த ஒப்பீடு ஒரு சமநிலை காசோலை என்று அழைக்கப்படுகிறது. சமநிலை காசோலைகளைப் பற்றி Mutz and Pemantle (2015) , சமநிலை காசோலைகள் மற்றும் Mutz and Pemantle (2015) புள்ளிவிவர அணுகுமுறைக்கு Hansen and Bowers (2008) பார்க்கவும். உதாரணமாக, ஒரு இருப்பு காசோலைப் பயன்படுத்தி, Allcott (2011) , ஓபராவர் சோதனையில் மூன்று முறைகளில் ஒழுங்கமைக்கப்படவில்லை என்பதை உறுதிப்படுத்தியது (அட்டவணை 2; தளங்கள் 2, 6 மற்றும் 8). மற்ற அணுகுமுறைகளுக்கு, Imbens and Rubin (2015) 21 ஆம் அதிகாரத்தை காண்க.
உட்புற செல்லுலமைப்பிற்கான பிற முக்கிய கவலைகள்: (1) சிகிச்சை பிரிவில் உள்ள அனைவருக்கும் உண்மையில் சிகிச்சையளிக்கப்படவில்லை, (2) இரண்டு பக்கமற்ற தன்னிச்சையானது, சிகிச்சை பிரிவில் உள்ள அனைவருக்கும் சிகிச்சையையும் சிலர் கட்டுப்பாட்டுக் குழுவானது சிகிச்சையளிக்கும், (3) உறுதிப்பாடு, அங்கு சில பங்கேற்பாளர்களுக்கான மதிப்பீடுகள் இல்லை, மற்றும் (4) குறுக்கீடு, சிகிச்சை சிகிச்சை நிலையில் உள்ள மக்களிடமிருந்து சிகிச்சை நிலைமையில் மக்களுக்கு சிகிச்சை அளிக்கிறது. இந்த பிரச்சினைகள் ஒவ்வொன்றிற்கும் Gerber and Green (2012) 5, 6, 7 மற்றும் 8 அதிகாரங்களைக் காண்க.
Westen and Rosenthal (2003) மற்றும் பெரிய தரவு ஆதாரங்களில், Lazer (2015) மற்றும் இந்த புத்தகத்தின் 2-ஆம் அதிகாரத்தில் செல்லுபடியாக்கல் ஆகியவற்றைப் பார்க்கவும்.
வெளி செல்லுபடியாகும் ஒரு அம்சம் ஒரு தலையீடு சோதிக்கப்பட்ட அமைப்பாகும். Allcott (2015) தளத்தில் தேர்வு சார்பு ஒரு கவனமாக கோட்பாட்டு மற்றும் அனுபவத்தை சிகிச்சை வழங்குகிறது. இந்த விவகாரம் Deaton (2010) விவாதிக்கிறது. அதே தலையீட்டின் மாற்று செயலாக்கங்கள் இதேபோன்ற விளைவுகளை ஏற்படுத்தும் என்பது வெளிப்புற செல்லுபடியாக்கத்தின் மற்றொரு அம்சமாகும். இந்த வழக்கில், Schultz et al. (2007) இடையே ஒரு ஒப்பீடு Schultz et al. (2007) மற்றும் Allcott (2011) ஆகியவை ஒப்ளவர் சோதனைகள் ஷூல்ட்ஸ் மற்றும் சகாக்களால் (1.7% எதிராக 5%) அசல் சோதனைகள் விட சிறியதாக மதிப்பிடப்பட்ட சிகிச்சை விளைவைக் கொண்டிருப்பதாகக் காட்டுகிறது. Allcott (2011) பின்வருமாறு பரிசோதனைகள் சிறிய Allcott (2011) என்று ஊகிக்கப்பட்டது. சிகிச்சையிலிருந்து வேறுபாடு ஏற்பட்டது: ஒரு கையால் எழுதப்பட்ட இமோடிகான் பல்கலைக்கழகத்தால் வழங்கப்பட்ட ஒரு ஆய்வின் பகுதியாக, அச்சிடப்பட்ட இமோடிகானுடன் ஒப்பிடுகையில் வெகுஜன உற்பத்தி செய்யப்பட்ட பகுதியாகும் ஒரு சக்தி நிறுவனத்தில் இருந்து அறிக்கை.
துறையில் சோதனைகள் சிகிச்சை விளைவுகளை heterogeneity ஒரு சிறந்த கண்ணோட்டத்திற்கு, Gerber and Green (2012) 12 வது பார்க்கவும். மருத்துவ பரிசோதனையில் சிகிச்சையளிப்பதற்கான சிகிச்சைமுறைகளுக்கு அறிமுகப்படுத்துவதற்கு, Kent and Hayward (2007) , Longford (1999) , மற்றும் Kravitz, Duan, and Braslow (2004) . சிகிச்சையளிக்கும் விளைவுகளின் பல்வகைமை பற்றிய கருத்தாக்கங்கள் பொதுவாக முன் சிகிச்சை பண்புகளை அடிப்படையாக கொண்ட வேறுபாடுகளில் கவனம் செலுத்துகின்றன. பிந்தைய சிகிச்சையின் விளைவுகளை அடிப்படையாகக் கொண்டிருப்பதன் மூலம் நீங்கள் ஆர்வமுள்ளவராக இருந்தால், பின்னர் முக்கிய அடுக்குகள் (Frangakis and Rubin 2002) போன்ற சிக்கலான அணுகுமுறைகள் தேவைப்படுகின்றன; Page et al. (2015) பார்க்கவும் Page et al. (2015) மதிப்பாய்விற்காக.
நேரியல் பின்னடைவைப் பயன்படுத்தி சிகிச்சையளிக்கும் விளைவுகளின் பல்வகைமையை பல ஆராய்ச்சியாளர்கள் மதிப்பிடுகின்றனர், ஆனால் புதிய வழிமுறைகள் இயந்திர கற்றல் சார்ந்தவை; எடுத்துக்காட்டாக, Green and Kern (2012) , Imai and Ratkovic (2013) , Taddy et al. (2016) , மற்றும் Athey and Imbens (2016a) .
பல ஒப்பீடு சிக்கல்கள் மற்றும் "மீன்பிடி" ஆகியவற்றின் காரணமாக விளைவுகளை மறுபரிசீலனை செய்வது பற்றிய சில சந்தேகங்கள் உள்ளன. பல ஒப்பீடு (Fink, McConnell, and Vollmer 2014; List, Shaikh, and Xu 2016) . "மீன்பிடி" பற்றிய கவலைகள் குறித்து ஒரு அணுகுமுறை முன்கூட்டிய பதிவு ஆகும், இது உளவியல் (Nosek and Lakens 2014) , அரசியல் அறிவியல் (Humphreys, Sierra, and Windt 2013; Monogan 2013; Anderson 2013; Gelman 2013; Laitin 2013) , மற்றும் பொருளாதாரம் (Olken 2015) .
Costa and Kahn (2013) ஆய்வில், பாதிப்புகளில் பாதிக்கும் மேற்பட்ட குடும்பங்கள் மக்கள் தொகை விவரங்களுடன் இணைக்கப்படலாம். இந்த விவரங்களில் ஆர்வமுள்ள வாசகர்கள் அசல் தாள்களைக் குறிக்க வேண்டும்.
வழிமுறைகள் நம்பமுடியாத முக்கியத்துவம் வாய்ந்தவை, ஆனால் அவை படிப்பதில் மிகவும் கடினமாக இருக்கின்றன. வழிமுறைகளைப் பற்றிய ஆய்வு உளவியலில் உள்ள மத்தியஸ்தர்களின் ஆய்வுக்கு மிகவும் நெருக்கமாக இருக்கிறது (ஆனால் இரண்டு கருத்துக்களுக்கு இடையே ஒரு துல்லியமான ஒப்பீடுக்காக VanderWeele (2009) பார்க்கவும்). Baron and Kenny (1986) உருவாக்கப்பட்ட அணுகுமுறை போன்ற வழிமுறைகளை கண்டுபிடிப்பதற்கான புள்ளிவிவர அணுகுமுறைகள் மிகவும் பொதுவானவை. துரதிர்ஷ்டவசமாக, அந்த நடைமுறைகள் பல வலுவான அனுமானங்களை (Bullock, Green, and Ha 2010) சார்ந்து மற்றும் பல்வேறு முறைமைகளில் இருக்கும்போது பாதிக்கப்படுகின்றன, ஒரு சூழ்நிலைகளில் பல எதிர்பார்க்கலாம் (Imai and Yamamoto 2013; VanderWeele and Vansteelandt 2014) . Imai et al. (2011) மற்றும் Imai and Yamamoto (2013) சில மேம்படுத்தப்பட்ட புள்ளிவிவர முறைகள் வழங்குகின்றன. மேலும், VanderWeele (2015) உணர்திறன் பகுப்பாய்வு ஒரு விரிவான அணுகுமுறை உட்பட பல முக்கிய முடிவுகளை ஒரு புத்தகம் நீளம் சிகிச்சை வழங்குகிறது.
ஒரு குறிப்பிட்ட அணுகுமுறை நேரடியாக இயந்திரத்தை கையாள முயற்சிக்கும் சோதனைகள் கவனம் செலுத்துகிறது (எ.கா., மாலுமிகள் வைட்டமின் சி கொடுக்கிறது). துரதிருஷ்டவசமாக, பல சமூக அறிவியல் அமைப்புகளில், பல வழிமுறைகள் அடிக்கடி உள்ளன மற்றும் மற்றவர்களை மாற்றாமல் ஒரு மாற்றத்தை ஏற்படுத்தும் சிகிச்சைகள் வடிவமைக்க கடினமாக உள்ளது. Imai, Tingley, and Yamamoto (2013) , Ludwig, Kling, and Mullainathan (2011) , மற்றும் Pirlott and MacKinnon (2016) ஆகியோரால் பரிசோதிக்கப்பட்ட மாற்றீட்டு வழிமுறைகள் சில அணுகுமுறைகள் விவரிக்கப்பட்டுள்ளன.
முழுமையான காரணி சோதனைகள் இயங்கும் ஆராய்ச்சியாளர்கள் பல கருதுகோள் பரிசோதனைகள் குறித்து கவலைப்பட வேண்டும்; மேலும் தகவலுக்கு Fink, McConnell, and Vollmer (2014) மற்றும் List, Shaikh, and Xu (2016) ஆகியவற்றைப் பார்க்கவும்.
இறுதியாக, Hedström and Ylikoski (2010) ஆகியோரால் விவரிக்கப்பட்ட விஞ்ஞானத்தின் தத்துவத்தில் வழிமுறைகள் ஒரு நீண்ட வரலாற்றைக் கொண்டுள்ளன.
பாகுபாட்டை அளவிடுவதற்கான கடித ஆய்வுகள் மற்றும் தணிக்கை ஆய்வுகள் ஆகியவற்றைப் பயன்படுத்துவதற்கு, Pager (2007) .
அமேசான் மெக்கானிக்கல் துர்க் (MTurk) உருவாக்க நீங்கள் உருவாக்கும் சோதனையாளர்களுக்கு பங்கேற்பாளர்களைப் பதிவு செய்ய மிகவும் பொதுவான வழி. மரபுவழி ஆய்வகத்தின் பரிசோதனைகள்-பணம் செலுத்தும் மக்களுக்கு இலவசமாக செய்யவேண்டிய பணிகளை முழுமையாக்குவதற்கு எம்டிர்க் பொருத்தமாக இருப்பதால், பல ஆராய்ச்சியாளர்கள் ஏற்கனவே துருக்கியர்களை (எம்டிர்கில் உள்ள தொழிலாளர்கள்) சோதனை முயற்சிகளாகப் பயன்படுத்த ஆரம்பித்துள்ளனர், இதன் விளைவாக விரைவான மற்றும் மலிவான தரவு சேகரிப்பு அடைய முடியும் (Paolacci, Chandler, and Ipeirotis 2010; Horton, Rand, and Zeckhauser 2011; Mason and Suri 2012; Rand 2012; Berinsky, Huber, and Lenz 2012) .
பொதுவாக, மோட்டர்கில் இருந்து நியமிக்கப்பட்ட பங்கேற்பாளர்களைப் பயன்படுத்துவதற்கான மிகப்பெரிய நன்மைகள் தரவரிசை ஆகும். ஆய்வக சோதனைகள் ரன் மற்றும் துறையில் சோதனைகள் செய்ய சில மாதங்கள் எடுக்க முடியும், ஆனால் MTurk இருந்து ஆட்சேர்ப்பு பங்கேற்பாளர்கள் சோதனைகள் நாட்கள் இயக்க முடியும். உதாரணமாக, Berinsky, Huber, and Lenz (2012) ஆகியோர் ஒரே ஒரு நாளில் 400 பாடங்களை ஒரு 8 நிமிட பரிசோதனையில் பங்கேற்க முடிந்தது. மேலும், இந்த பங்கேற்பாளர்கள் ஏறக்குறைய எந்த நோக்கத்திற்காகவும் (ஆய்வுகள் மற்றும் வெகுஜன ஒத்துழைப்பு உட்பட, அத்தியாயங்கள் 3 மற்றும் 5 இல் கலந்துரையாடப்பட்டது) பெறலாம். ஆட்சேர்ப்பு இந்த எளிமையானது, ஆராய்ச்சியாளர்கள் விரைவான வெற்றிகரமாக தொடர்புடைய சோதனைகள் தொடர முடியும்.
உங்கள் சொந்த பரிசோதனையின்போது MTurk இன் பங்கேற்பாளர்களை ஆட்சேர்ப்பு செய்வதற்கு முன், உங்களுக்குத் தெரிந்த நான்கு முக்கியமான விஷயங்கள் உள்ளன. முதலாவதாக, பல ஆராய்ச்சியாளர்கள் துருக்கியர்கள் சம்பந்தப்பட்ட சோதனைகள் பற்றிய ஒரு நம்பத்தகுந்த ஐயுறவுவாதத்தைக் கொண்டுள்ளனர். இந்த சந்தேகம் குறிப்பிட்டதல்ல என்பதால், ஆதாரங்களை எதிர்ப்பது கடினம். இருப்பினும், துருக்கியர்களைப் பயன்படுத்தி பல ஆண்டுகள் ஆய்ந்தபின், இந்த சந்தேகம் குறிப்பாக நியாயமற்றது என்று முடிவு செய்யலாம். துருக்கியர்களின் மக்கள்தொகை புள்ளிவிவரங்களை ஒப்பிட்டுப் பல ஆய்வுகள் இருந்தன, மேலும் மற்ற ஆய்வாளர்களுடனான துருக்கியர்கள் சோதனைகள் முடிவுகளை ஒப்பிடுகையில் பல ஆய்வுகள் இருந்தன. இந்த வேலை எல்லாவற்றிற்கும் மேலாக, நீங்கள் அதை பற்றி சிந்திக்க சிறந்த வழி துருக்கியர்கள் ஒரு நியாயமான வசதி மாதிரி, மிகவும் மாணவர்கள் போன்ற ஆனால் சற்று வித்தியாசமான (Berinsky, Huber, and Lenz 2012) . எனவே, மாணவர்கள் சிலர் ஒரு நியாயமான மக்கள்தொகையைப் போலவே, அனைவருக்கும் ஆராய்ச்சி, துருக்கியர்கள் சிலருக்கு நியாயமான மக்கள்தொகை இருக்கிறார்கள், ஆனால் அனைவருக்கும் ஆராய்ச்சி இல்லை. நீங்கள் துருக்கியர்களுடன் வேலை செய்யப் போகிறீர்கள் என்றால், இந்த ஒப்பீட்டு ஆய்வுகள் பலவற்றைப் படிக்கவும், அவற்றின் நுணுக்கங்களைப் புரிந்து கொள்ளவும் இது அர்த்தம்.
இரண்டாவதாக, MTurk சோதனையின் உள் செல்லுபடியை அதிகரிக்க சிறந்த ஆய்வாளர்கள் ஆய்வாளர்கள் உருவாக்கியுள்ளனர், மற்றும் இந்த சிறந்த நடைமுறைகளைப் பற்றி அறிந்து கொள்ளவும் (Horton, Rand, and Zeckhauser 2011; Mason and Suri 2012) பற்றி நீங்கள் அறிந்து கொள்ள வேண்டும். உதாரணமாக, துருக்கியர்களைப் பயன்படுத்தும் ஆய்வாளர்கள் கவனக்குறைவான பங்கேற்பாளர்களை (Berinsky, Margolis, and Sances 2014, 2016) அகற்றுவதற்காக திரட்டிகளைப் பயன்படுத்த ஊக்குவிக்கப்படுகிறார்கள் (ஆனால் DJ Hauser and Schwarz (2015b) மற்றும் DJ Hauser and Schwarz (2015b) DJ Hauser and Schwarz (2015a) . நீங்கள் கவனிக்காத பங்கேற்பாளர்களை அகற்றவில்லை என்றால், எந்தவொரு சிகிச்சையையும் அவர்கள் அறிமுகப்படுத்தும் சத்தம் மூலம் கழுவப்படலாம், நடைமுறையில், கவனிக்காத பங்கேற்பாளர்களின் எண்ணிக்கை கணிசமாக இருக்கும். ஹூபர் மற்றும் சகோ (2012) ஆகியோரால் நடத்தப்பட்ட பரிசோதனையில் பங்கேற்றவர்களில் சுமார் 30% பேர் அடிப்படை கவனத்தை திரட்டினர். துருக்கியர்கள் பயன்படுத்தும் போது பொதுவாக ஏற்படும் பிற பிரச்சனைகள் அல்லாத சற்றே பங்கேற்பாளர்கள் (Chandler et al. 2015) மற்றும் கொடூரம் (Zhou and Fishbach 2016) .
மூன்றாவது, டிஜிட்டல் சோதனையின் வேறு சில வடிவங்களுடன் தொடர்புடையது, MTurk சோதனைகள் அளவிட முடியாது; Stewart et al. (2015) மதிப்பீடு எந்த நேரத்தில் கிட்டத்தட்ட 7,000 MTurk மீது மக்கள் உள்ளன.
கடைசியாக, MTurk அதன் சொந்த விதிகள் மற்றும் நெறிமுறைகளான (Mason and Suri 2012) ஒரு சமூகம் என்று நீங்கள் தெரிந்து கொள்ள வேண்டும். நீங்கள் உங்கள் சோதனைகள் நடத்தப் போகிற ஒரு நாட்டினுடைய கலாச்சாரம் பற்றி அறிய முயற்சி செய்வீர்கள் போலவே, துருக்கியர்களின் கலாச்சாரம் மற்றும் விதிமுறைகளைப் பற்றி மேலும் தெரிந்து கொள்ள முயற்சி செய்யுங்கள் (Salehi et al. 2015) சாலி (Salehi et al. 2015) . நீங்கள் பொருத்தமற்ற அல்லது நியாயமற்ற (Gray et al. 2016) ஏதாவது செய்தால் துருக்கியர்கள் உங்கள் பரிசோதனையைப் பற்றி பேசுவதை நீங்கள் அறிவீர்கள்.
Huber, Hill, and Lenz (2012) , அல்லது Mason and Watts (2009) போன்ற Huber, Hill, and Lenz (2012) போன்றவை போன்ற ஆய்வகங்களைப் போலவே, உங்கள் சோதனையாளர்களுக்கு பங்கேற்பாளர்களை சேர்ப்பதற்கான ஒரு நம்பமுடியாத வசதியான வழி MTurk ஆகும். , Goldstein, McAfee, and Suri (2013) , Goldstein et al. (2014) , Horton and Zeckhauser (2016) , மற்றும் Mao et al. (2016) .
உங்கள் சொந்த தயாரிப்பை உருவாக்க முயற்சிக்கிறீர்கள் என நீங்கள் நினைத்தால், Harper and Konstan (2015) வழங்கப்படும் ஆலோசனைகளை நீங்கள் படிக்க வேண்டும் என்று பரிந்துரைக்கிறேன். ஒவ்வொரு வெற்றிகரமான திட்டத்திற்கும் பல, பல தோல்விகளைக் கொண்டுள்ளன. உதாரணமாக, MovieLens குழுவானது, GopherAnswers போன்ற பிற தயாரிப்புகளைத் தொடங்கியது, அவை முழுமையான தோல்விகளை (Harper and Konstan 2015) . ஒரு தயாரிப்பு உருவாக்க முயற்சிக்கும் போது ஒரு ஆராய்ச்சியாளரின் தோல்வியின் மற்றொரு உதாரணம், ஆர்டன் என்ற ஆன்லைன் விளையாட்டை உருவாக்க எட்வார்ட் காஸ்ட்ரோனோவாவின் முயற்சியே ஆகும். நிதியை $ 250,000 போதிலும், திட்டம் ஒரு தோல்வி (Baker 2008) . கோபர்அஸ்வெர்ஸ் மற்றும் ஆர்டன் போன்ற திட்டங்கள் துரதிர்ஷ்டவசமாக மிகவும் பிரபலமான திரைப்படங்களைக் காட்டிலும் பொதுவானவை.
பாஸ்சரின் குவாண்டான்ட் டெக் நிறுவனங்களில் அடிக்கடி விவாதிக்கப்பட்டது என்ற கருத்தை நான் கேட்டிருக்கிறேன், இது கூகிள் (Spector, Norvig, and Petrov 2012) ஆராய்ச்சிகளை மேற்கொள்ள உதவுகிறது.
பாண்ட் மற்றும் சகாக்களுடைய ஆய்வு (2012) ஆகியவை, இந்த சிகிச்சையின் விளைவுகளை அவர்கள் பெற்றவர்களின் நண்பர்களிடமிருந்து கண்டறியும் முயற்சிகளையும் முயற்சிக்கின்றன. சோதனையின் வடிவமைப்பு காரணமாக, இந்த ஸ்பில்லோக்கள் சுத்தமாக இருப்பதைக் கண்டறிவது கடினம்; ஆர்வமுள்ள வாசகர்கள் Bond et al. (2012) பார்க்க வேண்டும் Bond et al. (2012) இன்னும் விரிவான விவாதத்திற்கு. ஜோன்ஸ் மற்றும் சகாக்களும் (2017) 2012 தேர்தலில் மிகவும் ஒத்த பரிசோதனை நடத்தினர். இந்த சோதனைகள் அரசியல் விஞ்ஞானத்தில் நீண்டகால பாரம்பரிய பரிசோதனையின் ஒரு பகுதியாகும், அவை வாக்குப்பதிவை ஊக்குவிப்பதற்கான முயற்சிகள் (Green and Gerber 2015) . இந்த கிடைக்கும் வாக்குச் சோதனைகள் பொதுவானவை, ஏனெனில் அவை பாஸ்டரின் குவாண்டானில் உள்ளன. அதாவது, வாக்களிப்பு மற்றும் வாக்களிப்பு அதிகரிக்க உந்துதல் உள்ளவர்கள் பலர் நடத்தை மாற்றம் மற்றும் சமூக செல்வாக்கைப் பற்றி மேலும் பொதுவான கோட்பாடுகளை சோதிக்க ஒரு சுவாரசியமான நடத்தை இருக்க முடியும்.
அரசியல் கட்சிகள், என்.ஜி.ஓ.க்கள் மற்றும் வணிக நிறுவனங்கள் போன்ற பங்குதாரர் நிறுவனங்களுடன் கள சோதனைகள் நடத்துவதைப் பற்றிய ஆலோசனைக்கு, Loewen, Rubenson, and Wantchekon (2010) , JA List (2011) மற்றும் Gueron (2002) . நிறுவனங்களுடன் கூட்டு முயற்சிகள் எவ்வாறு ஆராய்ச்சி வடிவமைப்புகளை பாதிக்கலாம் என்பதற்கான எண்ணங்கள், King et al. (2007) மற்றும் Green, Calfano, and Aronow (2014) . Humphreys (2015) மற்றும் Nickerson and Hyde (2016) ஆகியோரால் கலந்துரையாடப்பட்டதன் மூலம், கூட்டாண்மை நெறிமுறை கேள்விகளுக்கு வழிவகுக்கும்.
உங்கள் பரிசோதனையை இயக்கும் முன் நீங்கள் பகுப்பாய்வுத் திட்டத்தை உருவாக்கினால், வழிகாட்டுதல்களைப் புகாரளிப்பதன் மூலம் நீங்கள் தொடங்குவதாக நான் பரிந்துரைக்கிறேன். மருத்துவத்தில் (Schulz et al. 2010) சமூகத்தில் ஆராய்ச்சி (Mayo-Wilson et al. 2013) (Schulz et al. 2010) மாற்றியமைக்கப்பட்ட CONSORT (சோதனைகளின் ஒருங்கிணைந்த ஸ்டாண்டர்ட் அறிக்கை (Mayo-Wilson et al. 2013) . ஒரு Mutz and Pemantle (2015) வழிகாட்டு நெறிமுறைகளை ஜர்னல் ஆஃப் எக்ஸ்ட்ரிமிண்டன்டினல் சயின்ஸ் சயின்ஸ் (Gerber et al. 2014) ( Mutz and Pemantle (2015) மற்றும் Gerber et al. (2015) ). இறுதியாக, உளவியல் வழிகாட்டுதல்கள் (APA Working Group 2008) மற்றும் Simmons, Nelson, and Simonsohn (2011) .
நீங்கள் ஒரு பகுப்பாய்வுத் திட்டத்தை உருவாக்கியிருந்தால், முன்பே பதிவுசெய்வது, உங்கள் முடிவுகளில் மற்றவர்களுக்கான நம்பிக்கையை அதிகரிக்கிறது. மேலும், நீங்கள் ஒரு பங்குதாரருடன் பணிபுரிகிறீர்கள் என்றால், முடிவுகளை கண்டறிந்த பிறகு பகுப்பாய்வுகளை மாற்றுவதற்கான உங்கள் பங்குதாரர் திறனை அது கட்டுப்படுத்தும். (Humphreys, Sierra, and Windt 2013; Monogan 2013; Anderson 2013; Gelman 2013; Laitin 2013) , மற்றும் பொருளாதாரம் (Olken 2015) முன்கூட்டியே பதிவு பெருகிய முறையில் உளவியல் (Nosek and Lakens 2014) , அரசியல் அறிவியல் (Humphreys, Sierra, and Windt 2013; Monogan 2013; Anderson 2013; Gelman 2013; Laitin 2013)
ஆன்லைன் துறையில் சோதனைகள் குறிப்பாக வடிவமைப்பு ஆலோசனைகள் கூட Konstan and Chen (2007) மற்றும் Chen and Konstan (2015) .
நான் ஆயுதமண்டலத் தந்திரம் என்று அழைக்கப்படுவது சிலநேரங்களில் நிரலாக்க ஆராய்ச்சி என்று அழைக்கப்படுகிறது; Wilson, Aronson, and Carlsmith (2010) .
Salganik, Dodds, and Watts (2006) , Salganik and Watts (2008) , Salganik and Watts (2009b) , Salganik and Watts (2009a) , மற்றும் Salganik (2007) . வெற்றிபெறும் அனைத்து சந்தைகளுக்கும் மேலும், Frank and Cook (1996) . மேலுஸ்சின் Mauboussin (2012) , Watts (2012) , மற்றும் Frank (2016) .
ஆய்வாளர்கள் எச்சரிக்கையுடன் பயன்படுத்த வேண்டும் என்று பங்கேற்பாளர்களுக்கு பணம் செலுத்துவதற்கான மற்றொரு அணுகுமுறை உள்ளது: கட்டாயப்படுத்தி. பல ஆன்லைன் துறையில் சோதனைகள் பங்கேற்பாளர்கள் அடிப்படையில் பரிசோதனைகள் வரைவு மற்றும் இழப்பீடு இல்லை. இந்த அணுகுமுறையின் எடுத்துக்காட்டுகள் Restivo மற்றும் வேன் டெ Rijt ன் அடங்கும் (2012) விக்கிபீடியா மற்றும் பாண்ட் மற்றும் சக களில் வெகுமதிகளை மீது சோதனை (2012) என அனைவரும் மக்களை வாக்களிக்க ஊக்குவிக்கும் மீது சோதனை. இந்த சோதனைகள் உண்மையில் பூஜ்ய மாறி செலவில் இல்லை, அவை ஆராய்ச்சியாளர்களுக்கு பூஜ்ய மாறி செலவாகும். இத்தகைய பரிசோதனையில், ஒவ்வொரு பங்குதாரருக்கும் விலை மிகக் குறைவாக இருந்தாலும், மொத்த செலவு மிக அதிகமாக இருக்கும். பாரிய ஆன்லைன் பரிசோதனையை இயக்கும் ஆராய்ச்சியாளர்கள் பெரும்பாலும் சிறிய அளவிலான மதிப்பீட்டு சிகிச்சையின் முக்கியத்துவத்தை நியாயப்படுத்தி, பல சிறிய நபர்களுக்கு இந்த சிறிய விளைவுகளை முக்கியத்துவம் வாய்ந்ததாகக் கூறலாம். ஆராய்ச்சியாளர்கள் பங்கேற்பாளர்களை திணிக்கும் செலவிற்கு சரியான சிந்தனை பொருந்தும். உங்கள் பரிசோதனை ஒரு மில்லியன் மக்களை ஒரு நிமிடம் வீழ்த்தினால், இந்த சோதனை எந்தவொரு நபருக்கும் மிகவும் தீங்கு விளைவிப்பதில்லை, ஆனால் மொத்தத்தில் அது கிட்டத்தட்ட இரண்டு ஆண்டுகளுக்கு வீணாகிவிட்டது.
பங்கேற்பாளர்களுக்கு பூஜ்ய மாறி செலவின கட்டணத்தை உருவாக்க மற்றொரு அணுகுமுறை லாட்டரி பயன்படுத்த வேண்டும், இது ஒரு அணுகுமுறை ஆய்வு ஆராய்ச்சி (Halpern et al. 2011) . சந்தோசமான பயனர் அனுபவங்களை உருவாக்குவது பற்றி மேலும் அறிய, Toomim et al. (2011) . பூஜ்ஜிய மாறி விலை பரிசோதனையை உருவாக்க போட்களைப் பயன்படுத்துவது பற்றி மேலும் அறிய ( ??? ) .
Russell and Burch (1959) முதலில் முன்மொழியப்பட்ட மூன்று R இன் பின்வருமாறு:
"மாற்று உயிரற்ற பொருள் உணர்வு வாழும் அதிக விலங்குகள் நிகராக்கலாக அர்த்தம். குறைப்பு ஒரு குறிப்பிட்ட அளவு மற்றும் துல்லியமான தகவல்களை பெற பயன்படுத்தப்படும் விலங்குகள், எண்கள் குறைக்க வேண்டிய. பண்புடைமை நிகழ்வு அல்லது இன்னும் பயன்படுத்த வேண்டும் இது அந்த விலங்குகள் பயன்படுத்தப்படும் மனிதாபிமானமற்ற நடைமுறைகள் தீவிரத்தை எந்த குறையும் என்று பொருள். "
மூன்று R இன் அத்தியாயம் 6-ல் விவரிக்கப்பட்டுள்ள நெறிமுறைக் கொள்கைகளை நான் புறக்கணிக்க மாட்டேன் என்று முன்மொழிகின்றேன். மாறாக, அவை இன்னும் விரிவான பதிப்புகளாக இருக்கின்றன - இந்த நன்மைகள் - குறிப்பாக மனித சோதனையின் அமைப்பில் - நன்மை.
உணர்வு ரீதியான தொற்று பரிசோதனை (Kramer, Guillory, and Hancock 2014) மற்றும் உணர்ச்சிகரமான தொற்று இயற்கை பரிசோதனை (Lorenzo Coviello et al. 2014) ஒப்பிடும் முதல் R ("மாற்று") அடிப்படையில், சோதனைகள் மூலம் இயற்கையான சோதனைகள் (மற்றும் பரிசோதனை அல்லாத தரவுகளில் சோதனைகள் தோராயமாக முயற்சி செய்வதற்கான மற்ற அணுகுமுறைகளை நோக்கி நகர்தல், அத்தியாயம் 2 ஐப் பார்க்கவும்). தார்மீக நலன்கள் கூடுதலாக, பரிசோதனையிலிருந்து சோதனைக்குட்பட்ட ஆய்வுகள் வரை மாறுவதால் ஆராய்ச்சியாளர்கள் ஆராய்ச்சியாளர்களை நியாயப்படுத்த முடியாத வகையில் சிகிச்சையளிப்பதை ஆய்வு செய்ய உதவுகிறது. இந்த நன்னெறி மற்றும் விநியோக நலன்கள் ஒரு செலவில் வந்தாலும். இயற்கை பரிசோதனைகள் மூலம் ஆராய்ச்சியாளர்கள் பங்கேற்பாளர்கள், சீரற்றமையாக்கல் மற்றும் சிகிச்சையின் தன்மை ஆகியவற்றின் ஆட்சேர்ப்பு போன்ற விஷயங்களைக் குறைவாகக் கொண்டுள்ளனர். உதாரணமாக, ஒரு சிகிச்சையாக மழைப்பொழிவின் ஒரு வரம்பு, இது இருவரும் நேர்மறைத் தன்மையை அதிகரிக்கிறது மற்றும் எதிர்மறையை குறைக்கிறது. ஆய்வக ஆராய்ச்சியில், கிராமர் மற்றும் சகாக்கள் சுயாதீனமாக நேர்மறையான மற்றும் எதிர்மறையை சரிசெய்ய முடிந்தது. Lorenzo Coviello et al. (2014) மேலும் விரிவுபடுத்தப்பட்டது L. Coviello, Fowler, and Franceschetti (2014) . கருவி மாறிகள் ஒரு அறிமுகம், இது Lorenzo Coviello et al. (2014) பயன்படுத்தப்படும் அணுகுமுறை ஆகும் Lorenzo Coviello et al. (2014) , Angrist and Pischke (2009) (குறைவான முறையான) அல்லது Angrist, Imbens, and Rubin (1996) (மேலும் முறையான) பார்க்கவும். கருவி மாறிகள் ஒரு சந்தேகம் மதிப்பீடு, Deaton (2010) , மற்றும் பலவீனமான வாசித்தல் கருவி மாறிகள் ஒரு அறிமுகம் பார்க்கவும் (மழை ஒரு பலவீனமான கருவி), பார்க்க Murray (2006) . மேலும் பொதுவாக, இயற்கை சோதனைகளுக்கு நல்ல அறிமுகம் Dunning (2012) , Rosenbaum (2002) , ( ??? ) , மற்றும் Shadish, Cook, and Campbell (2001) சோதனைகள் இல்லாத காரண காரிய விளைவுகளை மதிப்பிடுவது பற்றி நல்ல கருத்துக்களை வழங்குகின்றன.
இரண்டாவது R ("சுத்திகரிப்பு") அடிப்படையில், பதிவுகள் அதிகரிக்க இடுகைகள் தடுக்கும் இருந்து உணர்ச்சி Contagion வடிவமைப்பு மாறும் பரிசீலித்து போது அறிவியல் மற்றும் சரக்கு வர்த்தக ஆஃப் உள்ளன. உதாரணமாக, நியூஸ் ஃபீட்டின் தொழில்நுட்ப செயலாக்கமானது, அவை ஏதேனும் ஒரு விடயத்தைத் தடுக்கும் விடயங்களில் சோதனைகளை செய்ய மிகவும் எளிதானது என்று கருதி இருக்கலாம் (பதிவுகள் தடுப்பதை உள்ளடக்கிய ஒரு சோதனை செயல்படுத்தப்படலாம் என்பதை நினைவில் கொள்ளவும் அடிப்படை அமைப்பு மாற்றங்கள் தேவைப்படாமல் நியூஸ் ஃபீட் அமைப்பின் மேல் ஒரு அடுக்கு). இருப்பினும், விஞ்ஞான ரீதியாக, இந்த பரிசோதனையைச் சுட்டிக்காட்டியுள்ள கோட்பாடு மற்றொன்றுக்கு ஒரு வடிவமைப்புக்கு தெளிவாக தெரியவில்லை. துரதிர்ஷ்டவசமாக, செய்தி ஊட்டத்தில் உள்ளடக்கத்தை தடுக்கும் மற்றும் அதிகரிக்கும் உறவினர்களிடமிருந்து கணிசமான முன் ஆய்வுகளை நான் அறிந்திருக்கவில்லை. மேலும், அவற்றை சுத்திகரிப்பு சிகிச்சைகள் பற்றி குறைவான தீங்கு விளைவிப்பதைப் பற்றி நான் அதிகம் ஆராய்ச்சி செய்யவில்லை; இன்டர்நெட் தணிக்கை அளவைக் கருத்தில் கொள்ளும் B. Jones and Feamster (2015) , (Burnett and Feamster 2015; Narayanan and Zevenbergen 2015) படிப்பு (Burnett and Feamster 2015; Narayanan and Zevenbergen 2015) ஆகியவற்றோடு தொடர்புள்ள ஒரு தலைப்பில் நான் விவாதிக்கிறேன்.
மூன்றாவது ஆர் ("குறைப்பு") அடிப்படையில், பாரம்பரிய ஆற்றல் பகுப்பாய்விற்கு நல்ல அறிமுகம் Cohen (1988) (புத்தகம்) மற்றும் Cohen (1992) (கட்டுரை) வழங்கப்பட்டது, அதே நேரத்தில் Gelman and Carlin (2014) சற்று வேறுபட்ட முன்னோக்கை வழங்குகின்றன. பரிசோதனையின் வடிவமைப்பு மற்றும் பகுப்பாய்வு கட்டத்தில் முன்கூட்டிய சிகிச்சைகள் சேர்க்கப்படலாம்; Gerber and Green (2012) 4-ஆம் அத்தியாயம் 4 இரு அணுகுமுறைகளுக்கும் ஒரு நல்ல அறிமுகம் அளிக்கிறது, மற்றும் Casella (2008) இன்னும் ஆழமான சிகிச்சை அளிக்கிறது. சீரற்ற முறையில் இந்த முன்கணிப்புத் தகவலைப் பயன்படுத்தும் நுட்பங்கள் பொதுவாக தடுக்கப்பட்ட சோதனை வடிவமைப்புகள் அல்லது பரவலான பரிசோதனை வடிவமைப்புகள் (இந்த சொற்பொழிவு சமூகம் முழுவதும் தொடர்ச்சியாக பயன்படுத்தப்படவில்லை); இந்த நுட்பங்கள் அத்தியாயம் 3 ல் விவாதிக்கப்பட்ட அடுக்குமயமான மாதிரி நுட்பங்களை நெருக்கமாக தொடர்புபடுத்துகின்றன. பாரிய சோதனையில் இந்த வடிவமைப்புகளைப் பயன்படுத்துவதற்கு அதிகமான Higgins, Sävje, and Sekhon (2016) ஆகியவற்றைப் பார்க்கவும். பகுப்பாய்வுக் கட்டத்தில் முன்கூட்டி சிகிச்சை முறைகள் உள்ளன. McKenzie (2012) , விரிவான ஆய்வுகளில் பகுப்பாய்வு செய்வதற்கான வேறுபாடு-வேறுபாடு அணுகுமுறைகளை ஆராய்கிறார். சிகிச்சை விளைவுகளை மதிப்பிடுவதில் துல்லியத்தை அதிகரிக்க வெவ்வேறு அணுகுமுறைகளுக்கு இடையில் வர்த்தகம் செய்வதற்காக Carneiro, Lee, and Wilhelm (2016) பார்க்கவும். இறுதியாக, வடிவமைப்பு அல்லது பகுப்பாய்வுக் கட்டத்தில் (அல்லது இரண்டும்) முன்கூட்டியே சிகிச்சையளிக்கும் முயற்சிகளையும் சேர்த்துக் கொள்ளலாமா என்பதை தீர்மானிக்கும்போது, கருத்தில் கொள்ள சில காரணங்கள் உள்ளன. ஆராய்ச்சியாளர்கள் அவர்கள் "மீன்பிடி" (Humphreys, Sierra, and Windt 2013) ஆகியவற்றில் இல்லை என்பதைக் காட்ட விரும்பும் ஒரு அமைப்பில், வடிவமைப்பு கட்டத்தில் முன்கூட்டி சிகிச்சை முறைகள் பயன்படுத்தப்படுவது உதவியாக இருக்கும் (Higgins, Sävje, and Sekhon 2016) . பங்கேற்பாளர்கள் தொடர்ச்சியாக வருகின்ற சூழல்களில், குறிப்பாக ஆன்லைன் துறையில் சோதனைகள், வடிவமைப்பு கட்டத்தில் முன்கூட்டிய சிகிச்சையளிக்கும் தகவலைப் பயன்படுத்தி சிக்கலான தளவாடாக இருக்கலாம்; உதாரணமாக, Xie and Aurisset (2016) .
ஒரு வித்தியாசம்-ல்-வேறுபாடு அணுகுமுறை ஒரு வித்தியாசத்தை விட ஒரு மிகவும் பயனுள்ளதாக இருக்கும் ஏன் பற்றி ஒரு பிட் உள்ளுணர்வு சேர்த்து மதிப்பு. பல ஆன்லைன் விளைவுகளுக்கு மிகவும் அதிகமான மாறுபாடுகள் உள்ளன (எ.கா. RA Lewis and Rao (2015) மற்றும் Lamb et al. (2015) ) மற்றும் காலப்போக்கில் ஒப்பீட்டளவில் நிலையாக இருக்கும். இந்த வழக்கில், மாற்றம் ஸ்கோர் கணிசமாக சிறிய மாறுபாடு இருக்கும், புள்ளிவிவர சோதனை சக்தி அதிகரிக்கும். இந்த அணுகுமுறை டிஜிட்டல் வயதிற்கு முன்பே அடிக்கடி பயன்படுத்தப்படாமல் இருப்பதற்கு ஒரு காரணம், முன்கூட்டிய சிகிச்சை விளைவுகளுக்கு பொதுவானதல்ல. ஒரு குறிப்பிட்ட உடற்பயிற்சி வழக்கமான எடை இழப்பு ஏற்படுகிறது என்பதை அளவிட ஒரு பரிசோதனை கற்பனை செய்வது இது பற்றி சிந்திக்க ஒரு மிகவும் உறுதியான வழி. நீங்கள் ஒரு வித்தியாசமான அணுகுமுறை அணுகுமுறையை பின்பற்றினால், உங்கள் மதிப்பீட்டில் மக்கள்தொகையில் உள்ள வேறுபாடுகளிலிருந்து மாறுபட்ட தன்மை ஏற்படும். நீங்கள் வேறுபாடு-வேறுபாடுகள் அணுகுமுறையைச் செய்தால், எடைகளில் இயற்கையாக ஏற்படும் மாறுபாடு அகற்றப்படும், மேலும் சிகிச்சையால் ஏற்படும் ஒரு வித்தியாசத்தை நீங்கள் எளிதாக கண்டறிய முடியும்.
இறுதியாக, நான் ஒரு நான்காம் ஆர் சேர்த்து: "repurpose". ஆராய்ச்சியாளர்கள் தங்களது அசல் ஆராய்ச்சிக் கேள்விக்கு பதில் அளிப்பதைவிட அதிக பரிசோதனைத் தரவுடன் தங்களைக் கண்டறிந்தால், புதிய கேள்விகளைக் கேட்க தரவை மறுபரிசீலனை செய்ய வேண்டும். உதாரணமாக, கிராமர் மற்றும் சகாக்கள் ஒரு வித்தியாசமான மாறுபட்ட மதிப்பீட்டாளரைப் பயன்படுத்தி, அவற்றின் ஆராய்ச்சிக் கேள்விக்குத் தீர்வு காண்பதற்குத் தேவையானதை விட அதிகமாக தங்களைக் கண்டுபிடித்தனர் என்று கற்பனை செய்து பாருங்கள். முழு அளவிற்கும் தரவைப் பயன்படுத்துவதற்குப் பதிலாக, முன்கூட்டிய சிகிச்சை உணர்ச்சி வெளிப்பாட்டின் செயல்பாடாக விளைவுகளின் அளவை அவர்கள் ஆய்வு செய்திருக்கலாம். Schultz et al. (2007) சிகிச்சையின் விளைவு ஒளி மற்றும் கனரக பயனர்களுக்கு வேறுபட்டதாக இருப்பதாகக் கண்டறிந்தது, ஒருவேளை செய்தி Feed இன் விளைவுகள் ஏற்கனவே மகிழ்ச்சியாக (அல்லது சோகமான) செய்திகளை வெளியிடுவதிலேயே வேறுபடுகின்றன. மறுபடியும் "மீன்பிடி" (Humphreys, Sierra, and Windt 2013) மற்றும் "பி-ஹேக்கிங்" (Simmons, Nelson, and Simonsohn 2011) , ஆனால் இவை நேர்மையான அறிக்கை (Simmons, Nelson, and Simonsohn 2011) , முன் பதிவு (Humphreys, Sierra, and Windt 2013) , மற்றும் இயந்திரம் கற்றல் முறைகள் அதிக பொருத்தமற்ற தவிர்க்க முயற்சி.