ลองไปไกลกว่าการทดลองง่ายๆ สามแนวคิดมีประโยชน์สำหรับการทดลองที่หลากหลาย: ความถูกต้องความหลากหลายของผลการรักษาและกลไกต่างๆ
นักวิจัยที่ยังใหม่กับการทดลองมักจะมุ่งเน้นไปที่คำถามเฉพาะเจาะจงและแคบมาก: การรักษานี้ "ทำงาน" หรือไม่? ตัวอย่างเช่นโทรศัพท์จากอาสาสมัครกระตุ้นให้คนโหวตหรือไม่? การเปลี่ยนปุ่มเว็บไซต์จากสีน้ำเงินเป็นสีเขียวช่วยเพิ่มอัตราการคลิกผ่านหรือไม่ อย่างไรก็ตามการถ้อยคำที่หลวมเกี่ยวกับสิ่งที่ "ทำงาน" ปิดบังข้อเท็จจริงที่ว่าการทดลองที่มุ่งเน้นอย่างแคบไม่ได้บอกคุณจริงๆว่าการรักษา "ทำงาน" ในแง่ทั่วไป แต่การทดลองที่มุ่งเน้นอย่างเฉลียวฉลาดตอบคำถามเฉพาะเจาะจงมากขึ้น: ผลกระทบโดยเฉลี่ยของการรักษาที่เฉพาะเจาะจงนี้กับการใช้งานเฉพาะนี้สำหรับผู้เข้าร่วมในกลุ่มนี้ในขณะนี้คืออะไร? ฉันจะเรียกการทดลองที่มุ่งเน้นไปที่ การทดลองง่ายๆแบบ แคบนี้
การทดลองที่เรียบง่ายสามารถให้ข้อมูลที่มีค่า แต่พวกเขาไม่สามารถตอบคำถามมากมายที่มีความสำคัญและน่าสนใจเช่นว่ามีคนบางคนที่การรักษามีผลมากหรือน้อย ไม่ว่าจะมีการรักษาอื่นที่จะมีประสิทธิภาพมากขึ้นหรือไม่ และการทดลองครั้งนี้เกี่ยวข้องกับทฤษฎีทางสังคมที่กว้างขึ้นหรือไม่
เพื่อที่จะแสดงถึงคุณค่าของการก้าวไปไกลกว่าการทดลองแบบง่ายๆลองพิจารณาการทดลองภาคสนามอะนาล็อกโดย P. Wesley Schultz และเพื่อนร่วมงานเกี่ยวกับความสัมพันธ์ระหว่างบรรทัดฐานทางสังคมและการใช้พลังงาน (Schultz et al. 2007) Schultz และเพื่อนร่วมงานได้แขวน doorhangers ไว้ใน 300 ครัวเรือนในซานมาร์คอสรัฐแคลิฟอร์เนียและมีประตูที่เก็บข้อความต่าง ๆ เพื่อช่วยในการอนุรักษ์พลังงาน จากนั้นชูลทซ์และเพื่อนร่วมงานได้วัดผลของข้อความเหล่านี้ต่อการใช้พลังงานไฟฟ้าทั้งหลังจากหนึ่งสัปดาห์และหลังสามสัปดาห์ ดูรูปที่ 4.3 สำหรับรายละเอียดเพิ่มเติมของการออกแบบการทดลอง
การทดลองมีสองเงื่อนไข ในตอนแรกครัวเรือนได้รับเคล็ดลับการประหยัดพลังงานทั่วไป (เช่นใช้พัดลมแทนเครื่องปรับอากาศ) และข้อมูลเกี่ยวกับการใช้พลังงานเทียบกับการใช้พลังงานโดยเฉลี่ยในพื้นที่ใกล้เคียง Schultz และเพื่อนร่วมงานเรียกชื่อนี้ว่าสภาวะ เชิงบรรทัดฐานอธิบาย เพราะข้อมูลเกี่ยวกับการใช้พลังงานในละแวกนั้นให้ข้อมูลเกี่ยวกับพฤติกรรมทั่วไป (เช่นบรรทัดฐานเชิงพรรณนา) เมื่อ Schultz และเพื่อนร่วมงานต่างมองถึงการใช้พลังงานที่เกิดขึ้นในกลุ่มนี้การรักษาดูเหมือนจะไม่มีผลในระยะสั้นหรือระยะยาว กล่าวอีกนัยหนึ่งการรักษาไม่ได้ดูเหมือน "ทำงาน" (รูปที่ 4.4)
โชคดีที่ชูลท์ซและเพื่อนร่วมงานไม่สามารถตกลงกันได้สำหรับการวิเคราะห์แบบง่ายนี้ ก่อนการทดลองเริ่มต้นขึ้นพวกเขาให้เหตุผลว่าผู้ใช้ไฟฟ้าจำนวนมากที่อยู่เหนือค่าเฉลี่ยอาจลดการบริโภคของพวกเขาและผู้ใช้พลังงานไฟฟ้าที่อยู่ต่ำกว่าค่าเฉลี่ยอาจเพิ่มการบริโภคของพวกเขา เมื่อพวกเขามองไปที่ข้อมูลนั่นคือสิ่งที่พวกเขาพบ (รูปที่ 4.4) ดังนั้นสิ่งที่ดูเหมือนการรักษาที่ไม่มีผลก็คือการรักษาที่มีผลชดเชยสองครั้ง การเพิ่มขึ้นของการต่อต้านการก่อการร้ายในหมู่ผู้ใช้ที่มีน้ำหนักเบาเป็นตัวอย่างของ ผลบูมเมอแรง ซึ่งการรักษาอาจมีผลตรงกันข้ามกับสิ่งที่ตั้งใจไว้
พร้อมกับเงื่อนไขแรก Schultz และเพื่อนร่วมงานก็วิ่งไปในสภาพที่สอง ครัวเรือนที่อยู่ในสภาพที่สองได้รับเคล็ดลับการประหยัดพลังงานแบบเดียวกับข้อมูลทั่วไปและข้อมูลเกี่ยวกับการใช้พลังงานในครัวเรือนของตนเมื่อเทียบกับค่าเฉลี่ยสำหรับพื้นที่ใกล้เคียงของพวกเขาโดยมีการเพิ่มขึ้นเพียงเล็กน้อยสำหรับผู้ที่มีการบริโภคต่ำกว่าค่าเฉลี่ยนักวิจัยได้เพิ่ม ) และสำหรับคนที่มีการบริโภคสูงกว่าเกณฑ์เฉลี่ยพวกเขาเพิ่ม :( อีโมติคอนเหล่านี้ได้รับการออกแบบมาเพื่อเรียกสิ่งที่นักวิจัยเรียกว่า บรรทัดฐาน injunctive บรรทัดฐานที่ ไม่เป็นธรรมหมายถึงการรับรู้ถึงสิ่งที่ได้รับการยอมรับโดยทั่วไป (และไม่ผ่านการอนุมัติ) ในขณะที่บรรทัดฐานเชิงพรรณนาหมายถึงการรับรู้ สิ่งที่มักทำ (Reno, Cialdini, and Kallgren 1993)
นักวิทยาศาสตร์ได้เพิ่มไอคอนอีโมติคอนตัวเล็ก ๆ ตัวหนึ่งลง (รูปที่ 4.4) การเปลี่ยนแปลงที่เกิดขึ้นจากทฤษฎีทางจิตวิทยาสังคมเชิงนามธรรม (Cialdini, Kallgren, and Reno 1991) นักวิจัยสามารถที่จะเปลี่ยนโปรแกรมที่ดูเหมือนจะไม่ค่อยมีประโยชน์ในการทำงาน และในเวลาเดียวกันพวกเขาสามารถมีส่วนร่วมในการทำความเข้าใจทั่วไปว่าบรรทัดฐานทางสังคมมีผลต่อพฤติกรรมของมนุษย์อย่างไร
ในตอนนี้คุณอาจสังเกตเห็นว่ามีบางอย่างที่แตกต่างไปเล็กน้อยเกี่ยวกับการทดสอบนี้ โดยเฉพาะอย่างยิ่งการทดลองของชูลท์ซและเพื่อนร่วมงานไม่ได้มีกลุ่มควบคุมในทางเดียวกันกับที่การทดลองแบบสุ่มควบคุมทำได้ การเปรียบเทียบระหว่างการออกแบบนี้กับ Restivo และ van de Rijt แสดงให้เห็นถึงความแตกต่างระหว่างการออกแบบการทดลองสองรูปแบบที่สำคัญ ใน การออกแบบระหว่างวิชา เช่น Restivo และ van de Rijt มีกลุ่มบำบัดและกลุ่มควบคุม ในการออกแบบภายในอาสาสมัครในมืออื่น ๆ พฤติกรรมของผู้เข้าร่วมจะถูกเปรียบเทียบก่อนและหลังการรักษา (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) ในการทดสอบภายในเรื่องนั้นดูเหมือนว่าผู้เข้าร่วมแต่ละคนจะทำหน้าที่เป็นกลุ่มควบคุมของตัวเอง ความแข็งแรงของการออกแบบระหว่างวิชาคือการป้องกันจากสารก่อภูมิแพ้ (ตามที่ได้อธิบายไว้ก่อนหน้านี้) ขณะที่ความแรงของการทดลองภายในอาสาสมัครเพิ่มขึ้นอย่างแม่นยำในการประมาณค่า สุดท้ายนี้เพื่อคาดเดาความคิดที่จะเกิดขึ้นภายหลังเมื่อฉันเสนอคำแนะนำเกี่ยวกับการออกแบบการทดลองแบบดิจิตอลการออกแบบ _mixed จะช่วยเพิ่มความแม่นยำในการออกแบบภายในอาสาสมัครและการป้องกันการสร้างภาพลวงตาระหว่างผู้ออกแบบ (รูปที่ 4.5)
โดยรวมการออกแบบและผลการศึกษาของ Schultz และเพื่อนร่วมงาน (2007) แสดงให้เห็นถึงคุณค่าของการก้าวไปไกลกว่าการทดลองง่ายๆ โชคดีที่คุณไม่จำเป็นต้องเป็นอัจฉริยะที่สร้างสรรค์ในการออกแบบการทดลองเช่นนี้ นักวิทยาศาสตร์ทางสังคมได้พัฒนาแนวคิดสามประการที่จะนำคุณสู่การทดลองที่สมบูรณ์ยิ่งขึ้น: (1) ความถูกต้อง (2) ความไม่สม่ำเสมอของผลการรักษาและ (3) กลไก กล่าวคือหากคุณคำนึงถึงแนวคิดสามประการนี้ขณะที่คุณกำลังออกแบบการทดสอบของคุณคุณจะสร้างการทดสอบที่น่าสนใจและมีประโยชน์มากขึ้น เพื่อแสดงให้เห็นถึงแนวคิดทั้งสามแบบในการดำเนินการนี้ฉันจะอธิบายการทดลองภาคสนามดิจิทัลบางส่วนที่ติดตามได้จากการออกแบบที่หรูหราและน่าตื่นเต้นของ Schultz และเพื่อนร่วมงาน (2007) อย่างที่คุณจะได้เห็นการออกแบบการวิเคราะห์และการแปลความรอบคอบมากขึ้นคุณก็สามารถก้าวไปไกลกว่าการทดลองง่ายๆ