التجارب المعملية توفر السيطرة، والتجارب الميدانية توفر الواقعية، والتجارب الميدانية الرقمية الجمع بين السيطرة والواقعية على نطاق واسع.
تأتي التجارب بأشكال وأحجام مختلفة. في الماضي ، وجد الباحثون أنه من المفيد تنظيم التجارب على طول سلسلة متصلة بين التجارب المعملية والتجارب الميدانية . الآن ، ومع ذلك ، ينبغي للباحثين أيضا تنظيم التجارب على طول سلسلة متصلة ثانية بين التجارب التناظرية والتجارب الرقمية . ستساعدك مساحة التصميم ثنائية الأبعاد هذه على فهم نقاط القوة ونقاط الضعف في الأساليب المختلفة وإبراز المناطق ذات الفرص العظيمة (الشكل 4.1).
أحد الأبعاد التي يمكن تنظيم التجارب خلالها هو بُعد حقل المختبر. العديد من التجارب في العلوم الاجتماعية هي تجارب معملية حيث يقوم طلاب البكالوريوس بأداء مهام غريبة في المختبر للحصول على الائتمان بالطبع. يهيمن هذا النوع من التجارب على الأبحاث في علم النفس لأنه يمكّن الباحثين من إنشاء إعدادات عالية الدقة لعزل واختبار نظريات محددة حول السلوك الاجتماعي بدقة. لكن ، بالنسبة لبعض المشاكل ، يبدو الأمر غريبا بعض الشيء حول استنباط استنتاجات قوية حول السلوك البشري من أشخاص غير عاديين يقومون بمثل هذه المهام غير العادية في مثل هذا الوضع غير العادي. هذه المخاوف أدت إلى تحرك نحو التجارب الميدانية . تجمع التجارب الميدانية بين التصميم القوي لتجارب التحكم العشوائية وبين المجموعات الأكثر تمثيلاً للمشاركين الذين يؤدون مهامًا أكثر شيوعًا في ظروف طبيعية أكثر.
على الرغم من أن بعض الناس يفكرون في التجارب المعملية والتداخلية كطرق متنافسة ، فمن الأفضل التفكير فيها على أنها مكملة ، مع نقاط قوة ونقاط ضعف مختلفة. على سبيل المثال ، استخدم كل من Correll, Benard, and Paik (2007) تجربة مختبرية وتجربة حقلية في محاولة للعثور على مصادر "عقوبة الأمومة". في الولايات المتحدة ، تكسب الأمهات أموالًا أقل من النساء اللواتي ليس لديهن أطفال ، حتى عندما مقارنة النساء ذوات المهارات المماثلة التي تعمل في وظائف مماثلة. هناك العديد من التفسيرات الممكنة لهذا النمط ، أحدها أن أصحاب العمل متحيزون ضد الأمهات. (من المثير للاهتمام أن العكس هو الصحيح بالنسبة للآباء: فهم يميلون إلى كسب أكثر من الرجال غير المتماثلين من الأطفال.) من أجل تقييم التحيز المحتمل ضد الأمهات ، أجرت شركة Correll وزملاؤها تجربتين: واحدة في المختبر وواحدة في الحقل.
أولاً ، في تجربة معملية ، أخبروا المشاركين ، الذين كانوا طلاب جامعيين ، بأن الشركة تجري بحثًا عن وظيفة لشخص لقيادة قسم التسويق الجديد في الساحل الشرقي. تم إخبار الطلاب بأن الشركة أرادت مساعدتهم في عملية التوظيف ، وطلب منهم مراجعة سير العديد من المرشحين المحتملين وتقييم المرشحين على عدد من الأبعاد ، مثل ذكائهم ودفئهم والتزامهم بالعمل. علاوة على ذلك ، سئل الطلاب عما إذا كانوا سيوصون بتوظيف مقدم الطلب وما سيوصيون به كراتب بداية. ولكن دون علم الطلاب ، فإن السيرة الذاتية شيدت خصيصًا لتكون مشابهة لشيء واحد: بعضها يشير إلى الأمومة (من خلال إدراج قائمة في رابطة الآباء والمعلمين) والبعض الآخر لم يفعل ذلك. ووجد كوريل وزملاؤه أن الطلاب كانوا أقل احتمالا في التوصية بتوظيف الأمهات وأنهم عرضوا عليهم راتبا أقل. علاوة على ذلك ، من خلال تحليل إحصائي لكل من التقييمات والقرارات المتعلقة بالتوظيف ، وجد كوريل وزملاؤه أن مساوئ الأمهات قد تم تفسيرها إلى حد كبير من خلال تقييمهم لدرجة أدنى من حيث الكفاءة والالتزام. وهكذا ، سمحت هذه التجربة المعملية لكوريل وزملاؤه بقياس تأثير سببي وتقديم تفسير محتمل لهذا التأثير.
بالطبع ، قد يكون المرء متشككا في استخلاص استنتاجات حول سوق العمل في الولايات المتحدة بأكملها على أساس قرارات بضع مئات من الطلاب الجامعيين الذين ربما لم يكن لديهم وظيفة بدوام كامل ، ناهيك عن توظيف شخص ما. لذلك ، أجرى كوريل وزملاؤه أيضا تجربة حقلية مكملة. استجابوا لمئات من فرص العمل المعلن عنها مع خطابات تغطية وهمية واستئناف. وعلى غرار المواد التي عرضت على الطلاب الجامعيين ، فقد أشارت بعض السيرة الذاتية إلى الأمومة والبعض الآخر لم يفعل ذلك. ووجد كوريل وزملاؤه أنه من غير المرجح أن يتم استدعاء الأمهات لإجراء مقابلات من النساء غير المتزوجات اللواتي لديهن نفس القدر من الكفاءة. وبعبارة أخرى ، فإن أصحاب العمل الحقيقيين الذين يتخذون قرارات تبعية في بيئة طبيعية يتصرفون مثل الطلاب الجامعيين. هل اتخذوا قرارات مماثلة لنفس السبب؟ لسوء الحظ ، نحن لا نعرف. لم يتمكن الباحثون من مطالبة أصحاب العمل بتقييم المرشحين أو شرح قراراتهم.
يكشف هذا الزوج من التجارب الكثير عن التجارب المعملية والحقلية بشكل عام. تقدم التجارب المعملية للباحثين سيطرة شبه كاملة على البيئة التي يتخذ المشاركون فيها القرارات. لذا ، على سبيل المثال ، في التجربة المعملية ، كان Correll وزملاؤه قادرين على التأكد من قراءة جميع السير الذاتية في وضع هادئ ؛ في التجربة الميدانية ، قد لا تتم قراءة بعض السير الذاتية. علاوة على ذلك ، نظرًا لأن المشاركين في إعداد المختبر يعرفون أنهم يخضعون للدراسة ، فإن الباحثين غالبًا ما يكونون قادرين على جمع بيانات إضافية يمكن أن تساعد في توضيح سبب اتخاذ المشاركين لقراراتهم. على سبيل المثال ، طلب Correll وزملاؤه من المشاركين في التجربة المعملية تقييم المرشحين بأبعاد مختلفة. هذا النوع من بيانات العمليات يمكن أن يساعد الباحثين على فهم الآليات الكامنة وراء الاختلافات في كيفية معاملة المشاركين للسير الذاتية.
من ناحية أخرى ، فإن هذه الخصائص نفسها التي وصفتها للتو بأنها مزايا تعتبر في بعض الأحيان عيوبا. يجادل الباحثون الذين يفضلون التجارب الميدانية بأن المشاركين في التجارب المعملية يمكن أن يتصرفوا بشكل مختلف تمامًا لأنهم يعرفون أنهم يخضعون للدراسة. على سبيل المثال ، في التجربة المعملية ، قد يكون المشاركون قد فكروا في هدف البحث وغيروا سلوكهم حتى لا يظهروا متحيزين. علاوة على ذلك ، قد يرى الباحثون الذين يفضلون التجارب الميدانية أن الاختلافات البسيطة في السير الذاتية لا يمكن أن تبرز إلا في بيئة معملية نظيفة وعقيمة للغاية ، وبالتالي فإن التجربة المعملية سوف تبالغ في تقدير تأثير الأمومة على قرارات التوظيف الحقيقية. وأخيرًا ، ينتقد العديد من أنصار التجارب الميدانية اعتماد التجارب المعملية على المشاركين في الدراسة ، وهم: بشكل أساسي طلاب من دول غربية (Henrich, Heine, and Norenzayan 2010a) وديمقراطية (Henrich, Heine, and Norenzayan 2010a) . توضح التجارب التي أجراها كوريل وزملاؤه (2007) التطرفين في مجال المختبر. فيما بين هذين النقيضين ، هناك أيضًا مجموعة متنوعة من التصاميم الهجينة ، بما في ذلك طرق مثل جلب غير الطلاب إلى المختبر أو الذهاب إلى الحقل ، لكن لا يزال المشاركون يضطلعون بمهمة غير عادية.
بالإضافة إلى بُعد حقل المختبر الذي كان موجودًا في الماضي ، فإن العصر الرقمي يعني أن الباحثين لديهم الآن بعدًا رئيسيًا ثانيًا يمكن أن تتباين فيه التجارب: التناظرية الرقمية. مثلما توجد تجارب مخبرية نقية ، وتجارب حقلية صافية ، ومجموعة متنوعة من الهجينة بين ، توجد تجارب تناظرية خالصة ، وتجارب رقمية نقية ، ومجموعة متنوعة من الهجينة. من الصعب تقديم تعريف رسمي لهذا البعد ، ولكن تعريف العمل المفيد هو أن التجارب الرقمية بالكامل هي تجارب تستخدم البنية التحتية الرقمية لتجنيد المشاركين ، والعشوائية ، وتقديم العلاجات ، وقياس النتائج. على سبيل المثال ، كانت دراسة Restivo و van de Rijt (2012) لـ barnstars و Wikipedia تجربة رقمية بالكامل لأنها استخدمت الأنظمة الرقمية لجميع هذه الخطوات الأربع. وبالمثل ، لا تستخدم التجارب التناظرية بالكامل البنية التحتية الرقمية لأي من هذه الخطوات الأربع. العديد من التجارب الكلاسيكية في علم النفس هي تجارب تماثلية بالكامل. بين هذين النقيضين ، هناك تجارب رقمية جزئية تستخدم مزيجًا من الأنظمة التناظرية والرقمية.
عندما يفكر بعض الأشخاص بالتجارب الرقمية ، يفكرون على الفور في التجارب عبر الإنترنت. هذا أمر مؤسف لأن فرص تشغيل التجارب الرقمية ليست على الإنترنت فقط. يمكن للباحثين إجراء تجارب رقمية جزئية باستخدام الأجهزة الرقمية في العالم الفعلي من أجل تقديم العلاجات أو قياس النتائج. على سبيل المثال ، يمكن للباحثين استخدام الهواتف الذكية لتقديم العلاجات أو أجهزة الاستشعار في البيئة المبنية لقياس النتائج. في الواقع ، كما سنرى لاحقًا في هذا الفصل ، استخدم الباحثون بالفعل عدادات الطاقة المنزلية لقياس النتائج في التجارب حول استهلاك الطاقة التي تشمل 8.5 مليون أسرة (Allcott 2015) . ومع دمج الأجهزة الرقمية بشكل متزايد في حياة الناس ، تصبح أجهزة الاستشعار وأجهزة الاستشعار مدمجة في البيئة المبنية ، وهذه الفرص لتشغيل تجارب رقمية جزئية في العالم المادي ستزيد بشكل كبير. بمعنى آخر ، لا تعد التجارب الرقمية مجرد تجارب عبر الإنترنت.
تخلق الأنظمة الرقمية إمكانات جديدة للتجارب في كل مكان على امتداد مجال حقل المختبر. في التجارب المعملية الخالصة ، على سبيل المثال ، يمكن للباحثين استخدام الأنظمة الرقمية لقياس أدق لسلوك المشاركين ؛ أحد الأمثلة على هذا النوع من القياسات المحسنة هي أجهزة تتبع العين التي توفر مقاييس دقيقة ومستمرة من موقع التحديق. كما أن العصر الرقمي يخلق إمكانية إجراء تجارب شبيهة بالمختبرات عبر الإنترنت. على سبيل المثال ، اعتمد الباحثون بسرعة شركة Amazon Mechanical Turk (MTurk) لتوظيف مشاركين للتجارب عبر الإنترنت (الشكل 4.2). يتوافق MTurk مع "أصحاب العمل" الذين لديهم مهام يجب إكمالها مع "العمال" الذين يرغبون في إكمال هذه المهام مقابل المال. وعلى خلاف أسواق العمل التقليدية ، فإن المهام المعنية تتطلب عادةً بضع دقائق فقط لإكمالها ، والتفاعل الكامل بين صاحب العمل والعامل على الإنترنت. لأن MTurk يحاكي جوانب من التجارب المعملية التقليدية - دفع الناس لإكمال المهام التي لا يفعلونها مجاناً - فهي مناسبة بشكل طبيعي لأنواع معينة من التجارب. أساسا ، خلقت MTurk البنية التحتية لإدارة مجموعة من المشاركين - تجنيد ودفع الناس - واستفاد الباحثون من تلك البنية التحتية للاستفادة من تجمع دائم متاح من المشاركين.
الأنظمة الرقمية تخلق المزيد من الاحتمالات للتجارب الشبيهة بالمجال. على وجه الخصوص ، تمكن الباحثين من الجمع بين بيانات التحكم والمعالجة الصارمة المرتبطة بالتجارب المعملية مع المشاركين الأكثر تنوعًا والأوضاع الطبيعية الأكثر المرتبطة بالتجارب المعملية. بالإضافة إلى ذلك ، توفر التجارب الميدانية الرقمية أيضًا ثلاث فرص تميل إلى الصعوبة في التجارب التناظرية.
أولا ، في حين أن معظم التجارب المعملية والتناظرية الميدانية لديها المئات من المشاركين ، يمكن أن يكون للتجارب الميدانية الرقمية الملايين من المشاركين. هذا التغيير في الحجم هو أن بعض التجارب الرقمية يمكن أن تنتج بيانات بتكلفة صفر متغيرة. أي أنه بمجرد أن يقوم الباحثون بإنشاء بنية تحتية تجريبية ، فإن زيادة عدد المشاركين عادة لا يؤدي إلى زيادة التكلفة. زيادة عدد المشاركين بعامل 100 أو أكثر ليس مجرد تغيير كمي ؛ إنه تغيير نوعي ، لأنه يمكِّن الباحثين من تعلم أشياء مختلفة من التجارب (على سبيل المثال ، عدم تجانس تأثيرات العلاج) ولتشغيل تصميمات تجريبية مختلفة تمامًا (مثل تجارب مجموعة كبيرة). هذه النقطة مهمة جدًا ، سأعود إليها في نهاية الفصل عندما أقدم نصيحة حول إنشاء تجارب رقمية.
ثانياً ، في حين أن معظم التجارب المعملية والتناظرية الميدانية تعامل المشاركين على أنها أدوات سهلة التمييز ، فإن التجارب الميدانية الرقمية غالبًا ما تستخدم معلومات أساسية حول المشاركين في مراحل التصميم والتحليل الخاصة بالبحث. هذه المعلومات الأساسية ، والتي تسمى معلومات ما قبل المعالجة ، غالبًا ما تكون متاحة في التجارب الرقمية لأنها تعمل على أنظمة القياس دائمًا (انظر الفصل 2). على سبيل المثال ، يوجد لدى الباحث في Facebook معلومات مسبقة أكثر بكثير عن الأشخاص في تجربتها الميدانية الرقمية مقارنة بالباحثين الجامعيين حول الأشخاص في تجربتها الميدانية التناظرية. تتيح هذه المعالجة المسبقة تصميمات تجريبية أكثر كفاءة - مثل الحجب (Higgins, Sävje, and Sekhon 2016) والتوظيف الموجه للمشاركين (Eckles, Kizilcec, and Bakshy 2016) - وتحليل أكثر (Eckles, Kizilcec, and Bakshy 2016) - مثل تقدير عدم تجانس تأثيرات العلاج (Athey and Imbens 2016a) وتعديل (Bloniarz et al. 2016) لتحسين الدقة (Bloniarz et al. 2016) .
ثالثًا ، في حين أن العديد من التجارب المعملية والتناظرية الميدانية تقدم المعالجات وقياس النتائج في فترة زمنية مضغوطة نسبيًا ، فإن بعض التجارب الميدانية الرقمية تحدث عبر نطاقات زمنية أطول بكثير. على سبيل المثال ، كانت تجربة ريستيفو وفان دو ريجيت تُقاس بالنتيجة يومياً لمدة 90 يومًا ، وأحد التجارب التي أخبرك عنها لاحقًا في الفصل (Ferraro, Miranda, and Price 2011) تتبع النتائج على مدى ثلاث سنوات في الأساس لا كلفة. هذه الفرص الثلاثة - الحجم ، معلومات ما قبل المعالجة ، والمعالجة الطولية وبيانات النتائج - تنشأ بشكل شائع عندما يتم تشغيل التجارب على أنظمة القياس دائمًا (انظر الفصل 2 لمعرفة المزيد عن أنظمة القياس دائمًا).
في حين تقدم التجارب الميدانية الرقمية العديد من الاحتمالات ، إلا أنها تتشارك أيضًا بعض نقاط الضعف في كل من التجارب التناظرية والتجارب الحقلية. على سبيل المثال ، لا يمكن استخدام التجارب لدراسة الماضي ، ويمكنهم فقط تقدير آثار العلاجات التي يمكن التلاعب بها. أيضا ، على الرغم من أن التجارب مفيدة بلا شك في توجيه السياسة ، فإن التوجيه الدقيق الذي يمكن أن يقدمه محدود إلى حد ما بسبب المضاعفات مثل الاعتماد على البيئة ، ومشاكل الامتثال ، وتأثير التوازن (Banerjee and Duflo 2009; Deaton 2010) . كما تعمل التجارب الميدانية الرقمية على تضخيم الاهتمامات الأخلاقية الناتجة عن التجارب الميدانية - وهو موضوع سأتناوله لاحقًا في هذا الفصل وفي الفصل السادس.