التجارب المعملية توفر السيطرة، والتجارب الميدانية توفر الواقعية، والتجارب الميدانية الرقمية الجمع بين السيطرة والواقعية على نطاق واسع.
التجارب تأتي في كثير من الأشكال والأحجام المختلفة. ولكن على الرغم من هذه الاختلافات، وقد وجد الباحثون أنه من المفيد لتنظيم التجارب على طول سلسلة متصلة بين التجارب المخبرية والتجارب الميدانية. الآن، ومع ذلك، والباحثين وينبغي أيضا تنظيم التجارب على طول سلسلة متصلة بين التجارب التناظرية والتجارب الرقمية. وهذه المساحة التصميم ثنائي الأبعاد تساعدك على فهم نقاط القوة والضعف في المناهج المختلفة واقتراح مجالات أكبر فرصة (الشكل 4.1).
في الماضي، كانت الطريقة الرئيسية التي الباحثين تنظيم التجارب على طول البعد المختبر الميداني. معظم التجارب في العلوم الاجتماعية هي التجارب المعملية حيث أداء الطلاب الجامعيين مهام غريبة في المختبر للحصول على الائتمان بالطبع. هذا النوع من التجارب يهيمن البحوث في علم النفس لأنها تمكن الباحثون إلى إنشاء علاجات محددة جدا مصممة لاختبار نظريات محددة جدا حول السلوك الاجتماعي. لبعض المشاكل، ولكن شيئا يشعر غريبة بعض الشيء عن التوصل إلى استنتاجات قوية حول السلوك البشري من مثل هؤلاء الناس غير عادية أداء تلك المهام غير عادية في مثل هذا وضع غير عادي. وقد أدت هذه المخاوف إلى التحرك نحو التجارب الميدانية. تجارب ميدانية تجمع بين التصميم القوي للتجارب عشوائية مضبوطة مع المزيد من المجموعات الممثلة للمشاركين، وأداء المهام الأكثر شيوعا، في إعدادات أكثر طبيعية.
على الرغم من أن بعض الناس يعتقدون من المختبر والتجارب الميدانية وسائل المتنافسة، فمن الأفضل أن يفكر فيها وسائل تكميلية مع نقاط القوة ونقاط الضعف المختلفة. على سبيل المثال، Correll, Benard, and Paik (2007) استخدامها على حد سواء تجربة المختبر وتجربة ميدانية في محاولة للعثور على مصادر "عقوبة الأمومة." في الولايات المتحدة، والأمهات كسب المال أقل من النساء ليس لديها أطفال، حتى عندما مقارنة النساء بمهارات مماثلة تعمل في وظائف مماثلة. هناك العديد من التفسيرات المحتملة لهذا النمط، واحد هو أن أرباب العمل متحيزون ضد الأمهات. (ومن المثير للاهتمام، بل على العكس يبدو أن يكون صحيحا للآباء: أنها تميل إلى كسب أكثر من الرجال بتر مقارنة). من أجل تقييم التحيز المحتمل ضد الأمهات، ركض كوريل وزملاؤه تجربتين: واحد في المختبر واحد في هذا المجال.
أولا، قال كوريل وزملاؤه في تجربة مختبر المشاركين، الذين كانوا الجامعيين الكلية، أن الشركة لبدء الاتصالات ومقرها كاليفورنيا وتجري عملية بحث فرص العمل للإنسان أن يؤدي الجديدة قسم التسويق في الساحل الشرقي. وقال الطلاب أن الشركة تريد مساعدتهم في عملية التوظيف وطلب منهم مراجعة السير الذاتية لعدد من المرشحين المحتملين وتقييم المرشحين على عدد من الأبعاد مثل من ذكاء، والدفء، والالتزام بالعمل. وعلاوة على ذلك، وطلب من الطلاب إذا كانت ستوصي التعاقد مع مقدم الطلب وما كانت ستوصي باعتباره الراتب ابتداء. غير معروف للطلاب، إلا أن يستأنف شيدت خصيصا لتكون مشابهة إلا لشيء واحد: بعض السير الذاتية أشار الأمومة (من خلال سرد مشاركة في جمعية الآباء والمعلمين) وبعض لم يفعل ذلك. وجدت كوريل أن الطلاب كانوا أقل احتمالا أن يوصي توظيف الأمهات وتقدم لهم أقل راتب البداية. وعلاوة على ذلك، من خلال التحليل الإحصائي كل من التقييمات والقرارات ذات الصلة التوظيف، وجدت كوريل أن عيوب الأمهات وأوضح إلى حد كبير من خلال حقيقة أن الأمهات تم تصنيف أقل من حيث الكفاءة والالتزام. وبعبارة أخرى، يقول كوريل أن هذه الصفات هي الآلية التي من خلالها الأمهات محرومات. وهكذا، سمحت هذه التجربة المخبرية كوريل والزملاء لقياس تأثير السببية وتقديم التفسيرات المحتملة لهذا الغرض.
بالطبع، يمكن للمرء أن يكون متشككا حول رسم استنتاجات حول سوق العمل في الولايات المتحدة بأكمله على أساس قرارات بضع مئات من الطلاب الجامعيين الذين ربما لم يكن على وظيفة بدوام كامل، ناهيك عن التعاقد مع الناس. لذلك، كما أجرى كوريل وزملاؤه تجربة ميدانية متكاملة. استجاب الباحثون إلى المئات من فرص العمل المعلن عنها من خلال ارسال خطابات وهمية والسير الذاتية. على غرار المواد معروضة للطلاب الجامعيين، أشارت بعض السير الذاتية الأمومة وبعض لم يفعل ذلك. وجد كوريل وزملاؤه أن الأمهات كانوا أقل عرضة للحصول على استدعائه لإجراء مقابلات معهم من نساء لم ينجبن المؤهلين على قدم المساواة. وبعبارة أخرى، وأرباب العمل الحقيقية اتخاذ القرارات اللاحقة في بيئة طبيعية تصرفت مثل الكثير من الطلاب الجامعيين. وهل اتخاذ قرارات مماثلة لنفس السبب؟ للأسف، نحن لا نعرف. كان الباحثون لا يستطيع أن يطلب من أرباب العمل لتقييم المرشحين أو تفسير قراراتهم.
هذا الزوج من التجارب يكشف الكثير عن المختبر والتجارب الميدانية بشكل عام. التجارب المعملية تقدم الباحثون سيطرة شبه تامة للبيئة للمشاركين فيها واتخاذ القرارات. لذلك، على سبيل المثال، في التجربة المخبرية، كان قادرا على ضمان أن تكون جميع السير الذاتية تليت في بيئة هادئة كوريل. في التجربة الميدانية، وبعض السير الذاتية قد لا يكون حتى تم قراءة. وعلاوة على ذلك، لأن المشاركين في إعداد مختبر يعرفون أن يتم دراستها والباحثين وغالبا ما تكون قادرة على جمع البيانات الإضافية التي يمكن أن تساعدهم على فهم لماذا المشاركين يبذلون قراراتهم. على سبيل المثال، طلب كوريل المشاركين في التجربة المخبرية لتقييم المرشحين على أبعاد مختلفة. هذا النوع من البيانات العملية يمكن أن تساعد الباحثين على فهم الآليات الكامنة وراء الاختلافات في كيفية معاملة المشاركين السير الذاتية.
من ناحية أخرى، نفس هذه الخصائص الدقيقة التي وصفتها تماما كما المزايا كما تعتبر أحيانا عيوب. الباحثون الذين يفضلون التجارب الميدانية يجادلون بأن المشاركين في التجارب المعملية يمكن أن تتصرف بشكل مختلف للغاية عندما يجري لوحظ بشكل وثيق. على سبيل المثال، في المختبر قد خمنت المشاركين تجربة الهدف من البحث وتغيير سلوكهم حتى لا تبدو منحازة. وعلاوة على ذلك، يمكن للباحثين الذين يفضلون التجارب الميدانية يمكن القول بأن الخلافات الصغيرة على السير الذاتية تقف فقط في بيئة معملية نظيفة جدا، معقمة، وبالتالي فإن تجربة المختبر سوف الإفراط في تقدير تأثير الأمومة على قرارات التعيين الحقيقي. وأخيرا، فإن العديد من أنصار التجارب الميدانية انتقاد التجارب المعملية الاعتماد على المشاركين غريب: معظمهم من الطلبة من الغربية، تلقى تعليمه، الصناعية، ريتش، والدول الديمقراطية (Henrich, Heine, and Norenzayan 2010) . التجارب التي كتبها كوريل وزملاؤه (2007) توضح النقيضين على التواصل المختبر الميداني. بين هذين النقيضين هناك مجموعة متنوعة من التصاميم الهجينة بما في ذلك النهج مثل جلب غير الطلاب إلى مختبر أو الدخول في هذا المجال ولكن لا تزال تواجه المشاركين أداء مهمة غير عادية.
بالإضافة إلى البعد المختبر الميداني الذي كان قائما في الماضي، العصر الرقمي يعني أن الباحثين لديها الآن بعدا رئيسيا الثاني على طول التجارب التي يمكن أن تختلف: التناظرية الرقمية. كما أن هناك تجارب نقية مختبر، والتجارب الميدانية نقية، ومجموعة متنوعة من السيارات الهجينة في بين، وهناك تجارب نقية التناظرية، والتجارب الرقمية نقية، ومجموعة متنوعة من السيارات الهجينة. انها صعبة لتقديم تعريف رسمي لهذا البعد، ولكن تعريف عملي مفيد هو أن التجارب الرقمية بالكامل هي التجارب التي تعتمد على الاستفادة من البنية التحتية الرقمية لتجنيد المشاركين، بطريقة عشوائية، وتقديم العلاجات، وقياس النتائج. على سبيل المثال، Restivo وفان دي Rijt في (2012) ودراسة أوسمة ويكيبيديا تجربة رقمية بالكامل لأنها تستخدم الأنظمة الرقمية لكل أربعة من هذه الخطوات. وبالمثل تماما التجارب التناظرية هي التجارب التي لا تستفيد من البنية التحتية الرقمية لأي من هذه الخطوات الأربع. العديد من التجارب الكلاسيكية في علم النفس هي التجارب التناظرية. بين هذين النقيضين هناك جزئيا التجارب الرقمية التي تستخدم مزيجا من النظم التناظرية والرقمية لأربع خطوات.
الأهم من ذلك، الفرص لتشغيل التجارب الرقمية ليست فقط على الانترنت. يمكن للباحثين تشغيل التجارب الرقمية جزئيا باستخدام الأجهزة الرقمية في العالم المادي من أجل تقديم العلاج أو قياس النتائج. على سبيل المثال، يمكن للباحثين استخدام الهواتف الذكية لتقديم العلاج أو أجهزة الاستشعار في البيئة العمرانية لقياس النتائج. في الواقع، كما سنرى لاحقا في هذا الفصل، وقد استخدم الباحثون بالفعل متر الكهربائية المنزلية لقياس النتائج في التجارب حول المعايير الاجتماعية واستهلاك الطاقة التي تنطوي على 8.5 مليون من الأسر (Allcott 2015) . كما أصبح دمج الأجهزة الرقمية على نحو متزايد في حياة الناس وأجهزة استشعار على الاندماج في البيئة المبنية، هذه الفرص لتشغيل التجارب الرقمية جزئيا في العالم المادي سوف تزيد بشكل كبير. وبعبارة أخرى، والتجارب الرقمية ليست مجرد تجارب على الانترنت.
الأنظمة الرقمية خلق إمكانيات جديدة للتجارب في كل مكان على طول التواصل المختبر الميداني. في التجارب المعملية نقية، على سبيل المثال، يمكن للباحثين استخدام الأنظمة الرقمية لقياس أدق للسلوك المشاركين. مثال واحد من هذا النوع من تحسين قياس ومعدات تتبع العين التي توفر تدابير دقيقة ومستمرة من موقع علاه. كما يخلق العصر الرقمي إمكانية إجراء تجارب مثل مختبر على الانترنت. على سبيل المثال، قد اعتمد الباحثون بسرعة الأمازون الميكانيكية الترك (MTurk) لتجنيد المشاركين في التجارب على الانترنت (الشكل 4.2). MTurk مباريات "أرباب العمل" الذين لديهم المهام التي تحتاج إلى أن تكتمل مع "العمال" الذين يرغبون في إنجاز تلك المهام من أجل المال. وخلافا للأسواق العمل التقليدية، ومع ذلك، فإن المهام التي تدخل عادة لا تتطلب سوى بضع دقائق لإكمال والتفاعل الكامل بين صاحب العمل والعامل هو الظاهري. لأن يقلد MTurk جوانب تجارب دفع مختبر التقليدية الناس لاستكمال المهام التي أنها لن تفعل لخالية من أنها تناسب بشكل طبيعي لأنواع معينة من التجارب. أساسا، أنشأت MTurk البنية التحتية لإدارة مجموعة من المشاركين في تجنيد ودفع اتخذت الناس والباحثين الاستفادة من تلك البنية التحتية للاستفادة من حمام سباحة متاح دائما من المشاركين.
التجارب الرقمية يخلق مزيدا من الفرص للتجارب شبيهة المجال. يمكن التجارب الميدانية الرقمية توفر بيانات التحكم وعملية مشددة لفهم الآليات الممكنة (مثل التجارب المعملية) والمشاركين أكثر تنوعا اتخاذ قرارات حقيقية في بيئة طبيعية (مثل التجارب الميدانية). وبالإضافة إلى هذا المزيج من الخصائص الجيدة من التجارب السابقة، وعرض التجارب الميدانية الرقمية أيضا ثلاثة الفرص التي كان من الصعب في المختبر والتجارب الميدانية التناظرية.
أولا، في حين أن معظم المختبرات والتجارب الميدانية التناظرية لديها المئات من المشاركين، يمكن أن التجارب الميدانية الرقمية لديها الملايين من المشاركين. هذا التغيير في نطاق ولأن بعض التجارب الرقمية يمكن أن تنتج البيانات في صفر التكلفة المتغيرة. وهذا هو، مرة واحدة الباحثين خلقت بنية تحتية التجريبية، وزيادة عدد المشاركين وعادة ما لا يزيد التكلفة. زيادة عدد المشاركين من قبل عامل من 100 أو أكثر ليست مجرد تغيير كمي، بل هو تغيير نوعي، لأنها تمكن الباحثون إلى تعلم أشياء مختلفة من التجارب (على سبيل المثال، عدم تجانس الآثار العلاج) وتشغيل تصاميم تجريبية مختلفة تماما ( على سبيل المثال، تجارب مجموعة كبيرة). هذه نقطة مهمة جدا، سوف أعود إليها في نهاية الفصل عندما أقدم المشورة حول إنشاء التجارب الرقمية.
ثانيا، في حين أن معظم المختبرات والتجارب الميدانية التناظرية تعامل المشاركين في الحاجيات تمييزه، والتجارب الميدانية الرقمية وغالبا ما تستخدم المعلومات الأساسية حول المشاركين في تصميم وتحليل مراحل البحث. هذه المعلومات الخلفية، وهو ما يسمى معلومات ما قبل المعالجة، تتوفر في كثير من الأحيان في التجارب الرقمية لأنها تجري في بيئات قياسها بشكل كامل. على سبيل المثال، وهو باحث في الفيسبوك لديه المزيد من المعلومات قبل المعالجة من الباحث تصميم تجربة مختبر القياسية مع الطلاب الجامعيين. تمكن هذه المعلومات قبل المعالجة الباحثين لتجاوز علاج المشاركين الحاجيات كما يمكن تمييزها. وبشكل أكثر تحديدا، تمكن المعلومات قبل المعالجة أكثر كفاءة تصاميم مثل التجريبية كما منع (Higgins, Sävje, and Sekhon 2016) والتوظيف المستهدف من المشاركين (Eckles, Kizilcec, and Bakshy 2016) -و تحليل مثل أكثر الثاقبة كما تقدير عدم التجانس من آثار العلاج (Athey and Imbens 2016a) وتعديل متغيرا لتحسين الدقة (Bloniarz et al. 2016) .
ثالثا، في حين أن العديد من مختبر التناظرية والتجارب الميدانية توفر العلاجات والنتائج قياس في كمية مضغوط نسبيا من الزمن، بعض التجارب الميدانية الرقمية تنطوي العلاجات التي يمكن تسليمها مع مرور الوقت ويمكن قياس الآثار أيضا مع مرور الوقت. على سبيل المثال، Restivo وفان دي Rijt في التجربة لديه نتائج قياس يوميا لمدة 90 يوما، واحدة من التجارب انا اقول لكم عنها لاحقا في الفصل (Ferraro, Miranda, and Price 2011) يتتبع نتائج أكثر من 3 سنوات في الأساس لا يوجد كلفة. هي بيانات هذه ثلاث فرص الحجم، معلومات ما قبل العلاج، والعلاج الطولية والنتيجة الأكثر شيوعا عندما يتم تشغيل التجارب على أعلى دائما على أنظمة القياسات (انظر الفصل 2 لمعرفة المزيد عن دائما على أنظمة القياس).
في حين تقدم التجارب الميدانية الرقمية العديد من الاحتمالات، فإنها أيضا مشاركة بعض نقاط الضعف مع كل من المختبر التناظرية والتجارب الميدانية. على سبيل المثال، والتجارب لا يمكن أن تستخدم لدراسة الماضي، وأنها يمكن تقدير فقط آثار العلاجات التي يمكن التلاعب بها. أيضا، على الرغم من أن التجارب مفيدة لتوجيه السياسة مما لا شك فيه، والتوجيه الصحيح الذي يمكن أن تقدمه محدودة نوعا ما بسبب مضاعفات مثل الاعتماد البيئي، مشاكل الامتثال، والآثار التوازن (Banerjee and Duflo 2009; Deaton 2010) . وأخيرا، والتجارب الميدانية الرقمية تضخم المخاوف الأخلاقية التي أوجدتها التجارب الميدانية. أنصار التجارب الميدانية البوق قدرتها على التدخل بشكل مخفي وبشكل عشوائي في قرارات لاحقة قدمت من قبل الملايين من الناس. هذه الميزات توفر بعض المزايا العلمية، ولكنها يمكن أيضا إجراء التجارب الميدانية مجمع أخلاقيا (التفكير في أنها تتعامل الباحثين الناس مثل "فئران تجارب" على نطاق واسع). وعلاوة على ذلك، بالإضافة إلى الأضرار الممكنة للمشاركين، والتجارب الميدانية الرقمية، بسبب حجمها، ويمكن أيضا زيادة المخاوف بشأن تعطل العمل النظم الاجتماعية (على سبيل المثال، المخاوف بشأن تعطيل نظام المكافأة ويكيبيديا إذا أعطى Restivo وفان دير Rijt الكثير أوسمة) .