Uhalali inahusu kiasi gani matokeo ya majaribio msaada hitimisho zaidi kwa ujumla.
Hakuna majaribio kamili, na watafiti wamejenga msamiati mkubwa kuelezea matatizo iwezekanayo. Uthibitisho unahusu kiwango ambacho matokeo ya jaribio fulani husaidia hitimisho zaidi. Wanasayansi wa jamii wamegundua kuwasaidia kugawanya uhalali katika aina nne kuu: (Shadish, Cook, and Campbell 2001, chap. 2) uhalali wa ndani, kujenga uhalali, na uhalali wa nje (Shadish, Cook, and Campbell 2001, chap. 2) . Kufahamu mawazo haya kukupa orodha ya akili ya kutafakari na kuboresha kubuni na uchambuzi wa majaribio, na itasaidia kuwasiliana na watafiti wengine.
Vipindi vya uhitimisho vya uhitimisho wa takwimu karibu na kama uchambuzi wa takwimu za jaribio ulifanyika kwa usahihi. Katika mazingira ya Schultz et al. (2007) , swali kama hilo lingeweza kuzingatia ikiwa wamesabiwa \(p\) v \(p\) thamani yao. Kanuni za takwimu zinazohitajika kubuni na kuchambua majaribio ni zaidi ya upeo wa kitabu hiki, lakini hazijabadilishwa kimsingi katika umri wa digital. Imebadilika, hata hivyo, ni kwamba mazingira ya data katika majaribio ya digital yameunda fursa mpya kama vile kutumia mbinu za kujifunza mashine ili kukadiria uharibifu wa madhara ya matibabu (Imai and Ratkovic 2013) .
Uhalali wa ndani huwekwa karibu kama taratibu za majaribio zilifanywa kwa usahihi. Kurudi kwenye jaribio la Schultz et al. (2007) , maswali kuhusu uhalali wa ndani yanaweza kuzunguka karibu na randomization, utoaji wa matibabu, na kipimo cha matokeo. Kwa mfano, unaweza kuwa na wasiwasi kwamba wasaidizi wa utafiti hawajasoma mita za umeme kwa uaminifu. Kwa kweli, Schultz na wenzake walikuwa na wasiwasi juu ya tatizo hili, na walikuwa na sampuli ya meta kusoma mara mbili; Kwa bahati nzuri, matokeo yalikuwa sawa. Kwa ujumla, Schultz na jaribio la wenzake huonekana kuwa na uhalali wa juu wa ndani, lakini hii sio daima kesi: shamba ngumu na majaribio ya mtandaoni mara nyingi huingia katika matatizo kwa kweli hutoa matibabu sahihi kwa watu wa kulia na kupima matokeo kwa kila mtu. Kwa bahati nzuri, umri wa digital unaweza kusaidia kupunguza wasiwasi kuhusu uhalali wa ndani kwa sababu sasa ni rahisi kuhakikisha kwamba matibabu hutolewa kwa wale wanaotakiwa kuipata na kupima matokeo kwa washiriki wote.
Jenga vituo vya uhalali karibu na mechi kati ya data na ujenzi wa kinadharia. Kama ilivyojadiliwa katika sura ya 2, ujenzi ni dhana zisizo wazi ambazo wanasayansi wanasema kuhusu. Kwa bahati mbaya, dhana hizi zisizo wazi hazina daima ufafanuzi wazi na vipimo. Kurudi kwa Schultz et al. (2007) , madai ya kuwa kanuni za kijamii zinaweza kupunguza matumizi ya umeme inahitaji watafiti kuunda matibabu ambayo ingeweza kuendesha "kanuni za kijamii" (mfano, emoticon) na kupima "matumizi ya umeme". Katika majaribio ya analogog, watafiti wengi walifanya matibabu yao wenyewe na kupima matokeo yao wenyewe. Njia hii inahakikisha kuwa, iwezekanavyo, majaribio yanakabiliana na ujenzi wa abstract unaojifunza. Katika majaribio ya digital ambapo watafiti washirika na makampuni au serikali kutoa matibabu na kutumia mara kwa mara kwenye mifumo ya data ili kupima matokeo, mechi kati ya majaribio na ujenzi wa kinadharia inaweza kuwa dhaifu sana. Kwa hivyo, natarajia kwamba kujenga uhalali utakuwa na wasiwasi mkubwa katika majaribio ya digital kuliko katika majaribio ya analog.
Hatimaye, vituo vya uhalali nje vinazunguka kama matokeo ya jaribio hili yanaweza kuzalishwa kwa hali nyingine. Kurudi kwa Schultz et al. (2007) , mtu anaweza kuuliza kama wazo hili - kuwapa watu habari juu ya matumizi yao ya nishati kwa wenzao na ishara ya kanuni za kujeruhi (kwa mfano, kihisia) -weza kupunguza matumizi ya nishati ikiwa ikifanyika kwa njia tofauti katika mazingira tofauti. Kwa majaribio mengi yaliyotengenezwa vizuri na yenye ufanisi, wasiwasi kuhusu uhalali wa nje ni ngumu zaidi kushughulikia. Katika siku za nyuma, mjadala huu kuhusu uhalali wa nje mara kwa mara hauhusiani na kitu kikubwa zaidi kuliko kikundi cha watu waliokuwa wameketi kwenye chumba akijaribu kufikiria nini kitatokea ikiwa taratibu zilifanyika kwa njia tofauti, au kwa sehemu tofauti, au kwa washiriki tofauti . Kwa bahati nzuri, umri wa digital huwawezesha watafiti kuhamisha zaidi uchunguzi huu wa bure wa data na kutathmini uhalali wa nje kwa usawa.
Kwa sababu matokeo kutoka kwa Schultz et al. (2007) yalikuwa ya kusisimua, kampuni inayoitwa Opower iligawanyika na huduma nchini Marekani ili kupeleka matibabu zaidi. Kulingana na muundo wa Schultz et al. (2007) , Opower iliunda Ripoti za Nishati za Nyumbani zilizoboreshwa ambazo zilikuwa na modules mbili kuu: moja inayoonyesha matumizi ya umeme kwa jamaa na jirani zao na moja kutoa vidokezo vya kupunguza matumizi ya nishati (sura ya 4.6). Kisha, kwa ushirikiano na watafiti, Opower aliendesha majaribio yaliyodhibitiwa ya randomized kutathmini athari za Ripoti za Nishati za Nyumbani. Ingawa matibabu katika majaribio haya yalitolewa mara kwa mara kimwili-kwa kawaida kupitia barua ya zamani ya konokono - matokeo yalipimwa kwa kutumia vifaa vya digital katika ulimwengu wa kimwili (kwa mfano, mita za nguvu). Zaidi ya hayo, badala ya kukusanya taarifa hii na wasaidizi wa utafiti wanaotembelea kila nyumba, majaribio ya Opower yote yamefanyika kwa kushirikiana na makampuni ya nguvu kuwawezesha wachunguzi kufikia masomo ya nguvu. Kwa hiyo, majaribio haya ya sehemu ya digital yalikuwa yameendeshwa kwa kiwango kikubwa kwa gharama ndogo ya kutofautiana.
Katika seti ya kwanza ya majaribio yanayohusisha kaya 600,000 kutoka maeneo 10 tofauti, Allcott (2011) aligundua kwamba Ripoti ya Nishati ya Nyumbani ilipunguza matumizi ya umeme. Kwa maneno mengine, matokeo kutoka kwa kiasi kikubwa zaidi, utafiti zaidi wa kijiografia ulikuwa sawa na matokeo kutoka kwa Schultz et al. (2007) . Zaidi ya hayo, katika utafiti uliofuata unahusisha kaya za ziada milioni nane kutoka kwa maeneo 101 tofauti, Allcott (2015) tena aligundua kuwa Ripoti ya Nishati ya Nyumbani mara kwa mara imetumia matumizi ya umeme. Seti hii kubwa zaidi ya majaribio ilifunua muundo mpya unaovutia ambao hauwezi kuonekana katika jaribio lolote moja: ukubwa wa athari ulipungua katika majaribio ya baadaye (sura ya 4.7). Allcott (2015) walidhani kwamba kushuka kwa hii kulitokea kwa sababu, baada ya muda, matibabu yalitumika kwa aina tofauti za washiriki. Zaidi ya hayo, huduma za wateja walio na lengo zaidi za mazingira zilikuwa na uwezekano mkubwa wa kupitisha programu mapema, na wateja wao walikuwa wengi wanaoitikia matibabu. Kama huduma na wateja wasiokuwa na umakini wa mazingira walipitisha mpango huo, ufanisi wake ulionekana kupungua. Kwa hiyo, kama randomization katika majaribio kuhakikisha kwamba matibabu na kundi kudhibiti ni sawa, randomization katika maeneo ya utafiti kuhakikisha kwamba makadirio inaweza kuwa jumla kutoka kundi moja la washiriki kwa idadi kubwa zaidi (fikiria nyuma sura ya 3 kuhusu sampuli). Ikiwa maeneo ya utafiti hayapatikiwa kwa nasibu, basi kuzalisha-hata kutoka kwenye jaribio la ufanisi na uliofanywa-linaweza kuwa tatizo.
Pamoja, majaribio Allcott (2011) katika Allcott (2011) na 101 katika Allcott (2015) yaliyotokana na kaya milioni 8.5 kutoka nchini kote. Wao huonyesha mara kwa mara kwamba Ripoti za Nishati za Nyumbani hupunguza wastani wa matumizi ya umeme, matokeo ambayo inasaidia matokeo ya awali ya Schultz na wenzake kutoka nyumba 300 huko California. Zaidi ya kuiga tu matokeo haya ya awali, majaribio ya kufuatilia yanaonyesha pia kwamba ukubwa wa athari hutofautiana na mahali. Seti hii ya majaribio pia inaonyesha pointi mbili zaidi kuhusu vipimo vya sehemu ya kijijini. Kwanza, watafiti wataweza kushughulikia wasiwasi kuhusu uhalali wa nje wakati gharama za majaribio ya uendeshaji ni ndogo, na hii inaweza kutokea kama matokeo tayari yamehesabiwa na mfumo wa data daima. Kwa hiyo, inaonyesha kuwa watafiti wanapaswa kuwa wakitazama tabia nyingine zinazovutia na muhimu ambazo tayari zimeandikwa, na kisha kubuni majaribio juu ya miundombinu hii ya kupima iliyopo. Pili, seti hii ya majaribio inatukumbusha kuwa majaribio ya uwanja wa digital sio mtandaoni tu; inazidi, natarajia kuwa watakuwa kila mahali na matokeo mengi yanayohesabiwa na sensorer katika mazingira yaliyoundwa.
Aina nne za uhitimisho wa uhalali wa uhalali, uhalali wa ndani, kujenga uhalali, na uthibitisho wa nje - kutoa orodha ya akili ili kusaidia watafiti kuchunguza kama matokeo kutoka kwa jaribio fulani husaidia hitimisho zaidi. Ikilinganishwa na majaribio ya umri wa analog, katika majaribio ya umri wa digital, inapaswa kuwa rahisi kushughulikia uhalali wa nje kwa uwazi, na lazima iwe rahisi kuhakikisha uhalali wa ndani. Kwa upande mwingine, masuala ya kujenga uthibitisho pengine itakuwa changamoto zaidi katika majaribio ya umri wa digital, hasa majaribio ya uwanja wa digital ambayo yanahusisha ushirikiano na makampuni.