ስለሚቆይበት ሙከራ ውጤት ይበልጥ አጠቃላይ መደምደሚያ ለመደገፍ ምን ያህል ያመለክታል.
ምንም ሙከራ ፍጹም ነው, እና ተመራማሪዎች ይቻላል ችግር ለመግለጽ ሰፊ የቃላት አዳብረዋል. ስለሚቆይበት አንድ የተወሰነ ሙከራ ውጤት አንዳንድ ይበልጥ አጠቃላይ ድምዳሜ ለመደገፍ ይህም ወደ ያህል ያመለክታል. ማህበራዊ ሳይንቲስቶች ጠቃሚ አራት ዋና ዋና አይነቶች ውስጥ ተቀባይነት እንዲኖረው ተከፋፍለው ሆኖ አግኝቼዋለሁ: ስታትስቲካዊ መደምደሚያ ፀንቶ, ውስጣዊ ፀንቶ የሚቆይበት ለመገንባት, እና ውጫዊ እነደሚችለው (Shadish, Cook, and Campbell 2001, Ch 2) . እነዚህ ጽንሰ ጠንቅቆ እናንተ critiquing እና ሙከራ ንድፍ እና ትንተና ለማሻሻል የአእምሮ የፍተሻ ዝርዝር ያዘጋጃል, እና ሌሎች ተመራማሪዎች ጋር ግንኙነት እንዲያደርጉ ይረዳቸዋል.
ስታትስቲክስ መደምደሚያ ፀንቶ የሚቆይበት በሙከራ ላይ እስታቲስቲካዊ ትንታኔ በትክክል ይደረግ ነበር እንደሆነ ዙሪያ ያተኮረ. ዐውደ-ጽሑፍ ውስጥ Schultz et al. (2007) እንዲህ ያለ ጥያቄ እነሱ በትክክል ያላቸውን ገጽ-እሴቶች የተሰላ እንደሆነ ላይ ያተኮረ ይሆናል. እስታቲስቲካዊ ትንታኔ በዚህ መጽሐፍ ክልል ውጭ ነው, ነገር ግን እኔ ሙከራዎችን ንድፍ እና ለመተንተን አስፈላጊ ስታስቲካዊ መሠረታዊ ሥርዓቶች የዲጂታል ዘመን ውስጥ አልተለወጠም ማለት እንችላለን. ይሁን እንጂ, ዲጂታል ሙከራዎች ውስጥ የተለያዩ ውሂብ አካባቢ አዲስ ስታትስቲካዊ አጋጣሚዎችን መፍጠር ነው (ለምሳሌ, የሕክምና ውጤቶች የተለያያ ለመገመት የማሽን መማሪያ ዘዴ በመጠቀም (Imai and Ratkovic 2013) ) እና አዲስ ኮምፒውቲሽናል ፈተናዎች (ለምሳሌ, ግዙፍ ሙከራዎች ውስጥ ማገድ (Higgins, Sävje, and Sekhon 2016) ).
ውስጣዊ ፀንቶ የሙከራ አሠራሮች በትክክል የፈጸማቸው አለመሆናቸውን ዙሪያ ያተኮረ. ያለውን ሙከራ ወደ መመለስ Schultz et al. (2007) , ውስጣዊ ፀንቶ ጥያቄዎች, ወደ randomization ዙሪያ ውጤት አያያዝ አሰጣጥ, እና ልኬቶችን ሊያስተካክል ይችላል. ለምሳሌ ያህል, የምርምር ረዳት አስተማማኝ የኤሌክትሪክ ሜትር ማንበብ ነበር አሳስቦት ሊሆን ይችላል. እንዲያውም, Schultz እና ባልደረቦቻቸው ይህን ችግር በተመለከተ እጨነቅ ነበር እና ሁለት ጊዜ ለማንበብ ሜትር ናሙና ነበር; ደግነቱ, ውጤት በመሠረቱ ተመሳሳይ ነበር. በአጠቃላይ, Schultz እና ባልደረቦቻቸው 'ሙከራ ከፍተኛ ውስጣዊ ተቀባይነት እንዲኖረው ያላቸው ይመስላል, ነገር ግን ይህ ሁልጊዜ እንደዚያ አይደለም; ውስብስብ መስክ እና የመስመር ላይ ሙከራዎች ብዙውን ጊዜ ችግሮች በእርግጥ ለትክክለኛዎቹ ሰዎች መብት ሕክምና ነፃ እና ለሁሉም ሰው የሚሆን ውጤቶች በመለኪያ ወደ አሂድ. ይህ ቀላል ነገር ለመቀበል ሁሉ ተሳታፊዎች ውጤቶችን ለመለካት መሰላቸው ሰዎች የተዘጋጀ እንደ ህክምና ነፃ መሆኑን ለማረጋገጥ ቀላል ያደርገዋል ምክንያቱም ደግነቱ, የዲጂታል ዘመን ውስጣዊ ፀንቶ ስለ ስጋት ለመቀነስ ይረዳሃል.
ውሂብ እና የንድፈ constructs መካከል ተዛማጅ ዙሪያ ፀንቶ የሚቆይበት ማዕከላትን መገንባት. ምዕራፍ 2 ላይ እንደተብራራው constructs ዘንድ ስለ ማህበራዊ ሳይንቲስቶች ምክንያት ረቂቅ ጽንሰሃሳቦች ናቸው. መጥፎ አጋጣሚ ሆኖ, እነዚህ ረቂቅ ጽንሰሃሳቦች ዘወትር ግልጽ ትርጓሜዎች እና መለኪያዎች የላቸውም. በመመለስ ላይ Schultz et al. (2007) , የኤሌክትሪክ ኃይል አጠቃቀም ለመቀነስ ይችላሉ ማህበራዊ ደንቦች የእገዳ ዘንድ የይገባኛል ጥያቄ (ለምሳሌ, አንድ ገላጭ) "ማገጃ ማህበራዊ ደንቦች" ለመጠምዘዝ ነበር እና "የኤሌክትሪክ አጠቃቀም" ለመለካት አንድ ሕክምና መንደፍ ተመራማሪዎች ይጠይቃል. አናሎግ ሙከራዎች ውስጥ, ብዙ ተመራማሪዎች የራሳቸውን ሕክምና የተነደፉ የራሳቸውን ውጤቶች ለካ. ይህ አቀራረብ በተቻለ መጠን, የ ሙከራዎች በጥቅሉ constructs እየተጠና ጋር የሚዛመዱ, ያረጋግጣል. ኩባንያዎች ወይም መንግሥታት ጋር ተመራማሪዎች አጋር ሕክምና አሳልፎ እና ሁልጊዜ-ላይ መጠቀም የውሂብ ስርዓት ውጤት ለመለካት የት ዲጂታል ሙከራዎች ውስጥ, ሙከራው እና የንድፈ constructs መካከል ተዛማጅ ያነሰ አጥብቀው ሊሆን ይችላል. እላችኋለሁ: እንዲሁ CONSTRUCT ፀንቶ አናሎግ ሙከራዎች በላይ ዲጂታል ሙከራዎች ውስጥ አንድ ትልቅ ጉዳይ አዝማሚያ ይሆናል ብለው ነው የሚጠብቁት.
በመጨረሻም, ውጫዊ ፀንቶ ይህ ሙከራ ውጤት ሌሎች ሁኔታዎች ያጠቃልሉ እንደሆነ ዙሪያ ያተኮረ. በመመለስ ላይ Schultz et al. (2007) , አንድ ሰው, መጠየቅ ይችላል ፈቃድ ጉልበታቸውን ከእኩዮቻቸው ጋር ዝምድና የአጠቃቀም እና ማገጃ ደንቦች (ለምሳሌ, አንድ ገላጭ) ውስጥ በተለየ መንገድ የተደረገው ከሆነ -reduce የኃይል አጠቃቀም አንድ ምልክት ስለ ይህንኑ ተመሳሳይ ሃሳብ-የሚሰጡ ሰዎች መረጃ የተለየ ቅንብር? በጣም በጥሩ ሁኔታ የተቀየሰ እና ሙከራዎች ጥሩ ማስኬድ ያህል, ውጫዊ ፀንቶ ስለ ስጋቶች መፍትሔ ለመስጠት በጣም ከባዱ ነው. ቀደም ሲል, ውጫዊ ፀንቶ ስለ እነዚህ ክርክሮች በተደጋጋሚ ሂደቶች በተለየ መንገድ ያደረገውን, ወይም የተለየ ቦታ ላይ, ወይም ከተለያዩ ሰዎች ጋር ነበር ከሆነ እንደተከሰተ ኖሮ ምን መገመት በመሞከር በአንድ ክፍል ውስጥ ተቀምጠው ሰዎች ብቻ የቅንብር ነበሩ. ደግነቱ, የዲጂታል ዘመን እነዚህ ውሂብ-ነጻ ግምታዊ ውጪ ለመሄድ እና empirically ውጫዊ ተቀባይነት እንዲኖረው ለመገምገም ተመራማሪዎች ያስችላቸዋል.
ከ ውጤቶች ስለ Schultz et al. (2007) Opower የተባለ ኩባንያ ይበልጥ በሰፊው ሕክምና ለማሰማራት በዩናይትድ ስቴትስ ውስጥ መገልገያ ጋር ሽርክና, በጣም አስደሳች ነበር. ንድፍ ላይ የተመሠረተ Schultz et al. (2007) , Opower ሁለት ዋና ዋና ሞጁሎች, ገላጭ አዶ ጋር ከጎረቤት አንድ ቤተሰብ የኤሌክትሪክ አጠቃቀም ዘመድ የሚያሳይ አንድ እና አንድ የኃይል አጠቃቀም በመጨመሩ ጠቃሚ ምክሮችን በመስጠት እንዳለው መነሻ ኢነርጂ ሪፖርቶች (ምስል 4.6) ብጁ የፈጠረው. በዚያን ጊዜ, ተመራማሪዎች ጋር በመተባበር, Opower የመነሻ ኢነርጂ ሪፖርት ላይ ተጽዕኖ ለመገምገም ሙከራዎች በዘፈቀደ ሮጡ. እነዚህ ሙከራዎች ውስጥ ሕክምና በተለምዶ የድሮው ቀንድ አውጣ በኩል አካላዊ-አብዛኛውን ጊዜ አሳልፎ ነበር እንኳ ሜይል-ውጤት አካላዊ ዓለም ውስጥ የዲጂታል መሣሪያዎች (ለምሳሌ, ኃይል ሜትር) በመጠቀም ለካ ነበር. ከዚህ ይልቅ በእጅ እያንዳንዱ ቤት ለቤት ምርምር ረዳቶቹ ጋር ይህ መረጃ ሲሰበሰብ ይልቅ Opower ሙከራዎች ኃይል ሁሉ ንባብ ለመድረስ ተመራማሪዎች የሚያስችል ኃይል ኩባንያዎች ጋር በሽርክና ይደረግ ነበር. በመሆኑም እነዚህ በከፊል ዲጂታል የመስክ ሙከራዎችን ዝቅተኛ ተለዋዋጭ ወጪ ላይ ከፍተኛ ደረጃ ላይ ያሂዳል ነበር.
በዩናይትድ ስቴትስ ዙሪያ 10 ገልግሎት ኩባንያዎች አገልግሏል 600,000 ቤተሰቦች ጋር የተያያዙ ሙከራዎች አንድ የመጀመሪያ ስብስብ ውስጥ, Allcott (2011) የመነሻ የኃይል ሪፖርት 1.7% በ የኤሌክትሪክ ፍጆታ ዝቅ አልተገኘም. በሌላ አነጋገር, ይበልጥ ሰፊ, ይበልጥ በጂኦግራፊ የተለያዩ ጥናት ውጤቶች ከ ውጤቶች qualitatively ተመሳሳይ ነበር Schultz et al. (2007) . ነገር ግን, ውጤት መጠን አነስተኛ ነበር: በ Schultz et al. (2007) ወደ ገላጭ እና injective ደንቦች ሁኔታ (ገላጭ ጋር አንድ) ውስጥ እማወራ 5% በ ያላቸውን የኤሌክትሪክ አጠቃቀም ቀንሷል. ይህን ልዩነት ለማግኘት ትክክለኛ ምክንያት አይታወቅም, ነገር ግን Allcott (2011) አንድ ዩኒቨርሲቲ ባዘጋጀው አንድ ጥናት አካል እንደ በእጅ ገላጭ በመቀበል አንድ አንድ የጅምላ ምርት ሪፖርት አካል ሆኖ የታተመ ገላጭ ከመቀበል ይልቅ ጠባይ ላይ ትልቅ ተጽዕኖ ሊኖረው ይችላል የሚል ግምት ኃይል ኩባንያ.
በተጨማሪም, ተከታትለው በተደረጉ የምርምር ጥናቶች ውስጥ, Allcott (2015) ተጨማሪ 8 ሚሊዮን አባወራዎች ጋር በተያያዘ ተጨማሪ 101 ሙከራዎች ላይ ዘግቧል. እነዚህ በሚቀጥለው 101 ሙከራዎች ውስጥ የመነሻ የኃይል ሪፖርት ሰዎች የኤሌክትሪክ ፍጆታን ለመቀነስ ምክንያት ቀጠለ, ነገር ግን ውጤት እንኳ ትናንሽ ነበሩ. በዚህ ውድቅ ለማግኘት ትክክለኛ ምክንያት አልታወቀም አይደለም, ነገር ግን Allcott (2015) ሪፖርት ውጤታማነት የከሰሩና ተሳታፊዎች የተለያዩ አይነት ተግባራዊ እየተደረገ ነበር; ምክንያቱም በጊዜ ሂደት በመመናመን ላይ ታየ የሚል ግምት. ተጨማሪ በተለይም, ተጨማሪ የአካባቢ አካባቢዎች ውስጥ የፍጆታ አጋጣሚያቸው ቀደም ፕሮግራም መከተል እና ደንበኞችን ወደ ሕክምና ይበልጥ ምላሽ ነበር. ያነሰ የአካባቢ ደንበኞች ጋር የፍጆታ ፕሮግራሙ የማደጎ ሲሄድ, ውጤታማ እየቀነሰ ታየ. በመሆኑም ሙከራዎች ውስጥ randomization ሕክምና እና ቁጥጥር ቡድን ተመሳሳይ መሆናቸውን ያረጋግጣል ልክ እንደ, የምርምር ጣቢያዎች ውስጥ randomization ግምት (ወደ ናሙና በተመለከተ ምዕራፍ 3 አስባለሁ) ይበልጥ አጠቃላይ ህዝብ ተሳታፊዎች አንድ ቡድን አጠቃላይ የሚችል እንደሆነ ያረጋግጣል. የምርምር ጣቢያዎች በዘፈቀደ ቀመሱ አይደለም ከሆነ, ከዚያ ከምትታየው-እንኳ አንድ ፍጹም ንድፍ ሙከራ-ይችላሉ ችግር ሊሆን አካሂዷል.
አብረው, እነዚህ 111 ሙከራዎች-10 Allcott (2011) እና 101 Allcott (2015) በመላው ዩናይትድ ስቴትስ በላይ ስለ 8.5 ሚሊዮን ቤተሰቦች ይገመታል.. እነዚህ በተደጋጋሚ መነሻ ኢነርጂ ሪፖርቶች አማካይ የኤሌክትሪክ ፍጆታ, ካሊፎርኒያ ውስጥ 300 ቤቶች ውስጥ የመጀመሪያውን Schultz በክትትሉ እና የሥራ ባልደረቦቻችን የሚደግፍ ውጤት ለመቀነስ ያሳያሉ. ብቻ እነዚህ የመጀመሪያ ውጤቶች መተካታቸውን ባሻገር, ተከታታይ ሙከራዎች ደግሞ ውጤት መጠን አካባቢ ይለያያል ያሳያሉ. ሙከራዎች ይህ ስብስብ ደግሞ በከፊል ዲጂታል መስክ ሙከራዎች ስለ ሁለት ተጨማሪ አጠቃላይ ነጥቦች ያሳያል. በመጀመሪያ, ተመራማሪዎች ሙከራዎች የአሂድ ዋጋ ዝቅተኛ ሲሆን ውጫዊ ፀንቶ ስለ አድራሻ አሳሳቢ empirically ይችላል, እና ውጤት አስቀድሞ ውሂብ ሁልጊዜ-ላይ ሥርዓት የሚለካው ነው ከሆነ ይህ ሊከሰት ይችላል. ስለዚህ, ይህ ምርምር አስቀድሞ ተመዝግበው ያሉ ሌሎች ሳቢ እና አስፈላጊ ባህሪያት ለ መልክ-ውጭ ላይ መሆን, እና ከዚያ ይህን ነባር የመለኪያ መሠረተ አናት ላይ ሙከራዎችን ንድፍ እንደሚገባ ይጠቁማል. በሁለተኛ ደረጃ, ሙከራዎች ይህን ስብስብ ዲጂታል መስክ ሙከራዎች ብቻ መስመር ላይ ናቸው ያስታውሰናል; ከጊዜ ወደ እነርሱ አብሮ አካባቢ ዳሳሾች የሚለካው ብዙ ውጤት ጋር በሁሉም ቦታ ይሆናል ብለው ነው የሚጠብቁት.
ፀንቶ-ስታትስቲካዊ መደምደሚያ ፀንቶ, የውስጥ ፀንቶ የሚቆይበት አራት ዓይነት, ፀንቶ መገንባት, ውጫዊ ፀንቶ-ለማቅረብ ተመራማሪዎች አንድ የተወሰነ ሙከራ ከ ውጤቶች ይበልጥ አጠቃላይ መደምደሚያ ለመደገፍ እንደሆነ ለማጣራት ይረዳቸው ዘንድ አንድ የአእምሮ በዝርዝር ያስቀምጣል. የአናሎግ ዕድሜ ሙከራዎች ጋር ሲነጻጸር, የዲጂታል ዘመን ሙከራዎች ውስጥ empirically ውጫዊ ተቀባይነት እንዲኖረው ለመፍታት ቀላል መሆን አለበት እና የውስጥ ትክክለኝነት ለማረጋገጥ ቀላል መሆን አለበት. (ይህ Opower ሙከራዎች ጋር ጉዳይ አልነበረም ቢሆንም) በሌላ በኩል, CONSTRUCT ፀንቶ በሚቆይበት ጉዳዮች ምናልባት ዲጂታል ዕድሜ ሙከራዎች ውስጥ ይበልጥ አስቸጋሪ ይሆናል.