Willekeurich kontrolearren eksperiminten hawwe fjouwer wichtichste yngrediïnten: werving fan dielnimmers, randomization fan behanneling, levering fan behanneling, en mjitting fan útkomsten.
Willekeurich kontrolearren eksperiminten kinne nimme in protte foarmen en kinne brûkt wurde om te studearjen in protte soarten fan gedrach. Mar, at harren kearn, willekeurich kontrolearren eksperiminten hawwe fjouwer wichtichste yngrediïnten: werving fan dielnimmers, randomization fan behanneling, levering fan behanneling, en mjitting fan útkomsten. De digitale leeftyd net feroarje de fûnemintele karakter fan eksperimintearjen, mar it docht meitsje se makliker logistically. Bygelyks, yn it ferline is miskien hawwe dreech te mjitten it gedrach fan miljoenen fan minsken, mar dat is no soenen bart yn in soad digitale systemen. Ûndersikers dy't kin derachter te harnas dizze nije mooglikheden sille wêze kinne rinne eksperiminten dy't ûnmooglik earder.
Om dit alles in bytsje mear konkrete-sawol wat hat bleau itselde en wat is feroare-lit beskôgje Michael Restivo en Arnout van de Rijt s (2012) . De ûndersikers woenen te ferstean it effekt fan ynformele peer Rewards op redaksjonele bydragen oan Wikipedia. Yn it bysûnder, se studearre de effekten fan barnstars, in priis dy't alle Wikipedian kin jaan oan in oare Wikipedian te erkenne hurd wurkjen en troch warberens. Restivo en van de Rijt joech barnstars nei 100 fertsjinje Wikipedianen. Doe, Restivo en van de Rijt tracked de ûntfangers 'lettere bydragen oan Wikipedia oer de kommende 90 dagen. In grut part oan harren fernuvering, de minsken oan dy't se takend barnstars bebeakere om minder bewurkings nei ûntfangst ien. Yn oare wurden, de barnstars like te discouraging ynstee stimulearjen bydrage.
Gelokkich, Restivo en van de Rijt waarden der rint in "perturb en observearjen" eksperimint; se waarden rint in willekeurich regele eksperimint. Sa, neist te kiezen 100 top meiwurkers te ûntfangen in barnstar, se ek útsocht 100 top meiwurkers oan wa't se net jaan in barnstar. Dy hûndert tsjinne as in kontrôle groep, en dy't krige in barnstar en dy't net wie bepaald willekeurich. Doe't Restivo en van de Rijt seach by de kontrôle groep se fûn dat it hie in steile drop yn bydragen te. Ta beslút, doe't de ûndersikers ferlike minsken yn de behanneling groep (ie, krige barnstars) en minsken yn 'e kontrôle groep, se fûn dat de barnstar soarge redakteuren te dragen oer 60% mear. Mar, dizze stiging yn bydrage waard nimmen plak as ûnderdiel fan in algehiele ferfal yn beide groepen.
As dizze stúdzje yllustrearret, de kontrôle groep yn eksperiminten is kritysk op in manier dat is wat paradoksale. Om krekt mjitten it effekt fan barnstars, Restivo en van der Rijt nedich te observearjen minsken dy't net ûntfange barnstars. In protte kear ûndersikers dy't net fertroud mei eksperiminten fail te wurdearje de ongelooflijke wearde fan 'e kontrôle groep. As Restivo en van de Rijt net hawwe in kontrôle groep, se soenen hawwe lutsen krekt de ferkearde konklúzje. Control groepen binne sa wichtich dat de direkteur fan in grutte casino bedriuw hat sein dat der mar trije manieren dy't meiwurkers kinne wurde ôfsketten fan syn bedriuw: stellerij, seksuele oerlêst, en rint in eksperimint sûnder in kontrôle groep (Schrage 2011) .
Restivo en Van de Rijt syn stúdzje yllustrearret de fjouwer wichtichste yngrediïnten fan in eksperimint: werving, randomization, yntervinsje, en útkomsten. Tegearre, dizze fjouwer yngrediïnten tastean wittenskippers te bewegen boppe correlations en mjitten, de motivearring effekt behannelingen. Spesifyk, randomization betsjut dat as jo ferlykje resultaten foar de behanneling en kontrôle groepen jo krije in rûzing fan de motivearring effekt fan dat yntervinsje foar dat set fan dielnimmers. Yn oare wurden, mei in willekeurich kontrolearren eksperimint jo kinne der wis fan wêze, dat gjin ferskillen yn útkomsten wurde feroarsake troch de yntervinsje en net in fari- abele, in bewearing, dat ik meitsje krekt yn de Technyske Oanhingsel mei help fan de potinsjele útkomsten ramt.
Neist dat in moaie yllustraasje fan de meganika fan eksperiminten, Restivo en Van de Rijt syn stúdzje ek bliken dat de logistyk fan digitale eksperiminten kin wêze folslein oars út analoge eksperiminten. Yn Restivo en Van de Rijt syn eksperimint, wie it maklik te jaan de barnstar oan elkenien yn 'e wrâld en dat wie maklik te track de útkomst-tal bewurkings-oer in langere perioade fan tiid (want bewurkje skiednis wurdt automatysk fêstlein troch Wikipedia). Dy mooglikheid om te leverjen behannelings en mjitten resultaten by gjin kosten is kwalitatyf oars as eksperiminten yn it ferline. Hoewol't dit eksperimint belutsen 200 minsken, it koe hawwe rinne mei 2.000 of 20.000 minsken. It wichtichste ding tefoaren kommen fan de ûndersikers fan opskaling harren eksperimint troch in faktor fan 100 wie net kostje, it wie etyk. Dat is, Restivo en van de Rijt net wolle jaan barnstars oan undeserving redakteuren en se net wolle harren eksperimint om fersteure de Wikipedy mienskip (Restivo and Rijt 2012; Restivo and Rijt 2014) . Sa, hoewol't it eksperimint fan Restivo en Van de Rijt is relatyf ienfâldige, dat dúdlik sjen dat guon dingen oer eksperiminten hawwe bleau itselde en guon hawwe feroare. Yn it bysûnder, de basis logika fan eksperimintearjen is it itselde, mar de logistike hawwe feroare. Folgjende, om te mear dúdlik isolearjen de kânsen makke troch dizze feroaring, ik ferlykje de eksperiminten dy't ûndersikers kinne dwaan no oan de soarten fan eksperiminten dy't binne dien yn it ferline.