Tabia ya mifumo kubwa ya data si ya asili; inaendeshwa na malengo ya uhandisi ya mifumo.
Ijapokuwa vyanzo vingi vya data havikosefu kwa sababu watu hawajui data zao zimeandikwa (kifungu 2.3.3), watafiti hawapaswi kufikiria tabia katika mifumo hii ya mtandao kuwa "kawaida ya kutokea." Kwa kweli, mifumo ya digital ambayo rekodi ya tabia ni imetengenezwa sana ili kushawishi tabia maalum kama kubonyeza matangazo au kutuma maudhui. Njia ambazo malengo ya wabunifu wa mfumo wanaweza kuanzisha mwelekeo katika data inaitwa algorithmic confounding . Kuchanganyikiwa kwa algorithm haijulikani kwa wanasayansi wa kijamii, lakini ni wasiwasi mkubwa kati ya wanasayansi wa data makini. Na, tofauti na baadhi ya matatizo mengine na athari ya digital, kuchanganyikiwa kwa algorithm kwa kiasi kikubwa hauonekani.
Mfano rahisi sana wa kuchanganyikiwa kwa algorithm ni ukweli kwamba kwenye Facebook kuna idadi kubwa ya watumiaji na marafiki wapatao 20, kama ilivyogunduliwa na Johan Ugander na wenzake (2011) . Wanasayansi kuchambua data hii bila ufahamu wowote wa jinsi Facebook kazi inaweza bila shaka kuzalisha hadithi nyingi kuhusu jinsi 20 ni aina fulani ya namba ya kijamii ya kichawi. Kwa bahati nzuri, Ugander na wenzake walikuwa na uelewa mkubwa wa mchakato uliozalisha data, na walijua kwamba Facebook iliwahimiza watu walio na uhusiano mdogo kwenye Facebook ili wafanye marafiki zaidi mpaka kufikia marafiki 20. Ingawa Uganda na wafanyakazi wenzake hawatasema hili katika karatasi yao, sera hii inawezekana kuundwa na Facebook ili kuhamasisha watumiaji wapya kuwa wahusika zaidi. Bila kujua kuhusu kuwepo kwa sera hii, hata hivyo, ni rahisi kuteka hitimisho sahihi kutoka kwenye data. Kwa maneno mengine, idadi ya kushangaza ya watu wenye marafiki 20 hutuambia zaidi kuhusu Facebook kuliko tabia ya binadamu.
Katika mfano huu uliopita, mchanganyiko wa algorithmic ulizalisha matokeo ya quirky ambayo mtafiti mwenye makini anaweza kuchunguza na kuchunguza zaidi. Hata hivyo, kuna hata trickier version ya confonding algorithm kwamba hutokea wakati wabunifu wa mifumo online wanajua nadharia ya kijamii na kisha kuoka nadharia hizi katika kazi ya mifumo yao. Wanasayansi wa kijamii wanaita utendaji huu: wakati nadharia inabadilika ulimwengu kwa namna ambayo inaleta ulimwengu kuwa sawa na nadharia. Katika kesi ya kuchanganyikiwa ya algorithmic confounding, hali ya kufadhaika ya data ni vigumu sana kuchunguza.
Mfano mmoja wa muundo uliotengenezwa kwa ufanisi ni uthabiti katika mitandao ya kijamii mtandaoni. Katika miaka ya 1970 na 1980, watafiti waligundua mara kwa mara kwamba kama wewe ni marafiki na Alice na Bob, basi Alice na Bob wana uwezekano mkubwa wa kuwa marafiki na wengine kuliko kama walikuwa watu wawili waliochaguliwa kwa nasibu. Mfano huo huo ulionekana kwenye graph ya kijamii kwenye Facebook (Ugander et al. 2011) . Kwa hiyo, mtu anaweza kuhitimisha kuwa mifumo ya urafiki kwenye mwelekeo wa Facebook wa urafiki wa nje ya mtandao, angalau kwa suala la uhamiaji. Hata hivyo, ukubwa wa transitivity katika graph ya kijamii ya kijamii ni sehemu inayotokana na kuchanganyikiwa kwa algorithmic. Hiyo ni, wanasayansi wa data kwenye Facebook walijua utafiti wa kimapenzi na wa kinadharia juu ya transitivity na kisha kuioka katika jinsi Facebook kazi. Facebook ina "Watu Unaweza Kujua" kipengele kinachoonyesha marafiki wapya, na njia moja ambayo Facebook inatafuta nani atakayependekeza kwako ni uhamiaji. Hiyo ni, Facebook inawezekana kupendekeza kwamba uwe marafiki na marafiki wa rafiki zako. Kipengele hiki kwa hiyo kina athari za kuongezeka kwa mpito katika graph ya kijamii ya kijamii; kwa maneno mengine, nadharia ya transitivity huleta dunia kulingana na utabiri wa nadharia (Zignani et al. 2014; Healy 2015) . Kwa hiyo, wakati vyanzo vingi vya data vinaonekana kuzalisha utabiri wa nadharia ya kijamii, ni lazima tuwe na uhakika kwamba nadharia yenyewe haikuoka ndani ya jinsi mfumo ulivyofanya kazi.
Badala ya kufikiria vyanzo vyenye vya data kama kuzingatia watu katika hali ya asili, picha zaidi inayofaa ni kuangalia watu katika casino. Kasino ni mazingira yenye uhandisi iliyoundwa na kushawishi tabia fulani, na mtafiti hawezi kutarajia tabia katika casino kutoa dirisha lisilofanywa katika tabia ya kibinadamu. Bila shaka, unaweza kujifunza kitu kuhusu tabia ya kibinadamu kwa kujifunza watu katika kasinon, lakini ikiwa umekataa ukweli kwamba data iliundwa katika casino, unaweza kufuta hitimisho mbaya.
Kwa bahati mbaya, kushughulika na ugomvi wa algorithm ni vigumu sana kwa sababu sifa nyingi za mifumo ya mtandao ni wamiliki, haijashughulikiwa vizuri, na hubadilisha kila mara. Kwa mfano, kama nitakavyoelezea baadaye katika sura hii, kuchanganyikiwa kwa algorithm ilikuwa moja ya maelezo ya uwezekano wa kushuka kwa taratibu za Mwelekeo wa Fluji za Google (kifungu 2.4.2), lakini dai hili lilikuwa vigumu kutathmini kwa sababu utendaji wa ndani wa algorithm ya utafutaji wa Google ni wamiliki. Hali ya nguvu ya kuchanganyikiwa kwa algorithm ni aina moja ya mfumo wa drift. Kuchanganyikiwa kwa algorithm inamaanisha kuwa tunapaswa kuwa waangalifu kuhusu madai yoyote kuhusu tabia ya binadamu ambayo hutoka kwenye mfumo mmoja wa digital, bila kujali ni kubwa.