Iwa ni awọn ọna kika data nla kii ṣe adayeba; o wa ni idari nipasẹ awọn afojusun ti imọ-ẹrọ ti awọn ọna šiše.
Biotilẹjẹpe ọpọlọpọ awọn orisun data nla ko ni agbara nitori awọn eniyan ko mọ pe wọn ti ṣawari awọn data wọn (apakan 2.3.3), awọn oniwadi yẹ ki o ṣe akiyesi iwa ni awọn ọna ori ayelujara yii lati jẹ "sisẹlẹ ni otitọ." Ni otitọ, awọn ọna ṣiṣe oni-nọmba ti o gba iwa jẹ ti a ṣe atunṣe pupọ lati mu awọn iwa kan pato bii tite lori awọn ipolongo tabi firanṣẹ akoonu. Awọn ọna ti awọn afojusun ti awọn apẹẹrẹ awọn apẹẹrẹ le ṣe agbekale awọn ilana sinu data ni a npe ni algorithmic confounding . Algorithmic confounding jẹ mọ aimọ si awọn onimo ijinle sayensi, ṣugbọn o jẹ pataki ibakcdun laarin awọn ọlọgbọn data data. Ati pe, ko dabi awọn iṣoro miiran pẹlu awọn iṣeduro oni-nọmba, iṣeduro algorithmic jẹ eyiti a ko ri.
Àpẹrẹ ti o rọrun ti algorithmic confounding ni otitọ pe lori Facebook nibẹ ni nọmba ti ko ni agbara ti awọn olumulo pẹlu 20 ọrẹ, bi a ti ri nipasẹ Johan Ugander ati awọn alabaṣiṣẹpọ (2011) . Awọn onimo ijinle sayensi ṣe ayẹwo data yi laisi oye ti bi Facebook ṣe le ṣiṣẹ ọpọlọpọ awọn itan nipa bi 20 jẹ diẹ ninu awọn nọmba onibara ti idan. O ṣeun, Ugander ati awọn alabaṣiṣẹpọ rẹ ni imọran ti ọna ti o ṣẹda data, wọn si mọ pe Facebook rọ awọn eniyan pẹlu awọn asopọ diẹ lori Facebook lati ṣe awọn ọrẹ diẹ titi ti wọn fi de awọn ọrẹ 20. Biotilẹjẹpe Ugander ati awọn ẹlẹgbẹ ko sọ eyi ni iwe wọn, o ṣeeṣe pe eto yii ṣe nipasẹ Facebook lati ṣe iwuri fun awọn olumulo titun lati di diẹ sii. Laisi mọ nipa iṣedede ti eto imulo yii, sibẹsibẹ, o rọrun lati fa ipari ti ko tọ lati inu data naa. Ni gbolohun miran, nọmba ti o pọju ti awọn eniyan ti o ni awọn ọrẹ 20 to sọ fun wa siwaju sii nipa Facebook ju nipa iwa eniyan.
Ni apẹẹrẹ yi tẹlẹ, iṣeduro algorithmic ṣe agbejade abajade ti o jẹ ki awadi oluwadi le ṣawari ati ṣe iwadi siwaju sii. Sibẹsibẹ, nibẹ jẹ ẹya paapaa trickier ti algorithmic confounding ti o waye nigbati awọn apẹẹrẹ ti awọn ọna ayelujara ti wa ni mọ ti awọn awujọ awujo ati ki o si beki wọnyi imo sinu awọn iṣẹ ti awọn ọna šiše wọn. Awọn onimo ijinlẹ sayensi pe iṣẹ-ṣiṣe yi: nigbati igbimọ kan yi aye pada ni ọna ti o le mu aye wa si ila pẹlu yii. Ninu ọran ti algorithmic ti n ṣakoro, iṣan ti ẹda ti data jẹ gidigidi soro lati wa.
Apeere kan ti apẹrẹ ti a ṣẹda nipasẹ ṣiṣe iṣe jẹ ọna gbigbe ni awọn aaye ayelujara awujọ ayelujara. Ni awọn ọdun 1970 ati ọdun 1980, awọn oluwadi leralera ri pe bi o ba jẹ ọrẹ pẹlu Alice ati Bob, lẹhinna Alice ati Bob ṣee ṣe awọn ọrẹ pẹlu ara wọn ju ti wọn ba jẹ eniyan meji ti a ko yan lailewu. Ilana kanna ni a ri ni awọn ajọṣepọ lori Facebook (Ugander et al. 2011) . Bayi, ẹnikan le pinnu pe awọn abuda ti ore lori Facebook ṣe apẹrẹ awọn apẹrẹ ti awọn ọrẹ ọrẹ alailẹgbẹ, ni o kere julọ ni awọn ọna gbigbe. Sibẹsibẹ, igbelaruge ti transitivity ninu awọn ajọṣepọ ti Facebook jẹ eyiti a dari nipasẹ algorithmic confounding. Iyẹn ni, awọn onimo ijinlẹ data ni Facebook mọ nipa iṣeduro ti iṣalaye ati imọ-ọrọ nipa iyipada ati lẹhinna yan o si bi Facebook ṣe n ṣiṣẹ. Facebook ni "ẹya eniyan ti o le mọ" ẹya ti o ni imọran awọn ọrẹ titun, ati ọna kan ti Facebook pinnu ẹni ti o daba fun ọ ni transitivity. Iyẹn ni pe, Facebook jẹ o ṣeeṣe lati daba pe ki o di ọrẹ pẹlu awọn ọrẹ ọrẹ rẹ. Ẹya ara ẹrọ bayi ni ipa ti nyara transitivity ninu awọn aaye ayelujara ti Facebook; Ni awọn ọrọ miiran, ilana ti transitivity mu ki aye wa laini pẹlu asọtẹlẹ yii (Zignani et al. 2014; Healy 2015) . Bayi, nigbati awọn orisun data nla ba han lati tun awọn asọtẹlẹ ti igbimọ awujọ ṣe, a gbọdọ rii daju wipe ko ṣe idiyele yii fun bi ọna eto naa ti n ṣiṣẹ.
Dipo ki o ronu awọn orisun data nla gẹgẹ bi awọn akiyesi awọn eniyan ni ipo iseda, iṣesi ti o dara julọ jẹ fifiyesi awọn eniyan ni itatẹtẹ kan. Casinos jẹ awọn ayika ti a ṣe atunṣe ti a ṣe atunṣe lati ṣe idaniloju awọn iwa kan, ati pe oluwadi kan kì yio ni ireti iwa ni itatẹtẹ lati pese window ti ko ni oju si iwa eniyan. O dajudaju, o le kọ ẹkọ nipa iwa eniyan nipa kikọ awọn eniyan ni awọn iwin, ṣugbọn ti o ba ko bikita pe a ṣẹda data naa sinu itatẹtẹ, o le fa awọn ipinnu buburu kan.
Laanu, iṣeduro algorithmic confounding jẹ gidigidi nira nitori ọpọlọpọ awọn ẹya ara ẹrọ ti awọn ọna ori ayelujara jẹ oniṣowo, ti ko tọ si akọsilẹ, ati iyipada nigbagbogbo. Fun apẹẹrẹ, bi emi yoo ṣe alaye nigbamii ni ori yii, iṣeduro algorithmic jẹ alaye ti o ṣeeṣe fun isinku ti Google Trend Trend (apakan 2.4.2), ṣugbọn eyi ni o ṣòro lati ṣayẹwo nitori awọn iṣẹ inu ti Google search algorithm ni o wa. ọwọn. Iyatọ ti algorithmic confounding jẹ ẹya kan ti ọna eto. Algorithmic confounding tumo si pe o yẹ ki a wa ni abojuto nipa eyikeyi ibeere nipa iwa eniyan ti o wa lati inu ẹrọ oni-nọmba kan, bii bi o ṣe tobi.