2.3.2.5 алгоритамски збунет

Однесување во најдат податоци не е природно, тоа е управувано од страна на инженеринг цели на системите.

Иако многумина се најде извори на податоци се нереактивни затоа што луѓето не се свесни дека нивната податоци се евидентираат (Оддел 2.3.1.3), научниците не треба да се разгледа однесувањето во овие онлајн системи за да се биде "природно" или "чиста". Во реалноста, дигитални системи кои рекорд однесување се високо Инженерните да предизвикаат одредени однесувања како што е кликање на реклами или објавување на содржини. Начините на кои цели на системот дизајнери можат да се воведе модели на податоци се нарекува алгоритамски изненадувачките. Алгоритамски изненадувачките е релативно непознат за научници од општествените науки, но тоа е голема загриженост меѓу внимателни податоци научниците. И, за разлика од некои од другите проблеми со дигиталните траги, алгоритамски изненадувачките во голема мера е невидлив.

А релативно едноставен пример на алгоритамски изненадувачки е фактот што на Фејсбук има се anomalously голем број на корисници со околу 20 пријатели (Ugander et al. 2011) . Научниците анализа со овие податоци без разбирање за тоа како Фејсбук може да работи без сомнение генерира многу приказни за тоа како 20 е некој вид на магичен социјалните број. Сепак, Ugander и неговите колеги имаа значителен разбирање на процесот кои генерирана за податоци, и тие знаеја дека Фејсбук ги охрабрува луѓето со неколку конекции на Facebook за да се направи повеќе пријатели додека не стигна до 20 пријатели. Иако Ugander и неговите колеги не го кажувам во весникот, оваа политика се претпоставува дека е создадена од страна Фејсбук со цел да ги поттикне новите корисници да станат поактивни. Без да знае за постоењето на оваа политика, сепак, тоа е лесно да се подготви погрешен заклучок од податоци. Со други зборови, изненадувачки голем број на луѓе со околу 20 пријатели ни кажува повеќе за Facebook од однесувањето на човекот.

Повеќе штетни од оваа претходниот пример каде алгоритамски изненадувачките произведено чудат како резултат на тоа внимателно истражувачи може да се испита понатаму, постои дури и сложени да ја формира верзија на алгоритамски изненадувачките што се случува кога дизајнерите на онлајн системи се свесни за социјални теории и потоа се пече овие теории во работната на нивните системи. Социјални научници се јавите на оваа перформативност: кога теории го промени светот на таков начин што тие се донесе во светот повеќе во согласност со теорија. Во случаите од перформативните алгоритамски изненадувачките, збунет од природата на податоците е веројатно невидлив.

Еден пример на еден модел создадена од страна перформативност е transitivity во друштвените мрежи на интернет. Во 1970-тите и 1980-тите години, научниците постојано се покажа дека ако сте пријатели со Алис и сте пријатели со Боб, тогаш Боб и Алис се со поголема веројатност да бидат пријатели едни со други од две случајно избрани луѓе. И, истиот овој модел е пронајден во социјалната графика на Фејсбук (Ugander et al. 2011) . Така, може да се заклучи дека моделите на пријателство на Фејсбук се реплицира модели на офлајн пријателства, барем во однос на transitivity. Сепак, големината на transitivity во социјалната графика Фејсбук делумно е управувано од страна на алгоритамски изненадувачките. Тоа е, научниците податоци на Фејсбук знаеле за емпириски и теоретски истражувања за transitivity, а потоа се пече во тоа како работи Facebook. Фејсбук има "Луѓето ќе може да знае" функцијата, што нови пријатели, и еден начин на кој на Фејсбук одлучува кој да му предложите на вас е transitivity. Тоа е, Фејсбук е поверојатно да укажуваат на тоа дека ќе станат пријатели со пријателите на вашите пријатели. со тоа оваа опција има ефект на зголемување на transitivity во социјалната графика Фејсбук; со други зборови, теоријата на transitivity носи во светот во согласност со предвидувањата на теоријата (Healy 2015) . Така, кога големите извори на податоци се појавува да се репродуцира предвидувања на општествена теорија, мора да бидеме сигурни дека самата теорија не беше печени во тоа како функционира системот.

Наместо да се размислува за големи извори на податоци што е следење на луѓе во природна средина, повеќе АП метафора е истовремено луѓе во казино. Казината се високо Инженерните средини за да предизвика одредени однесувања, и истражувачите не би се очекува дека однесувањето во казино ќе обезбеди непречен прозорец во човековото однесување. Се разбира, ние би можеле да научат нешто во врска со однесувањето на проучување на луѓето со луѓе во казина, всушност казино може да биде идеална опција за проучување на односите помеѓу конзумирањето на алкохол и ризик параметри, но ако се игнорира дека податоците се создава во казино ние би можеле подготви некои лоши заклучоци.

За жал, се занимаваат со алгоритамски изненадувачките е особено тешко, бидејќи многу карактеристики на онлајн системи се неслободни, слабо документирани, и постојано се менува. На пример, како што јас ќе објаснам подоцна во ова поглавје, алгоритамски изненадувачките беше едно можно објаснување за постепеното распаѓање на Google грип Трендови (Дел 2.4.2), но ова тврдење е тешко да се процени, бидејќи на внатрешниот работата на пребарување на Google алгоритам се заштитени. Динамичната природа на алгоритамски изненадувачките е една форма на систем лебдат. Алгоритамски изненадувачките значи дека ние треба да бидат претпазливи во врска со какво било побарување за човековото однесување, која доаѓа од еден дигитален систем, без разлика колку големи.