Büyük veri sistemlerinde davranışlar doğal değildir; Sistemlerin mühendislik hedefleri tarafından yönlendirilir.
Birçok büyük veri kaynağı reaktif değildir, çünkü insanlar verilerin kaydedilmesinin farkında değildir (bölüm 2.3.3), araştırmacılar bu çevrimiçi sistemlerde davranışları “doğal olarak meydana gelir” olarak düşünmemelidir. Gerçekte, davranışı kaydeden dijital sistemler; Reklamları tıklamak veya içerik yayınlamak gibi belirli davranışları tetiklemek için yüksek derecede tasarlanmıştır. Sistem tasarımcılarının amaçlarının kalıplara veri ekleyebilme yolları, algoritmik karıştırıcı olarak adlandırılır. Algoritmik karışıklık, sosyal bilimciler için nispeten bilinmemektedir, ancak dikkatli veri bilimcileri arasında büyük bir endişe kaynağıdır. Ve, dijital izlerle ilgili diğer problemlerden farklı olarak, algoritmik karıştırıcılık büyük ölçüde görünmezdir.
Göreceli olarak algoritmik karıştırmanın bir örneği, Facebook'ta, Johan Ugander ve meslektaşları (2011) tarafından keşfedildiği gibi, yaklaşık 20 arkadaşa sahip anormal derecede yüksek sayıda kullanıcı olduğu gerçeğidir. Bu verileri, Facebook'un nasıl çalıştığını anlamadan analiz eden bilim adamları, kuşkusuz, bir çeşit büyülü toplumsal sayı olduğu hakkında pek çok hikaye üretebilirlerdi. Neyse ki, Ugander ve meslektaşları, verileri yaratan süreç hakkında önemli bir anlayışa sahipti ve Facebook'un, Facebook'taki birkaç bağlantıya sahip olan kişileri 20 arkadaşa ulaşana kadar daha fazla arkadaş edinmeleri için teşvik ettiğini biliyorlardı. Ugander ve meslektaşları bu makalede bunu söylemese de, yeni kullanıcıların daha aktif olmalarını teşvik etmek için bu politika muhtemelen Facebook tarafından oluşturuldu. Bununla birlikte, bu politikanın varlığını bilmeden, verilerden yanlış bir sonuca varmak kolaydır. Diğer bir deyişle, yaklaşık 20 arkadaşla şaşırtıcı derecede yüksek sayıda insan, Facebook hakkında insan davranışından daha fazlasını anlatıyor.
Bu önceki örnekte, algoritmik karışıklık, dikkatli bir araştırmacının daha fazla tespit edip araştırabileceği ilginç bir sonuç ortaya koymuştur. Bununla birlikte, çevrimiçi sistem tasarımcıları sosyal teorilerin farkında olduğunda ve bu teorileri kendi sistemlerinin işleyişine hazırlarken ortaya çıkan algoritmik karışıklıkların daha da zorlu bir versiyonu vardır. Sosyal bilimciler bu performalite diyorlar: Bir teori dünyayı, dünyayı teori ile daha uyumlu hale getirecek şekilde değiştirdiğinde. Performanssal algoritmik karıştırıcı durumunda, verilerin karıştırılmış doğasının saptanması çok zordur.
Gerçekleştirmenin yarattığı bir örüntü örneği, çevrimiçi sosyal ağlarda geçişliliktir. 1970'lerde ve 1980'lerde, araştırmacılar sürekli olarak, hem Alice hem de Bob ile arkadaşysanız, Alice ve Bob'un, rastgele seçilmiş iki kişi olsaydı, birbirleriyle arkadaş olma olasılıklarının daha yüksek olduğunu buldular. Bu aynı model, Facebook'taki sosyal grafikte bulundu (Ugander et al. 2011) . Bu nedenle, Facebook'taki arkadaşlık kalıplarının, en azından geçişlilik açısından, çevrimdışı arkadaşlık kalıplarını kopyaladığı sonucuna varılabilir. Bununla birlikte, Facebook sosyal grafiğindeki geçişlilik büyüklüğü kısmen algoritmik karıştırıcı tarafından yürütülür. Yani, Facebook'taki veribilimcileri, transitlikle ilgili ampirik ve teorik araştırmaları biliyorlardı ve daha sonra Facebook'un nasıl çalıştığıyla ilgili olarak bunu yapıyorlardı. Facebook'un yeni arkadaşlar öneren bir “İnsanları Tanıyor Olabilir” özelliği vardır ve Facebook'un size tavsiyede bulunacağına karar vermenin bir yolu da geçişliliktir. Yani, Facebook'un arkadaşlarınızın arkadaşlarıyla arkadaş olmanızı önerme olasılığı daha yüksektir. Bu özellik, böylece Facebook sosyal grafikte artan bir geçişlilik etkisi vardır; Başka bir deyişle, geçişlilik teorisi, dünyayı, teorinin tahminleriyle uyumlu hale getirmektedir (Zignani et al. 2014; Healy 2015) . Dolayısıyla, büyük veri kaynakları, sosyal teorinin öngörülerini yeniden üretmeye başladığı zaman, teorinin, sistemin nasıl işlediğine bakılmamış olduğundan emin olmalıyız.
İnsanları doğal bir ortamda gözlemlemek gibi büyük veri kaynaklarını düşünmek yerine, bir kumarhanedeki insanları daha uygun bir metafor gözlemliyor. Casinolar, belirli davranışları tetiklemek için tasarlanmış yüksek derecede tasarlanmış ortamlardır ve bir araştırmacı, casinodaki davranışların, insan davranışlarına sınırsız bir pencere sunmasını beklemez. Tabi ki, insan davranışları hakkında, kumarhanelerde insanlarla çalışarak bir şeyler öğrenebilirsiniz, ancak verilerin bir kumarhanede yaratıldığını görmezden geldiyseniz, bazı kötü sonuçlar çıkartabilirsiniz.
Ne yazık ki, algoritmik karıştırmayla uğraşmak özellikle zordur çünkü çevrimiçi sistemlerin pek çok özelliği tescilli, yetersiz belgelenmiş ve sürekli olarak değişmektedir. Örneğin, bu bölümde daha sonra açıklayacağım gibi, algoritmik karışıklık, Google Grip Eğilimlerinin aşamalı olarak parçalanması (bölüm 2.4.2) için olası bir açıklamaydı, ancak bu iddiayı değerlendirmek zordu çünkü Google'ın arama algoritmasının iç işleyişi tescilli. Algoritmik karıştırmanın dinamik doğası, bir sistem sapması biçimidir. Algoritmik karışıklık, ne kadar büyük olursa olsun, tek bir dijital sistemden gelen insan davranışlarıyla ilgili herhangi bir iddia konusunda ihtiyatlı olmamız gerektiği anlamına gelir.