ქცევა ი მონაცემები არ არის ბუნებრივი, მას ამოძრავებს საინჟინრო მიზნების სისტემები.
მიუხედავად იმისა, რომ ი მონაცემები წყაროების არასამთავრობო რეაქტიული იმიტომ, რომ ხალხს არ იცის მათი მონაცემების ჩაწერა (სექცია 2.3.1.3), მკვლევარები არ უნდა განიხილოს ქცევის ამ ონლაინ სისტემები უნდა იყოს "ბუნებრივად ხდება" ან "სუფთა". სინამდვილეში, ციფრული სისტემების, რომ ჩანაწერი ქცევის ტექნოლოგიით გამოიწვიოს კონკრეტული ქცევას, როგორიცაა დაწკაპვით განცხადებები ან განთავსებას მობილურისთვის. გზები, რომ მიზნები სისტემა დიზაინერების შეუძლია გააცნოს თარგების მონაცემები ეწოდება ალგორითმული confounding. ალგორითმული confounding შედარებით უცნობი სოციალური მეცნიერები, მაგრამ ეს არის შეშფოთების მთავარი ფრთხილად მონაცემები მეცნიერები. და, განსხვავებით ზოგიერთი სხვა პრობლემები ციფრული კვალი, ალგორითმული confounding დიდწილად უხილავი.
შედარებით მარტივი მაგალითია ალგორითმული confounding არის ის ფაქტი, რომ Facebook არ არის ანომალურად მაღალი რაოდენობის წევრებს დაახლოებით 20 მეგობარი (Ugander et al. 2011) . მეცნიერთა ანალიზის ამ მონაცემების გარეშე გაგება, თუ როგორ მუშაობს Facebook შეიძლება უდავოდ გენერირება ბევრი ისტორიები, თუ როგორ 20 ერთგვარი ჯადოსნური სოციალური ნომერი. თუმცა, Ugander და მისი კოლეგები ჰქონდა მნიშვნელოვანი გაგება პროცესში, რომელიც გენერირდება მონაცემები და მათ იცოდნენ, რომ Facebook ხალხს მოუწოდებდა რამდენიმე კავშირები Facebook რათა უფრო მეტი მეგობარი, სანამ არ მიაღწია 20 მეგობარი. მიუხედავად იმისა, რომ Ugander და კოლეგებს არ ამბობენ, რომ ეს ქაღალდი, ეს პოლიტიკა, სავარაუდოდ, ქმნის Facebook რათა ხელი შეუწყოს ახალ წევრებს უფრო აქტიური გახდეს. გარეშე იცის არსებობის შესახებ ამ პოლიტიკის, თუმცა, ეს არ არის ადვილი მიაპყროს არასწორი დასკვნა მონაცემები. სხვა სიტყვებით, გასაკვირი მაღალი რაოდენობის ხალხი დაახლოებით 20 მეგობარი გვეუბნება, უფრო მეტი Facebook, ვიდრე ადამიანის ქცევა.
უფრო დამღუპველი, ვიდრე ეს წინა მაგალითად, სადაც ალგორითმული confounding წარმოებული quirky შედეგი, რომ ფრთხილად მკვლევარები შეიძლება გამოიძიოს შემდგომი, არსებობს კიდევ უფრო რთული აღმოჩნდეს მობილური ალგორითმული confounding რომ ხდება, როდესაც დიზაინერების ონლაინ სისტემები იცის სოციალური თეორიები და შემდეგ bake ეს თეორიები სამუშაო მათი სისტემები. სოციალური მეცნიერები უწოდებენ ამ performativity: როდესაც თეორიები სამყაროს შეცვლა ისე, რომ ისინი, რათა მსოფლიოს უფრო შეესაბამება თეორია. იმ შემთხვევაში, პერფორმატიული ალგორითმული confounding, რომ confounded ბუნების მონაცემები, სავარაუდოდ, უხილავი.
ერთი მაგალითი ნიმუში მიერ შექმნილი performativity არის გარდამავლობის ონლაინ სოციალური ქსელები. 1970 და 1980-იან წლებში, მკვლევარები არაერთხელ აჩვენა, რომ იმ შემთხვევაში, თუ თქვენ მეგობრებს Alice და თქვენ მეგობრებს Bob, შემდეგ ბობ და Alice უფრო სავარაუდოა, რომ იყოს მეგობარი ერთმანეთს ორი შემთხვევით შერჩეული ადამიანი. და ეს ძალიან იგივე ნიმუში ნაპოვნი იქნა სოციალური გრაფაში on Facebook (Ugander et al. 2011) . აქედან გამომდინარე, შეიძლება დავასკვნათ, რომ ნიმუშების მეგობრობისათვის on Facebook იმეორებს ნიმუშების გასულია მეგობრობას, მინიმუმ თვალსაზრისით გარდამავლობის. თუმცა, მასშტაბები გარდამავლობის წელს Facebook სოციალური გრაფაში ნაწილობრივ ამოძრავებს ალგორითმული confounding. რომ არის, მონაცემები მეცნიერები Facebook- ზე იცოდა ემპირიული და თეორიული კვლევის გარდამავლობა და შემდეგ გამომცხვარი, თუ როგორ მუშაობს Facebook. Facebook აქვს "თქვენთვის ნაცნობი ადამიანების" ფუნქცია, რომელიც ვარაუდობს, ახალი მეგობრები, და ერთი გზა, რომ Facebook გადაწყვეტს, უნდა ვივარაუდოთ, რომ თქვენ გარდამავლობა. რომ არის, Facebook უფრო სავარაუდოა, რომ ვივარაუდოთ, რომ თქვენ გახდეს მეგობარი მეგობრებთან ერთად თქვენს მეგობრებს. ეს ფუნქცია ამდენად მას აქვს ეფექტი იზრდება გარდამავლობის წელს Facebook სოციალური გრაფაში; სხვა სიტყვებით, თეორია გარდამავლობის მოაქვს მსოფლიოში შესაბამისობაში პროგნოზები თეორია (Healy 2015) . ასე რომ, როდესაც დიდი მონაცემთა წყაროებს, როგორც ჩანს, აღვადგინოთ პროგნოზები სოციალური თეორია, დარწმუნებული უნდა ვიყოთ, რომ თეორია თავისთავად არ გამომცხვარი, თუ როგორ სისტემა მუშაობდა.
ვიდრე ფიქრი დიდი მონაცემები წყაროები, როგორც აკვირდებიან ადამიანი ბუნებრივ გარემოში, უფრო apt მეტაფორა აკვირდება ადამიანი კაზინო. სამორინეები ტექნოლოგიით გარემოში შემუშავებული რომ გამოიწვიოს გარკვეული ქცევის და მკვლევარები არასოდეს ველოდი, რომ ქცევის კაზინო გაუწევს სამორინეში ფანჯარა ადამიანის ქცევა. რა თქმა უნდა, ჩვენ შეგვიძლია ვისწავლოთ, ადამიანის ქცევის შესწავლა ადამიანი კაზინო ფაქტობრივად კაზინო შეიძლება იყოს იდეალური გარემოში სწავლობს შორის ურთიერთობა ალკოჰოლის მოხმარება და რისკის პარამეტრების, მაგრამ თუ ჩვენ იგნორირებას, რომ მონაცემები იქმნებოდა კაზინო ჩვენ შეგვიძლია გავამახვილო რამდენიმე ცუდი დასკვნები.
სამწუხაროდ, საქმე ალგორითმული confounding განსაკუთრებით რთულია, რადგან ბევრი თვისებები ონლაინ სისტემები საკუთრების, ცუდად დოკუმენტირებული და მუდმივად იცვლება. მაგალითად, მე ახსნას მოგვიანებით ამ თავში, ალგორითმული confounding იყო ერთ-ერთი შესაძლო ახსნა ეტაპობრივი დაშლას of Google გრიპის ტენდენციები (სექცია 2.4.2), მაგრამ ეს პრეტენზია იყო იმისთვის, რომ შეაფასოს, რადგან შიდა სამუშაოები Google- ის საძიებო ალგორითმი საკუთრების. დინამიური ბუნება ალგორითმული confounding არის ერთი ფორმა სისტემა დრიფტი. ალგორითმული confounding იმას ნიშნავს, რომ ჩვენ უნდა დაფიქრდეს, რაიმე პრეტენზია ადამიანის ქცევას, რომელიც ერთი ციფრული სისტემა, არ აქვს მნიშვნელობა, თუ რამდენად დიდი.