2.3.2.5 알고리즘 적 혼동

발견 된 데이터 동작은이 시스템의 설계 목표에 의해 구동되고, 천연 아니다.

사람들이 인식하지 않기 때문에 많은 발견 데이터 소스가 비 반응성 있지만 데이터는 (제 2.3.1.3)는, 연구자들은 "자연 발생"또는 수 이러한 온라인 시스템의 동작을 고려하지 않아야 기록되고있다 "순수."현실에서, 기록 동작은 매우 이러한 광고를 클릭하거나 콘텐츠를 게시으로 특정 행동을 유도하도록 설계 디지털 시스템. 시스템 설계자의 목표를 ​​데이터로 패턴을 소개 할 수있는 방법은 알고리즘 혼란이라고합니다. 알고리즘 교란 사회 과학 비교적 불명이지만 조심 데이터 과학자들 사이의 주요 관심사이다. 그리고, 디지털 트레이스와 다른 몇 가지 문제와는 달리, 알고리즘 혼란은 크게 보이지 않습니다.

알고리즘 혼란의 비교적 간단한 예는 페이스 북에 약 20 친구들과 함께 사용자의 비정상적으로 높은 수 있다는 사실이다 (Ugander et al. 2011) . 페이스 북은 doubtlessly (20)가 마법의 소셜 번호의 일종입니다 방법에 대한 많은 이야기를 생성 할 수있는 작동 방식의 이해없이이 데이터를 분석하는 과학자. 그러나 Ugander와 그의 동료들은 데이터를 생성 한 프로세스의 실질적인 이해를 가지고, 그들은 페이스 북은 그들이 20 친구에 도달 할 때까지 더 많은 친구를 만들기 위해 페이스 북에 몇 연결을 가진 사람들을 격려 것을 알고 있었다. Ugander와 동료는 논문에서이 말을하지 않지만,이 정책은 아마도 더 활성화 될 새로운 사용자를 유도하기 위해 페이스 북에 의해 만들어졌습니다. 이 정책의 존재를 알지 못하고, 그러나, 데이터로부터 잘못 결론을 도출하기 쉽다. 즉, 약 20 친구와 함께 사람들의 놀라 울 정도로 높은 숫자는 우리에게 인간의 행동보다 페이스 북에 대한 자세한 내용을 알려줍니다.

알고리즘 혼란이주의 연구자가 온라인 시스템 설계자는 사회 이론을 인식 할 때 발생하는 알고리즘 혼란의 더 까다로운 버전은 다음 작업에이 이론을 구워, 추가 조사를 할 수있는 기발한 결과를 생산이 앞의 예보다 더 악성 자신의 시스템. 사회 과학자들은이 performativity 전화 : 이론들이 더 많은 이론과 선으로 세계를 가지고 같은 방법으로 세상을 바꿀 때. 교란 수행 적 알고리즘의 경우, 데이터의 성격은 망할 것 것으로 보이지 않는다.

performativity 의해 생성 된 패턴의 하나의 예는 온라인 소셜 네트워크의 이행 성이다. 1970 년대와 1980 년대 연구자들은 반복해서 앨리스와 친구가 당신이 밥과 친구가있는 경우, 다음 밥과 앨리스는 두 개의 무작위로 선택된 사람보다 서로 친구가 될 가능성이 더 높습니다 것으로 나타났습니다. 그리고, 바로이 같은 패턴은 페이스 북의 소셜 그래프에서 발견되었다 (Ugander et al. 2011) . 따라서, 하나는 페이스 북에 우정의 패턴이 적어도 이행 성 측면에서, 오프라인 우정의 패턴을 복제한다는 결론을 내릴 수 있습니다. 그러나, 북 소셜 그래프 이행 성의 크기는 부분적으로 교란 알고리즘에 의해 구동된다. 즉, 페이스 북의 데이터 과학자가 이행 성에 대한 경험적 및 이론적 연구 알고 후 페이스 북의 작동 방식으로 구운입니다. 페이스 북은 "사람들 당신은 알고있다"새로운 친구를 제시 기능, 페이스 북은 당신이 이행 성이에 제안 할 사람을 결정하는 것이 하나의 방법이있다. 즉, 페이스 북은 당신이 당신의 친구의 친구와 친구가 될 것을 제안 할 가능성이 높습니다. 이 기능은 따라서 북 소셜 그래프로 이행 성을 향상시키는 효과를 갖는다; 즉, 이행 성 이론은 이론의 예측과 일치으로 세계를 제공합니다 (Healy 2015) . 빅 데이터 소스가 사회 이론의 예측을 재현하기 위해 나타날 때 따라서, 우리는 이론 자체 시스템이 어떻게 작동하는지에 구운되지 않았 음을 확인해야합니다.

오히려 자연 속에서 사람들을 관찰로 큰 데이터 소스의 생각보다 더 적절한 비유는 카지노에서 사람들을 관찰한다. 카지노는 매우 특정 행동을 유도하기위한 환경을 설계하고, 그 연구자들은 카지노에서 그 행동이 인간의 행동 내로 자유롭게 창을 제공 할 것 기대하지 않을 것입니다. 물론, 우리가 인간의 행동 공부하는 사람들에 대해 뭔가 배울 수 카지노 된 사실 카지노는 알코올 소비와 위험 사이의 관계 연구에 이상적인 설정을 할 수 있습니다 우리는 데이터가 카지노에서 생성되는 것을 무시할 경우 환경 설정을-그러나 우리는 수도 나쁜 결론을 그립니다.

온라인 시스템의 많은 기능이 제대로 문서화, 독점, 그리고 끊임없이 변화하기 때문에 불행하게도, 알고리즘 혼란을 처리하는 것은 특히 어렵다. 나는이 장에서 나중에 설명하겠습니다 예를 들어, 알고리즘 혼란 구글 독감 트렌드 (2.4.2 절)의 점진적 브레이크 다운에 대한 하나의 가능한 설명했지만,이 주장은 평가하기 어려웠다 때문에 구글의 검색의 내부 동작 알고리즘은 독점이다. 알고리즘 혼란의 동적 특성은 시스템 드리프트의 한 형태이다. 알고리즘 혼란이 얼마나 큰 우리가 상관없이 하나의 디지털 시스템에서 오는 인간의 행동에 대한 모든 주장에 대해 신중 없어야 것을 의미한다.