2.3.2.5アルゴリズム的混乱します

見つかったデータでの動作は、それがシステムのエンジニアリングの目標によって駆動され、自然ではありません。

人々が気づいていないため、多く見つかったデータソースは非反応性であるが、それらのデータは、(セクション2.3.1.3)は、研究者は「天然に存在する」またはであることを、これらのオンラインシステムでの動作を考慮するべきではありません記録されている「純粋な。」実際には、記録動作は非常にそのような広告をクリックしたり、コンテンツを投稿などの特定の行動を誘導するように設計されているデジタルシステム。システム設計者の目標は、データにパターンを導入することができる方法は、アルゴリズム交絡と呼ばれています。アルゴリズム交絡は、社会科学者に比較的未知であるが、それは慎重にデータ科学者の間で主要な関心事です。そして、デジタル・トレースと他の問題のいくつかとは違って、アルゴリズム的交絡は、主に目に見えないです。

アルゴリズムの交絡の比較的単純な例はFacebookを利用して約20友達とユーザの異常に高い数があるという事実である(Ugander et al. 2011) Facebookがどのように動作するかのいずれか理解せずに、このデータを用いて分析する科学者たちは、間違いなく20は魔法の社会的数のいくつかの種類であるかについての多くの物語を生成することができます。しかし、Uganderと彼の同僚は、データを生成したプロセスの実質的な理解を持っていた、と彼らは20の友人に達するまでFacebookはもっとたくさんの友達を作るためにFacebook上でいくつかの接続を持つ人々を奨励していることを知っていました。 Uganderらは論文でこれを言うことはありませんが、このポリシーは、おそらく、よりアクティブになるために新しいユーザーを奨励するために、Facebookから作成されました。このポリシーの存在を知らずに、しかし、データから間違った結論を引き出すことは容易です。言い換えれば、約20の友人を持つ人々の驚​​くほど高い数は、人間の行動よりも、フェイスブックの詳細を教えてくれる。

アルゴリズムの交絡は慎重に研究者がさらに調査かもしれないという風変わりな結果を生成し、この前の例よりももっと悪質、オンラインシステムの設計者は社会的な理論を知っているし、その後の作業にこれらの理論を焼くときに発生するアルゴリズムの交絡のさえトリッキーバージョンがあります自分のシステムの。社会科学者は、このperformativityを呼び出す:理論は、彼らがより多くの理論とラインに世界を持って来るように世界を変えるとき。遂行的アルゴリズムの交絡の例では、データの混乱性質はそう見えません。

performativityによって作成されるパターンの一例は、オンラインのソーシャルネットワークで推移です。 1970年代と1980年代には、研究者は、繰り返し使用すると、アリスと友人であり、あなたはボブと友達である場合には、ボブとアリスは、2つのランダムに選択された人以外互いに友人である可能性が高いことがわかりました。そして、この非常に同じパターンがFacebookのソーシャルグラフで発見された(Ugander et al. 2011)したがって、1はFacebookの友情のパターンは、少なくとも推移の観点から、オフライン友情のパターンを複製することを結論付けることがあります。しかし、Facebookのソーシャルグラフにおける推移の大きさは、部分的アルゴリズム交絡によって駆動されます。つまり、Facebookの時のデータ科学者は推移に関する実証的・理論的研究を知っていたし、その後Facebookがどのように機能するかにそれを焼きました。 Facebookは「あなたが知っているかもしれない人々 "新しい友人を示唆している、とFacebookがあなたに提案する者を決定する1つの方法は推移性である特徴を有しています。つまり、Facebookはあなたがあなたの友人の友人と友達になることを示唆している可能性が高いです。この機能は、このようにFacebookのソーシャルグラフ内の推移を増加させる効果を有します。言い換えれば、推移性の理論は理論の予測とラインに世界をもたらします(Healy 2015)ビッグデータ・ソースが社会理論の予測を再現するために表示されたときにこのように、我々は理論自体はシステムが働いてどのように焼いていなかったことを確認する必要があります。

むしろ、自然の中で人々を観察するようにビッグデータ・ソースのことを考えよりも、より多くのaptのメタファーは、カジノの人々を観察しています。カジノは非常に特定の動作を誘導するように設計された環境を設計している、と研究者はカジノでその振る舞い​​が人間の行動に自由にウィンドウを提供するであろう期待することはありませんでしょう。もちろん、我々は人間の行動勉強人々について何か学ぶことができるカジノを-で実際のカジノがアルコール消費量とリスクの関係研究するための理想的な環境である場合があり、我々はデータがカジノで作成されていたことを無視して好みを-が、我々はかもしれませんいくつかの悪い結論を出します。

オンラインシステムの多くの機能が不十分な文書化され、独自のものであり、常に変化しているため残念ながら、アルゴリズム的交絡を扱うことは特に困難です。私は、この章の後半で説明しますように例えば、アルゴリズム的交絡は、Googleインフルトレンド(2.4.2項)の緩やかなブレークダウンのための1つの可能な説明でしたが、この主張は、評価することは困難でしたので、Googleの検索の内部の仕組みアルゴリズムは独自のものです。アルゴリズムの交絡の動的な性質は、システムのドリフトの一形態です。アルゴリズムの交絡は、私たちがどんなに大きな、単一のデジタルシステムから来る人間の行動のためのいかなる請求については慎重であるべきではないことを意味します。