2.4.1.2学生の間で友情の形成

研究者は、友情形成を理解するために、電子メールログや行政記録を使用していました。本研究では、ビッグデータの不完全性に対処する必要があります。

多くの状況では、研究者は、彼らが自動的に1箇所に集めたいすべてのものを持っている幸運ではありません。 2つの一般的な問題は、人々と理論の構築とデータの間に不一致に関する不完全な情報です。これらの問題の両方がKossinetsとワットによって対処された(2009)のネットワークが進化する方法社会を理解する努力の一環として。

既存の関係2)共有活動(例えば、寮、クラス)および3)人口統計の1)構造:大まかに言えば、研究者は、ソーシャルネットワークの進化は、3つの機能によって駆動されていることと思います。これらの3因子間の相互関係を理解することは、個人の人口統計や活動についての情報と組み合わせ縦ネットワークデータを必要とします。以前の研究では、これらの機能のいくつかを持っていたが、どれも3つすべてを持っていません。

Kossinetsとワッツは、大規模な大学からの電子メールのログを取得することで、彼らの研​​究を開始しました。しかし、単独でこれらの電子メールのログが不完全だった、彼らはネットワークの進化を駆動する様々な要因を理解するために必要なものがすべて含まれていません。共有活動(例えば、学生寮の情報やコースへの登録の完全なリスト)について、大学との情報によって収集された人口統計学的情報:したがって、Kossinetsとワッツは、情報の他の二つのソースと、これらの電子メールのログを統合しました。不完全であった、それぞれが情報これら3つの情報源、一旦、Kossinetsとワッツは、ネットワークの進化を理解するための強力なデータ構造を持っていた一緒にマージされました。

しかし、彼らは克服しなければならなかった1最終的な課題がありました。 Kossinetsとワッツは、この大学でソーシャルネットワークは、彼らが誰に接続されていた人の推定に電子メールのログを使用する方法が必要でしたので、どのように進化したかを勉強したいと思ったその時点で。以前(2.3.2.1項)で述べたように、社会的な研究のためのデジタル・トレースを使用した場合、理論的な構築物の運用開始のこの種は大きな課題です。最後に、Kossinetsとワッツは、2人が時間\さ(t \)で接続されたと考えられていたと判断した場合、それらは電子メールを(\私は\()(\(j は\)を電子メールで送信し、\(jは\)は \を電子メールで送信交換していた場合にのみ、 私は前の60日に))\します 。これらの選択は任意ではありませんでした。彼らはこの経験的な設定を慎重に検討に基づいて、およびKossinetsとワットは、彼らの結果は、これらの選択肢に対して頑健であったことを確認しました。あなたの運用開始は、いくつかの特定の選択関与する場合、一般的には、60日間の代わりに30日または90日には、あなたの結果は、この選択に敏感ではないことを確認するために、良いアイデアですカットオフを-言います。

1):Kossinetsとワット(例えば、人口統計情報が欠落し、共有アクティビティに関する情報が不足し、理論的な構築物の欠落)の不備に起因する問題に対処したら、彼らはネットワークの進化を駆動することができる三つの主要な力を理解するためにそれらを有効にデータを持っていました既存の関係2)共有活動(例えば、寮、クラス)および3)人口統計の構造。以前の研究と一致して、彼らは同じような人口統計を持つ人々が関係を形成する可能性が高いことがわかりました。しかし、以前の研究とは異なり、それらは、このパターンが強く、既存のネットワーク構造と共有活動によって軽減されたことを見出しました。つまり、以前の研究者は見ていたパターンは、部分的に、以前の研究者が持っていなかったことがデータによって説明されました。このように、成功した彼らのデータの不備に対処することにより、Kossinetsとワッツは、ソーシャルネットワークの進化を駆動する種々の異なる因子の相互作用を明らかにできました。