2.4.1.2 formação de Amizade entre os estudantes

Os investigadores usaram registros de e-mail e registros administrativos para compreender a formação de amizade. Esta pesquisa requer lidar com a incompletude do big data.

Em muitas situações, os investigadores não têm a sorte de ter tudo o que querem coletadas automaticamente em um só lugar. Dois problemas comuns são informações incompletas sobre as pessoas e uma incompatibilidade entre construções teóricas e dados. Ambos os problemas foram abordados por Kossinets e Watts (2009) , como parte de seus esforços para compreender como as redes sociais evoluir.

Grosso modo, os investigadores pensam que a evolução rede social é impulsionada por três características: 1) a estrutura das relações existentes 2) atividades compartilhadas (por exemplo, dormitórios, classes) e 3) demografia. Compreender as inter-relações entre estes três factores requer dados de rede longitudinais combinados com informações sobre demografia e atividades dos indivíduos. Estudos anteriores tinham algumas destas características, mas nenhum teve todos os três.

Kossinets e Watts começou suas pesquisas, adquirindo os logs de e-mail a partir de uma grande universidade. No entanto, esses logs de e-mail só estavam incompletos, eles não incluem tudo o necessário para compreender os diversos fatores que impulsionam a evolução da rede. Portanto, Kossinets e Watts fundiu esses logs por e-mail, com outras duas fontes de informação: informação demográfica recolhida pela universidade e informações sobre as atividades compartilhadas (por exemplo, informação residência de estudantes e uma lista completa das matrículas em cursos). Uma vez que estas três fontes de informação, cada um dos quais era incompleta, foram mesclados Kossinets e Watts tinha uma estrutura de dados poderosa para a evolução da rede entendimento.

Mas, havia um último desafio que teve de superar. Kossinets e Watts queria estudar a forma como a rede social nesta universidade evoluiu para que eles precisavam de uma maneira de usar os logs de e-mail em uma estimativa do que estava ligado ao que no momento em que. Como discutido na anteriormente (Seção 2.3.2.1), este tipo de operacionalização das construções teóricas é um grande desafio quando se utiliza vestígios digitais para a investigação social. No final, Kossinets e Watts decidiu que duas pessoas foram considerados conectados em tempo de \ (t \) se e somente se eles haviam trocado e-mails (\ (i \) por e-mail \ (j \) e \ (j \) por e-mail \ ( i \)) nos 60 dias anteriores. Estas escolhas não eram arbitrárias; baseavam-se em consideração cuidadosa dessa configuração empírica, e Kossinets e Watts verificado que os seus resultados foram robustos para essas escolhas. Em geral, se a sua operacionalização envolve a escolha de alguns específicos cortes, digamos 60 dias em vez de 30 dias ou 90 dias-lo é uma boa idéia para se certificar de que seus resultados não são sensíveis a esta escolha.

Uma vez Kossinets e Watts abordou o problema causado pela incompletude (por exemplo, falta de informação demográfica, informações sobre a atividade compartilhada falta, e falta de construções teóricas), que tinham dados que lhes permitiu compreender as três forças principais que podem conduzir a evolução da rede: 1) a estrutura das relações existentes 2) atividades compartilhadas (por exemplo, dormitórios, classes) e 3) demografia. Consistente com pesquisas anteriores, eles descobriram que as pessoas com dados demográficos semelhantes são mais propensos a formar relacionamentos. No entanto, ao contrário de estudos anteriores, eles descobriram que este padrão foi fortemente atenuado pela estrutura de rede existente e atividades compartilhadas. Em outras palavras, o padrão que os pesquisadores anteriores tinha visto foi parcialmente explicada pelos dados que os pesquisadores anteriores não tinham. Assim, ao lidar com sucesso com a incompletude dos seus dados, Kossinets e Watts puderam esclarecer a interação de uma variedade de diferentes fatores que impulsionam evoluções da rede social.