2.4.1.2 formación de la amistad entre los estudiantes

Los investigadores utilizaron los registros de correo electrónico y los registros administrativos para entender la formación de amistades. Esta investigación requiere tratar con el carácter incompleto de datos grandes.

En muchas situaciones, los investigadores no tienen la suerte de tener todo lo que quieren recoger de forma automática en un solo lugar. Dos problemas comunes son la información incompleta acerca de las personas y un desajuste entre las construcciones teóricas y datos. Ambos de estos problemas fueron abordados por Kossinets y Watts (2009) como parte de sus esfuerzos para comprender cómo evolucionan las redes sociales.

En términos generales, los investigadores piensan que la evolución red social es impulsada por tres características: 1) la estructura de las relaciones existentes 2) actividades compartidas (por ejemplo, dormitorios, clases) y 3) datos demográficos. La comprensión de las interrelaciones entre estos tres factores se requieren datos longitudinales de la red combinados con información sobre la demografía y las actividades de los individuos. Estudios anteriores habían algunas de estas características, pero ninguno tenía los tres.

Kossinets y Watts comenzó su investigación mediante la adquisición de los registros de correo electrónico de una gran universidad. Sin embargo, estos registros de correo electrónico solo estaban incompletos, que no incluyen todo lo necesario para comprender los diversos factores que impulsan la evolución de la red. Por lo tanto, Kossinets y Watts se fusionaron estos registros de correo electrónico, con otras dos fuentes de información: la información demográfica recopilada por la universidad y la información sobre las actividades compartidas (por ejemplo, información residencia de estudiantes y una lista completa de inscripción en los cursos). Una vez que estas tres fuentes de información, cada uno de los cuales era incompleta, se fusionaron juntos Kossinets y Watts tenía una estructura de datos de gran alcance para la evolución de la red entendimiento.

Sin embargo, hubo un último reto que tuvieron que superar. Kossinets y Watts querían estudiar cómo la red social en esta universidad ha evolucionado por lo que necesitaban una manera de utilizar los registros de correo electrónico en una estimación de que estaba conectada a quien en ese momento. Como se discutió en anteriormente (Sección 2.3.2.1), este tipo de puesta en marcha de las construcciones teóricas es un gran reto cuando se utiliza huellas digitales para la investigación social. Al final, Kossinets y Watts decidieron que se consideraron dos personas conectadas a la hora \ (t \) si y sólo si habían intercambiado mensajes de correo electrónico (\ (i \) enviado por correo electrónico \ (j \) y \ (j \) enviado por correo electrónico \ ( i \)) en los 60 días anteriores. Estas opciones no son arbitrarias; que se basan en una cuidadosa consideración de este campo de investigación, y Kossinets y Watts comprueban que sus resultados fueron robustos a estas opciones. En general, si su puesta en funcionamiento consiste en elegir algunos puntos de corte específicos, digamos 60 días en lugar de 30 días o 90 días, que es una buena idea para asegurarse de que sus resultados no son sensibles a esta elección.

Una vez Kossinets y Watts abordan el problema causado por la información incompleta (por ejemplo, la falta de información demográfica, la falta de información sobre la actividad compartida, y la falta constructos teóricos), tenían los datos que les permitieron comprender las tres fuerzas principales que pueden conducir evolución de la red: 1) la la estructura de las relaciones existentes 2) actividades compartidas (por ejemplo, dormitorios, clases) y 3) la demografía. De acuerdo con investigaciones anteriores, encontraron que las personas con similares características demográficas son más propensos a formar relaciones. Sin embargo, a diferencia de estudios anteriores, encontraron que este patrón fue fuertemente atenuado por la estructura de red existente y actividades comunes. En otras palabras, el patrón que los investigadores anteriores habían visto se explica en parte por datos que los investigadores anteriores no tenían. Por lo tanto, al tratar con éxito con el carácter incompleto de sus datos, Kossinets y Watts pudieron aclarar la interacción de una variedad de diferentes factores que impulsan la evolución de la red social.