L'ère numérique est omniprésente, elle est en croissance et elle change ce qui est possible pour les chercheurs.
La prémisse centrale de ce livre est que l'ère numérique crée de nouvelles opportunités pour la recherche sociale. Les chercheurs peuvent maintenant observer le comportement, poser des questions, mener des expériences et collaborer de manière tout à fait impossible dans un passé récent. Ces nouvelles opportunités s'accompagnent de nouveaux risques: les chercheurs peuvent maintenant nuire aux gens d'une manière qui était impossible dans un passé récent. La source de ces opportunités et risques est la transition de l'ère analogique à l'ère numérique. Cette transition ne s'est pas produite tout à la fois - comme un interrupteur qui s'allume - et, en fait, elle n'est pas encore terminée. Cependant, nous en avons déjà assez vu pour savoir qu'il se passe quelque chose de grand.
Une façon de remarquer cette transition est de chercher des changements dans votre vie quotidienne. Beaucoup de choses dans votre vie qui étaient analogiques sont maintenant numériques. Peut-être que vous utilisiez un appareil photo avec film, mais maintenant vous utilisez un appareil photo numérique (qui fait probablement partie de votre téléphone intelligent). Peut-être que vous lisiez un journal physique, mais maintenant vous lisez un journal en ligne. Peut-être que vous avez l'habitude de payer pour des choses en espèces, mais maintenant vous payez avec une carte de crédit. Dans chaque cas, le passage de l'analogique au numérique signifie que plus de données sur vous sont capturées et stockées numériquement.
En fait, lorsqu'on les considère globalement, les effets de la transition sont étonnants. La quantité d'informations dans le monde augmente rapidement, et une plus grande partie de ces informations est stockée numériquement, ce qui facilite l'analyse, la transmission et la fusion (figure 1.1). Toutes ces informations numériques sont appelées «big data». En plus de cette explosion des données numériques, il y a une croissance parallèle de l'accès à la puissance de calcul (figure 1.1). Ces tendances - augmentation des volumes de données numériques et disponibilité croissante de l'informatique - devraient se poursuivre dans un avenir prévisible.
À des fins de recherche sociale, je pense que la caractéristique la plus importante de l'ère numérique est l' informatique partout . Commençant comme des machines de la taille d'une pièce qui étaient disponibles seulement aux gouvernements et aux grandes compagnies, les ordinateurs ont rétréci dans la taille et se sont multipliés dans l'omniprésence. Chaque décennie depuis les années 1980 a vu émerger un nouveau genre d'ordinateurs: ordinateurs personnels, ordinateurs portables, téléphones intelligents et maintenant des processeurs embarqués dans l'Internet des Objets (ordinateurs à l'intérieur d'appareils tels que voitures, montres et thermostats) (Waldrop 2016) . De plus en plus, ces ordinateurs omniprésents font plus que simplement calculer; ils détectent, stockent et transmettent également des informations.
Pour les chercheurs, les implications de la présence d'ordinateurs partout dans le monde sont les plus faciles à observer en ligne, un environnement entièrement mesuré et susceptible d'être expérimenté. Par exemple, un magasin en ligne peut facilement collecter des données incroyablement précises sur les habitudes d'achat de millions de clients. En outre, il peut facilement randomiser des groupes de clients pour recevoir différentes expériences d'achat. Cette possibilité de randomiser au-dessus du suivi signifie que les magasins en ligne peuvent constamment exécuter des expériences contrôlées randomisées. En fait, si vous avez déjà acheté quelque chose dans un magasin en ligne, votre comportement a été suivi et vous avez presque certainement participé à une expérience, que vous le sachiez ou non.
Ce monde pleinement mesuré et entièrement aléatoire ne se passe pas seulement en ligne; cela se passe de plus en plus partout. Les magasins physiques collectent déjà des données d'achat extrêmement détaillées et développent une infrastructure pour surveiller le comportement d'achat des clients et combiner l'expérimentation à la pratique commerciale habituelle. L'Internet des objets signifie que le comportement dans le monde physique sera de plus en plus capturé par les capteurs numériques. En d'autres termes, lorsque vous pensez à la recherche sociale à l'ère numérique, vous ne devriez pas seulement penser en ligne , vous devriez penser partout .
En plus de permettre la mesure du comportement et la randomisation des traitements, l'ère numérique a également créé de nouvelles façons de communiquer. Ces nouvelles formes de communication permettent aux chercheurs de mener des enquêtes innovantes et de créer une collaboration de masse avec leurs collègues et le grand public.
Un sceptique pourrait souligner qu'aucune de ces capacités n'est vraiment nouvelle. Par le passé, il y a eu d'autres avancées majeures dans la capacité de communiquer des personnes (par exemple, le télégraphe (Gleick 2011) ), et les ordinateurs se développent à peu près au même rythme depuis les années 1960 (Waldrop 2016) . Mais ce qui manque à ce sceptique, c'est qu'à un certain point plus de la même chose devient quelque chose de différent. Voici une analogie que j'aime (Halevy, Norvig, and Pereira 2009; Mayer-Schönberger and Cukier 2013) . Si vous pouvez capturer une image d'un cheval, alors vous avez une photo. Et, si vous pouvez capturer 24 images d'un cheval par seconde, alors vous avez un film. Bien sûr, un film est juste un tas de photos, mais seul un sceptique extrême pourrait prétendre que les photos et les films sont les mêmes.
Les chercheurs sont en train de faire un changement semblable à la transition de la photographie à la cinématographie. Ce changement ne signifie toutefois pas que tout ce que nous avons appris dans le passé devrait être ignoré. Tout comme les principes de la photographie informent ceux de la cinématographie, les principes de la recherche sociale qui ont été développés au cours des 100 dernières années éclaireront la recherche sociale qui aura lieu au cours des 100 prochaines années. Mais, le changement signifie également que nous ne devrions pas continuer à faire la même chose. Nous devons plutôt combiner les approches du passé avec les capacités du présent et du futur. Par exemple, la recherche de Joshua Blumenstock et de ses collègues était un mélange de recherche par sondage traditionnelle avec ce que certains pourraient appeler la science des données. Ces deux ingrédients étaient nécessaires: ni les réponses au sondage ni les registres d'appels en eux-mêmes n'étaient suffisants pour produire des estimations à haute résolution de la pauvreté. Plus généralement, les chercheurs en sciences sociales devront combiner les idées issues des sciences sociales et de la science des données pour tirer parti des opportunités de l'ère numérique; Aucune approche ne suffira à elle seule.