Suurissa tietolähteissä tapahtuva mittaus ei todennäköisesti muuta käyttäytymistä.
Yksi sosiaalisen tutkimuksen haaste on se, että ihmiset voivat muuttaa käyttäytymistään, kun he tietävät, että tutkijat noudattavat niitä. Sosiaalitieteilijät yleensä kutsuvat tätä reaktiivisuutta (Webb et al. 1966) . Esimerkiksi ihmiset voivat olla avokätisempiä laboratoriotutkimuksissa kuin kenttätutkimukset, koska he ovat hyvin tietoisia siitä, että heitä tarkkaillaan (Levitt and List 2007a) . Yksi osa suurta tietoa, jota monet tutkijat pitävät lupaavina, on se, että osallistujat eivät yleensä ole tietoisia siitä, että heidän tietonsa on kaapattu tai että he ovat tottuneet tähän tiedonkeruuseen, että he eivät enää muuta käyttäytymistään. Koska osallistujat eivät ole reagoivia , siksi monia suuria tietolähteitä voidaan käyttää sellaisten käyttäytymismenetelmien tutkimiseen, joita ei aikaisemmin ole käytetty tarkkaan mittaukseen. Esimerkiksi Stephens-Davidowitz (2014) käytti rasististen termien esiintyvyyttä hakukoneiden kyselyissä mittaamaan rotusyrjyyttä eri alueilla Yhdysvalloissa. Hakutiedon ei-reagoivien ja suurien (ks. Kohta 2.3.1) luonne on vaikea käyttää muilla menetelmillä, kuten kyselyillä.
Ei-toimenpide ei kuitenkaan takaa, että nämä tiedot ovat jonkin verran suoraa kuvaa ihmisten käyttäytymisestä tai asenteista. Esimerkiksi eräs vastaaja haastatteluun perustuvassa tutkimuksessa sanoi: "Ei ole, että minulla ei ole ongelmia, en vain aseta niitä Facebookille" (Newman et al. 2011) . Toisin sanoen, vaikka jotkut suuret tietolähteet eivät ole reagoivia, ne eivät aina ole sosiaalisen toivottavuuden puolueellisuudesta, taipumuksesta ihmisille haluavat esitellä itseään parhaalla mahdollisella tavalla. Lisäksi, kuten kuvataan myöhemmin luvussa, suurilla tietolähteillä otettu käyttäytyminen vaikuttaa joskus alustan omistajien tavoitteisiin, joita kutsun algoritmiseksi häiritsemiseksi . Lopuksi, vaikka ei-reaktiviteetti on tutkimukselle edullinen, ihmisten käyttäytymisen seuraaminen ilman heidän suostumustaan ja tietoisuuttaan herättää eettisiä huolenaiheita, joita kuvataan yksityiskohtaisesti luvussa 6.
Kolme ominaisuutta, jotka juuri kuvatin - suuret, jatkuvat ja ei-reagoivat - ovat yleensä, mutta eivät aina, sosiaalisen tutkimuksen kannalta edullisia. Seuraavaksi käsittelen suurien tietolähteiden seitsemän ominaisuutta - epätäydellinen, saavuttamaton, ei-edustava, ajelehtiva, algoritmisesti sekava, likainen ja herkkä - joka yleensä, mutta ei aina, aiheuttaa ongelmia tutkimukselle.