Մեծ տվյալների աղբյուրների չափումը շատ ավելի քիչ հավանական է, փոխելու պահվածքը:
Սոցիալական հետազոտության մեկ մարտահրավեր է այն, որ մարդիկ կարող են փոխել իրենց վարքագիծը, երբ գիտեն, որ դրանք դիտարկվում են հետազոտողների կողմից: Հասարակական գիտնականները, ընդհանուր առմամբ, կոչում են այս ռեակցիան (Webb et al. 1966) : Օրինակ, մարդիկ կարող են ավելի առատաձեռն լինել լաբորատոր հետազոտություններում, քան դաշտային ուսումնասիրությունները, քանի որ նախկինում նրանք շատ տեղյակ են, որ դրանք նկատվում են (Levitt and List 2007a) : Մեծ թվով հետազոտողների կարծիքով, խոստումնալից է, որ մասնակիցները, ընդհանուր առմամբ, տեղյակ չեն, որ իրենց տվյալները գրավել են կամ նրանք այնքան սովոր են դարձել այս տվյալների հավաքագրման մեջ, որ այլեւս չի փոխում իրենց վարքը: Քանի որ մասնակիցները ոչ ակտիվ են , հետեւաբար, մեծ տվյալների աղբյուրները կարող են օգտագործվել այն վարքագծի ուսումնասիրության համար, որը նախկինում չի եղել ճշգրիտ չափման համար: Օրինակ, Stephens-Davidowitz (2014) օգտագործեց ռասիստական պայմանների գերակշռումը որոնման հարցումների մեջ, ռասայական անիմի չափման համար ԱՄՆ-ի տարբեր մարզերում: Որոնողական տվյալների ոչ ակտիվ եւ մեծ (տես բաժին 2.3.1) բնույթը հնարավորություն տվեցին չափել դժվար, օգտագործելով այլ մեթոդներ, ինչպիսիք են հետազոտությունները:
Անհասկանալիությունը, սակայն, չի ապահովում, որ այդ տվյալները որեւէ կերպ անմիջականորեն արտացոլում են մարդկանց վարքագծի կամ վերաբերմունքի դրսեւորումները: Օրինակ, հարցազրույցի վրա հիմնված մեկ հարցման մեջ պատասխանողը պատասխանեց. «Ոչ, ես խնդիրներ չունեմ, ես պարզապես Facebook- ին չեմ դնում» (Newman et al. 2011) : Այլ կերպ ասած, թեեւ որոշ տվյալների մեծ աղբյուրները ոչ ակտիվ են, սակայն նրանք միշտ չէ, որ ազատ են սոցիալական շահավետության կողմնակիցներից, մարդիկ ցանկություն են հայտնում իրենց լավագույն ձեւով ներկայացնել: Հետագայում, ինչպես ես նկարագրեմ գլխում, ավելի մեծ տվյալների աղբյուրների վրա պահված պահվածքը երբեմն ազդում է պլատֆորմի սեփականատերերի նպատակների վրա, որը ես կկոչեմ ալգորիթմիկ խառնաշփոթ : Վերջիվերջո, չնայած ոչ ակտիվությունը հետազոտության համար ձեռնտու է, հետեւելով մարդկանց վարքագիծը, առանց նրանց համաձայնության եւ իրազեկվածության, բարձրացնում է էթիկական մտահոգությունները, որ ես մանրամասն նկարագրում եմ գլուխ 6-ում:
Իմ նկարագրած երեք հատկությունները, մեծ, միշտ, եւ ոչ ակտիվ, ընդհանուր առմամբ, բայց ոչ միշտ, ձեռնտու են սոցիալական հետազոտության համար: Դրանից հետո ես կանդրադառնամ մեծ տվյալների աղբյուրների յոթ առանձնահատկություններին `թերի, անմատչելի, ոչ ներկայացուցչական, կախված, ալգորիթմային խառնաշփոթ, կեղտոտ եւ զգայուն, ընդհանրապես, բայց ոչ միշտ` հետազոտության համար խնդիրներ ստեղծելու համար: