Upimaji katika vyanzo vya data kubwa haziwezekani sana kubadilisha tabia.
Changamoto moja ya utafiti wa kijamii ni kwamba watu wanaweza kubadilisha tabia zao wakati wanajua kuwa wanazingatiwa na watafiti. Wanasayansi wa jamii kwa ujumla huita hii reactivity (Webb et al. 1966) . Kwa mfano, watu wanaweza kuwa na ukarimu zaidi katika masomo ya maabara kuliko masomo ya shamba kwa sababu hapo awali wanafahamika kuwa wanazingatiwa (Levitt and List 2007a) . Kipengele kimoja cha data kubwa ambayo watafiti wengi wanapata kuahidi ni kwamba washiriki hawajui kwamba takwimu zao zinachukuliwa au wamekuwa wamezoea ukusanyaji huu wa data ambazo hazibadili tabia zao tena. Kwa sababu washiriki hawajui , kwa hiyo, vyanzo vingi vya data kubwa vinaweza kutumiwa kujifunza tabia ambayo haijafaa kwa kipimo sahihi hapo awali. Kwa mfano, Stephens-Davidowitz (2014) alitumia kuenea kwa maneno ya ubaguzi wa rangi katika maswali ya utafutaji wa utafutaji ili kupima uhai wa jamii katika mikoa tofauti ya Marekani. Yale yasiyo ya kazi na kubwa (angalia kifungu 2.3.1) asili ya vipimo vya utafutaji vinavyoweza kuwezeshwa kwa utafutaji ambavyo vinaweza kuwa vigumu kutumia mbinu zingine, kama vile tafiti.
Hata hivyo, hauna kuhakikisha kuwa data hizi kwa namna fulani ni kutafakari moja kwa moja tabia au tabia za watu. Kwa mfano, kama mhojiwa mmoja katika utafiti uliozingatia mahojiano alisema, "Sio kwamba sina shida, sio kuwaweka kwenye Facebook" (Newman et al. 2011) . Kwa maneno mengine, ingawa baadhi ya vyanzo vyenye vya habari havikosefu, sio daima hawana uhuru wa kijamii, tabia ya watu kutaka kujitolea wenyewe kwa njia bora. Zaidi ya hayo, kama nitakavyoelezea baadaye katika sura, tabia iliyosababishwa katika vyanzo vya data kubwa wakati mwingine huathiriwa na malengo ya wamiliki wa jukwaa, suala nitaloita algorithmic confounding . Hatimaye, ingawa sio reactivity ni faida kwa utafiti, kufuatilia tabia ya watu bila ridhaa yao na ufahamu huwafufua wasiwasi wa kimaadili ambayo nitaelezea kwa undani katika sura ya 6.
Mali tatu ambazo nilizozielezea-kubwa, daima, na zisizo za kutosha-kwa kawaida, lakini sio zote, zinafaa kwa utafiti wa kijamii. Ifuatayo, nitageuka kwenye vitu saba vya vyanzo vingi vya data-visivyo kamili, visivyoweza kupatikana, wasiowakilishi, visivyosababishwa, vichafu vyema, vichafu, na nyeti-ambayo kwa kawaida, lakini si mara zote, husababisha matatizo kwa utafiti.