വലിയ ഡാറ്റാ സ്രോതസ്സുകളിലെ അളവ് പെരുമാറ്റത്തെ മാറ്റാനുള്ള സാധ്യത കുറവാണ്.
ഗവേഷകരുടെ നിരീക്ഷണത്തിലാണെന്ന് അവർക്കറിയുമ്പോൾ ആളുകൾക്ക് അവരുടെ സ്വഭാവം മാറ്റാൻ കഴിയുമെന്നതാണ് സാമൂഹ്യ ഗവേഷണത്തിലെ ഒരു വെല്ലുവിളി. സാമൂഹ്യ ശാസ്ത്രജ്ഞർ ഈ പ്രവർത്തനത്തെ സാധാരണയായി വിളിക്കുന്നു (Webb et al. 1966) . ഉദാഹരണമായി, ലബോറട്ടറിയിൽ പഠിക്കുന്നതിനേക്കാളും കൂടുതൽ ആളുകൾക്ക് പഠിക്കാനാകും, കാരണം മുൻകാലങ്ങളിൽ അവർ നിരീക്ഷിക്കപ്പെടുകയാണെന്ന് അവർക്കറിയാം (Levitt and List 2007a) . പല ഗവേഷകരും വാഗ്ദാനം ചെയ്യുന്ന വലിയ ഡാറ്റയുടെ ഒരു വശം, പങ്കെടുത്തവർ പൊതുവെ അവരുടെ ഡാറ്റ പിടിച്ചടക്കുന്നുവെന്ന് അറിഞ്ഞിരിക്കുകയോ അല്ലെങ്കിൽ ഈ ഡാറ്റ ശേഖരത്തിന് അത് ശീലമായിരിക്കുന്നു, അത് അവരുടെ സ്വഭാവത്തെ മാറ്റിമറിക്കുകയില്ല. പങ്കാളികൾ നിഷ്ക്രിയരാണെന്നതിനാൽ , കൃത്യമായ അളവിൽ കൃത്യമായ അളവിലേക്ക് മാറാൻ കഴിയാത്ത പെരുമാറ്റ പഠനത്തിനായി വലിയ ഡാറ്റയുടെ നിരവധി ഉറവിടങ്ങൾ ഉപയോഗിക്കാൻ കഴിയും. ഉദാഹരണമായി, Stephens-Davidowitz (2014) വിവിധ പ്രദേശങ്ങളിലെ വംശീയ സ്വഭാവം അളക്കാൻ തിരയൽ എഞ്ചിൻ ചോദ്യങ്ങളിൽ വംശീയതയുടെ പ്രയോഗത്തെ സ്വാധീനിച്ചു. സർവേകൾ പോലെയുള്ള മറ്റ് രീതികൾ ഉപയോഗിക്കുന്നത് ബുദ്ധിമുട്ടുള്ളതും തിരയൽ ഡാറ്റയുടെ പ്രാപ്തമാക്കിയ അളവുകളുടെ സ്വഭാവവും സ്വാഭാവികമല്ലാത്തതും വലുതുമായ (വിഭാഗം 2.3.1 കാണുക).
എന്നിരുന്നാലും, ഈ ഡാറ്റ ജനങ്ങളുടെ പെരുമാറ്റത്തിൻറെയോ മനോഭാവത്തിൻറെയോ ഒരു പ്രത്യക്ഷ പ്രതിഫലിപ്പാണ് ആണെന്ന് നോൺ റക്റേക്റ്റിവിറ്റി ഉറപ്പിക്കുന്നില്ല. ഉദാഹരണത്തിന് ഒരു അഭിമുഖത്തിൽ ഒരാൾ പ്രതികരിച്ചുള്ള പഠനത്തിൽ പറഞ്ഞു, "എനിക്ക് പ്രശ്നങ്ങളല്ല, ഫെയ്സ്ബുക്കിൽ അവ കൊടുക്കാറില്ല" (Newman et al. 2011) . മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, ചില വലിയ വിവര ഉറവിടങ്ങൾ നിഷ്ക്രിയമാണെങ്കിലും, അവ എല്ലായ്പ്പോഴും സാമൂഹ്യ അഭിലാഷണത്തിന്റെ പക്ഷപാതിത്വത്തിൽ നിന്ന് മുക്തമല്ല. ജനങ്ങൾ ഏറ്റവും മികച്ച രീതിയിൽ തങ്ങളെത്തന്നെ അവതരിപ്പിക്കാൻ ആഗ്രഹിക്കുന്ന പ്രവണത. കൂടാതെ, പിന്നീട് ഞാൻ അധ്യായത്തിൽ വിവരിക്കവേ, വലിയ ഡാറ്റാ സ്രോതസ്സുകളിൽ പിടിച്ചെടുക്കുന്ന പെരുമാറ്റം പ്ലാറ്റ്ഫോം ഉടമകളുടെ ലക്ഷ്യത്തെയാണ് ബാധിക്കുന്നത്, ഒരു പ്രശ്നം ഞാൻ അൽഗോരിത്മിക് കൗണ്ടിംഗ് എന്നു വിളിക്കും. അവസാനമായി, ഗൃഹാതുരത്വം ഗവേഷണത്തിനായി പ്രയോജനകരമാണെങ്കിലും, ആളുകളുടെ സ്വഭാവവും അവയുടെ സമ്മതവും കൂടാതെ ബോധവൽക്കരണമില്ലാതെ ട്രാക്കുചെയ്യുന്നു. ഞാൻ ആറാം അദ്ധ്യായം 6 ൽ വിശദീകരിക്കാം.
ഞാൻ വിശേഷിപ്പിച്ച മൂന്നു സവിശേഷതകളും-വലിയ, എല്ലായ്പ്പോഴും-നോൺ-രസകരമല്ലാത്ത-സാധാരണയായി, പക്ഷെ എപ്പോഴും സാമൂഹ്യ ഗവേഷണത്തിന് പ്രയോജനകരമല്ല. അടുത്തതായി, വലിയ ഡാറ്റാ സ്രോതസ്സുകളുടെ ഏഴ് പ്രോപ്പർട്ടികളിലേക്ക്-അപൂർണമായ, പ്രവേശിക്കാനാകാത്ത, പ്രതിനിധാനം ചെയ്യാത്ത, ഡ്രോയിംഗ്, അൽഗൊരിതംചെയ്ത ആശയക്കുഴപ്പം, വൃത്തികെട്ട, സെൻസിറ്റീവ്-ഞാൻ പൊതുവെ, എന്നാൽ എല്ലായ്പ്പോഴും ഗവേഷണ പ്രശ്നങ്ങൾ സൃഷ്ടിക്കുന്നു.