বড় ডেটা উত্সের পরিমাপ আচরণের পরিবর্তন হওয়ার সম্ভাবনা কম।
সামাজিক গবেষণা একটি চ্যালেঞ্জ হল যে তারা তাদের আচরণ পরিবর্তন করতে পারেন যখন তারা জানেন যে তারা গবেষকরা দ্বারা পরিদর্শন করা হচ্ছে। সামাজিক বিজ্ঞানী সাধারণত এই প্রতিক্রিয়াটি কল (Webb et al. 1966) । উদাহরণস্বরূপ, ক্ষেত্র গবেষণার তুলনায় মানুষ ল্যাবরেটরি গবেষণায় আরও উদার হতে পারে কারণ প্রাক্তনদের তারা খুব সচেতন যে তারা (Levitt and List 2007a) পরিদর্শন করা হচ্ছে। অনেক গবেষকরা আশাবাদী যে বড় তথ্য একটি দিক অংশগ্রহণকারী সাধারণত তাদের তথ্য বা ক্যাপচার করা হচ্ছে যে তারা এই তথ্য সংগ্রহের অভ্যস্ত হয়ে গেছে যে সাধারণত সচেতন নয় যে এটি তাদের আচরণ পরিবর্তন না যেহেতু অংশগ্রহণকারীরা নন- প্রতিক্রিয়াশীল , তাই, বড় ডেটার অনেকগুলি সূত্র এমন আচরণ অধ্যয়ন করতে ব্যবহার করা যেতে পারে যা আগে সঠিক পরিমাপে সক্ষম ছিল না। উদাহরণস্বরূপ, Stephens-Davidowitz (2014) মার্কিন যুক্তরাষ্ট্রে বিভিন্ন অঞ্চলে জাতিগত নিষ্ঠুরতা পরিমাপ করার জন্য সার্চ ইঞ্জিন Stephens-Davidowitz (2014) বর্ণবাদী শর্তগুলির বিস্তার ব্যবহার করেন। নিষ্ক্রিয় এবং বড় (অধ্যায় 2.3.1 দেখুন) সার্ভেগুলির মতো অন্যান্য পদ্ধতিগুলি ব্যবহার করে অনুসন্ধান ডিফল্ট পরিমাপের পরিমাপগুলি কঠিন হবে।
Nonreactivity, যাইহোক, এই তথ্য কোনভাবে হয় মানুষের আচরণ বা মনোভাব একটি সরাসরি প্রতিফলন নিশ্চিত না। উদাহরণস্বরূপ, একটি ইন্টারভিউ ভিত্তিক গবেষণায় এক প্রতিক্রিয়াশীল হিসাবে, "এটা আমার সমস্যা নেই যে আমি না, আমি ফেসবুকে তাদের নির্বাণ না করছি" (Newman et al. 2011) । অন্য কথায়, যদিও কিছু বড় তথ্য উত্স অ-প্রতিক্রিয়াশীল, তারা সবসময় সামাজিক যোগ্যতা পক্ষপাতহীন নয়, জনগণের পক্ষে সর্বোত্তম সম্ভাব্য উপায়ে তাদের উপস্থাপন করতে চায়। উপরন্তু, আমি অধ্যায় পরে বর্ণনা করব হিসাবে, বড় তথ্য উত্স মধ্যে বন্দী আচরণ কখনও কখনও প্ল্যাটফর্ম মালিকদের লক্ষ্য দ্বারা প্রভাবিত হয়, একটি সমস্যা আমি অ্যালগরিদম confounding কল করব অবশেষে, যদিও অরৈখিকতাটি গবেষণার জন্য সুবিধাজনক, জনগণের আচরণকে তাদের সম্মতি ব্যতীত ট্র্যাকিং এবং সচেতনতা সম্পর্কে নৈতিক উদ্বেগ উত্থাপন করে যা আমি অধ্যায় 6 এ বিস্তারিত বর্ণনা করবো।
তিনটি বৈশিষ্ট্যাবলী যা আমি শুধু বর্ণিত- বড়, সর্বদা অন, এবং nonreactive- সাধারণত, কিন্তু সামাজিক গবেষণা জন্য সবসময়, সুবিধাজনক না। পরবর্তীতে, আমি বড় তথ্য সূত্রের সাতটি বৈশিষ্ট্যগুলি-অসম্পূর্ণ, অপ্রাসঙ্গিক, অ-প্রতিনিধি, ড্রিফটিং, অ্যালগরিদমভাবে বিশৃঙ্খল, নোংরা এবং সংবেদনশীল-যা সাধারণত, কিন্তু সবসময় না, গবেষণা করার জন্য সমস্যা তৈরি করি।