জনসংখ্যার ড্রিফট, ব্যবহার ড্রিফট এবং সিস্টেম ড্রিফট দীর্ঘমেয়াদী প্রবণতা অধ্যয়ন করার জন্য বড় তথ্য সূত্র ব্যবহার করা কঠিন করে তোলে।
অনেক বড় তথ্য উত্সের একটি বড় সুবিধা হল যে তারা সময়ের সাথে তথ্য সংগ্রহ করে। সামাজিক বিজ্ঞানীরা এই ধরনের ওভার টাইম তথ্য অনুদৈর্ঘ্য তথ্য কল । এবং, স্বাভাবিকভাবেই, পরিবর্তন অধ্যয়ন করার জন্য অনুদৈর্ঘিক তথ্য খুবই গুরুত্বপূর্ণ। নির্ভরযোগ্যভাবে পরিবর্তন পরিমাপ করার জন্য, তবে, পরিমাপ সিস্টেম নিজেই স্থিতিশীল হতে হবে। সমাজবিজ্ঞানী ওটিস ডুডলি ডানকানের কথাতে, "যদি আপনি পরিবর্তন পরিমাপ করতে চান তবে পরিমাপ পরিবর্তন করবেন না" (Fischer 2011) ।
দুর্ভাগ্যবশত, অনেক বড় তথ্য ব্যবস্থা-বিশেষ করে ব্যবসায়িক ব্যবস্থা-সব সময় পরিবর্তন করা হচ্ছে, একটি প্রক্রিয়া যা আমি ড্রিফ্ট কল করব বিশেষ করে, এই পদ্ধতিগুলি তিনটি প্রধান উপায়ে পরিবর্তিত হয়: জনসংখ্যা প্রবাহ (যারা তাদের ব্যবহার করছে তা পরিবর্তন), আচরণগত ড্রিফ্ট (মানুষ কীভাবে তাদের ব্যবহার করছেন তা পরিবর্তন) এবং সিস্টেম ড্রিফট (সিস্টেম নিজেই পরিবর্তন)। ড্রিফট তিনটি উত্স মানে একটি বড় তথ্য উত্স কোন প্যাটার্ন বিশ্বের একটি গুরুত্বপূর্ণ পরিবর্তন দ্বারা সৃষ্ট হতে পারে, অথবা এটা ড্রিফ্ট কিছু ফর্ম দ্বারা হতে পারে।
ড্রিফট-জনসংখ্যা প্রবাহের প্রথম উত্স- এই সিস্টেমটি ব্যবহার করে এমন পরিবর্তনগুলির কারণে হয়, এবং এই পরিবর্তনের ফলে ক্ষুদ্র ও দীর্ঘমেয়াদী উভয় ক্ষেত্রেই ঘটতে পারে। উদাহরণস্বরূপ, ২01২ সালের মার্কিন রাষ্ট্রপতি নির্বাচনের সময় মহিলাদের দ্বারা লিখিত রাজনীতি সম্পর্কে টুইটগুলির অনুপাত দিনে দিনে (Diaz et al. 2016) পরিবর্তিত হয়। এইভাবে, টুইটার-শ্লোকের মেজাজে পরিবর্তন হতে পারে কি হতে পারে প্রকৃতপক্ষে কোনও মুহুর্তে কথা বলা ব্যক্তিদের মধ্যে একটি পরিবর্তন হতে পারে। এই স্বল্পমেয়াদী অস্থিরতাগুলি ছাড়াও, কিছু সংখ্যক ডেমোগ্রাফিক গ্রুপের দীর্ঘমেয়াদী প্রবণতা রয়েছে যা টুইটারকে ত্যাগ ও ত্যাগ করে।
একটি সিস্টেম ব্যবহার করা হয় যারা পরিবর্তন ছাড়াও, সিস্টেম ব্যবহার করা হয় কিভাবে পরিবর্তন হয়, আমি আচরণগত ড্রিফট কল যা। উদাহরণস্বরূপ, ২013 সালের অক্টোবরে জিজিয়ী তুর্কি বিক্ষোভের সময় বিক্ষোভকারীরা হ্যাশট্যাগ ব্যবহারের পরিবর্তে প্রতিবাদ রুপান্তরিত করে। এখানে কিভাবে Zeynep Tufekci (2014) আচরণগত ড্রিফট বর্ণিত, তিনি টুইটার এবং ব্যক্তির উপর আচরণ পর্যবেক্ষণ ছিল কারণ তিনি সনাক্ত করতে সক্ষম হয় যা:
"যা ঘটেছে তা ছিল যে, প্রতিবাদটি প্রভাবশালী কাহিনী হয়ে উঠেছিল, যতোই সংখ্যালঘু মানুষ ... হ্যাশট্যাগ ব্যবহার বন্ধ করে নতুন প্রজন্মের মনোযোগ আকর্ষণ করার ছাড়া ... যখন বিক্ষোভ অব্যাহত এবং এমনকি তীব্রতর হয়, হ্যাশট্যাগ মারা যায়। সাক্ষাত্কার এই জন্য দুটি কারণ প্রকাশ। প্রথমত, একবার সব বিষয় জানত, হ্যাশট্যাগ অক্ষর-সীমিত টুইটার প্ল্যাটফর্মে একসময় অত্যধিক এবং অপ্রত্যাশিত ছিল। দ্বিতীয়ত, হ্যাশট্যাগগুলি শুধুমাত্র একটি নির্দিষ্ট বিষয়ের দিকে মনোযোগ আকর্ষণের জন্য উপযোগী ছিল, এটি সম্পর্কে কথা বলার জন্য নয়। "
সুতরাং, গবেষক প্রতিবাদ সংক্রান্ত হ্যাশট্যাগ দিয়ে টুইট বিশ্লেষণ করে বিক্ষোভ অধ্যয়নরত ছিল কি এই আচরণগত ড্রিফট কারণে ঘটছে ছিল একটি বিকৃত অর্থে হবে. উদাহরণস্বরূপ, তারা বিশ্বাস করতে পারে যে প্রতিবাদের আলোচনা দীর্ঘ কমে আগে আসলে এটি কমে.
ড্রিফট তৃতীয় ধরনের সিস্টেম ড্রিফ্ট হয়। এই ক্ষেত্রে, এটা মানুষ পরিবর্তন বা তাদের আচরণ পরিবর্তন হয় না, কিন্তু সিস্টেম নিজেই পরিবর্তন। উদাহরণস্বরূপ, সময়ের সাথে ফেসবুকে স্ট্যাটাস আপডেটগুলির দৈর্ঘ্য বাড়িয়েছে। সুতরাং, অবস্থা আপডেটের কোন অনুদৈর্ঘ্য অধ্যয়ন এই পরিবর্তন দ্বারা সৃষ্ট শিল্পকর্মের জন্য ঝুঁকিপূর্ণ হবে। সিস্টেম ড্রিফট ঘনিষ্ঠভাবে অ্যালগরিডমিক বিভক্তকরণের একটি সমস্যা সম্পর্কিত, যা আমি অধ্যায় 2.3.8 এ আবরণ করব।
উপসংহারে, অনেক বড় তথ্য উত্সগুলি তাদের ব্যবহার, কিভাবে সেগুলি ব্যবহার করা হয়, এবং কিভাবে সিস্টেমগুলি কাজ করে সেগুলির মধ্যে পরিবর্তনের কারণে ভেসে যাচ্ছে। পরিবর্তনের এই উত্সগুলি কখনও কখনও আকর্ষণীয় গবেষণা প্রশ্ন করা হয়, কিন্তু এই পরিবর্তনগুলি সময়ের সাথে দীর্ঘমেয়াদি পরিবর্তনগুলি ট্র্যাক করতে বড় ডেটা উত্সের ক্ষমতা জাগিয়ে তোলে।