2.3.7

ਜਨਸੰਖਿਆ ਡ੍ਰਫਸਟ, ਵਰਤੋਂ ਡ੍ਰਾਇਪ ਅਤੇ ਸਿਸਟਮ ਡ੍ਰਾਇਵਿੰਗ ਲੰਬੇ ਸਮੇਂ ਦੇ ਰੁਝਾਨਾਂ ਦਾ ਅਧਿਐਨ ਕਰਨ ਲਈ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਨੂੰ ਮੁਸ਼ਕਲ ਬਣਾਉਂਦੇ ਹਨ

ਬਹੁਤ ਸਾਰੇ ਵੱਡੇ ਸਰੋਤਾਂ ਦੇ ਬਹੁਤ ਫਾਇਦੇ ਇਹ ਹਨ ਕਿ ਉਹ ਸਮੇਂ ਨਾਲ ਡਾਟਾ ਇਕੱਠਾ ਕਰਦੇ ਹਨ ਸਮਾਜਿਕ ਵਿਗਿਆਨੀ ਇਸ ਕਿਸਮ ਦੇ ਓਵਰ-ਟਾਈਮ ਡਾਟਾ ਲੰਮੀ ਡੇਟਾ ਨੂੰ ਕਹਿੰਦੇ ਹਨ . ਅਤੇ, ਕੁਦਰਤੀ ਤੌਰ ਤੇ, ਪਰਿਵਰਤਨ ਦੇ ਅਧਿਐਨ ਲਈ ਲੰਮੀ ਡੇਟਾ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦੇ ਹਨ. ਬਦਲਾਵ ਨੂੰ ਭਰੋਸੇਮੰਦ ਕਰਨ ਲਈ, ਹਾਲਾਂਕਿ, ਮਾਪ ਸਿਸਟਮ ਵੀ ਖੁਦ ਸਥਿਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ. ਸਮਾਜਵਾਦੀ ਵਿਗਿਆਨੀ Otis Dudley ਡੰਕਨ ਦੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, "ਜੇਕਰ ਤੁਸੀਂ ਤਬਦੀਲੀ ਨੂੰ ਮਾਪਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਮਾਪ ਨੂੰ ਨਾ ਬਦਲੋ" (Fischer 2011) .

ਬਦਕਿਸਮਤੀ ਨਾਲ, ਬਹੁਤ ਸਾਰੀਆਂ ਵੱਡੀਆਂ ਡੈਟਾ ਪ੍ਰਣਾਲੀਆਂ-ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਕਾਰੋਬਾਰੀ ਪ੍ਰਣਾਲੀਆਂ-ਹਰ ਵੇਲੇ ਬਦਲ ਰਹੀਆਂ ਹਨ, ਇਕ ਪ੍ਰਕਿਰਿਆ ਜਿਸ ਨੂੰ ਮੈਂ ਡ੍ਰਾਈਫਟ ਕਾਲ ਕਰਾਂਗਾ. ਵਿਸ਼ੇਸ਼ ਤੌਰ ਤੇ, ਇਹ ਪ੍ਰਣਾਲੀਆਂ ਤਿੰਨ ਮੁੱਖ ਤਰੀਕਿਆਂ ਵਿਚ ਬਦਲਦੀਆਂ ਹਨ: ਜਨਸੰਖਿਆ ਦਾ ਵਹਾਇਆ (ਜੋ ਵਰਤ ਰਿਹਾ ਹੈ ਵਿੱਚ ਬਦਲਾਓ), ਵਿਵਹਾਰਿਕ ਤਣਾਓ (ਕਿਵੇਂ ਲੋਕ ਉਸ ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਹਨ), ਅਤੇ ਸਿਸਟਮ ਪ੍ਰਣਾਲੀ (ਪ੍ਰਣਾਲੀ ਵਿੱਚ ਤਬਦੀਲੀ) ਵਹਿੰਦਾ ਕਰਨ ਦੇ ਤਿੰਨ ਸਰੋਤ ਦਾ ਮਤਲੱਬ ਹੈ ਕਿ ਇੱਕ ਵੱਡੇ ਡੇਟਾ ਸ੍ਰੋਤ ਵਿੱਚ ਕੋਈ ਪੈਟਰਨ ਸੰਸਾਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਣ ਤਬਦੀਲੀ ਦੇ ਕਾਰਨ ਹੋ ਸਕਦਾ ਹੈ, ਜਾਂ ਇਹ ਕਿਸੇ ਨਵੇਂ ਰੂਪ ਦੇ ਕਾਰਨ ਹੋ ਸਕਦਾ ਹੈ.

ਡ੍ਰਫਸਟ ਜਨਸੰਖਿਆ ਦੇ ਪਹਿਲੇ ਸਰੋਤ ਦਾ ਪ੍ਰਵਾਹ ਜੋ ਸਿਸਟਮ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ, ਵਿੱਚ ਤਬਦੀਲੀਆਂ ਕਾਰਨ ਹੁੰਦਾ ਹੈ ਅਤੇ ਇਹ ਬਦਲਾਵ ਛੋਟੇ ਅਤੇ ਲੰਬੇ ਸਮਾਂ-ਸਾਰਣੀਆਂ ਦੋਵਾਂ ਵਿੱਚ ਹੋ ਸਕਦਾ ਹੈ. ਉਦਾਹਰਣ ਵਜੋਂ, ਅਮਰੀਕਾ ਦੇ 2012 ਦੇ ਰਾਸ਼ਟਰਪਤੀ ਚੋਣ ਦੌਰਾਨ ਰਾਜਨੀਤੀ ਬਾਰੇ ਟਵੀਟਰਾਂ ਦਾ ਅਨੁਪਾਤ ਜੋ ਕਿ ਔਰਤਾਂ ਦੁਆਰਾ ਲਿਖੇ ਗਏ ਸਨ, ਦਿਨ ਪ੍ਰਤੀ ਦਿਨ (Diaz et al. 2016) ਬਦਲਦੇ ਰਹਿੰਦੇ ਸਨ. ਇਸ ਤਰ੍ਹਾਂ, ਟਵੀਟਰ-ਕਾਵਿ ਦੇ ਮੂਡ ਵਿਚ ਇਕ ਤਬਦੀਲੀ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਸ਼ਾਇਦ ਅਸਲ ਵਿਚ ਕਿਸੇ ਵੀ ਪਲ 'ਤੇ ਕੌਣ ਗੱਲ ਕਰ ਰਿਹਾ ਹੈ,' ਚ ਬਦਲਾਅ ਹੋ ਸਕਦਾ ਹੈ. ਇਹਨਾਂ ਛੋਟੇ-ਮਿਆਦ ਦੇ ਉਤਰਾਅ-ਚੜਾਅ ਦੇ ਇਲਾਵਾ, ਟਵਿੱਟਰ ਨੂੰ ਅਪਣਾਉਣ ਅਤੇ ਛੱਡਣ ਵਾਲੇ ਕੁਝ ਜਨਸੰਖਿਆ ਸਮੂਹਾਂ ਦੀ ਇੱਕ ਲੰਮੀ-ਮਿਆਦ ਦੀ ਰੁਚੀ ਵੀ ਹੈ.

ਇੱਕ ਸਿਸਟਮ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੇ ਬਦਲਾਵਾਂ ਤੋਂ ਇਲਾਵਾ, ਸਿਸਟਮ ਵਿੱਚ ਵਰਤੀ ਜਾਣ ਵਾਲੀ ਤਬਦੀਲੀ ਵਿੱਚ ਵੀ ਬਦਲਾਅ ਆਇਆ ਹੈ, ਜਿਸ ਨਾਲ ਮੈਂ ਵਿਵਹਾਰਿਕ ਵਹਿੰਦਾ ਹਾਂ. ਉਦਾਹਰਨ ਲਈ, ਟਰਕੀ ਵਿੱਚ 2013 ਓਕੂਵਿ ਜਿਓਜੀ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੌਰਾਨ, ਪ੍ਰਦਰਸ਼ਨਕਾਰੀਆਂ ਨੇ ਹੈਸ਼ਟੈਗਾਂ ਦੀ ਵਰਤੋਂ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਕਿਉਂਕਿ ਰੋਸ ਪ੍ਰਗਟਾਵਾ ਹੋਇਆ ਸੀ. ਜ਼ੇਨਏਪ ਟੂਫਕੀ (2014) ਨੇ ਵਰਤਾਓ ਦੀ ਲਹਿਰ ਦਾ ਵਰਣਨ ਕਿਸ ਤਰ੍ਹਾਂ ਕੀਤਾ ਹੈ, ਜਿਸ ਨੂੰ ਉਹ ਪਤਾ ਕਰਨ ਦੇ ਯੋਗ ਸੀ ਕਿਉਂਕਿ ਉਹ ਟਵਿੱਟਰ ਅਤੇ ਵਿਅਕਤੀਗਤ ਰੂਪ ਵਿਚ ਵਿਹਾਰ ਦੇਖ ਰਹੀ ਸੀ:

"ਜੋ ਕੁਝ ਵਾਪਰਿਆ ਉਹ ਇਹ ਸੀ ਕਿ ਜਿਵੇਂ ਹੀ ਰੋਸ ਪ੍ਰਗਟਾਉਣ ਵਾਲੀ ਇਕ ਮਹੱਤਵਪੂਰਣ ਕਹਾਣੀ ਬਣ ਗਈ, ਵੱਡੀ ਗਿਣਤੀ ਵਿੱਚ ਲੋਕਾਂ ਨੇ ... ਇੱਕ ਨਵੀਂ ਘਟਨਾ ਵੱਲ ਧਿਆਨ ਖਿੱਚਣ ਤੋਂ ਬਿਨਾਂ ਹੈਟਟੈਗ ਦੀ ਵਰਤੋਂ ਬੰਦ ਕਰ ਦਿੱਤੀ ... ਜਦੋਂ ਕਿ ਰੋਸ ਪ੍ਰਦਰਸ਼ਨ ਜਾਰੀ ਰਿਹਾ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੇਜ਼ ਹੋ ਗਿਆ, ਹੈਸ਼ਟਗੇਸ ਦੀ ਮੌਤ ਹੋ ਗਈ. ਇੰਟਰਵਿਊਜ਼ ਨੇ ਇਸਦੇ ਦੋ ਕਾਰਨ ਦੱਸੇ. ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਇਕ ਵਾਰ ਹਰ ਕੋਈ ਇਸ ਵਿਸ਼ੇ ਬਾਰੇ ਜਾਣਦਾ ਸੀ, ਹੈਸ਼ਟੈਗ ਇੱਕ ਵਾਰ ਅਨਾਜਦਾਰ ਸੀ ਅਤੇ ਅੱਖਰ-ਸੀਮਤ ਟਵਿੱਟਰ ਪਲੇਟਫਾਰਮ ਤੇ ਫਜ਼ੂਲ ਸੀ. ਦੂਜਾ, ਹੈਸ਼ਟੈਗ ਇੱਕ ਖਾਸ ਵਿਸ਼ੇ ਵੱਲ ਧਿਆਨ ਖਿੱਚਣ ਲਈ ਸਿਰਫ ਉਪਯੋਗੀ ਹੀ ਦਿਖਾਈ ਦਿੱਤਾ ਗਿਆ ਸੀ, ਨਾ ਕਿ ਇਸ ਬਾਰੇ ਗੱਲ ਕਰਨ ਲਈ. "

ਇਸ ਲਈ, ਖੋਜਕਾਰ, ਜੋ ਰੋਸ-ਸਬੰਧਤ hashtags ਨਾਲ ਟਵੀਟ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਕੇ ਰੋਸ ਦਾ ਅਧਿਐਨ ਕੀਤਾ ਗਿਆ ਸੀ ਕਿ ਕੀ ਇਸ ਵਤੀਰੇ ਰੁਖ਼ ਦੇ ਕਾਰਨ ਹੋ ਰਿਹਾ ਸੀ ਦੇ ਇੱਕ ਗ਼ਲਤ ਭਾਵਨਾ ਹੈ ਸੀ. ਮਿਸਾਲ ਲਈ, ਉਹ ਵਿਸ਼ਵਾਸ ਹੋ ਸਕਦਾ ਹੈ, ਜੋ ਕਿ ਰੋਸ ਦੀ ਚਰਚਾ ਲੰਬੇ ਘੱਟ ਅੱਗੇ ਇਸ ਨੂੰ ਅਸਲ ਵਿੱਚ ਘੱਟ.

ਤੀਸਰੀ ਤਰਹ ਦੀ ਪ੍ਰਵਾਹ ਪ੍ਰਣਾਲੀ ਦੀ ਪ੍ਰਵਾਹ ਹੈ ਇਸ ਕੇਸ ਵਿੱਚ, ਇਹ ਲੋਕ ਬਦਲ ਰਹੇ ਹਨ ਜਾਂ ਉਨ੍ਹਾਂ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਬਦਲਣਾ ਨਹੀਂ ਹੈ, ਪਰ ਪ੍ਰਣਾਲੀ ਖੁਦ ਹੀ ਬਦਲ ਰਹੀ ਹੈ. ਉਦਾਹਰਣ ਵਜੋਂ, ਸਮੇਂ ਦੇ ਨਾਲ ਫੇਸਬੁੱਕ ਨੇ ਸਟੇਟਸ ਅਪਡੇਟਸ ਦੀ ਲੰਬਾਈ ਦੀ ਸੀਮਾ ਵਧਾ ਦਿੱਤੀ ਹੈ ਇਸ ਤਰ੍ਹਾਂ, ਹਾਲਤ ਬਦਲਾਆਂ ਦਾ ਕੋਈ ਲੰਮੀ ਅਧਿਐਨ ਇਸ ਬਦਲਾਅ ਦੇ ਕਾਰਨ ਬਣੀਆਂ ਚੀਜ਼ਾਂ ਦੇ ਕਮਜ਼ੋਰ ਹੋ ਜਾਵੇਗਾ. ਸਿਸਟਮ ਡ੍ਰਫਸਟ ਅਲਗੋਰਿਦਮਿਕ ਗਲਬਾਤ ਨਾਮਕ ਸਮੱਸਿਆ ਨਾਲ ਨੇੜਤਾ ਨਾਲ ਸੰਬੰਧ ਰੱਖਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਮੈਂ ਭਾਗ 2.3.8 ਵਿਚ ਸ਼ਾਮਲ ਕਰਾਂਗਾ.

ਸਿੱਟਾ ਕੱਢਣ ਲਈ, ਬਹੁਤ ਸਾਰੇ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਉਹਨਾਂ ਦੀ ਵਰਤੋ ਕਿਸ ਤਰ੍ਹਾਂ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ, ਉਹ ਕਿਵੇਂ ਵਰਤੇ ਜਾ ਰਹੇ ਹਨ, ਅਤੇ ਸਿਸਟਮ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਇਸ ਦੇ ਬਦਲਣ ਦੇ ਕਾਰਨ ਬਦਲਾਓ ਦੇ ਇਹ ਸਰੋਤ ਕਈ ਵਾਰ ਦਿਲਚਸਪ ਖੋਜ ਪ੍ਰਸ਼ਨ ਹੁੰਦੇ ਹਨ, ਪਰ ਇਹ ਬਦਲਾਵ ਸਮੇਂ ਦੇ ਨਾਲ ਲੰਮੇ ਸਮੇਂ ਦੀਆਂ ਤਬਦੀਲੀਆਂ ਨੂੰ ਟਰੈਕ ਕਰਨ ਲਈ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਗੁੰਝਲਦਾਰ ਬਣਾਉਂਦੇ ਹਨ.