ਗੈਰ-representativeness ਦੇ ਦੋ ਸਰੋਤ ਵੱਖ-ਵੱਖ ਆਬਾਦੀ ਅਤੇ ਵੱਖ-ਵੱਖ ਉਪਯੋਗ ਪੈਟਰਨ ਹਨ.
ਵੱਡੇ ਡਾਟਾ ਯੋਜਨਾਬੱਧ ਦੇ ਦੋ ਮੁੱਖ ਤਰੀਕੇ ਵਿੱਚ ਪੱਖਪਾਤੀ ਕੀਤਾ ਜਾ ਕਰਨ ਲਈ ਹੁੰਦੇ ਹਨ. ਇਹ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਸਾਰੇ ਕਿਸਮ ਦੇ ਲਈ ਇੱਕ ਸਮੱਸਿਆ ਦਾ ਕਾਰਨ ਬਣ ਨਾ ਲੋੜ ਹੈ, ਪਰ ਇਹ ਕੁਝ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਲਈ ਇਸ ਨੂੰ ਇੱਕ ਨਾਜ਼ੁਕ ਫਲਾਅ ਹੋ ਸਕਦਾ ਹੈ.
ਤਰਤੀਬਵਾਰ ਪੱਖਪਾਤ ਦੀ ਪਹਿਲੀ ਸਰੋਤ ਹੈ, ਜੋ ਕਿ ਲੋਕ ਕਬਜ਼ਾ ਆਮ ਤੌਰ ਤੇ ਨਾ ਹੀ ਸਾਰੇ ਲੋਕ ਇੱਕ ਪੂਰਨ ਬ੍ਰਹਿਮੰਡ ਜ ਕੋਈ ਵੀ ਖਾਸ ਆਬਾਦੀ ਤੱਕ ਇੱਕ ਲਗਾਤਾਰ ਨਮੂਨਾ ਹੈ. ਮਿਸਾਲ ਲਈ, ਟਵਿੱਟਰ 'ਤੇ ਅਮਰੀਕਨ ਅਮਰੀਕਨ ਦੀ ਇੱਕ ਬੇਤਰਤੀਬੇ ਨਮੂਨਾ ਨਹੀ ਹਨ (Hargittai 2015) . ਤਰਤੀਬਵਾਰ ਪੱਖਪਾਤ ਦੀ ਇੱਕ ਦੂਜਾ ਸਰੋਤ ਹੈ, ਜੋ ਕਿ ਬਹੁਤ ਸਾਰੇ ਵੱਡੇ ਡਾਟਾ ਸਿਸਟਮ ਕਾਰਵਾਈ ਨੂੰ ਹਾਸਲ ਹੈ, ਅਤੇ ਕੁਝ ਲੋਕ ਹੋਰ ਵੱਧ ਹੋਰ ਬਹੁਤ ਸਾਰੇ ਕਾਰਵਾਈ ਦਾ ਯੋਗਦਾਨ. ਮਿਸਾਲ ਲਈ, ਟਵਿੱਟਰ 'ਤੇ ਕੁਝ ਲੋਕ ਹੋਰ ਵੱਧ ਗੁਣਾ ਵੱਧ ਟਵੀਟ ਦੇ ਅਣਗਿਣਤ ਦਾ ਯੋਗਦਾਨ. ਇਸ ਲਈ, ਇੱਕ ਖਾਸ ਪਲੇਟਫਾਰਮ 'ਤੇ ਸਮਾਗਮ ਪਲੇਟਫਾਰਮ ਨੂੰ ਆਪਣੇ ਆਪ ਨੂੰ ਵੱਧ ਕੁਝ subgroups ਦੇ ਹੋਰ ਵੀ ਭਾਰੀ ਵਿਚਾਰਤਮਕ ਹੋ ਸਕਦਾ ਹੈ.
ਆਮ ਤੌਰ 'ਤੇ ਖੋਜਕਾਰ ਡਾਟਾ ਹੈ ਕਿ ਉਹ ਇਸ ਬਾਰੇ ਇੱਕ ਬਹੁਤ ਕੁਝ ਜਾਣਨਾ ਚਾਹੁੰਦੇ ਹਨ. ਪਰ, ਵੱਡੇ ਡਾਟਾ ਦੇ ਗੈਰ-ਪ੍ਰਤੀਨਿਧ ਨਾਲ ਕੁਦਰਤ ਦੇ ਦਿੱਤੀ ਹੈ, ਇਸ ਨੂੰ ਮਦਦਗਾਰ ਨੂੰ ਵੀ ਆਪਣੀ ਸੋਚ ਬਦਲਣ ਲਈ ਹੈ. ਤੁਹਾਨੂੰ ਇਹ ਵੀ ਡਾਟਾ ਤੁਹਾਡੇ ਕੋਲ, ਨਾ ਭੁੱਲੋ ਕਿ ਬਾਰੇ ਬਹੁਤ ਪਤਾ ਕਰਨ ਦੀ ਲੋੜ ਹੈ. ਇਹ ਖਾਸ ਕਰਕੇ ਸੱਚ ਹੈ, ਜਦ ਕਿ ਡਾਟਾ ਤੁਹਾਡੇ ਕੋਲ, ਨਾ ਭੁੱਲੋ ਕਿ ਡਾਟਾ ਤੁਹਾਡੇ ਕੋਲ ਹੈ, ਜੋ ਕਿ ਤੱਕ ਯੋਜਨਾਬੱਧ ਵੱਖ-ਵੱਖ ਹੁੰਦੇ ਹਨ. ਉਦਾਹਰਨ ਲਈ, ਜੇਕਰ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਵਿਕਾਸਸ਼ੀਲ ਦੇਸ਼ ਵਿਚ ਇਕ ਮੋਬਾਈਲ ਫੋਨ ਕੰਪਨੀ ਕਾਲ ਦੇ ਰਿਕਾਰਡ ਹੈ, ਤੁਹਾਨੂੰ ਸੋਚਣਾ ਚਾਹੀਦਾ ਹੈ ਨਾ ਕਿ ਕੇਵਲ, ਪਰ ਇਹ ਵੀ ਲੋਕ ਹਨ ਜੋ ਬਹੁਤ ਇੱਕ ਮੋਬਾਈਲ ਫੋਨ ਦੇ ਮਾਲਕ ਨੂੰ ਗਰੀਬ ਹੋ ਸਕਦਾ ਹੈ, ਬਾਰੇ ਆਪਣੇ dataset ਵਿੱਚ ਲੋਕ ਦੇ ਬਾਰੇ. ਅੱਗੇ, ਅਧਿਆਇ 3 ਵਿਚ, ਸਾਨੂੰ ਮੱਧਮਾਨ ਨੂੰ ਖੋਜਕਾਰ ਗੈਰ-ਪ੍ਰਤੀਨਿਧ ਨਾਲ ਡਾਟਾ ਤੱਕ ਬਿਹਤਰ ਅਨੁਮਾਨ ਕਰਨ ਲਈ ਯੋਗ ਕਰ ਸਕਦੇ ਹੋ, ਬਾਰੇ ਸਿੱਖ ਸਕੋਗੇ.