ਵੱਡੇ ਡੇਟਾ ਸ੍ਰੋਤਾਂ ਹਰ ਜਗ੍ਹਾ ਹਨ, ਪਰ ਉਹਨਾਂ ਨੂੰ ਸਮਾਜਿਕ ਖੋਜ ਲਈ ਵਰਤਣਾ ਔਖਾ ਹੋ ਸਕਦਾ ਹੈ. ਮੇਰੇ ਤਜਰਬੇ ਵਿਚ, ਡੇਟਾ ਲਈ ਕੁਝ "ਮੁਫ਼ਤ ਲੰਗਰ" ਨਿਯਮ ਦੀ ਕੋਈ ਚੀਜ਼ ਹੈ: ਜੇ ਤੁਸੀਂ ਇਸ ਨੂੰ ਇਕੱਠੇ ਕਰਨ ਲਈ ਬਹੁਤ ਸਾਰਾ ਕੰਮ ਨਹੀਂ ਕਰਦੇ ਹੋ, ਤਾਂ ਸੰਭਵ ਹੈ ਕਿ ਤੁਸੀਂ ਇਸ ਬਾਰੇ ਬਹੁਤ ਸਾਰਾ ਕੰਮ ਸੋਚਦੇ ਹੋ ਅਤੇ ਇਸਦਾ ਵਿਸ਼ਲੇਸ਼ਣ
ਅੱਜ ਦੇ ਵੱਡੇ ਸਰੋਤਾਂ ਅਤੇ ਕੱਲ੍ਹ ਦੀ ਸੰਭਾਵਨਾ ਦੇ 10 ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ ਇਹਨਾਂ ਵਿੱਚੋਂ ਤਿੰਨ ਆਮ ਤੌਰ 'ਤੇ (ਪਰ ਹਮੇਸ਼ਾ ਨਹੀਂ) ਖੋਜ ਲਈ ਉਪਯੋਗੀ ਹੁੰਦੇ ਹਨ: ਵੱਡੇ, ਹਮੇਸ਼ਾਂ-ਤੇ, ਅਤੇ ਗੈਰ-ਸਰਗਰਮ ਸੱਤ ਆਮ ਤੌਰ 'ਤੇ (ਪਰ ਹਮੇਸ਼ਾ ਨਹੀਂ) ਖੋਜ ਲਈ ਸਮੱਸਿਆਵਾਂ ਹਨ: ਅਧੂਰਾ, ਨਾ-ਪਹੁੰਚਣ ਯੋਗ, ਨਿਰਪੱਖ, ਡ੍ਰਾਈਪਿੰਗ, ਅਲਗੋਰਿਥਮਿਕ ਤੌਰ ਤੇ ਸ਼ਰਮਿੰਦਾ, ਗੰਦੇ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ. ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਬਹੁਤ ਸਾਰੇ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਆਖਿਰਕਾਰ ਪੈਦਾ ਹੁੰਦੀਆਂ ਹਨ ਕਿਉਂਕਿ ਸਮਾਜਿਕ ਖੋਜ ਦੇ ਉਦੇਸ਼ ਲਈ ਵੱਡੇ ਸੰਦਰਭ ਨਹੀਂ ਬਣਾਏ ਗਏ ਸਨ.
ਇਸ ਚੈਪਟਰ ਵਿਚਲੇ ਵਿਚਾਰਾਂ ਦੇ ਆਧਾਰ ਤੇ, ਮੈਂ ਸਮਝਦਾ ਹਾਂ ਕਿ ਸਮਾਜਿਕ ਖੋਜ ਲਈ ਤਿੰਨ ਮਹੱਤਵਪੂਰਨ ਤਰੀਕੇ ਹਨ ਜੋ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਦੀ ਜ਼ਿਆਦਾ ਕੀਮਤੀ ਹੋਣਗੇ. ਪਹਿਲਾ, ਉਹ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਪ੍ਰਤੀਯੋਗੀ ਸਿਧਾਂਤਕ ਭਵਿੱਖਬਾਣੀਆਂ ਵਿੱਚ ਫੈਸਲਾ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾ ਸਕਦੇ ਹਨ. ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਕੰਮ ਦੇ ਉਦਾਹਰਣਾਂ ਵਿੱਚ Farber (2015) (ਨਿਊ ਯਾਰਕ ਟੈਕਸੀ ਡ੍ਰਾਇਵਰ) ਅਤੇ King, Pan, and Roberts (2013) (ਚੀਨ ਵਿੱਚ ਸੇਂਸਸਰਸ਼ਿਪ) ਸ਼ਾਮਲ ਹਨ. ਦੂਜਾ, ਵੱਡੀਆਂ ਡਾਟਾ ਸ੍ਰੋਤ, ਵਰਤਮਾਨ ਸਮੇਂ ਦੇ ਸਮੇਂ ਤੋਂ ਨੀਤੀ ਲਈ ਸੁਧਾਰੀ ਮਾਪ ਨੂੰ ਸਮਰੱਥ ਬਣਾ ਸਕਦੇ ਹਨ. ਇਸ ਕਿਸਮ ਦੀ ਕੰਮ ਦਾ ਇੱਕ ਉਦਾਹਰਣ Ginsberg et al. (2009) (ਗੂਗਲ ਫਲੋ ਰੁਝਾਨ) ਅੰਤ ਵਿੱਚ, ਵੱਡੇ ਡੇਟਾ ਸ੍ਰੋਤ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਪ੍ਰਯੋਗਾਂ ਦੇ ਬਗੈਰ ਕਾਰਜਕੁਸ਼ਲ ਅਨੁਮਾਨ ਲਗਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ. ਇਸ ਕਿਸਮ ਦੇ ਕੰਮ ਦੇ ਉਦਾਹਰਣ Mas and Moretti (2009) (ਉਤਪਾਦਕਤਾ 'ਤੇ ਪੀਅਰ ਪ੍ਰਭਾਵ) ਅਤੇ Einav et al. (2015) (ਈਬੇ ਤੇ ਨੀਲਾਮੀ 'ਤੇ ਕੀਮਤ ਸ਼ੁਰੂ ਕਰਨ ਦਾ ਪ੍ਰਭਾਵ) ਹਾਲਾਂਕਿ ਇਹਨਾਂ ਵਿਚੋਂ ਹਰੇਕ ਪਹੁੰਚ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਬਹੁਤ ਸਾਰਾ ਡਾਟਾ ਲਿਆਉਣ ਲਈ ਲੋੜੀਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਅੰਕਾਂ ਦੀ ਪਰਿਭਾਸ਼ਾ, ਜਾਂ ਅੰਦਾਜ਼ਾ ਲਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਦੋ ਗੱਲਾਂ, ਜੋ ਮੁਕਾਬਲੇ ਦੀਆਂ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰਦੀਆਂ ਹਨ. ਇਸ ਲਈ, ਮੈਂ ਸੋਚਦਾ ਹਾਂ ਕਿ ਵੱਡੇ ਪੱਧਰ ਦੇ ਸਰੋਤ ਕੀ ਕਰ ਸਕਦੇ ਹਨ, ਇਸ ਬਾਰੇ ਸੋਚਣ ਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਉਹ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਦਿਲਚਸਪ ਅਤੇ ਅਹਿਮ ਸਵਾਲ ਪੁੱਛ ਸਕਦਾ ਹੈ.
ਸਮਾਪਤੀ ਤੋਂ ਪਹਿਲਾਂ, ਮੈਂ ਸੋਚਦਾ ਹਾਂ ਕਿ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਦਾ ਡਾਟਾ ਅਤੇ ਥਿਊਰੀ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਤੇ ਮਹੱਤਵਪੂਰਣ ਪ੍ਰਭਾਵ ਹੋ ਸਕਦਾ ਹੈ. ਹੁਣ ਤੱਕ, ਇਸ ਕਾਂਡ ਵਿੱਚ ਥਿਊਰੀ-ਡ੍ਰੈਨਡ ਇਮਪਾਰੀਕਲ ਰਿਸਰਚ ਦੀ ਪਹੁੰਚ ਹੈ. ਪਰ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਥਿਉਰਾਈਜਿੰਗ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਰੱਖਦੇ ਹਨ. ਅਰਥਾਤ, ਅਨੁਭਵੀ ਤੱਥਾਂ, ਨਮੂਨਿਆਂ ਅਤੇ ਬੁਝਾਰਤਾਂ ਦੇ ਧਿਆਨ ਨਾਲ ਇਕੱਤਰ ਕਰਨ ਦੁਆਰਾ ਖੋਜਕਰਤਾ ਨਵੇਂ ਸਿਧਾਂਤ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ. ਇਹ ਬਦਲ, ਥਿਊਰੀ ਲਈ ਡਾਟਾ-ਪਹਿਲੀ ਪਹੁੰਚ ਨਵੇਂ ਨਹੀਂ ਹੈ, ਅਤੇ ਇਹ ਬੰਬੇ ਥਿਊਰੀ ਲਈ ਆਪਣੇ ਕਾਲ ਦੇ ਨਾਲ ਬਾਰਨੀ ਗਲੇਸਰ ਅਤੇ ਐਨਸੈਲਮ ਸਟ੍ਰਾਸ (1967) ਦੁਆਰਾ ਸਭ ਤੋਂ ਜ਼ਬਰਦਸਤ ਢੰਗ ਨਾਲ ਸੰਕੇਤ ਹੈ . ਹਾਲਾਂਕਿ, ਇਹ ਡੇਟਾ-ਪਹਿਲੀ ਪਹੁੰਚ, "ਸਿਧਾਂਤ ਦਾ ਅੰਤ" ਨਹੀਂ ਦਰਸਾਉਂਦਾ, ਜਿਵੇਂ ਕਿ ਡਿਜੀਟਲ ਯੁੱਗ (Anderson 2008) ਵਿੱਚ ਖੋਜ ਦੇ ਕੁਝ ਪੱਤਰਕਾਰੀ ਵਿੱਚ ਦਾਅਵਾ ਕੀਤਾ ਗਿਆ ਹੈ. ਇਸ ਦੀ ਬਜਾਏ, ਡਾਟਾ ਮਾਹੌਲ ਬਦਲਣ ਦੇ ਰੂਪ ਵਿੱਚ, ਸਾਨੂੰ ਡਾਟਾ ਅਤੇ ਥਿਊਰੀ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਵਿੱਚ ਇੱਕ ਮੁੜ-ਸੰਤੁਲਨ ਦੀ ਆਸ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ. ਅਜਿਹੀ ਸੰਸਾਰ ਵਿਚ ਜਿੱਥੇ ਡਾਟਾ ਇਕੱਤਰ ਕਰਨਾ ਮਹਿੰਗਾ ਸੀ, ਇਸ ਨੂੰ ਸਿਰਫ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਦਾ ਅਹਿਸਾਸ ਹੋਇਆ ਜਿਸਦਾ ਸਿੱਧ ਹੋਇਆ ਕਿ ਸਿਧਾਂਤ ਸਭ ਤੋਂ ਲਾਭਦਾਇਕ ਹੋਵੇਗਾ. ਪਰ, ਅਜਿਹੇ ਸੰਸਾਰ ਵਿੱਚ ਜਿੱਥੇ ਬਹੁਤ ਸਾਰੇ ਮਾਤਰਾ ਵਿੱਚ ਡੇਟਾ ਮੁਫ਼ਤ ਵਿੱਚ ਉਪਲਬਧ ਹਨ, ਇਹ ਇੱਕ ਡਾਟਾ-ਪਹਿਲੀ ਪਹੁੰਚ (Goldberg 2015) ਵੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਦਾ ਮਤਲਬ ਬਣਦਾ ਹੈ.
ਜਿਵੇਂ ਮੈਂ ਇਸ ਅਧਿਆਇ ਵਿਚ ਦਿਖਾਇਆ ਹੈ, ਖੋਜਕਰਤਾ ਲੋਕਾਂ ਨੂੰ ਦੇਖ ਕੇ ਬਹੁਤ ਕੁਝ ਸਿੱਖ ਸਕਦੇ ਹਨ ਅਗਲੇ ਤਿੰਨ ਅਧਿਆਇਆਂ ਵਿੱਚ, ਮੈਂ ਦੱਸਾਂਗਾ ਕਿ ਅਸੀਂ ਹੋਰ ਜਿਆਦਾ ਵੱਖਰੀਆਂ ਚੀਜਾਂ ਕਿਵੇਂ ਸਿੱਖ ਸਕਦੇ ਹਾਂ ਜੇਕਰ ਅਸੀਂ ਸਾਡੇ ਡੇਟਾ ਨੂੰ ਸੰਗ੍ਰਿਹ ਕਰਾਂਗੇ ਅਤੇ ਲੋਕਾਂ ਨਾਲ ਉਹਨਾਂ ਨਾਲ ਪ੍ਰਸ਼ਨ ਪੁੱਛ ਕੇ ਹੋਰ ਪ੍ਰਭਾਵਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਾਂਗੇ (ਅਧਿਆਇ 3), ਚਲ ਰਹੇ ਪ੍ਰਯੋਗਾਂ (ਅਧਿਆਇ 4) ਖੋਜ ਪ੍ਰਕਿਰਿਆ ਵਿਚ ਸਿੱਧੇ (ਅਧਿਆਇ 5).