ਇਸ ਅਧਿਆਇ ਵਿਚ ਸ਼ਾਮਲ ਇਕ ਕਿਸਮ ਦੀ ਨਜ਼ਰ ਵਿਚ ਨਸਲੀ-ਵਿਗਿਆਨ ਸ਼ਾਮਲ ਨਹੀਂ ਹੈ. ਡਿਜੀਟਲ ਸਪੇਸ ਵਿੱਚ ਨਸਲੀ-ਵਿਗਿਆਨ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, Boellstorff et al. (2012) ਵੇਖੋ Boellstorff et al. (2012) , ਅਤੇ ਮਿਸ਼ਰਤ ਡਿਜੀਟਲ ਅਤੇ ਸਰੀਰਕ ਥਾਂਵਾਂ ਵਿੱਚ ਨਸਲੀ-ਵਿਗਿਆਨ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ Lane (2016) .
"ਵੱਡੇ ਡੇਟਾ" ਦੀ ਕੋਈ ਇਕਸਾਰ ਸਹਿਮਤੀ ਪਰਿਭਾਸ਼ਾ ਨਹੀਂ ਹੈ, ਪਰ ਬਹੁਤ ਸਾਰੀਆਂ ਪਰਿਭਾਸ਼ਾਵਾਂ "3 ਵਿਆਂ" ਤੇ ਧਿਆਨ ਲਗਾਉਣਾ ਜਾਪਦਾ ਹੈ: ਮਾਤਰਾ, ਭਿੰਨਤਾ, ਅਤੇ ਵਿਵੇਕੀ (ਜਿਵੇਂ ਕਿ Japec et al. (2015) ). De Mauro et al. (2015) ਵੇਖੋ De Mauro et al. (2015) ਪਰਿਭਾਸ਼ਾ ਦੀ ਸਮੀਖਿਆ ਲਈ
ਵੱਡੇ ਡੇਟਾ ਦੀ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਸਰਕਾਰੀ ਪ੍ਰਸ਼ਾਸਨਿਕ ਡੇਟਾ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨਾ ਇੱਕ ਅਸਧਾਰਨ ਜਿਹਾ ਹੈ, ਹਾਲਾਂਕਿ ਕਈਆਂ ਨੇ ਇਹ ਕੇਸ ਵੀ ਬਣਾਇਆ ਹੈ, ਜਿਸ ਵਿੱਚ Legewie (2015) , Connelly et al. (2016) , ਅਤੇ Einav and Levin (2014) . ਖੋਜ ਲਈ ਸਰਕਾਰੀ ਪ੍ਰਸ਼ਾਸਕੀ ਡਾਕੂਮੈਂਟ ਦੇ ਮੁੱਲ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ, Card et al. (2010) ਦੇਖੋ Card et al. (2010) , Adminstrative Data Taskforce (2012) , ਅਤੇ Grusky, Smeeding, and Snipp (2015) .
ਸਰਕਾਰੀ ਅੰਕੜਾ ਪ੍ਰਣਾਲੀ ਦੇ ਅੰਦਰੋਂ ਪ੍ਰਸ਼ਾਸਕੀ ਖੋਜਾਂ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਲਈ, ਖਾਸ ਕਰਕੇ ਅਮਰੀਕੀ ਜਨਗਣਨਾ ਬਿਊਰੋ, Jarmin and O'Hara (2016) . ਸਟੈਟਿਕਸ ਸਵੀਡਨ ਵਿਖੇ ਪ੍ਰਸ਼ਾਸਕੀ ਰਿਕਾਰਡਾਂ ਦੀ ਖੋਜ ਦੇ ਇੱਕ ਕਿਤਾਬ ਦੇ ਲੰਬੇ ਇਲਾਜ ਲਈ, Wallgren and Wallgren (2007) .
ਅਧਿਆਇ ਵਿੱਚ, ਮੈਂ ਸੰਖੇਪ ਰੂਪ ਵਿੱਚ ਇੱਕ ਸਰਵੇਖਣ ਸਰਵੇਖਣ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਆਮ ਸੋਸ਼ਲ ਸਰਵੇ (ਜੀਐਸਐਸ) ਜਿਵੇਂ ਟਵਿੱਟਰ ਜਿਵੇਂ ਸੋਸ਼ਲ ਮੀਡੀਆ ਡੇਟਾ ਸਰੋਤ ਨਾਲ. ਰਵਾਇਤੀ ਸਰਵੇਖਣਾਂ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਡੇਟਾ ਦੇ ਵਿਚਕਾਰ ਪੂਰੀ ਅਤੇ ਧਿਆਨ ਨਾਲ ਤੁਲਨਾ ਕਰਨ ਲਈ Schober et al. (2016) ਵੇਖੋ Schober et al. (2016)
ਵੱਡੇ ਲੇਖਾਂ ਦੀਆਂ ਇਹ 10 ਲੱਛਣਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਤਰ੍ਹਾਂ ਦੇ ਵੱਖ-ਵੱਖ ਲੇਖਕਾਂ ਦੁਆਰਾ ਵੱਖ ਵੱਖ ਢੰਗਾਂ ਵਿੱਚ ਵਿਖਿਆਨ ਕੀਤਾ ਗਿਆ ਹੈ. ਇਨ੍ਹਾਂ ਮੁੱਦਿਆਂ 'ਤੇ ਮੇਰੀ ਸੋਚ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਨ ਵਾਲੀ ਲਿਖਤ ਵਿੱਚ ਸ਼ਾਮਲ ਹੈ Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) Japec et al. (2015) Horton and Tambe (2015) , Japec et al. (2015) , ਅਤੇ Goldstone and Lupyan (2016) .
ਇਸ ਅਧਿਆਇ ਦੌਰਾਨ, ਮੈਂ ਡਿਜੀਟਲ ਟਰੇਸ ਸ਼ਬਦ ਦਾ ਇਸਤੇਮਾਲ ਕੀਤਾ ਹੈ, ਜਿਸਨੂੰ ਮੈਂ ਸੋਚਦਾ ਹਾਂ ਕਿ ਨਿਰਪੱਖ ਹੈ. ਡਿਜ਼ੀਟਲ ਟਰੇਸ ਲਈ ਇਕ ਹੋਰ ਪ੍ਰਸਿੱਧ ਸ਼ਬਦ ਡਿਜੀਟਲ ਪ੍ਹੈਰਾ (Golder and Macy 2014) , ਪਰ ਜਿਵੇਂ ਹੈਲ ਅਬਲਸਨ, ਕੇਨ ਲੀਡੀਨ, ਅਤੇ ਹੈਰੀ ਲੇਵਿਸ (2008) ਕਹਿੰਦੇ ਹਨ ਕਿ ਵਧੇਰੇ ਢੁੱਕਵੀਂ ਸਮਾਂ ਸ਼ਾਇਦ ਡਿਜੀਟਲ ਫਿੰਗਰਪ੍ਰਿੰਟਸ ਹਨ . ਜਦੋਂ ਤੁਸੀਂ ਪੈਰਾਂ ਦੇ ਪ੍ਰਿੰਟਸ ਬਣਾਉਂਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਕੀ ਹੋ ਰਿਹਾ ਹੈ ਅਤੇ ਤੁਹਾਡੇ ਪੈਰਾਂ ਦੇ ਨਿਸ਼ਾਨ ਆਮ ਤੌਰ ਤੇ ਤੁਹਾਨੂੰ ਨਿੱਜੀ ਤੌਰ ਤੇ ਨਹੀਂ ਲੱਭੇ ਜਾ ਸਕਦੇ. ਇਹ ਤੁਹਾਡੇ ਡਿਜੀਟਲ ਟਰੇਸ ਲਈ ਵੀ ਸਹੀ ਨਹੀਂ ਹੈ ਵਾਸਤਵ ਵਿੱਚ, ਤੁਸੀਂ ਹਰ ਸਮੇਂ ਟਰੇਸ ਛੱਡ ਰਹੇ ਹੋ ਜਿਸ ਬਾਰੇ ਤੁਹਾਨੂੰ ਬਹੁਤ ਘੱਟ ਗਿਆਨ ਹੈ. ਅਤੇ, ਹਾਲਾਂਕਿ ਇਹ ਟਰੇਸ ਉਹਨਾਂ ਦਾ ਤੁਹਾਡਾ ਨਾਂ ਨਹੀਂ ਹੈ, ਉਹਨਾਂ ਨੂੰ ਅਕਸਰ ਤੁਹਾਨੂੰ ਵਾਪਸ ਜੋੜਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿਚ, ਉਹ ਹੋਰ ਉਂਗਲਾਂ ਦੇ ਨਿਸ਼ਾਨ ਜਿਵੇਂ: ਅਦਿੱਖ ਅਤੇ ਨਿੱਜੀ ਪਛਾਣ
ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ M. Lin, Lucas, and Shmueli (2013) ਅਤੇ McFarland and McFarland (2015) . ਇਹਨਾਂ ਮੁੱਦਿਆਂ ਨਾਲ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਅੰਕੜਾ ਮਹੱਤਤਾ ਦੀ ਬਜਾਏ ਵਿਹਾਰਿਕ ਮਹੱਤਤਾ ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ.
ਰਾਜ ਚੇਤੀ ਅਤੇ ਸਹਿਯੋਗੀਆਂ ਨੂੰ ਟੈਕਸ ਦੇ ਵੇਰਵੇ ਤਕ ਕਿਵੇਂ ਪਹੁੰਚ ਕੀਤੀ ਗਈ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ Mervis (2014) ਦੇਖੋ.
ਵੱਡੀਆਂ ਡਾਟਾਸੈਟਸ ਕੰਪੋਟੇਸ਼ਨਲ ਸਮੱਸਿਆਵਾਂ ਵੀ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਆਮ ਤੌਰ ਤੇ ਇਕੋ ਕੰਪਿਊਟਰ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਤੋਂ ਪਰੇ ਹੁੰਦੇ ਹਨ. ਇਸ ਲਈ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਵੱਡੇ ਡੈਟਾਸੈਟਾਂ ਤੇ ਗਣਨਾ ਕਰਦੇ ਹੋਏ ਅਕਸਰ ਕੰਮ ਨੂੰ ਕਈ ਕੰਪਿਊਟਰਾਂ ਉੱਤੇ ਫੈਲਾਇਆ, ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਜਿਸ ਨੂੰ ਪੈਰਲਲ ਪ੍ਰੋਗ੍ਰਾਮਿੰਗ ਵੀ ਕਿਹਾ ਜਾਂਦਾ ਹੈ . ਪਰਲੋਬਲਿੰਗ ਪ੍ਰਣਾਲੀ ਦੀ ਜਾਣ-ਪਛਾਣ ਲਈ, ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਇਕ ਭਾਸ਼ਾ ਜਿਸਨੂੰ ਹਡੂਓਪ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਦੇਖੋ Vo and Silvia (2016) .
ਹਮੇਸ਼ਾਂ-ਬਾਰੇ ਡਾਟਾ ਤੇ ਵਿਚਾਰ ਕਰਨ ਸਮੇਂ, ਇਹ ਵਿਚਾਰ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ ਤੁਸੀਂ ਸਮੇਂ ਦੇ ਨਾਲ ਨਾਲ ਉਸੇ ਵਿਅਕਤੀ ਦੀ ਤੁਲਨਾ ਕਰ ਰਹੇ ਹੋ ਜਾਂ ਤੁਸੀਂ ਕੁਝ ਬਦਲਦੇ ਸਮੂਹ ਦੀ ਤੁਲਨਾ ਕਰ ਰਹੇ ਹੋ; ਉਦਾਹਰਨ ਲਈ, Diaz et al. (2016) ਵੇਖੋ Diaz et al. (2016)
ਗੈਰ-ਕਿਰਿਆਸ਼ੀਲ ਉਪਾਅ 'ਤੇ ਇੱਕ ਕਲਾਸਿਕ ਕਿਤਾਬ Webb et al. (1966) . ਇਸ ਪੁਸਤਕ ਦੇ ਉਦਾਹਰਣ ਡਿਜੀਟਲ ਉਮਰ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਦੇ ਹਨ, ਪਰ ਉਹ ਅਜੇ ਵੀ ਰੋਸ਼ਨੀ ਕਰ ਰਹੇ ਹਨ. ਪੁੰਜ ਦੀ ਨਿਗਰਾਨੀ ਦੀ ਮੌਜੂਦਗੀ ਕਾਰਨ ਲੋਕਾਂ ਦੇ ਵਿਹਾਰਾਂ ਨੂੰ ਬਦਲਣ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਲਈ, Penney (2016) ਅਤੇ Brayne (2014) .
ਰੀਐਕਟੀਵਿਟੀ ਦਾ ਸੰਬੰਧ ਅਭਿਆਸ ਨਾਲ ਸੰਬੰਧਤ ਹੈ ਜਿਸ ਨਾਲ ਖੋਜਕਾਰਾਂ ਨੇ ਮੰਗਾਂ ਦੇ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਕਹੇ (Orne 1962; Zizzo 2010) ਅਤੇ ਹੈਵੋਂਰੋਨ ਪਰਭਾਵ (Adair 1984; Levitt and List 2011) .
ਰਿਕਾਰਡ ਲਿੰਕੇਜ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ Dunn (1946) ਅਤੇ Fellegi and Sunter (1969) (ਇਤਿਹਾਸਕ) ਅਤੇ Larsen and Winkler (2014) (ਆਧੁਨਿਕ) ਦੇਖੋ. ਕੰਪਿਊਟਰ ਦੇ ਵਿਗਿਆਨ ਵਿਚ ਵੀ ਅਜਿਹੇ ਤਰੀਕੇ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਹਨ ਜਿਵੇਂ ਕਿ ਡਾਟਾ ਡਡੂਪਲੀਕੇਸ਼ਨ, ਇਨਸਟੈਨਸ਼ਨ ਆਈਡੀਟੀਟੀਸ਼ਨ, ਨਾਮ ਮੇਲਿੰਗ, ਡੁਪਲੀਕੇਟ ਡਿਟੈਕਸ਼ਨ, ਅਤੇ ਡੁਪਲੀਕੇਟ ਰਿਕਾਰਡ ਦੀ ਖੋਜ (Elmagarmid, Ipeirotis, and Verykios 2007) . ਲਿੰਕ ਨੂੰ ਰਿਕਾਰਡ ਕਰਨ ਲਈ ਗੁਪਤਤਾ ਰੱਖਣ ਦੇ ਤਰੀਕੇ ਵੀ ਹਨ ਜੋ ਨਿੱਜੀ ਪਛਾਣ ਜਾਣਕਾਰੀ (Schnell 2013) ਦੇ ਪ੍ਰਸਾਰਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹਨ. ਫੇਸਬੁਕ ਨੇ ਆਪਣੇ ਰਿਕਾਰਡਾਂ ਨੂੰ ਵੋਟਿੰਗ ਵਿਵਹਾਰ ਲਈ ਜੋੜਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵੀ ਤਿਆਰ ਕੀਤੀ ਹੈ; ਇਹ ਇੱਕ ਪ੍ਰਯੋਗ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਕੀਤਾ ਗਿਆ ਸੀ ਜਿਸ ਬਾਰੇ ਮੈਂ ਤੁਹਾਨੂੰ ਅਧਿਆਇ 4 ਵਿਚ ਦੱਸਾਂਗਾ (Bond et al. 2012; Jones et al. 2013) .
ਵੈਧਤਾ ਦਾ ਨਿਰਮਾਣ ਕਰਨ ਲਈ, Shadish, Cook, and Campbell (2001) ਅਧਿਆਇ 3 ਦੇਖੋ.
ਏਓਐਲ ਖੋਜ ਲੌਗ ਬੁਰਕਾਉਣ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ Ohm (2010) ਦੇਖੋ. ਮੈਂ ਅਧਿਆਇ 4 ਵਿਚ ਕੰਪਨੀਆਂ ਅਤੇ ਸਰਕਾਰਾਂ ਨਾਲ ਭਾਈਵਾਲੀ ਕਰਨ ਬਾਰੇ ਸਲਾਹ ਪੇਸ਼ ਕਰਦਾ ਹਾਂ ਜਦੋਂ ਮੈਂ ਪ੍ਰਯੋਗਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਦਾ ਹਾਂ ਬਹੁਤ ਸਾਰੇ ਲੇਖਕਾਂ ਨੇ ਖੋਜ ਦੇ ਬਾਰੇ ਵਿੱਚ ਚਿੰਤਾਵਾਂ ਪ੍ਰਗਟ ਕੀਤੀਆਂ ਹਨ ਜੋ ਪਹੁੰਚਯੋਗ ਡਾਟਾ ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ, Huberman (2012) ਅਤੇ boyd and Crawford (2012) .
ਯੂਨੀਵਰਸਿਟੀ ਦੇ ਖੋਜਕਾਰ ਡਾਟਾ ਪਹੁੰਚ ਹਾਸਲ ਕਰਨ ਲਈ ਇਕ ਚੰਗਾ ਤਰੀਕਾ ਹੈ ਇੱਕ intern ਜ ਦਾ ਦੌਰਾ ਖੋਜਕਾਰ ਦੇ ਤੌਰ ਤੇ ਇੱਕ ਕੰਪਨੀ 'ਤੇ ਕੰਮ ਕਰਨ ਲਈ ਹੁੰਦਾ ਹੈ. ਡਾਟਾ ਪਹੁੰਚ ਯੋਗ ਕਰਨ ਲਈ ਇਸ ਦੇ ਨਾਲ, ਇਸ ਕਾਰਜ ਨੂੰ ਵੀ ਮਦਦ ਕਰੇਗਾ ਖੋਜਕਾਰ ਬਾਰੇ ਡਾਟਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਹੋਰ ਸਿੱਖਣ.
ਸਰਕਾਰੀ ਡਾਟਾ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਰੂਪ ਵਿੱਚ, Mervis (2014) ਚਰਚਾ ਕੀਤੀ ਗਈ ਹੈ ਕਿ ਕਿਵੇਂ ਰਾਜ ਚੇਤੀ ਅਤੇ ਸਹਿਯੋਗੀਆਂ ਨੇ ਸਮਾਜਿਕ ਗਤੀਸ਼ੀਲਤਾ 'ਤੇ ਆਪਣੇ ਖੋਜ ਵਿੱਚ ਵਰਤੇ ਗਏ ਟੈਕਸ ਦੇ ਰਿਕਾਰਡਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ.
ਇਕ ਸੰਕਲਪ ਦੇ ਰੂਪ ਵਿਚ "ਪ੍ਰਤਿਨਿਧੀਕਰਨ" ਦੇ ਇਤਿਹਾਸ ਉੱਤੇ ਹੋਰ, Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , ਅਤੇ Kruskal and Mosteller (1980) .
ਬਰੌਫ਼ ਅਤੇ ਡੇਰ ਅਤੇ ਹਿਲ ਦੇ ਕੰਮ ਦੇ ਸੰਖੇਪ ਵਿਚ ਸੰਖੇਪ ਸੀ. ਹੈਜ਼ੇ 'ਤੇ ਹੈਜ਼ੇ ਦੇ ਕੰਮ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, Freedman (1991) ਦੇਖੋ. ਬ੍ਰਿਟਿਸ਼ ਡਾਕਟਰਾਂ ਦੇ ਅਧਿਐਨ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ Doll et al. (2004) ਵੇਖੋ Doll et al. (2004) ਅਤੇ Keating (2014)
ਬਹੁਤ ਸਾਰੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇਹ ਜਾਣ ਕੇ ਹੈਰਾਨੀ ਹੋਵੇਗੀ ਕਿ ਭਾਵੇਂ ਡਲ ਅਤੇ ਹਿਲ ਨੇ ਔਰਤਾਂ ਦੇ ਡਾਕਟਰਾਂ ਅਤੇ 35 ਸਾਲ ਤੋਂ ਘੱਟ ਉਮਰ ਦੇ ਡਾਕਟਰਾਂ ਤੋਂ ਡਾਟਾ ਇਕੱਠਾ ਕੀਤਾ ਸੀ, ਉਨ੍ਹਾਂ ਨੇ ਜਾਣਬੁੱਝ ਕੇ ਇਸ ਡੇਟਾ ਨੂੰ ਆਪਣੇ ਪਹਿਲੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਨਹੀਂ ਵਰਤਿਆ. ਜਿਵੇਂ ਕਿ ਉਹਨਾਂ ਨੇ ਦਲੀਲ ਦਿੱਤੀ: "ਕਿਉਂਕਿ 35 ਸਾਲ ਤੋਂ ਘੱਟ ਉਮਰ ਦੀਆਂ ਔਰਤਾਂ ਅਤੇ ਮਰਦਾਂ ਵਿੱਚ ਫੇਫੜਿਆਂ ਦਾ ਕੈਂਸਰ ਮੁਕਾਬਲਤਨ ਘੱਟ ਹੁੰਦਾ ਹੈ, ਇਸ ਲਈ ਆਉਣ ਵਾਲੇ ਕੁਝ ਸਾਲਾਂ ਵਿੱਚ ਇਹਨਾਂ ਸਮੂਹਾਂ ਵਿੱਚ ਲਾਭਦਾਇਕ ਅੰਕੜੇ ਪ੍ਰਾਪਤ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਨਹੀਂ ਹੈ. ਇਸ ਮੁੱਢਲੀ ਰਿਪੋਰਟ ਵਿਚ ਅਸੀਂ 35 ਸਾਲ ਜਾਂ ਇਸ ਤੋਂ ਵੱਧ ਉਮਰ ਦੇ ਵਿਅਕਤੀਆਂ ਵੱਲ ਸਾਡਾ ਧਿਆਨ ਸੀਮਿਤ ਰੱਖਿਆ ਹੈ. " Rothman, Gallacher, and Hatch (2013) , ਜਿਸ ਵਿਚ ਭੜਕਾਊ ਸਿਰਲੇਖ ਹੈ" ਪ੍ਰਤਿਸ਼ਠਾਵਾਨਤਾ ਨੂੰ ਕਿਉਂ ਬਚਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, "ਇਸਦੇ ਮੁੱਲ ਲਈ ਵਧੇਰੇ ਆਮ ਦਲੀਲ ਇਰਾਦਤਨ ਗੈਰ-ਪ੍ਰਤੀਨਿਧ ਡੇਟਾ ਬਣਾਉਣਾ.
ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਸਰਕਾਰਾਂ ਜੋ ਪੂਰੀ ਆਬਾਦੀ ਬਾਰੇ ਬਿਆਨ ਦੇਣ ਦੀ ਇੱਛਾ ਰੱਖਦੇ ਹਨ, ਲਈ ਗੈਰ-ਪੇਸ਼ਕਾਰੀ ਦੀ ਇੱਕ ਵੱਡੀ ਸਮੱਸਿਆ ਹੈ. ਇਹ ਕੰਪਨੀਆਂ ਲਈ ਇੱਕ ਚਿੰਤਾ ਦੀ ਘੱਟ ਹੁੰਦੀ ਹੈ, ਜੋ ਆਮ ਤੌਰ ਤੇ ਆਪਣੇ ਉਪਭੋਗਤਾਵਾਂ 'ਤੇ ਕੇਂਦਰਤ ਹੁੰਦੀਆਂ ਹਨ. ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ, ਸਟੈਟਿਸਟਿਕਸ ਨੀਦਰਲੈਂਡਜ਼ ਵਪਾਰ ਦੇ ਵੱਡੇ Buelens et al. (2014) ਦੀ ਗੈਰ-ਮੌਜੂਦਗੀ ਦੇ ਮੁੱਦੇ ਨੂੰ ਕਿਵੇਂ ਵਿਚਾਰਦਾ ਹੈ, ਇਸ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ ਵੇਖੋ Buelens et al. (2014) .
boyd and Crawford (2012) , K. Lewis (2015b) ਅਤੇ Hargittai (2015) ਦੇਖੋ, ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਦੇ ਗੈਰ-ਪ੍ਰਤਿਨਿਧੀ ਪ੍ਰਕਿਰਤੀ ਬਾਰੇ ਚਿੰਤਾ ਪ੍ਰਗਟਾਉਣ ਵਾਲੇ ਖੋਜਕਰਤਾਵਾਂ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਲਈ.
ਸਮਾਜਕ ਸਰਵੇਖਣਾਂ ਅਤੇ ਮਹਾਂਮਾਰੀ ਵਿਗਿਆਨ ਖੋਜ ਦੇ ਟੀਚਿਆਂ ਦੀ ਵਧੇਰੇ ਵਿਸਥਾਰਪੂਰਵਕ ਤੁਲਨਾ ਲਈ, Keiding and Louis (2016) .
ਵੋਟਰਾਂ ਬਾਰੇ Jungherr (2013) ਤੌਰ 'ਤੇ ਨਮੂਨਾ ਬਣਾਉਣ ਲਈ ਟਵਿੱਟਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਯਤਨਾਂ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ, ਖ਼ਾਸ ਤੌਰ' ਤੇ 2009 ਦੇ ਜਰਮਨ ਚੋਣ ਤੋਂ, Jungherr (2013) ਅਤੇ Jungherr (2015) . Tumasjan et al. (2010) ਦੇ ਕੰਮ ਦੇ ਬਾਅਦ Tumasjan et al. (2010) ਦੁਨੀਆ ਭਰ ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਅਭਿਆਸ ਦੇ ਢੰਗਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ- ਜਿਵੇਂ ਕਿ ਭਾਵਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਵਰਤਣ ਲਈ ਪੱਖਪਾਤਕ ਅਤੇ ਨਕਾਰਾਤਮਕ ਪਾਰਟੀਆਂ ਦਾ ਜ਼ਿਕਰ ਕੀਤਾ ਗਿਆ ਹੈ- ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੀਆਂ ਚੋਣਾਂ ਦੀ ਚੋਣ ਕਰਨ ਲਈ ਟਵਿੱਟਰ ਡਾਟਾ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਸੁਧਾਰਨ ਲਈ (Gayo-Avello 2013; Jungherr 2015, chap. 7.) ਇੱਥੇ Huberty (2015) ਨੇ ਚੋਣਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਇਹਨਾਂ ਕੋਸ਼ਿਸ਼ਾਂ ਦੇ ਨਤੀਜਿਆਂ ਦਾ ਸੰਖੇਪ ਵਰਨਣ ਕੀਤਾ ਹੈ:
"ਸੋਸ਼ਲ ਮੀਡੀਆ 'ਤੇ ਆਧਾਰਿਤ ਸਭ ਜਾਣਦੇ ਅਨੁਮਾਨਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਸਫਲ ਹੋ ਗਈ ਹੈ ਜਦੋਂ ਸੱਚਮੁੱਚ ਸਾਹਮਣੇ ਆਉਣ ਵਾਲੇ ਚੋਣਕਾਰ ਅਨੁਮਾਨਾਂ ਦੀ ਮੰਗ ਕੀਤੀ ਜਾਂਦੀ ਹੈ. ਇਹ ਅਸਫਲਤਾਵਾਂ ਵਿਧੀਗਤ ਜਾਂ ਅਲਗੋਰਿਦਮਿਕ ਮੁਸ਼ਕਿਲਾਂ ਦੀ ਬਜਾਏ ਸੋਸ਼ਲ ਮੀਡੀਆ ਦੇ ਬੁਨਿਆਦੀ ਸੰਪਤੀਆਂ ਦੇ ਕਾਰਨ ਜਾਪਦੀਆਂ ਹਨ. ਸੰਖੇਪ ਵਿੱਚ, ਸੋਸ਼ਲ ਮੀਡੀਆ ਨਹੀਂ, ਅਤੇ ਸ਼ਾਇਦ ਕਦੇ ਵੀ ਨਹੀਂ ਕਰੇਗਾ, ਵੋਟਰਾਂ ਦੀ ਇੱਕ ਸਥਾਈ, ਨਿਰਪੱਖ, ਨੁਮਾਇੰਦਾ ਤਸਵੀਰ ਪੇਸ਼ ਕਰਦੇ ਹਨ; ਅਤੇ ਸੁਵਿਧਾਜਨਕ ਨਮੂਨੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਦੀ ਘਾਟ ਤੋਂ ਬਾਅਦ ਇਹਨਾਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਡਾਟਾ ਨਹੀਂ ਹੈ. "
ਅਧਿਆਇ 3 ਵਿਚ, ਮੈਂ ਨਵੇਕਣ ਅਤੇ ਅੰਦਾਜ਼ੇ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਿਸਥਾਰ ਵਿਚ ਬਿਆਨ ਕਰਾਂਗਾ. ਭਾਵੇਂ ਕਿ ਕੁਝ ਖਾਸ ਸ਼ਰਤਾਂ ਅਧੀਨ, ਡੇਟਾ ਗੈਰ-ਪ੍ਰਤੀਨਿਧਤਾਵਾਨ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਚੰਗੇ ਅੰਦਾਜ਼ੇ ਦੇਣ ਲਈ ਭਾਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ.
ਸਿਸਟਮ ਡ੍ਰਾਈਵਰ ਬਾਹਰੋਂ ਦੇਖਣ ਲਈ ਬਹੁਤ ਔਖਾ ਹੈ ਹਾਲਾਂਕਿ, ਮੂਵੀ ਲੈਨਜ ਪ੍ਰੋਜੈਕਟ (ਅਧਿਆਇ 4 ਵਿਚ ਹੋਰ ਚਰਚਾ ਕੀਤੀ ਗਈ) ਇਕ ਅਕਾਦਮਿਕ ਖੋਜ ਸਮੂਹ ਦੁਆਰਾ 15 ਤੋਂ ਵੱਧ ਸਾਲਾਂ ਲਈ ਚਲਾਇਆ ਗਿਆ ਹੈ. ਇਸ ਤਰ੍ਹਾਂ, ਉਹ ਸਮੇਂ ਦੇ ਨਾਲ ਵਿਧੀ ਦੇ ਤਰੀਕੇ ਨੂੰ ਕਿਵੇਂ ਵਿਕਾਸ ਕਰਦੇ ਹਨ ਅਤੇ ਕਿਵੇਂ ਇਸ ਨਾਲ ਵਿਸ਼ਲੇਸ਼ਣ ਪ੍ਰਭਾਵ ਪਾ ਸਕਦੇ ਹਨ (Harper and Konstan 2015) ਬਾਰੇ ਜਾਣਕਾਰੀ ਅਤੇ ਦਸਤਾਵੇਜ਼ ਸਾਂਝੀ ਕਰਨ ਦੇ ਯੋਗ ਹੋਏ ਹਨ.
ਬਹੁਤ ਸਾਰੇ ਵਿਦਵਾਨਾਂ ਨੇ ਟਵਿੱਟਰ 'ਤੇ Liu, Kliman-Silver, and Mislove (2014) ਵੱਲ ਧਿਆਨ ਦਿੱਤਾ ਹੈ: Liu, Kliman-Silver, and Mislove (2014) ਅਤੇ Tufekci (2014) .
ਜਨਸੰਖਿਆ ਦੇ ਵਹਿਣ ਦਾ ਨਿਪਟਾਰਾ ਕਰਨ ਲਈ ਇਕ ਤਰੀਕਾ ਉਪਯੋਗਕਰਤਾਵਾਂ ਦਾ ਇੱਕ ਪੈਨਲ ਬਣਾਉਣਾ ਹੈ, ਜੋ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸਮੇਂ ਦੇ ਨਾਲ ਹੀ ਇੱਕੋ ਵਿਅਕਤੀਆਂ ਦਾ ਅਧਿਐਨ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, Diaz et al. (2016) ਵੇਖੋ Diaz et al. (2016)
ਪਹਿਲਾਂ ਮੈਂ ਇੱਕ ਭਾਸ਼ਣ ਵਿੱਚ ਜੌਨ ਕਲੇਨਬਰਗ ਦੁਆਰਾ ਵਰਤੇ ਗਏ ਸ਼ਬਦ "ਅਲਗੋਰਿਥਮਿਕ ਤੌਰ ਤੇ ਸ਼ਰਮਸਾਰ" ਸੁਣਿਆ ਸੀ, ਪਰ ਬਦਕਿਸਮਤੀ ਨਾਲ ਮੈਨੂੰ ਇਹ ਯਾਦ ਨਹੀਂ ਹੈ ਕਿ ਇਹ ਭਾਸ਼ਣ ਕਦੋਂ ਅਤੇ ਕਿੱਥੇ ਦਿੱਤਾ ਗਿਆ ਸੀ. ਪਹਿਲੀ ਵਾਰ ਜਦੋਂ ਮੈਂ ਪ੍ਰਿੰਟ ਵਿੱਚ ਸ਼ਬਦ ਦੇਖਿਆ ਤਾਂ Anderson et al. (2015) , ਜੋ ਕਿ ਦਿਲਚਸਪ ਚਰਚਾ ਹੈ ਕਿ ਡੇਟਿੰਗ ਸਾਈਟ ਦੁਆਰਾ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਐਲਗੋਰਿਥਮ ਸਮਾਜਿਕ ਤਰਜੀਹਾਂ ਦਾ ਅਧਿਐਨ ਕਰਨ ਲਈ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਇਹਨਾਂ ਵੈਬਸਾਈਟਾਂ ਤੋਂ ਡਾਟਾ ਵਰਤਣ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਕਿਵੇਂ ਗੁੰਝਲ ਸਕਦੇ ਹਨ. ਇਹ ਚਿੰਤਾ Anderson et al. (2014) ਜਵਾਬ ਵਿਚ K. Lewis (2015a) ਦੁਆਰਾ ਕੀਤੀ ਗਈ ਸੀ Anderson et al. (2014) .
ਫੇਸਬੁੱਕ ਤੋਂ ਇਲਾਵਾ, ਟਵਿੱਟਰ ਨੇ ਲੋਕਾਂ ਨੂੰ ਟਰਾਇਡੇਕ ਬੰਦ ਹੋਣ ਦੇ ਵਿਚਾਰਾਂ ਦੇ ਅਧਾਰ ਤੇ ਪਾਲਣਾ ਕਰਨ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਹੈ; Su, Sharma, and Goel (2016) . ਇਸ ਲਈ ਟਵਿਟਰ ਵਿੱਚ ਟਰਾਇਡਿਕ ਬੰਦ ਹੋਣ ਦਾ ਪੱਧਰ ਟਰਾਇਡੇਕ ਕਲੋਜ਼ਰ ਅਤੇ ਮਨੁੱਖੀ ਤਣਾਅ ਬੰਦ ਕਰਨ ਲਈ ਕੁਝ ਅਲਗੋਰਿਦਮਿਕ ਪ੍ਰਵਿਰਤੀ ਵੱਲ ਮਨੁੱਖੀ ਰੁਝਾਨ ਦਾ ਸੁਮੇਲ ਹੈ.
ਕੰਮ ਪ੍ਰਤੀ ਹੋਰ ਜਿਆਦਾ ਕਰਨ ਲਈ - ਖਾਸ ਤੌਰ ਤੇ ਇਹ ਵਿਚਾਰ ਕਿ ਕੁਝ ਸਮਾਜਿਕ ਵਿਗਿਆਨ ਸਿਧਾਂਤ "ਇੰਜਣਾਂ ਨੂੰ ਕੈਮਰੇ ਨਹੀਂ" (ਅਰਥਾਤ, ਉਹ ਇਸ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਦੀ ਬਜਾਏ ਜਗਤ ਨੂੰ ਹੀ ਢਾਲਦੇ ਹਨ) -ਮੈਕੇਨਜ਼ੀ Mackenzie (2008) .
ਸਰਕਾਰੀ ਅੰਕੜਾ ਏਜੰਸੀਆਂ ਨੇ ਅੰਕੜਿਆਂ ਦੀ ਡਾਟਾ ਸੰਪਾਦਨ ਨੂੰ ਸਾਫ ਕਰਨ ਲਈ ਡਾਟਾ ਦਰਜ ਕੀਤਾ ਹੈ . De Waal, Puts, and Daas (2014) ਸਰਵੇਖਣ ਡਾਟਾ ਲਈ ਵਿਕਸਿਤ ਕੀਤੇ ਅੰਕੜਿਆਂ ਦੀ ਡਾਟਾ ਸੰਪਾਦਨ ਤਕਨੀਕਾਂ ਦਾ ਵਰਣਨ ਕਰਦੇ ਹਨ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਵੱਡੇ ਡੇਟਾ ਸ੍ਰੋਤਾਂ, ਅਤੇ Puts, Daas, and Waal (2015) ਦੇ ਹਿਸਾਬ ਦੀ ਹੱਦ ਦੀ ਜਾਂਚ ਕਰਦੇ ਹਨ ਵਧੇਰੇ ਆਮ ਦਰਸ਼ਕ
ਸਮਾਜਿਕ ਬੋਟਾਂ ਬਾਰੇ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਲਈ, Ferrara et al. (2016) ਵੇਖੋ Ferrara et al. (2016) ਟ੍ਰੇਡ ਦੇ ਸਪੈਮ ਲੱਭਣ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਤ ਕਰਨ ਵਾਲੀਆਂ ਕੁਝ ਉਦਾਹਰਣਾਂ ਲਈ Clark et al. (2016) ਵੇਖੋ Clark et al. (2016) ਅਤੇ Chu et al. (2012) . ਅੰਤ ਵਿੱਚ, Subrahmanian et al. (2016) ਡਾਰਪਾ ਟਵੀਟਰ ਬੋਟ ਚੈਲੇਜ ਦੇ ਨਤੀਜਿਆਂ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਟਵਿੱਟਰ ਉੱਤੇ ਬੋਟਾ ਖੋਜਣ ਲਈ ਪਹੁੰਚ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ.
Ohm (2015) ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਦੇ ਵਿਚਾਰ 'ਤੇ ਪਹਿਲਾਂ ਦੇ ਖੋਜਾਂ ਦੀ ਸਮੀਖਿਆ ਕਰਦਾ ਹੈ ਅਤੇ ਬਹੁ-ਪੱਖੀ ਟੈਸਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ. ਉਹ ਚਾਰ ਕਾਰਕ ਜੋ ਉਹ ਪ੍ਰਸਤਾਵਿਤ ਕਰਦੇ ਹਨ, ਨੁਕਸਾਨ ਦੀ ਤੀਬਰਤਾ, ਨੁਕਸਾਨ ਦੀ ਸੰਭਾਵਨਾ, ਇੱਕ ਗੁਪਤ ਰਿਸ਼ਤਾ ਦੀ ਮੌਜੂਦਗੀ ਅਤੇ ਕੀ ਇਹ ਖਤਰਾ ਬਹੁਤੀਆਂ ਚਿੰਤਾਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ.
ਫਾਰਬਰ ਦੇ ਨਿਊਯਾਰਕ ਵਿੱਚ ਟੈਕਸੀਆਂ ਦਾ ਅਧਿਐਨ Camerer et al. (1997) ਦੁਆਰਾ ਪਹਿਲਾਂ ਦੇ ਇੱਕ ਅਧਿਐਨ ਦੇ ਅਧਾਰ ਤੇ ਸੀ Camerer et al. (1997) ਨੇ ਕਾਗਜ਼ ਯਾਤਰਾ ਦੀਆਂ ਚਿੰਨ੍ਹ ਦੇ ਤਿੰਨ ਵੱਖੋ-ਵੱਖਰੇ ਸੁਝਵਾਉਣ ਵਾਲੇ ਨਮੂਨਿਆਂ ਨੂੰ ਵਰਤਿਆ. ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਦੇ ਅਧਿਐਨ ਵਿੱਚ ਇਹ ਪਾਇਆ ਗਿਆ ਕਿ ਡਰਾਈਵਰਾਂ ਨੂੰ ਟੀਚੇ ਪ੍ਰਾਪਤ ਕਰਨ ਵਾਲੇ ਬਣਨ ਵਾਲੇ ਸਨ: ਉਨ੍ਹਾਂ ਦਿਨਾਂ ਵਿੱਚ ਘੱਟ ਕੰਮ ਕੀਤਾ ਜਿੱਥੇ ਉਨ੍ਹਾਂ ਦੀ ਤਨਖਾਹ ਵੱਧ ਸੀ.
ਅਗਲੇ ਕੰਮ ਵਿੱਚ, ਕਿੰਗ ਅਤੇ ਸਹਿਕਰਮੀਆਂ ਨੇ ਚੀਨ ਵਿੱਚ ਆਨਲਾਈਨ ਸੈਂਸਰਸ਼ਿਪ ਦੀ ਖੋਜ ਕੀਤੀ ਹੈ (King, Pan, and Roberts 2014, [@king_how_2016] ) . ਚੀਨ ਵਿੱਚ ਆਨਲਾਈਨ ਸੈਂਸਰਸ਼ਿਪ ਨੂੰ ਮਾਪਣ ਲਈ ਸਬੰਧਤ ਪਹੁੰਚ ਲਈ, Bamman, O'Connor, and Smith (2012) . King, Pan, and Roberts (2013) ਅੰਕਿਤ ਹੋਏ 11 ਮਿਲੀਅਨ ਪੋਸਟਾਂ ਦੀ ਭਾਵਨਾ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਲਈ Hopkins and King (2010) ਅੰਕੜਿਆਂ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ ਵੇਖੋ. ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਲਈ ਵੇਖੋ: James et al. (2013) (ਘੱਟ ਤਕਨੀਕੀ) ਅਤੇ Hastie, Tibshirani, and Friedman (2009) (ਵਧੇਰੇ ਤਕਨੀਕੀ).
ਪੂਰਵ ਅਨੁਮਾਨ ਉਦਯੋਗਿਕ ਡਾਟਾ ਵਿਗਿਆਨ ਦਾ ਇੱਕ ਵੱਡਾ ਹਿੱਸਾ ਹੈ (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . ਇਕ ਕਿਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਜੋ ਸਮਾਜਿਕ ਖੋਜਕਰਤਾਵਾਂ ਦੁਆਰਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਉਹ ਹੈ ਆਬਾਦੀ ਪੂਰਵ ਅਨੁਮਾਨ; ਵੇਖੋ, ਉਦਾਹਰਨ ਲਈ, Raftery et al. (2012) .
ਗੂਗਲ ਫਲੂ ਰੁਝਾਨ ਇਨਸਟੇਨਫੇਜ਼ ਪ੍ਰਚਲਣ ਨੂੰ ਘਟਾਉਣ ਲਈ ਖੋਜ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲਾ ਪਹਿਲਾ ਪ੍ਰੋਜੈਕਟ ਨਹੀਂ ਸੀ. ਅਸਲ ਵਿੱਚ, ਸੰਯੁਕਤ ਰਾਜ ਅਮਰੀਕਾ (Polgreen et al. 2008; Ginsberg et al. 2009) ਅਤੇ ਸਵੀਡਨ (Hulth, Rydevik, and Linde 2009) ਨੇ ਪਾਇਆ ਹੈ ਕਿ ਕੁਝ ਖਾਸ ਖੋਜ ਸ਼ਬਦ (ਜਿਵੇਂ ਕਿ "ਫਲੂ") ਨੇ ਰਾਸ਼ਟਰੀ ਜਨਤਾ ਦੀ ਸਿਹਤ ਦੀ ਨਿਗਰਾਨੀ ਕੀਤੀ ਹੈ ਡੇਟਾ ਜਾਰੀ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ. ਬਾਅਦ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ, ਕਈ ਹੋਰ ਪ੍ਰੋਜੈਕਟ ਨੇ ਬਿਮਾਰੀ ਦੀ ਨਿਗਰਾਨੀ ਲਈ ਡਿਜੀਟਲ ਟਰੇਸ ਡੇਟਾ ਦਾ ਇਸਤੇਮਾਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ ਹੈ; Althouse et al. (2015) ਵੇਖੋ Althouse et al. (2015) ਇੱਕ ਸਮੀਖਿਆ ਲਈ
ਸਿਹਤ ਦੇ ਅੰਦਾਜ਼ਿਆਂ ਦੀ ਅਨੁਮਾਨ ਲਗਾਉਣ ਲਈ ਡਿਜੀਟਲ ਟ੍ਰੇਸ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ ਇਲਾਵਾ, ਚੋਣਾਂ ਦੇ ਨਤੀਜਿਆਂ ਦੀ ਪੂਰਵ-ਅਨੁਮਾਨ ਕਰਨ ਲਈ ਟਵਿੱਟਰ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਵੀ ਵੱਡੀ ਗਿਣਤੀ ਵਿੱਚ ਕੰਮ ਕੀਤਾ ਗਿਆ ਹੈ; ਸਮੀਖਿਆ ਲਈ Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (ਅਧਿਆਇ 7), ਅਤੇ Huberty (2015) . ਆਰਥਿਕ ਸੂਚਕਾਂ, ਜਿਵੇਂ ਕਿ ਘਰੇਲੂ ਘਰੇਲੂ ਉਤਪਾਦ (ਜੀ.ਡੀ.ਪੀ.) ਦੇ Bańbura et al. (2013) , ਕੇਂਦਰੀ ਬੈਂਕਾਂ ਵਿੱਚ ਵੀ ਆਮ ਹੈ, Bańbura et al. (2013) . ਟੇਬਲ 2.8 ਵਿਚ ਕੁਝ ਅਜਿਹੇ ਅਧਿਐਨ ਸ਼ਾਮਲ ਹਨ ਜੋ ਦੁਨੀਆ ਦੀ ਕਿਸੇ ਕਿਸਮ ਦੀ ਘਟਨਾ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਕਿਸੇ ਕਿਸਮ ਦੇ ਡਿਜੀਟਲ ਟਰੇਸ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ.
ਡਿਜੀਟਲ ਟਰੇਸ | ਨਤੀਜਾ | Citation |
---|---|---|
ਟਵਿੱਟਰ | ਅਮਰੀਕਾ ਵਿਚ ਫਿਲਮਾਂ ਦੇ ਬਾਕਸ ਆਫਿਸ ਦੀ ਆਮਦ | Asur and Huberman (2010) |
ਖੋਜ ਲੌਗ | ਅਮਰੀਕਾ ਵਿਚ ਫਿਲਮਾਂ, ਸੰਗੀਤ, ਕਿਤਾਬਾਂ ਅਤੇ ਵੀਡੀਓ ਗੇਮਾਂ ਦੀ ਵਿਕਰੀ | Goel et al. (2010) |
ਟਵਿੱਟਰ | ਡਾਓ ਜੋਨਸ ਇੰਡਸਟਰੀਅਲ ਔਸਤ (ਯੂਐਸ ਸਟਾਕ ਮਾਰਕੀਟ) | Bollen, Mao, and Zeng (2011) |
ਸੋਸ਼ਲ ਮੀਡੀਆ ਅਤੇ ਖੋਜ ਲਾਗ | ਸੰਯੁਕਤ ਰਾਜ ਅਮਰੀਕਾ, ਯੂਨਾਈਟਿਡ ਕਿੰਗਡਮ, ਕੈਨੇਡਾ ਅਤੇ ਚੀਨ ਵਿੱਚ ਨਿਵੇਸ਼ਕ ਭਾਵਨਾਵਾਂ ਅਤੇ ਸਟਾਕ ਬਾਜ਼ਾਰਾਂ ਦੇ ਸਰਵੇਖਣ | Mao et al. (2015) |
ਖੋਜ ਲੌਗ | ਸਿੰਗਾਪੁਰ ਅਤੇ ਬੈਂਕਾਕ ਵਿਚ ਡੇਂਗੂ ਬੁਖ ਦੀ ਪ੍ਰਚੱਲਤਤਾ | Althouse, Ng, and Cummings (2011) |
ਅਖੀਰ ਵਿਚ, ਜੌਨ ਕਲਿਨਬਰਗ ਅਤੇ ਸਹਿਕਰਮੀਆਂ (2015) ਨੇ ਧਿਆਨ ਦਿਵਾਇਆ ਹੈ ਕਿ ਭਵਿੱਖਬਾਣੀਆਂ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਦੋ ਤਰਾਂ ਦੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਵਿਚ ਆਉਂਦੀਆਂ ਹਨ ਅਤੇ ਸਮਾਜਿਕ ਵਿਗਿਆਨਕਾਂ ਨੇ ਇਕ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰਨ ਅਤੇ ਦੂਜੇ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ ਹੈ. ਇਕ ਨੀਤੀ ਬਣਾਉਣ ਵਾਲੀ ਕੰਪਨੀ ਦੀ ਕਲਪਨਾ ਕਰੋ, ਮੈਂ ਅੰਨਾ ਨੂੰ ਫੋਨ ਕਰ ਦਿਆਂਗਾ, ਜੋ ਸੋਕੇ ਦਾ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ ਅਤੇ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਮੀਂਹ ਪਾਉਣ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਵਧਾਉਣ ਲਈ ਬਾਰਸ਼ ਨਾਚ ਕਰਨ ਲਈ ਇਕ ਸ਼ਮਊਨ ਨੂੰ ਰੱਖਣਾ ਹੈ ਜਾਂ ਨਹੀਂ. ਇਕ ਹੋਰ ਪਾਲਸੀ ਬਣਾਉਣ ਵਾਲਾ, ਮੈਂ ਉਸ ਨੂੰ ਬੇਟੀ ਨੂੰ ਬੁਲਾਵਾਂਗਾ, ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਘਰ ਦੇ ਰਸਤੇ 'ਤੇ ਗਿੱਲੀ ਹੋਣ ਤੋਂ ਬਚਣ ਲਈ ਛਤਰੀ ਨੂੰ ਕੰਮ ਕਰਨ ਲਈ. ਅੰਨਾ ਅਤੇ ਬੇਟੀ ਦੋਵਾਂ ਦਾ ਚੰਗਾ ਫ਼ੈਸਲਾ ਹੋ ਸਕਦਾ ਹੈ ਜੇ ਉਹ ਮੌਸਮ ਨੂੰ ਸਮਝਣ, ਪਰ ਉਹਨਾਂ ਨੂੰ ਵੱਖੋ ਵੱਖਰੀਆਂ ਗੱਲਾਂ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ ਅੰਨਾ ਨੂੰ ਇਹ ਸਮਝਣ ਦੀ ਜ਼ਰੂਰਤ ਹੈ ਕਿ ਕੀ ਮੀਂਹ ਦੀਆਂ ਨਦੀਆਂ ਮੀਂਹ ਬਣਦੀਆਂ ਹਨ. ਬੇਟੀ, ਦੂਜੇ ਪਾਸੇ, ਕਾਰਨਾ ਕਰਕੇ ਕੁਝ ਵੀ ਸਮਝਣ ਦੀ ਜ਼ਰੂਰਤ ਨਹੀਂ ਹੈ; ਉਸ ਨੂੰ ਸਿਰਫ ਇਕ ਸਹੀ ਪੂਰਵ ਅਨੁਮਾਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ ਸਮਾਜਕ ਖੋਜਕਰਤਾਵਾਂ ਅਕਸਰ ਅੰਨਾ ਨਾਲ ਸਾਹਮਣਾ ਕਰਦੇ ਹੋਏ, ਜਿਵੇਂ ਕਿ ਕਲੇਨਬਰਗ ਅਤੇ ਸਹਿਕਰਮੀਆਂ "ਬਾਰਸ਼ ਨਾਲ ਡਾਂਸ ਵਰਗੇ" ਨੀਤੀ ਸੰਬੰਧੀ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਸਮੱਸਿਆਵਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਰਤ ਕਰਦੀਆਂ ਹਨ- ਕਿਉਂਕਿ ਉਹਨਾਂ ਨੂੰ ਕਾਰਗੁਜ਼ਾਰੀ ਦੇ ਸਵਾਲ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ. ਬੈਟੀ ਦਾ ਸਾਹਮਣਾ ਕਰਦੇ ਹੋਏ ਪ੍ਰਸ਼ਨ ਜਿਵੇਂ ਕਿ ਕਲੇਨਬਰਗ ਅਤੇ ਸਹਿਕਰਮੀਆਂ "ਛਤਰੀ ਵਰਗੇ" ਨੀਤੀ ਸੰਬੰਧੀ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਕਹਿੰਦੇ ਹਨ - ਇਹ ਵੀ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੋ ਸਕਦਾ ਹੈ, ਪਰ ਸਮਾਜਿਕ ਖੋਜਕਾਰਾਂ ਵੱਲੋਂ ਬਹੁਤ ਘੱਟ ਧਿਆਨ ਦਿੱਤਾ ਗਿਆ ਹੈ.
ਜਰਨਲ ਪੀ.ਐਸ. ਰਾਜਨੀਤੀ ਵਿਗਿਆਨ ਦੇ ਵੱਡੇ ਅੰਕੜਿਆਂ, ਕਾਰਨਾਤਮਿਕ ਅਨੁਮਾਨ, ਅਤੇ ਰਸਮੀ ਸਿਧਾਂਤ Clark and Golder (2015) , ਅਤੇ Clark and Golder (2015) ਹਰ ਯੋਗਦਾਨ ਨੂੰ ਸਾਰ ਦਿੰਦੇ ਹਨ. ਨੈਸ਼ਨਲ ਅਕੈਡਮੀ ਆਫ ਸਾਇੰਸਜ਼ ਆਫ ਯੂਨਾਈਟਿਡ ਸਟੇਟ ਆਫ ਅਮਰੀਕਾ ਦੇ ਜਰਨਲ ਪ੍ਰੋਸੀਡਿੰਗਸ ਨੇ ਇਕ ਕਾਰਨਾਮਿਆਂ ਅਤੇ ਵੱਡੇ ਅੰਕਾਂ 'ਤੇ ਇਕ Shiffrin (2016) ਅਤੇ Shiffrin (2016) ਹਰੇਕ ਯੋਗਦਾਨ ਦਾ ਸਾਰ ਦਿੱਤਾ. ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਦੇ ਪਹੁੰਚਾਂ ਲਈ ਜੋ ਵੱਡੇ ਡੇਟਾ ਸ੍ਰੋਤਾਂ ਦੇ ਅੰਦਰ ਕੁਦਰਤੀ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਆਪਣੇ-ਆਪ ਖੋਜਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ, Jensen et al. (2008) ਵੇਖੋ Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) , ਅਤੇ Sharma, Hofman, and Watts (2016) .
ਕੁਦਰਤੀ ਪ੍ਰਯੋਗਾਂ ਦੇ ਸਬੰਧ ਵਿੱਚ, Dunning (2012) ਬਹੁਤ ਸਾਰੇ ਉਦਾਹਰਣਾਂ ਨਾਲ ਇੱਕ ਸ਼ੁਰੂਆਤੀ, ਪੁਸਤਕ-ਲੰਬਾਈ ਦੇ ਇਲਾਜ ਮੁਹੱਈਆ ਕਰਦੀ ਹੈ. ਕੁਦਰਤੀ ਪ੍ਰਯੋਗਾਂ ਦੀ ਇੱਕ ਸ਼ੱਕੀ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਲਈ, Rosenzweig and Wolpin (2000) (ਅਰਥ-ਸ਼ਾਸਤਰ) ਜਾਂ Sekhon and Titiunik (2012) (ਰਾਜਨੀਤਕ ਵਿਗਿਆਨ) ਦੇਖੋ. Deaton (2010) ਅਤੇ Heckman and Urzúa (2010) ਇਹ ਦਲੀਲ ਪੇਸ਼ ਕਰਦੇ ਹਨ ਕਿ ਕੁਦਰਤੀ ਪ੍ਰਯੋਗਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਤ ਕਰਨ ਨਾਲ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਬੇਯਕੀਨੀ ਕਾਰਨ ਕਾਰਨ ਪ੍ਰਭਾਵ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਵੱਲ ਧਿਆਨ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ; Imbens (2010) ਕੁਦਰਤੀ ਪ੍ਰਯੋਗਾਂ ਦੇ ਮੁੱਲ ਦੇ ਇੱਕ ਹੋਰ ਆਸ਼ਾਵਾਦੀ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨਾਲ ਇਨ੍ਹਾਂ ਦਲੀਲਾਂ ਨੂੰ ਕਾਊਂਟਰ ਕਰਦੇ ਹਨ.
ਇਹ ਵਰਣਨ ਕਰਦੇ ਹੋਏ ਕਿ ਇੱਕ ਖੋਜਕਾਰ ਸੇਵਾ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਤਿਆਰ ਕੀਤੇ ਜਾਣ ਦੇ ਅਸਰ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾ ਕੇ ਕਿਵੇਂ ਜਾ ਸਕਦਾ ਹੈ, ਮੈਂ ਇਕ ਤਕਨੀਕ ਦਾ ਵਰਣਨ ਕਰ ਰਿਹਾ ਸੀ ਜਿਸਨੂੰ ਸਹਾਇਕ ਵਸਤੂਆਂ ਕਿਹਾ ਜਾਂਦਾ ਹੈ . Imbens and Rubin (2015) , ਆਪਣੇ ਅਧਿਆਇ 23 ਅਤੇ 24 ਵਿੱਚ, ਇਕ ਪ੍ਰਸਤੁਤੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ ਅਤੇ ਇੱਕ ਡਰਾਫਟ ਲੌਟਰੀ ਨੂੰ ਉਦਾਹਰਣ ਵਜੋਂ ਵਰਤਦੇ ਹਨ ਕੰਪਲੀਏਟਰਾਂ ਉੱਤੇ ਫੌਜੀ ਸੇਵਾ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਕਈ ਵਾਰੀ ਕੰਪਲੀਏਅਰ ਔਸਤ ਕਾਰਨ ਪ੍ਰਭਾਵ (CAcE) ਕਿਹਾ ਜਾਂਦਾ ਹੈ ਅਤੇ ਕਈ ਵਾਰ ਸਥਾਨਕ ਔਸਤ ਇਲਾਜ ਪ੍ਰਭਾਵ (ਦੇਰ). Sovey and Green (2011) , Angrist and Krueger (2001) , ਅਤੇ Bollen (2012) ਰਾਜਨੀਤੀ ਵਿਗਿਆਨ, ਅਰਥਸ਼ਾਸਤਰ, ਅਤੇ ਸਮਾਜ ਸ਼ਾਸਤਰ ਵਿਚ ਸਹਾਇਕ ਵਸਤੂਆਂ ਦੀ ਵਰਤੋਂ ਦੀਆਂ ਸਮੀਖਿਆਵਾਂ ਪੇਸ਼ ਕਰਦੇ ਹਨ ਅਤੇ Sovey and Green (2011) "ਰੀਡਰ ਦੀ ਜਾਂਚ ਸੂਚੀ" ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ. ਵਗੈਰਾ ਵੈਲਿਉਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅਧਿਐਨਾਂ ਦੀ ਪੜਤਾਲ ਕਰਨੀ
ਇਹ ਪਤਾ ਚਲਦਾ ਹੈ ਕਿ 1970 ਡਰਾਫਟ ਲੈਟਰੀ ਨਹੀਂ ਸੀ, ਅਸਲ ਵਿਚ ਇਸ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਰੈਂਡਮ ਕੀਤਾ ਗਿਆ ਸੀ; ਸ਼ੁੱਧ ਬੇਤਰਤੀਬੇ (Fienberg 1971) ਤੋਂ ਛੋਟੀਆਂ ਤਬਦੀਲੀਆਂ ਸਨ Berinsky and Chatfield (2015) ਦਲੀਲ ਦਿੰਦੇ ਹਨ ਕਿ ਇਹ ਛੋਟੀ ਜਿਹੀ ਵਿਵਹਾਰ Berinsky and Chatfield (2015) ਮਹੱਤਵਪੂਰਨ ਨਹੀਂ ਹੈ ਅਤੇ ਸਹੀ ਤਰ੍ਹਾਂ ਤਿਆਰ ਕੀਤੀਆਂ ਰੈਂਡਮਾਇਜ਼ੀਕਰਣ ਦੇ ਮਹੱਤਵ ਬਾਰੇ ਚਰਚਾ ਕਰਦਾ ਹੈ.
ਮਿਲਾਨ ਦੇ ਰੂਪ ਵਿੱਚ, ਆਸ਼ਾਵਾਦੀ ਰਿਵਿਊ ਲਈ Stuart (2010) ਅਤੇ ਨਿਰਾਸ਼ਾਵਾਦੀ ਸਮੀਖਿਆ ਲਈ Sekhon (2009) . ਇੱਕ ਕਿਸਮ ਦੀ ਛਾਂਗਣ ਦੇ ਤੌਰ ਤੇ ਮਿਲਾਨ ਲਈ ਹੋਰ ਵੇਖੋ, ਵੇਖੋ Ho et al. (2007) . ਹਰ ਇੱਕ ਵਿਅਕਤੀ ਲਈ ਇੱਕ ਵੀ ਸੰਪੂਰਣ ਮੈਚ ਲੱਭਣਾ ਅਕਸਰ ਮੁਸ਼ਕਿਲ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਇਸ ਵਿੱਚ ਬਹੁਤ ਸਾਰੀਆਂ ਗੁੰਝਲਦਾਰਤਾਵਾਂ ਸ਼ਾਮਿਲ ਹੁੰਦੀਆਂ ਹਨ ਪਹਿਲੀ, ਜਦੋਂ ਸਹੀ ਮੇਲ ਉਪਲਬਧ ਨਾ ਹੋਣ, ਖੋਜਕਾਰਾਂ ਨੂੰ ਫੈਸਲਾ ਕਰਨਾ ਹੋਵੇਗਾ ਕਿ ਦੋ ਇਕਾਈਆਂ ਦੇ ਵਿਚਕਾਰ ਦੀ ਦੂਰੀ ਨੂੰ ਕਿਵੇਂ ਮਾਪਣਾ ਹੈ ਅਤੇ ਜੇ ਦਿੱਤੀ ਗਈ ਦੂਰੀ ਕਾਫ਼ੀ ਨੇੜੇ ਹੈ. ਦੂਜੀ ਗੁੰਝਲਤਾ ਪੈਦਾ ਹੁੰਦੀ ਹੈ ਜੇ ਖੋਜਕਰਤਾ ਇਲਾਜ ਸਮੂਹ ਵਿਚ ਹਰੇਕ ਕੇਸ ਲਈ ਬਹੁਤੇ ਮੈਚਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹਨ, ਕਿਉਂਕਿ ਇਸ ਨਾਲ ਵਧੇਰੇ ਸਹੀ ਅੰਦਾਜ਼ੇ ਹੋ ਸਕਦੀਆਂ ਹਨ. ਇਨ੍ਹਾਂ ਦੋਵਾਂ ਮੁੱਦਿਆਂ ਦੇ ਨਾਲ-ਨਾਲ ਹੋਰ, ਜਿਨ੍ਹਾਂ ਨੂੰ Imbens and Rubin (2015) ਦੇ ਅਧਿਆਇ 18 ਵਿੱਚ ਵਿਸਤ੍ਰਿਤ ਰੂਪ ਦਿੱਤਾ ਗਿਆ ਹੈ. ( ??? ) ਦੇ ਭਾਗ II ਵੀ ਵੇਖੋ.
ਇੱਕ ਉਦਾਹਰਣ ਲਈ Dehejia and Wahba (1999) ਦੇਖੋ, ਜਿੱਥੇ ਮਿਲਾਨ ਢੰਗ ਨਾਲ ਇੱਕ ਰਲਵੇਂ ਕੰਟਰੋਲ ਕੀਤੇ ਪ੍ਰਯੋਗਾਂ ਤੋਂ ਅਨੁਮਾਨ ਲਗਾਉਣ ਦੇ ਸਮਰੱਥ ਸੀ. ਪਰ, ਉਦਾਹਰਨ ਲਈ ਜਿੱਥੇ ਮੈਚਿੰਗ ਢੰਗ ਇੱਕ ਪ੍ਰਯੋਗਾਤਮਕ ਮਾਪਦੰਡ ਪੈਦਾ ਕਰਨ ਵਿੱਚ ਅਸਫਲ ਹੋਏ, ਉਨ੍ਹਾਂ ਲਈ Arceneaux, Gerber, and Green (2006) ਅਤੇ Arceneaux, Gerber, and Green (2010) .
Rosenbaum (2015) ਅਤੇ Hernán and Robins (2016) ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਦੇ ਅੰਦਰ ਲਾਭਦਾਇਕ ਤੁਲਨਾ ਲੱਭਣ ਲਈ ਹੋਰ ਸਲਾਹ ਪੇਸ਼ ਕਰਦੇ ਹਨ.