純粹的現成策略和純粹的定制策略都沒有充分利用數字時代的能力。在未來,我們將創建混合動力車。
在介紹中,我將現成的Marcel Duchamp風格與米開朗基羅的定制風格進行了對比。這種對比也捕捉到了傾向於與現成品一起工作的數據科學家和傾向於使用自定義工作的社會科學家之間的差異。然而,在未來,我希望我們會看到更多的混合動力車,因為這些純粹的方法都是有限的。想要只使用現成品的研究人員將會掙扎,因為世界上沒有很多美麗的現成品。另一方面,想要僅使用自定義選項的研究人員將犧牲規模。然而,混合方法可以將現成品帶來的規模與來自自定義的問題和數據之間的緊密配合相結合。
我們在四個經驗章節的每一章中都看到了這些混合動力的例子。在第2章中,我們了解了Google流感趨勢如何將始終在線的大數據系統(搜索查詢)與基於概率的傳統測量系統(CDC流感監測系統)相結合,以產生更快的估算(Ginsberg et al. 2009) 。在第3章中,我們看到了Stephen Ansolabehere和Eitan Hersh (2012)將定制的調查數據與現成的政府行政數據相結合,以便更多地了解實際投票的人的特徵。在第4章中,我們看到了Opower實驗如何將現成的電力測量基礎設施與定制治療相結合,以研究社會規範對數百萬人行為的影響(Allcott 2015) 。最後,在第5章中,我們看到Kenneth Benoit及其同事(2016)如何將定制的人群編碼過程應用於由政黨創建的現成宣言集,以創建研究人員可用於研究政策辯論動態的數據。
這四個例子都表明,未來強有力的戰略將是豐富大數據源,這些數據源不是為研究創造的,而是提供更多信息,使其更適合研究(Groves 2011) 。無論是從定制產品還是現成品開始,這種混合風格對許多研究問題都有很大希望。