本書中的兩個主題是1)混合現成品和自定義和2)道德。
本書中有兩個主題,現在我想強調它們,以便你一遍又一遍地註意到它們。第一個可以通過比較兩個偉人的比喻來說明:馬塞爾杜尚和米開朗基羅。杜尚以他的現成品而聞名,例如噴泉 ,在那裡他拿走普通物品並將它們重新用作藝術品。另一方面,米開朗基羅沒有重新利用。當他想要創造一尊大衛雕像時,他並沒有找到一塊看起來像大衛的大理石:他花了三年時間努力創作他的傑作。 大衛不是現成的;這是一個定制的(圖1.2)。
這兩種風格 - 現成品和自定義 - 大致映射到可用於數字時代社會研究的風格。正如您將看到的,本書中的一些示例涉及巧妙地重新利用最初由公司和政府創建的大數據源。然而,在其他示例中,研究人員從一個特定問題開始,然後使用數字時代的工具來創建回答該問題所需的數據。如果做得好,這兩種風格都會非常強大。因此,數字時代的社會研究將涉及現成品和習俗;它將涉及Duchamps和Michelangelos。
如果您通常使用現成數據,我希望本書能夠向您展示自定義數據的價值。同樣,如果您通常使用自定義數據,我希望本書能夠向您展示現成數據的價值。最後,最重要的是,我希望本書能夠向您展示這兩種風格相結合的價值。例如,Joshua Blumenstock及其同事是杜尚的一部分,也是米開朗基羅的一部分;他們重新調整了通話記錄(現成品)並創建了自己的調查數據(定制)。現成和自定義的混合是一種模式,您將在本書中看到這種模式;它往往需要社會科學和數據科學的思想,而且往往會帶來最激動人心的研究。
貫穿本書的第二個主題是道德。我將向您展示研究人員如何利用數字時代的能力進行激動人心的重要研究。我將向您展示如何利用這些機會的研究人員將面臨艱難的道德決策。第6章將完全致力於道德規範,但我也將道德規範納入其他章節,因為在數字時代,道德規範將成為研究設計中不可或缺的一部分。
Blumenstock及其同事的工作再次說明。能夠訪問150萬人的精細呼叫記錄,為研究創造了絕佳的機會,但也創造了傷害的機會。例如,Jonathan Mayer及其同事(2016)已經表明,即使是“匿名”的呼叫記錄(即沒有姓名和地址的數據)也可以與公開信息結合使用,以便識別數據中的特定人員並推斷出有關的敏感信息。他們,比如某些健康信息。需要明確的是,Blumenstock及其同事並沒有試圖推斷任何人的敏感信息,但這種可能性意味著他們很難獲得呼叫數據,並迫使他們在進行研究時採取廣泛的保護措施。
除了通話記錄的細節之外,還存在一個貫穿數字時代的大量社會研究的根本緊張。研究人員 - 通常與公司和政府合作 - 在參與者的生活中擁有越來越大的權力。通過權力,我的意思是能夠在沒有他們的同意甚至意識的情況下向人們做事。例如,研究人員現在可以觀察數百萬人的行為,正如我稍後將要描述的,研究人員還可以在數百萬人中進行大規模實驗。此外,所有這些都可能在沒有相關人員的同意或意識的情況下發生。隨著研究人員的力量越來越大,關於如何使用這種能力的清晰度沒有相應的增加。事實上,研究人員必鬚根據不一致和重疊的規則,法律和規範來決定如何行使權力。強大的能力和模糊的指導方針的結合可以迫使善意的研究人員努力解決困難的決策。
如果您通常關注數字時代的社會研究如何創造新的機會,我希望本書能夠向您展示這些機會也會帶來新的風險。同樣,如果您通常關注這些風險,我希望本書能夠幫助您了解可能需要某些風險的機遇機會。最後,也是最重要的是,我希望本書能夠幫助每個人負責任地平衡數字時代社會研究帶來的風險和機遇。隨著權力的增加,責任也必須增加。