önsöz

Bu kitap, 2005 yılında Columbia Üniversitesi'nde bir bodrumda başladı. O zaman, lisansüstü bir öğrenciydim ve sonunda tezim olacak bir online deneme yürütüyordum. Bu deneyin 4. bölümdeki bilimsel bölümleri hakkında size anlatacağım, ama şimdi size tezim veya kağıtlarımın hiçbirinde olmayan bir şeyi anlatacağım. Ve bu, araştırma hakkında ne düşündüğümü temelden değiştiren bir şey. Bir sabah, bodrum ofisime geldiğimde, Brezilya'da 100'den fazla insanın deneyime katıldığını keşfettim. Bu basit deneyimin üzerinde derin bir etkisi oldu. O zamanlar, geleneksel laboratuvar deneylerini yürüten arkadaşlarım vardı ve bu deneylere katılmak için insanları işe almak, denetlemek ve ödemek için ne kadar çalıştıklarını biliyordum; Bir günde 10 kişi çalıştırabilirlerse, bu iyi bir ilerlemeydi. Ancak, çevrimiçi denememle birlikte uyurken 100 kişi katıldı. Araştırma yaparken uyurken, doğru olmak için çok iyi gelebilir, ama öyle değil. Teknolojideki değişiklikler - özellikle analog çağdan dijital çağa geçiş - artık sosyal verileri yeni yollarla toplayıp analiz edebileceğimiz anlamına geliyor. Bu kitap, bu yeni yollarla sosyal araştırma yapmakla ilgilidir.

Bu kitap, daha fazla veri bilimi yapmak isteyen sosyal bilimciler, daha fazla sosyal bilim yapmak isteyen veri bilimcileri ve bu iki alanın meleziyle ilgilenen herkes içindir. Bu kitabın kime ait olduğu göz önüne alındığında, bunun sadece öğrenciler ve profesörler için olmadığını söylemek gerekir. Halen bir üniversitede çalışıyorum (Princeton), ayrıca (ABD Sayım Bürosu) hükümetinde ve teknoloji endüstrisinde (Microsoft Research'te) çalıştım, bu yüzden dışarıda gerçekleşen çok heyecan verici bir araştırma olduğunu biliyorum. üniversiteler. Sosyal araştırma olarak ne yaptığınızı düşünürseniz, o zaman bu kitap sizin için, nerede çalıştığınız veya hangi tür teknikler kullandığınız önemli değil.

Zaten fark etmiş olabileceğiniz gibi, bu kitabın tonu diğer birçok akademik kitaptan biraz farklı. Bu kasıtlı. Bu kitap, 2007'den beri Sosyoloji Bölümü'nde Princeton'da ders verdiğim sayısal sosyal bilimler üzerine bir yüksek lisans seminerinden doğmuştur ve bu seminerden bir miktar enerji ve heyecanı yakalamak isterim. Özellikle, bu kitabın üç özelliğe sahip olmasını istiyorum: Bunun yararlı, geleceğe yönelik ve iyimser olmasını istiyorum.

Faydalı : Amacım size yardımcı olacak bir kitap yazmak. Bu nedenle, açık, gayri resmi ve örnek odaklı bir tarzda yazacağım. Çünkü aktarmak istediğim en önemli şey, sosyal araştırmalar hakkında belirli bir düşünme şeklidir. Ve benim deneyimlerim, bu düşünce tarzını iletmenin en iyi yolunun gayri resmi ve pek çok örnek olduğunu ortaya koyuyor. Ayrıca, her bölümün sonunda, “Ne okuyacaksın” adlı bir bölümüm var ki, benim sunduğum birçok konu hakkında daha detaylı ve teknik okumalara geçiş yapmanıza yardımcı olacak. Sonunda, bu kitabın hem araştırma yapmanıza hem de başkalarının araştırmalarını değerlendirmenize yardımcı olacağını umuyorum.

Gelecek odaklı: Bu kitap, dijital bugün mevcut sistemleri ve gelecekte oluşturulacak olanlar kullanarak sosyal araştırma yapmak için yardımcı olacaktır. 2004 yılında bu tür araştırmalara başladım ve o zamandan beri pek çok değişiklik gördüm ve eminim ki kariyerinizin ilerleyişi boyunca pek çok değişiklik göreceksiniz. Değişim karşısında ilgili kalmanın hilesi soyutlamadır . Örneğin, bu, Twitter API'sini bugün olduğu gibi nasıl kullanacağınızı tam olarak öğreten bir kitap olmayacak; bunun yerine, büyük veri kaynaklarından nasıl öğreneceğinizi öğretecektir (bölüm 2). Bu, Amazon Mechanical Turk üzerinde denemeler yapmak için adım adım talimatlar veren bir kitap olmayacak; bunun yerine, dijital çağ altyapısına dayanan deneyleri nasıl tasarlayacağınızı ve yorumlayacağınızı öğretecektir (bölüm 4). Soyutlamanın kullanılmasıyla, umarım bu konuyla ilgili zamansız bir kitap olacaktır.

İyimser : Bu kitabın yürüttüğü iki toplum - sosyal bilimciler ve veri bilimcileri - çok farklı geçmişlere ve ilgilere sahipler. Kitapta bahsettiğim bilim ile ilgili farklılıklara ek olarak, bu iki toplumun farklı tarzları olduğunu da fark ettim. Veri bilimcileri genellikle heyecanlıdır; Camı yarı dolu olarak görmeye eğilimliler. Öte yandan sosyal bilimciler genellikle daha kritiktir; Camı yarı boş olarak görmeye eğilimliler. Bu kitapta, bir veri bilimcisinin iyimser tonunu benimleyeceğim. Bu yüzden, örnekler sunduğumda, size bu örnekler hakkında ne sevdiğimi anlatacağım. Ve örneklerle ilgili sorunlara işaret ettiğimde - bunu yapacağım çünkü hiçbir araştırma mükemmel değil - bu problemleri olumlu ve iyimser bir şekilde göstermeye çalışacağım. Kritik olma uğruna eleştirel olmayacağım - daha iyi bir araştırma yapmanıza yardımcı olabilmek için kritik olacağım.

Dijital çağda hala sosyal araştırmaların ilk günlerinde bulunuyoruz, ama bu konuda çok yaygın olan bazı yanlış anlaşılmalar gördüm. Veri bilimcilerden, iki yaygın yanlış anlaşılmayı gördüm. Birincisi, daha fazla verinin otomatik olarak problemleri çözdüğünü düşünüyor. Ancak, sosyal araştırmalar için bu benim deneyimim değildi. Aslında, sosyal araştırmalar için, daha fazla veri - daha fazla verinin aksine- daha yardımcı olabilir. Veri bilimcilerden gördüğüm ikinci yanlış anlama, sosyal bilimin sağduyuya sarılmış bir fanteziden ibaret olduğunu düşünüyor. Elbette, bir sosyal bilimci olarak - daha spesifik olarak bir sosyolog olarak- buna katılmıyorum. Akıllı insanlar uzun zamandır insan davranışını anlamak için çok çalışıyorlar ve bu çabadan birikmiş olan bilgeliği görmezden gelmek akıllıca görünmüyor. Umarım bu kitap size bu bilgeliğin bir kısmını anlaşılması kolay bir şekilde sunacaktır.

Sosyal bilimcilerden, iki yaygın yanlış anlaşılmayı da gördüm. Birincisi, bazı insanların, dijital çağın araçlarını kullanarak, bazı kötü makaleler yüzünden, sosyal araştırma fikrini yazdığını gördüm. Bu kitabı okuyorsanız, zaten sosyal medya verilerini banal veya yanlış (veya her ikisi de) olan şekillerde kullanan bir grup kağıdı zaten okudunuz. Bende de var. Ancak, bu örneklerden yola çıkarak, tüm dijital çağ sosyal araştırmaların kötü sonuç vermesi ciddi bir hata olacaktır. Aslında, muhtemelen, anket verilerini banal veya yanlış yollarla kullanan bir sürü kağıt okuyorsunuzdur, ancak anketleri kullanarak tüm araştırmaları yazmazsınız. Bunun nedeni anket verileriyle yapılan büyük bir araştırma olduğunu biliyorsunuz ve bu kitapta size dijital çağın araçlarıyla yapılan büyük araştırmaların da olduğunu göstereceğim.

Sosyal bilimcilerden gördüğüm ikinci yaygın yanlış anlama, şimdiki zamanı geleceğe karıştırmaktır. Dijital çağda sosyal araştırmayı değerlendirdiğimizde (tanımlayacağım araştırma) iki ayrı soru sormamız önemlidir: “Şu anda bu araştırma tarzı ne kadar iyi çalışıyor?” Ve “Bu tarz ne kadar iyi olacak? Gelecekte araştırma çalışması? ”Araştırmacılar ilk soruyu cevaplamak için eğitilmişler, ancak bu kitap için ikinci sorunun daha önemli olduğunu düşünüyorum. Yani, dijital çağda sosyal araştırma henüz büyük, paradigmayı değiştiren entelektüel katkılar üretmemiş olsa da, dijital çağ araştırmalarının gelişme oranı inanılmaz derecede hızlıdır. Dijital çağdaki araştırmaları bana bu kadar heyecan verici kılan bu oran, mevcut seviyeden daha fazla.

Bu son paragraf gelecekte belirtilmeyen bir zamanda size potansiyel zenginlikler sunabiliyor gibi görünse de, amacım sizi belirli bir araştırma türüne satmak değil. Kişisel olarak Twitter, Facebook, Google, Microsoft, Apple veya başka bir teknoloji şirketindeki hisseleri sahip değilim (her ne kadar tam açıklama uğruna, Microsoft'tan çalıştığım veya Microsoft'tan araştırma fonu aldığımı belirtmeliyim) Google ve Facebook). Bu nedenle, kitap boyunca, amacım güvenilir bir anlatıcı olarak kalmak, size mümkün olan tüm heyecan verici yeni şeyleri anlatmak, diğerlerini gördüğüm birkaç tuzaktan (ve bazen de kendime düştüğümden) sizi yönlendirmek. .

Sosyal bilimlerin ve veri biliminin kesişimi bazen hesaplama sosyal bilimi olarak adlandırılır. Bazıları bunun teknik bir alan olduğunu düşünüyor, ancak bu geleneksel anlamda teknik bir kitap olmayacak. Örneğin, ana metinde denklemler yoktur. Kitabı bu şekilde yazmayı seçtim çünkü büyük veri kaynakları, anketler, deneyler, kitle işbirliği ve etik dahil olmak üzere dijital çağda sosyal araştırmaların kapsamlı bir görünümünü sağlamak istedim. Tüm bu konuları kapsayacak ve her biri hakkında teknik bilgi vermenin imkansız olduğu ortaya çıktı. Bunun yerine, her bölümün sonundaki “Ne okuyacaksınız” bölümünde daha teknik materyale işaretçiler verilmiştir. Başka bir deyişle, bu kitap size herhangi bir özel hesaplamanın nasıl yapıldığını öğretmek için tasarlanmamıştır; daha ziyade, sosyal araştırma hakkında düşündüğünüz yolu değiştirmek için tasarlanmıştır.

Bu kitap bir derste nasıl kullanılır?

Daha önce de söylediğim gibi, bu kitap kısmen 2007'den beri Princeton'da öğrettiğim sayısal sosyal bilimler üzerine bir yüksek lisans seminerinden ortaya çıktı. Bu kitabı bir ders vermek için kullanmayı düşündüğünüz için, kursunuzdan nasıl büyüdüğümü ve bunun diğer derslerde nasıl kullanıldığını hayal etmemde bana yardımcı olabileceğini düşündüm.

Birkaç yıl boyunca, bir kitap olmadan dersimi okudum; Sadece bir makale koleksiyonu atardım. Öğrenciler bu makalelerden öğrenebildikleri halde, yazılar sadece yaratmayı umduğum kavramsal değişimlere yol açmıyordu. Öyleyse çoğu zaman öğrencilerin büyük resmi görmelerine yardımcı olmak için perspektif, bağlam ve tavsiye sağlayan sınıfta harcadım. Bu kitap, tüm bu perspektifi, bağlamı ve tavsiyeyi, herhangi bir önkoşul olmayan bir şekilde (sosyal bilimler veya veri bilimi açısından) yazma girişimi.

Bir yarıyıl boyunca, bu kitabı çeşitli ek okumalarla eşleştirmenizi tavsiye ederim. Örneğin, bu tür bir ders iki hafta boyunca deneylere katılabilir ve bölüm 4'ü ön-tedavi bilgilerinin tasarım ve deney analizindeki rolü gibi konularda okumalarla eşleştirebilirsiniz; şirketlerdeki büyük ölçekli A / B testleri ile ortaya çıkan istatistiksel ve hesaplamalı konular; Özellikle mekanizmalara odaklanmış deneylerin tasarımı; Amazon Mechanical Turk gibi çevrimiçi işgücü piyasalarından katılımcıların kullanımına ilişkin pratik, bilimsel ve etik konular. Programlama ile ilgili okuma ve etkinliklerle de eşleştirilebilir. Bu birçok olası eşleştirmeler arasındaki uygun seçim, kursunuzdaki (ör. Lisans, yüksek lisans veya doktora) öğrenciler, geçmişleri ve hedeflerine bağlıdır.

Bir dönem boyu kurs, haftalık sorun kümelerini de içerebilir. Her bölüm, zorluk derecesine göre etiketlenmiş çeşitli aktivitelere sahiptir: kolay ( kolay ), orta ( orta ), zor ( zor ) ve çok zor ( çok zor ). Ayrıca, her bir problemi gerektirdiği becerilerle etiketledim: math ( matematik gerektirir ), kodlama ( kodlama gerektirir ) ve veri toplama ( veri koleksiyonu ). Son olarak, kişisel favorilerim olan etkinliklerden birkaçını etiketledim ( benim favorim ). Umarım bu çeşitli aktiviteler koleksiyonunda, öğrencileriniz için uygun olanları bulacaksınız.

Bu kitabı derslerde kullananlara yardımcı olmak için, dersler, slaytlar, her bölüm için önerilen eşlemeler ve bazı etkinliklere yönelik çözümler gibi bir öğretim materyalleri koleksiyonu oluşturdum. Bu materyalleri bulabilir ve onlara katkıda bulunabilir: http://www.bitbybitbook.com.