مقدمة

بدأ هذا الكتاب في عام 2005 في قبو في جامعة كولومبيا. في ذلك الوقت ، كنت طالبة دراسات عليا ، وكنت أدير تجربة عبر الإنترنت ستصبح في نهاية الأمر أطروحة. سأخبركم جميعًا بالأجزاء العلمية لتلك التجربة في الفصل 4 ، لكن الآن سأخبرك عن شيء ليس في رسالتي أو في أي من مقالاتي. وهذا شيء غيّر بشكل أساسي كيف أفكر في البحث. في صباح أحد الأيام ، عندما جئت إلى مكتب الطابق السفلي ، اكتشفت أن حوالي 100 شخص من البرازيل شاركوا في تجربتي طوال الليل. هذه التجربة البسيطة كان لها تأثير عميق علي. في ذلك الوقت ، كان لدي أصدقاء كانوا يديرون التجارب المعملية التقليدية ، وأدركت كم كان من الصعب عليهم العمل على تجنيد الأشخاص والإشراف عليهم ودفعهم للمشاركة في هذه التجارب ؛ إذا تمكنوا من تشغيل 10 أشخاص في يوم واحد ، فهذا كان تقدمًا جيدًا. ومع ذلك ، مع تجربتي عبر الإنترنت ، شارك 100 شخص أثناء نومي. قد يبدو البحث الذي تقوم به أثناء نومك جيدًا لدرجة يصعب تصديقه ، لكنه ليس كذلك. تعني التغييرات في التكنولوجيا - وبالتحديد الانتقال من العصر التناظري إلى العصر الرقمي - أنه يمكننا الآن جمع وتحليل البيانات الاجتماعية بطرق جديدة. يدور هذا الكتاب حول إجراء البحوث الاجتماعية بهذه الطرق الجديدة.

هذا الكتاب مخصص لعلماء الاجتماع الذين يرغبون في عمل المزيد من علم البيانات ، وعلماء البيانات الذين يرغبون في القيام بمزيد من العلوم الاجتماعية ، وأي شخص مهتم بهجين من هذين المجالين. بالنظر إلى من هو هذا الكتاب ، يجب أن يذهب دون أن يقول أنه ليس فقط للطلاب والأساتذة. على الرغم من أنني أعمل حاليًا في جامعة (برينستون) ، وكنت أعمل أيضًا في الحكومة (في مكتب الإحصاء الأمريكي) وفي مجال التكنولوجيا (في Microsoft Research) ، لذلك أعرف أن هناك الكثير من الأبحاث المثيرة التي تحدث خارج الجامعات. إذا كنت تفكر في ما تقوم به كأبحاث اجتماعية ، فهذا الكتاب هو لك ، بغض النظر عن مكان عملك أو أي نوع من الأساليب التي تستخدمها حاليًا.

كما قد تكون لاحظت بالفعل ، تختلف نغمة هذا الكتاب قليلاً عن العديد من الكتب الأكاديمية الأخرى. هذا مقصود. ظهر هذا الكتاب من ندوة الدراسات العليا حول العلوم الاجتماعية الحسابية التي قمت بتدريسها في برينستون في قسم علم الاجتماع منذ عام 2007 ، وأود أن أحصل على بعض الطاقة والإثارة من تلك الندوة. على وجه الخصوص ، أريد أن يكون لهذا الكتاب ثلاث خصائص: أريده أن يكون مفيدًا ، وموجهاً نحو المستقبل ، ومتفائلاً.

مفيد : هدفي هو كتابة كتاب مفيد لك. لذلك ، سأكتب بأسلوب مفتوح ، غير رسمي ، ومُدار على سبيل المثال. ذلك لأن أهم شيء أريد أن أنقله هو طريقة معينة للتفكير في البحث الاجتماعي. وتشير خبرتي إلى أن أفضل طريقة لنقل طريقة التفكير هذه هي بشكل غير رسمي ومع الكثير من الأمثلة. أيضا ، في نهاية كل فصل ، لدي قسم يسمى "ما سيتم قراءته بعد ذلك" والذي سيساعدك على الانتقال إلى قراءات أكثر تفصيلاً وتقنية حول العديد من الموضوعات التي أقدمها. في النهاية ، آمل أن يساعدك هذا الكتاب في إجراء البحوث وتقييم أبحاث الآخرين.

المستقبل المنحى: هذا الكتاب سوف تساعدك على إجراء البحوث الاجتماعية باستخدام الأنظمة الرقمية الموجودة اليوم وتلك التي سيتم إنشاؤها في المستقبل. بدأت في إجراء هذا النوع من الأبحاث في عام 2004 ، ومنذ ذلك الحين رأيت العديد من التغييرات ، وأنا متأكد من أنه على مدار مسيرتك سوف ترى العديد من التغييرات أيضًا. الحيلة للبقاء ذات الصلة في مواجهة التغيير هي فكرة مجردة . على سبيل المثال ، لن يكون هذا كتابًا يعلمك بالضبط كيفية استخدام واجهة برمجة تطبيقات Twitter كما هي اليوم ؛ بدلا من ذلك ، سوف يعلمك كيف تتعلم من مصادر البيانات الضخمة (الفصل 2). هذا لن يكون كتابًا يعطيك تعليمات خطوة بخطوة لتشغيل التجارب على Amazon Mechanical Turk ؛ بدلاً من ذلك ، ستعلمك كيفية تصميم وتفسير التجارب التي تعتمد على البنية الرقمية العمرية (الفصل 4). أرجو من خلال استخدام التجريد أن يكون هذا كتابًا خالصًا حول موضوع مناسب.

التفاؤل : إن المجتمعين اللذين يربطهما هذا الكتاب - علماء الاجتماع وعلماء البيانات - لديهم خلفيات واهتمامات مختلفة تمامًا. بالإضافة إلى هذه الاختلافات المتعلقة بالعلوم ، والتي تحدثت عنها في الكتاب ، لاحظت أيضًا أن هاتين الطائفتين لديهما أساليب مختلفة. علماء البيانات متحمسون بشكل عام ؛ يميلون إلى رؤية الزجاج نصف ممتلئ. علماء الاجتماع ، من ناحية أخرى ، أكثر انتقادا عموما. يميلون إلى رؤية الزجاج نصف فارغ. في هذا الكتاب ، سأتبنى النبرة المتفائلة لعالم البيانات. لذا ، عندما أقدم الأمثلة ، سأقول لك ما أحب حول هذه الأمثلة. وعندما أشير إلى المشاكل مع الأمثلة - وسأفعل ذلك لأنه لا يوجد بحث مثالي - سأحاول أن أشير إلى هذه المشاكل بطريقة إيجابية ومتفائلة. لن أكون حرجًا من أجل أن أكون حرجًا - سأكون حرجًا حتى أتمكن من مساعدتك في إنشاء بحث أفضل.

ما زلنا في الأيام الأولى للبحث الاجتماعي في العصر الرقمي ، لكني رأيت بعض حالات سوء الفهم الشائعة لدرجة أنه من المنطقي بالنسبة إليّ أن أخاطبها هنا ، في المقدمة. من علماء البيانات ، رأيت اثنين من سوء الفهم المشترك. الأول هو التفكير في أن المزيد من البيانات تحل المشاكل تلقائيًا. ومع ذلك ، بالنسبة للبحوث الاجتماعية ، لم تكن تجربتي. في الواقع ، بالنسبة للابحاث الاجتماعية ، يبدو أن البيانات الأفضل - على العكس من المزيد من البيانات - أكثر فائدة. سوء الفهم الثاني الذي رأيته من علماء البيانات هو التفكير في أن العلوم الاجتماعية هي مجرد مجموعة من الكلام الفارغ الملتف حول الحس السليم. وبطبيعة الحال ، فأنا كعالم اجتماعي - وبشكل أكثر تحديدًا كعالم اجتماع - لا أوافق على ذلك. لقد عمل الأشخاص الأذكياء بجد لفهم السلوك البشري لفترة طويلة ، ويبدو من غير الحكمة تجاهل الحكمة المتراكمة من هذا الجهد. آمل أن يقدم لك هذا الكتاب بعض هذه الحكمة بطريقة يسهل فهمها.

من علماء الاجتماع ، رأيت أيضًا سوء فهم شائعين. أولاً ، لقد شاهدت بعض الأشخاص يشطبون فكرة البحث الاجتماعي باستخدام أدوات العصر الرقمي بسبب بعض الأوراق السيئة. إذا كنت تقرأ هذا الكتاب ، فمن المحتمل أنك قرأت بالفعل مجموعة من الأوراق تستخدم بيانات الشبكات الاجتماعية بطرق عادية أو خاطئة (أو كليهما). لدي ايضا. ومع ذلك ، قد يكون من الخطأ الفادح أن نستخلص من هذه الأمثلة أن جميع البحوث الاجتماعية في العصر الرقمي سيئة. في الواقع ، ربما تكون قد قرأت أيضًا مجموعة من الأوراق تستخدم بيانات المسح بطرق عادية أو خاطئة ، لكنك لا تشطب جميع الأبحاث باستخدام استطلاعات الرأي. هذا لأنك تعلم أن هناك بحثًا رائعًا تم إجراؤه مع بيانات المسح ، وفي هذا الكتاب ، سأوضح لك أن هناك أيضًا بحثًا رائعًا تم إجراؤه باستخدام أدوات العصر الرقمي.

سوء الفهم الثاني الذي رأيته من علماء الاجتماع هو الخلط بين الحاضر والمستقبل. عندما نقيّم البحث الاجتماعي في العصر الرقمي - وهو البحث الذي سأصفه - من المهم أن نسأل سؤالين مختلفين: "ما مدى نجاح هذا النمط من البحث في الوقت الحالي؟" و "ما مدى جودة هذا النمط من البحث؟" العمل البحثي في ​​المستقبل؟ ”يتم تدريب الباحثين على الإجابة على السؤال الأول ، ولكن بالنسبة لهذا الكتاب أعتقد أن السؤال الثاني أكثر أهمية. أي أنه على الرغم من أن البحوث الاجتماعية في العصر الرقمي لم تسفر بعد عن مساهمات فكرية ضخمة ومتغيرة ، فإن معدل تحسين أبحاث العصر الرقمي سريع بشكل لا يصدق. إن معدل التغيير هذا - أكثر من المستوى الحالي - هو ما يجعل البحث في العصر الرقمي أمراً مثيراً بالنسبة لي.

على الرغم من أن هذه الفقرة الأخيرة قد يبدو أنها توفر لك ثروات محتملة في وقت غير محدد في المستقبل ، فإن هدفي ليس بيعك على أي نوع معين من الأبحاث. لا أمتلك شخصيًا في Twitter أو Facebook أو Google أو Microsoft أو Apple أو أي شركة أخرى للتكنولوجيا (على الرغم من أنه من أجل الإفصاح الكامل ، يجب أن أذكر أنني قد عملت في ، أو حصلت على تمويل أبحاث من Microsoft ، جوجل ، والفيسبوك). لذلك ، فإن هدفي هو الحفاظ على راوي موثوق به ، يخبرك عن كل الأشياء الجديدة والمثيرة الممكنة ، بينما يوجهك بعيدًا عن بعض الفخاخ التي رأيتها تقع على عاتق الآخرين (وأحيانا وقعت في نفسي) .

يسمى أحيانًا تقاطع العلوم الاجتماعية وعلوم البيانات بالعلوم الاجتماعية الحسابية. يعتبر البعض أن هذا مجال تقني ، لكن هذا لن يكون كتابًا فنيًا بالمعنى التقليدي. على سبيل المثال ، لا توجد معادلات في النص الرئيسي. اخترت كتابة هذا الكتاب لأنني أردت تقديم نظرة شاملة للبحث الاجتماعي في العصر الرقمي ، بما في ذلك مصادر البيانات الكبيرة ، والدراسات الاستقصائية ، والتجارب ، والتعاون الجماعي ، والأخلاقيات. تبين أنه من المستحيل تغطية كل هذه الموضوعات وتقديم تفاصيل تقنية حول كل منها. بدلاً من ذلك ، يتم إعطاء مؤشرات إلى مزيد من المواد التقنية في قسم "ما سيتم قراءته بعد ذلك" في نهاية كل فصل. بمعنى آخر ، هذا الكتاب ليس مصممًا ليعلمك كيفية إجراء أي حساب محدد ؛ بدلاً من ذلك ، تم تصميمه لتغيير الطريقة التي تفكر بها في البحث الاجتماعي.

كيفية استخدام هذا الكتاب في دورة تدريبية

كما قلت من قبل ، ظهر هذا الكتاب جزئياً من ندوة الدراسات العليا حول العلوم الاجتماعية الحسابية التي قمت بتدريسها منذ عام 2007 في برينستون. نظرًا لأنك ربما تفكر في استخدام هذا الكتاب لتدريس دورة تدريبية ، ففكرت أنه قد يكون من المفيد بالنسبة لي أن أشرح كيف نشأت من الدورة التدريبية وكيف أتخيل أنها تستخدم في دورات أخرى.

لعدة سنوات ، درست درسي بدون كتاب. كنت مجرد تعيين مجموعة من المقالات. بينما كان الطلاب قادرين على التعلم من هذه المقالات ، لم تكن المقالات وحدها تؤدي إلى التغييرات المفاهيمية التي كنت آمل في إنشاءها. لذلك ، سأقضي معظم الوقت في الفصل لتقديم منظور وسياق ونصائح لمساعدة الطلاب على رؤية الصورة الكبيرة. هذا الكتاب هو محاولتي لكتابة كل هذا المنظور والسياق والمشورة بطريقة لا تنطوي على أي شروط مسبقة - سواء من حيث العلوم الاجتماعية أو علم البيانات.

في فصل دراسي طويل ، أوصيك بإقران هذا الكتاب بمجموعة متنوعة من القراءات الإضافية. على سبيل المثال ، قد تستغرق هذه الدورة أسبوعين في التجارب ، ويمكنك إقران الفصل 4 بقراءات حول مواضيع مثل دور معلومات ما قبل المعالجة في تصميم وتحليل التجارب ؛ القضايا الإحصائية والحسابية التي تثيرها اختبارات A / B واسعة النطاق في الشركات ؛ تصميم تجارب تركز بشكل خاص على الآليات ؛ القضايا العملية والعلمية والأخلاقية المتعلقة باستخدام المشاركين من أسواق العمل عبر الإنترنت ، مثل Amazon Mechanical Turk. ويمكن أيضًا إقرانها بالقراءات والأنشطة المتعلقة بالبرمجة. يعتمد الاختيار المناسب بين هذه الأزواج الممكنة المتعددة على الطلاب في دراستك (على سبيل المثال ، المرحلة الجامعية ، أو الماجستير ، أو الدكتوراه) ، وخلفياتهم ، وأهدافهم.

يمكن أن تشتمل الدورة التدريبية على الفصل الدراسي على مجموعات مشكلة أسبوعية. يحتوي كل فصل على مجموعة متنوعة من الأنشطة التي يتم تصنيفها حسب درجة الصعوبة: سهلة ( سهل )، متوسط ​​( متوسط )، الصعب ( الصعب ) ، وصعب للغاية ( صعب جدا ). أيضًا ، لقد صنفت كل مشكلة بالمهارات التي تتطلبها: الرياضيات ( يتطلب الرياضيات ) ، الترميز ( يتطلب الترميز ) ، وجمع البيانات ( جمع البيانات ). أخيرًا ، لقد صنّفت بعض الأنشطة التي هي المفضلة الشخصية ( أُفضله ). آمل أن تجد ضمن هذه المجموعة المتنوعة من الأنشطة بعضًا تلائم طلابك.

من أجل مساعدة الأشخاص الذين يستخدمون هذا الكتاب في الدورات التدريبية ، لقد بدأت مجموعة من المواد التعليمية مثل المناهج الدراسية ، والشرائح ، والتزايدات الموصى بها لكل فصل ، وحلول لبعض الأنشطة. يمكنك العثور على هذه المواد - والمساهمة فيها - على http://www.bitbybitbook.com.