Այս գիրքը սկսվել է 2005 թվականին Կոլումբիայի համալսարանի նկուղում: Այդ ժամանակ ես ասպիրանտ եմ, եւ ես աշխատում էի առցանց փորձ, որը, ի վերջո, դարձավ իմ դիսերտացիան: Ես ձեզ պատմում եմ այդ փորձի գիտական մասերի մասին 4-րդ գլխում, հիմա ես ձեզ պատմելու եմ մի բան այն մասին, որ իմ դիսերտացիայում կամ իմ թերթերից որեւէ մեկում չկա: Եվ դա այն մի բանն է, որն արմատապես փոխեց, թե ինչպես եմ մտածում հետազոտությունների մասին: Մի առավոտ, երբ ես մտա իմ նկուղային գրասենյակ, ես գտա, որ իմ փորձարկումին մասնակցել է Բրազիլիայից շուրջ 100 հոգի: Այս պարզ փորձը ինձ վրա մեծ ազդեցություն ունեցավ: Այդ ժամանակ ես ունեի ընկերներ, որոնք վարում էին ավանդական լաբորատոր փորձեր, եւ ես գիտեի, թե որքան դժվար էր նրանք աշխատել, հավաքագրել, վերահսկել եւ վճարել այդ փորձերին մասնակցելու մարդկանց: եթե մի օրվա ընթացքում կարող էին 10 հոգի աշխատել, դա լավ առաջընթաց էր: Այնուամենայնիվ, իմ առցանց փորձով 100 հոգի մասնակցում էի, երբ քնած էրի : Կատարելով ձեր հետազոտությունը քնած ժամանակ, կարող եք շատ լավ հնչեցնել, որ ճշմարիտ լինի, բայց դա ոչ: Տեխնոլոգիական փոփոխությունները, մասնավորապես, անալոգային տարիքից թվային տարիքին անցումը նշանակում է, որ մենք այժմ կարող ենք հավաքագրել եւ վերլուծել սոցիալական տվյալների նոր ձեւերով: Այս գիրքը այս նոր ձեւերով սոցիալական հետազոտություն կատարելու մասին է:
Այս գիրքը նախատեսված է սոցիալական գիտնականների համար, ովքեր ցանկանում են ավելի շատ տվյալների գիտություն, տվյալների գիտնականներ, ովքեր ցանկանում են ավելի շատ սոցիալական գիտություն կատարել, եւ բոլորը հետաքրքրված են այդ երկու ոլորտների հիբրիդով: Հաշվի առնելով, թե ով է այս գիրքը, պետք է գնա առանց ասելու, որ դա ոչ միայն ուսանողների եւ դասախոսների համար է: Թեեւ ներկայումս աշխատում եմ համալսարանում (Princeton), ես աշխատել եմ նաեւ կառավարությունում (ԱՄՆ մարդահամարի բյուրոյի) եւ տեխնոլոգիական արդյունաբերության մեջ (Microsoft Research- ում), այնպես որ ես գիտեմ, որ շատ հետաքրքիր հետազոտություններ տեղի են ունենում դուրս համալսարաններ: Եթե կարծում եք, թե ինչ եք անում, որպես սոցիալական հետազոտություն, ապա այս գիրքը ձեզ համար է, անկախ նրանից, թե որտեղ եք աշխատում կամ ինչպիսի տեխնիկա եք օգտագործում:
Ինչպես արդեն նկատել եք, այս գիրքի տոնը փոքր-ինչ տարբերվում է շատ այլ ակադեմիական գրքերից: Դա կանխամտածված է: Այս գիրքը հայտնվել է սոցիոլոգիայի ամբիոնում սոցիոլոգիայի վերաբերյալ շրջանավարտ սեմինարից, որը ես սովորել եմ սոցիոլոգիայի ամբիոնում 2007 թ.-ից, եւ ես կցանկանայի, որ այն ներգրավվի սեմինարի որոշ էներգետիկ եւ հուզմունքով: Մասնավորապես, ես ուզում եմ, որ այս գիրքը ունենա երեք բնութագիր. Ես ուզում եմ, որ այն լինի օգտակար, ապագա կողմնորոշված եւ լավատես:
Օգտակար . Իմ նպատակն է գրել մի գիրք, որն օգտակար է ձեզ համար: Հետեւաբար, ես պատրաստվում եմ գրել բաց, ոչ ֆորմալ եւ օրինակի վրա հիմնված ոճով: Դա է պատճառը, որ ամենակարեւորը, որ ես ուզում եմ հաղորդել, սոցիալական հետազոտությունների որոշակի ձեւի մասին է: Եվ իմ փորձը ցույց է տալիս, որ այս մտածելակերպը փոխանցելու լավագույն ձեւը ոչ պաշտոնական է եւ բազմաթիվ օրինակներ: Բացի այդ, յուրաքանչյուր գլխի վերջում ես ունեմ «Ինչ կարդա հաջորդը» բաժինը, որը կօգնի ձեզ անցնել ավելի մանրամասն եւ տեխնիկական ընթերցումներ, որոնք ես ներկայացնում եմ այն թեմաներից շատերը: Ի վերջո, ես հուսով եմ, որ այս գիրքը կօգնի ձեզ, թե հետազոտություններ կատարեք, եւ թե գնահատեք ուրիշների ուսումնասիրությունները:
Ապագա կողմնորոշված . Այս գիրքը կօգնի ձեզ կատարել սոցիալական հետազոտություն, օգտագործելով թվային համակարգեր, որոնք առկա են այսօր եւ այնտեղ , որոնք կստեղծվեն ապագայում: Ես սկսեցի այսպիսի հետազոտություն կատարել 2004 թվականին, եւ դրանից հետո շատ փոփոխություններ եմ տեսել, եւ վստահ եմ, որ ձեր կարիերայի ընթացքում դուք կտեսնեք շատ փոփոխություններ: Փոփոխության առումով կարեւորը մնալը հնարավոտն է : Օրինակ, սա չի պատրաստվում լինել մի գիրք, որը սովորեցնում է ձեզ, թե ինչպես օգտագործել Twitter API- ը, որն առկա է այսօր; փոխարենը պատրաստվում է ձեզ սովորեցնել մեծ տվյալների աղբյուրներից (2-րդ գլուխ): Սա չի պատրաստվում լինել գիրք, որը Ձեզ հնարավորություն է տալիս քայլ առ քայլ հրահանգներ գործարկել Amazon Mechanical Turk- ի փորձարկումների համար: փոխարենը պատրաստվում է ձեզ սովորեցնել եւ մեկնաբանել փորձերը, որոնք հիմնված են թվային տարիքային ենթակառուցվածքին (4-րդ գլուխ): Աբստրակտի օգտագործմամբ, ես հույս ունեմ, որ դա ժամանակին թեմա է լինելու անժամկետ գիրք:
Լավատես . Այս գիրքը ներգրավված երկու համայնքները, սոցիալական գիտնականները եւ տվյալների գիտնականները, ունեն շատ տարբեր ծագում եւ շահ: Բացի այս գիտական տարբերություններին, որոնք ես խոսում եմ գրքում, ես նկատեցի նաեւ, որ այս երկու համայնքներն ունեն տարբեր ոճեր: Տվյալների գիտնականները հիմնականում ոգեւորված են. նրանք հակված են տեսնել ապակու կես մասը: Սոցիալական գիտնականները, ընդհանուր առմամբ, ավելի քննադատական են, նրանք հակված են տեսնել ապակու կեսը դատարկ: Այս գրքում ես պատրաստվում եմ ընդունել տվյալների գիտնականի լավատեսական տոնը: Այսպիսով, երբ ներկայացնեմ օրինակներ, ես պատմելու եմ այն, ինչ ես սիրում եմ այս օրինակների մասին: Եվ երբ ես մատնանշում եմ օրինակների հետ կապված խնդիրները, եւ ես դա անելու եմ, որովհետեւ ոչ մի հետազոտություն կատարյալ չէ, ես փորձելու եմ այդ խնդիրները դրական եւ լավատես լինել: Ես չեմ պատրաստվում լինել քննադատական լինելու համար, ես քննադատող կլինեմ, որպեսզի կարողանամ օգնել ձեզ ավելի լավ հետազոտություն ստեղծել:
Մենք դեռ թվային դարաշրջանի սոցիալական հետազոտությունների վաղ օրերին ենք, բայց ես տեսել եմ որոշակի անհամապատասխանություններ, որոնք այնքան տարածված են, որ իմաստը իմաստալից է նրանց դիմել այստեղ, նախաբանում: Տվյալների գիտնականներից ես եմ տեսել երկու ընդհանուր թյուրիմացություններ: Առաջինը մտածում է, որ ավելի շատ տվյալներ ինքնաբերաբար լուծում են խնդիրները: Սակայն, սոցիալական հետազոտությունների համար, դա իմ փորձը չէ: Իրականում, սոցիալական հետազոտությունների համար, ավելի լավ տվյալներ, ի տարբերություն ավելի շատ տվյալների, կարծես թե ավելի օգտակար են: Երկրորդ թյուրիմացությունը, որ ես տեսել եմ տվյալների գիտնականներից, մտածում է, որ սոցիալական գիտությունը ընդամենը իմաստալից վերաբերմունքի շուրջ փաթաթված խոսակցություն է: Իհարկե, որպես սոցիալական գիտնական, առավել եւս որպես սոցիոլոգ, ես դրա հետ համաձայն չեմ: Խելացի մարդիկ երկար ժամանակ աշխատել են մարդկային վարքագծի հասկանալու համար, եւ խելամտորեն կարծես անտեսել այդ ջանքերից կուտակված իմաստությունը: Իմ հույսն այն է, որ այս գիրքը ձեզ կներկայացնի այդ իմաստությունից որոշակի ձեւով, որը հեշտ է հասկանալ:
Սոցիալական գիտնականներից ես էլ տեսել եմ երկու ընդհանուր թյուրիմացություններ: Նախ, ես տեսել եմ, որ որոշ մարդիկ գրում են սոցիալական հետազոտության ամբողջ գաղափարը, օգտագործելով թվային տարիքի գործիքները մի քանի վատ փաստաթղթերի պատճառով: Եթե դուք այս գիրքը կարդում եք, հավանաբար արդեն իսկ կարդացել եք սոցիալական փաթեթի մի քանի թղթեր, որոնք օգտագործվում են սոցիալական լրատվամիջոցների տվյալների մեջ, որոնք անսովոր կամ սխալ են (կամ երկուսն էլ): Ես էլ ունեմ: Այնուամենայնիվ, այս օրինակներից եզրակացնելու լուրջ սխալ կլիներ, որ բոլոր թվային տարիքի սոցիալական հետազոտությունը վատ է: Փաստորեն, դուք, հավանաբար, նաեւ կարդացել եք մի փունջ թղթեր, որոնք օգտագործում են հետազոտության տվյալները այնպես, ինչպես պարզ կամ սխալ են, բայց դուք չեք գրում բոլոր ուսումնասիրությունները, օգտագործելով հետազոտությունները: Դա է պատճառը, որ դուք գիտեք, որ հետազոտության տվյալների հետ կատարված մեծ հետազոտություն կա, եւ այս գրքում ես ձեզ ցույց կտամ, որ թվայնացման տարրերի հետ կապված մեծ հետազոտություն կա:
Երկրորդ ընդհանուր թյուրըմբռնումս, որ ես տեսա սոցիալական գիտնականներից, ներկաներին ապագային շփոթելն է: Երբ մենք գնահատում ենք սոցիալական հետազոտությունը թվային տարիքում, այն հետազոտությունը, որը ես պատրաստվում եմ նկարագրել, կարեւոր է, որ մենք երկու տարբեր հարցադրենք. «Որքանով է այս հետազոտության ոճը հենց հիմա» եւ «Որքանով է այդ ոճը հետազոտական աշխատանքները »: Հետազոտողները պատրաստված են առաջին հարցին պատասխանելու համար, բայց այս գիրքը համարում եմ, որ երկրորդ հարցը ավելի կարեւոր է: Այսինքն, թեեւ թվային տարիքում սոցիալական հետազոտությունները դեռեւս զանգվածային, paradigm- փոխելով մտավոր ներդրումները, թվային տարիքի հետազոտությունների բարելավման մակարդակը աներեւակայելի է: Դա փոփոխության այդպիսի փոխարժեքն է, քան ներկայիս մակարդակը, ինչը թվային տարիքային հետազոտություն է, որը ինձ համար այնքան հետաքրքիր է դարձնում:
Թեեւ վերջին պարբերությունը, կարծես, կարող է թվալ, որ հնարավոր է հարստություն ներկայացնել որոշակի ժամանակահատվածում, իմ նպատակն է ձեզ վաճառել որեւէ կոնկրետ տեսակի հետազոտություն: Ես անձամբ չունեմ Twitter- ի, Facebook- ի, Google- ի, Microsoft- ի, Apple- ի կամ որեւէ այլ տեխնոլոգիական ընկերության բաժնետոմսեր (չնայած, լիարժեք բացահայտման համար, նշեմ, որ ես աշխատել եմ, Google- ը եւ Facebook- ը): Գրքի ողջ ընթացքում, իմ նպատակն է մնալ հավաստի պատմող, պատմելով ձեզ բոլոր այն հետաքրքիր նոր իրերի մասին, որոնք հնարավոր է ուղեկցել ձեզ հեռու մի քանի թակարդներից, որոնք ես տեսել եմ ուրիշներին, եւ երբեմն ընկնում ես ինձ մեջ: .
Հասարակագիտության եւ տվյալների գիտության խաչմերուկը երբեմն կոչվում է հաշվողական սոցիալական գիտություն: Ոմանք դա համարում են տեխնիկական դաշտ, բայց դա տեխնիկական գրականություն չի լինի ավանդական իմաստով: Օրինակ, հիմնական տեքստում հավասարումներ չկան: Ես ընտրեցի գիրքը այս ձեւով գրել, որովհետեւ ուզում էի թվային տարիքում սոցիալական հետազոտությունների համապարփակ պատկերացում կազմել, ներառյալ մեծ տվյալների աղբյուրները, հետազոտությունները, փորձերը, զանգվածային համագործակցությունը եւ էթիկան: Պարզվեց, որ այդ բոլոր թեմաներն ընդգրկելու անհնար է եւ յուրաքանչյուրի վերաբերյալ տեխնիկական մանրամասնություններ տրամադրել: Փոխարենը, ավելի շատ տեխնիկական նյութեր ցուցադրվում են «Ինչ կարդալ հաջորդ» բաժնում, յուրաքանչյուր գլխի վերջում: Այսինքն, այս գիրքը նախատեսված չէ սովորեցնել ձեզ, թե ինչպես կատարել ցանկացած կոնկրետ հաշվարկ: Փոխարենը, այն նախատեսված է փոխելու այն ճանապարհը, որը դուք մտածում եք սոցիալական հետազոտության մասին:
Ինչպես օգտագործել այս գիրքը դասընթացում
Ինչպես ավելի վաղ ասացի, այս գիրքը մասամբ առաջ է եկել հաշվարկային սոցիալական գիտությունների գծով ավարտական սեմինարից, որը ես սովորեցնում եմ 2007 թ-ից Պրինսետոնում: Քանի որ կարող ես մտածել այս գիրքը սովորելու սովորելու մասին, ես մտածեցի, որ օգտակար կլինի ինձ բացատրել, թե ինչպես է այն աճել իմ ընթացքից եւ ինչպես պատկերացնում եմ, որ այն օգտագործվում է այլ դասընթացներում:
Մի քանի տարի է, առանց դասագրքերի իմ դասընթացի ուսուցանեցի. Ես կցանկանայի միայն հոդվածներ հավաքել: Թեեւ ուսանողները կարողացան սովորեն այս հոդվածներից, հոդվածները մենակ չտվեցին, որ ես հույս ունեի ստեղծել այնպիսի հայեցակարգային փոփոխություններ: Այնպես որ, ես ժամանակի մեծ մասը կանցկացնեի դասարանում, ապահովելով հեռանկարային, համատեքստ եւ խորհուրդներ, որպեսզի ուսանողներին տեսնեն մեծ պատկերը: Այս գիրքը իմ փորձությունն է գրել բոլոր այդ հեռանկարը, համատեքստը եւ խորհրդատվությունը այնպիսի եղանակով, որը չունի նախադրյալներ `սոցիալական գիտության կամ տվյալների գիտության առումով:
Մի կիսամյակի ընթացքում, ես խորհուրդ կտայի զուգակցել այս գիրքը մի շարք լրացուցիչ ընթերցմամբ: Օրինակ, նման դասընթացը կարող է երկու շաբաթ անցկացնել փորձերի վրա, եւ դուք կարող եք զուգահեռի 4-րդ գլուխը կարդալ այնպիսի թեմաների շուրջ, ինչպիսիք են նախնական բուժման տեղեկատվության դերը փորձերի նախագծման եւ վերլուծության մեջ, ընկերությունների լայնամասշտաբ A / B թեստերի կողմից բարձրացված վիճակագրական եւ հաշվարկային խնդիրներ; փորձարկումների հատուկ նախագծման մեխանիզմների վրա, ինչպես նաեւ գործնական, գիտական եւ էթիկական հարցերը, որոնք վերաբերում են առցանց աշխատաշուկային շուկաներում մասնակիցների օգտագործմանը, ինչպիսիք են Amazon Mechanical Turk- ը: Այն կարող է զուգակցվել նաեւ ծրագրավորման հետ կապված ընթերցումներով եւ գործողություններով: Այս տարբեր հնարավոր զույգերի միջեւ համապատասխան ընտրությունը կախված է ձեր դասընթացի (օրինակ, բակալավրի, մագիստրատուրայի կամ ասպիրանտուրայի) ուսանողներից, նրանց ծագումից եւ նպատակներից:
Մի կիսամյակային դասընթացը կարող է ներառել նաեւ շաբաթական խնդիրները: Յուրաքանչյուր գլուխ ունի մի շարք գործողություններ, որոնք նշվում են դժվարության աստիճանով. Հեշտ ( ), միջին ( ), ծանր ( ), եւ շատ դժվար ( ): Բացի այդ, ես ամեն խնդրով նշել եմ այն հմտությունները, որոնք պահանջում են, մաթեմատիկա ), կոդավորում ( ) եւ տվյալների հավաքագրման ( ): Ի վերջո, ես նշեցի մի քանի գործողություններ, որոնք իմ անձնական էջանշաններն են ( ): Հուսով եմ, որ այս տարբեր հավաքածուների շրջանակներում դուք կգտնեք մի քանիսը, որոնք համապատասխանում են ձեր աշակերտներին:
Որպեսզի օգնել այս գիրքը դասավանդողների օգտագործմանը, սկսեցի դասավանդման նյութերի հավաքածու, օրինակ, ուսումնական պլանների, սլայդների, առաջարկվող զույգերի յուրաքանչյուր գլուխ եւ որոշ գործողությունների լուծումներ: Դուք կարող եք գտնել այդ նյութերը եւ նպաստել դրանց `http://www.bitbybitbook.com- ում: