Counting hêsan dikare bê balkêş, eger tu pirseke pir baş bi daneyên baş bifikire.
Tevî ku ew di zimanek baş-hişyarî de, hevpeyvînek civakî ya bi rastî tenê tiştên tiştan dike. Di temenê mezin de, lêkolîner dikarin her demek bêtir hesab bikin, lê ew ne wateya ku ew tenê hûrgelan bi destnîşan bikin. Lê belê, lêkolînvanan divê bipirsin: Çi tiştên ku hejmarek giran in? Ew dibe ku wekî mijareke bi temamî reklamî ye, lê belê hin nimûneyên gelemperî hene.
Pir caran xwendekaran bi lêkolînek xwe ya rêjîmê digotin û digotin: "Ez diçim ku tiştek hejmarekî ku hema hema hema hema hema hema hema hejmare hejmartî ye. Ji bo nimûne, xwendekaran dikare bibêjin ku gelek kesan koçberan dixebite û gelek kesan qirêj bûne, lê ti kesek nalînên koçberan xwendin. Di ezmûnê min de, vê stratejiyê, ku ez ji hêla neheqiyê re dibêjim, bi gelemperî re lêkolînek baş e. Tevgera nebûna nehsan e ku mîna gotina ku li wir li wir derê ye, û ez ê çiqas dixebitin ku hûn dagirtin. Lê ne her gûra hewce nebe ku hûn tije bikin.
Di şûna veguhestinê de, ez difikirim stratejiyeke çêtir e ku ji bo pirsên lêkolînê yên ku girîng in an jî balkêş in . Her du şertên hûrgelan ji bo xuyakirin, lê belê yek awayî ku ji bo lêkolînê girîng a fikrên girîng e ku ew bandorek rêbazên girîng a biryareke girîng a girîng e. Ji bo nimûne, rêjeya bêkarîya bêkariyê girîng e ku ew yek nîşana aboriyê ye ku biryara polîtîkayên rêbaz dike. Bi gelemperî, ez difikirim ku lêkolînvanên girîng ên ku girîng e. Ji ber vê yekê beşa vê beşê, ez ê her du mînakên ku ez difikirim ku ez hejmartin balkêş e. Di her rewşê de, lêkolîner nerazî bûne; lê belê, ew di gelek pergalên taybet de hatine hesab kirin ku çavkaniyên girîng ên ku bi sîstema civakî çawa kar dikin bêtir fikrên gelemperî hene. Bi gotinên din, pir ji van tiştan çi tecrûbeyên taybetî yên balkêş e ku ew bi xwe re neyên zanîn, ew ji van fikrên gelemperî tê.
Mînakek yek ji hêza hêsanî ya ji hêla Henry Farber (2015) vekolîna radyoya taksî ya New Yorkê ve tête. Tevî ku ev grûp dibe ku meriv bi balkêş eşkere berbiçav, ew malpera lêkolînê ya stratejîk e ku ji bo firokeyên pêşbaziyê di karûbarên karsaziya karker de test dikin. Ji bo armanca lêkolînê ya Farber, li ser hawirdora karûbarên karûbarên taxxî yên du girîng hene: (1) wesayeta wan ji rojane heta rojane, li beşek li ser faktorên mîna hewayê, û (2) hejmara hejmara wan Kar dikare xebata xwe li ser biryarên xwe li ser her roj lihev bikin. Ev taybetmendiyên li ser pêwendiya navbera saetan û saetan xebitandin ku pirsgirêkek pir girîng e. Modelên aborî yên neoclassical pêşniyar dikin ku daktorên taksî dê di rojên ku li wan perçeyên mehek bilindtir in. Alternatîf, modela ji aborîzanên reklamî li dijî pêşniyara pêşniyaz dike. Heke ku ajotan bi armancên bacê yên taybet re diaxivin-her rojê $ 100 bêjin û kar bîne heta ku hedefa wê tête, wê hingê dê ajoker wê çend rojên ku di wan de bêtir qezenc kirin kar dikin. Ji bo nimûne, eger hûn kardariyek hedef bûn, hûn dikarin roja saet baş ($ 25 per hour) û pênc saetên li roja roja xirab ($ 20 per hour). Ji ber vê yekê, ajotan di rojên bêtir karûbarên saet zêdetir zêde (karûbarên modelên neocografîk) an jî çend rojan di rojên meaşê de bi mêjûya kêmînayî (wek pêşniyara modelên ekonomîk) pêşniyaz kirine çend saetan kar dikin?
Ji bo bersîvkirina vê pirsê Farber daneyên li ser her taxi, ji sala 2009-2013-ê, ji hêla gelemperî vekirî heye. Ev daneyên ku-ji hêla metre elektronîk ve hatibûn damezirandin ku ji bo her tripek bi karanîna bi her rêwîtiyê re bikar tîne-navnîşan dest pê dike, destnîşan destnîşan, dawiya dawiyê, devera dawiyê, dawiyê, û tip (eger tip bi karta krediyê dayî dayîn) . Bikaranîna vê daneyên mîlyar taxi, Farber dît ku piranîya ajokteran di rojên din de dema karê me bilind e, bi helwesta neoclassîk re.
Ji bilî vê dîtina sereke ya sereke, Farber bi karûbarê daneyên danûstendinê ji bo fêmkirina heterogenity û dînamîkan bikar tîne. Wî dît ku, demjimêr, carotakên nû yên nû bi hînkirina demjimêr zêdetir saet zêdetir xebitînin (mînak, ew hîn bibin ku wekî modela neoclassical pêşniyar dike). Û ajokarên nû yên ku wekî bêtir lêgerên armanca behsa behsa gelemperî ji bo ajokarên bacê berbiçav dibin. Her du van tiştên bêhtir peyda, yên ku alîkarî behsa tevgera ajokrasên niha, şirove dikirin, ji ber ku ji hêla dataset ve tê vebêjin. Ew ne dihatin ku di lêkolînên pêşîn de lêkolîn kirin ku çîteyên kaxezan ên ji hêla (Camerer et al. 1997) biçûk ên di demeke kurt de (Camerer et al. 1997) .
Pirsgirêka Farber ji bo çavkaniya herî mezin ya çavkaniyê ji ber çavkaniya herî mezin ya çavkaniya nêzîk bû, ji ber ku daneyên ku ji hêla bajêr hatin kom kirin, nêzîkî daneyên ku Farber wê dagir kir (cudahiyek e ku Farber dê hewceyê daneyên li tevahî lêgerîn û pevçûnan-lê belê daneyên bajêr tenê tenê têketinên ku bi kartê kredî tên dayîn). Lêbelê, daneyên tenê tenê ne. Ya sereke ya lêkolînê ya Farber hatibû danûstandinên balkêş a danûstandinên dahatû, pirsek ku ji hêla vê taybetmendiya vê taybet ve heye.
Nimûneya duyemîn ya tiştên dinyayê ji aliyê Gary King, Jennifer Pan, û Molly Roberts (2013) li ser sînensasyona online bi hêla hikûmeta Çînî ve têne lêkolîn kirin. Di vê rewşê de, lêbelê, lêkolînerên wê daneyên xwe yên xwe bigirin û wan bi rastiya xwe re danûstandin ku daneyên wan neqas bû.
Pîvan û hevkarên ku ji hêla çapemeniya sosyal di Çînê ve tê de ji hêla terorîsteke dewleta pir mezin a ku bi dehan hezar kesan ve tête fikirîn tête kirin. Lêkolîner û hemwelatiyên xwe, hûrgelan hûrsaz dikin ka çiqas ev sansors biryar didin ka kîjan materyalî jê bê jêbirin. Zanyariyên Çîn bi rastî hêviyên nakokî yên derbarê kîjan postên herî zêde dibe ku jêbirin jêbirin. Hinekan difikirin ku sansors li ser hûrgelên ku rexnegir in dewletê, lê hinekên din difikirin ku ew li ser mesajan dikin ku tevgerên kolektîf bihêz dikin, wekî protestoyan. Têgihiştina ku ev hêviyên rast e, ji bo lêkolînvanên hukumetê û hikumetên otorîtal ên ku di sînensiyonê de beşdarî fêm dikin. Ji ber vê yekê, Padîşah û hevpeymanan dixwest ku peyamên ku weşandî bûn û paşê bi postên ku hatine belav kirin û nehatiye jêbirin de jêbirin.
Berhevkirina van mesajan tev li feat engineering hêja yên sîsik zêdetir ji 1,000 malperên-her di medya civakî de Chinese bi rûpel cuda Planên-peydakirina posts têkildar, û paşê Beken van Mesajên ji bo dîtina ku jêbirin bûn. Li Amûdê ji bilî pirsgirêkên engineering normal re têkildar bi pîvaneke mezin web-crawling, vê projeyê di warê diyar kir ku ew pêwîst be, gelek bi lez ji ber ku gelek posts sansûr bi xwe jî li kêmtir ji 24 saetan girtin. Bi gotineke din, a crawler hêdî dê gelek posts ku sansûr kirin bêriya. Din, ji peydaker hebû ji bo ku ez hemû ev berhevkirina daneyên dema êşkuj detection da ku malperên medyaya civakî ya astengkirina an na guherîn di siyaseta wan de li bersiva vê lêkolînê.
Heta ku ev karê pîşesaziya mezin a tije hate qedandin, King û hevalên xwe di derbarê 85 mîlyarên cuda yên cuda de, her yek ji 11 mîlyon peyda bûn. Ji bo nimûne, mijareke hestiyariya bilind ya Ai Weiwei, hunermendê rêjîmê ye; mijareke hestiyariya navîn heqîqetê û nirxandina draviya Çînê ye, û mijareke hestiyariya kêmtir e ku kampê cîhanê ye. Ji van 11 mîlyon hanê, nêzîkî 2 mîlyon sensored bû. Hin tiştek ecêb, Padîş û hevalên me dît ku mijarên li ser mijarên gelemperî gelemperî hinek caran bêtir ji sernavên navîn û kêm-hest-hûrgelan sansored bûn. Di heman demê de, kanserên çînî ji ber ku dibe ku piştî posta Censor a Ai Weiwei behsa peyama ku ji kampê Cîhanê re behsa behsa şîrove dike. Ev peyda ne piştgirî dikin ku hikûmetê hemî mijaran li ser mijarên hestiyar hene.
Ev hesabê hêsan a rêjeya rêjeya censorshipê ji ber mijara veguherî dibe. Ji bo nimûne, hikûmetê dikare hîsên sînor ên Ai Weiwei piştgirî dikin, lê belê hîsên ku ji wan rexne ne. Ji bo ku di navbera navnîşên din de bi baldarî veqetin, lêkolîner divê hewceyê ku helwesta her postê binêrin. Bêguman, tevî karên ku bi karanîna pêşdibistanên pêşdibistan yên ku ji hêla pêş-heyî ve tê bikaranîn, bi awayekî gelemperî, tevahî rêbazên xweser ên xweser ên xweser ên xweser ên hêja ne. Ji ber vê yekê, padîşah û hevalbendan hewceyê hewceyê ku ji 11 mîlyonên çapemeniya sosyal ên sosyalî binivîsin, wekî ku ew (1) rexnegiriya dewletê ne, (2) piştgiriya dewletê, an jî 3 () raporên raporên li ser bûyerên iraqî yan rastîn. Ev digre, dişibe karekî mezin, lê wan jî ev çareser bikaranîna trick bi hêz e, ku di zanista welat hevpar di heman demê de Di zanistên civakî de nisbeten kêm: hînbûnê bin kontrola; pirtir 2.5
Yekem, di pêngavê de gelemperî bi awayekî preprocessing tê gotin, lêkolînerên medya medyayê di navgîniya belgefîlmê de guhertin , li wir her belgek ji bo her belgek û yek-dîmînek ku heya peyamek peyvek taybet e (ango, xwenîşandan an astengî) . Piştre, komek ji alîgirên lêkolîner bi destnîşankirina nimûneyên hûrgelan re destnîşankirin. Wê demê, ew daneyên vê dest-nîşana bikar anî ku modela fêrbûna makîneyê çêbikin ku dikare hestiyariya posta xwe li ser taybetmendiyên wê li ser xweş bike. Di dawiyê de, ew ev modela bikar anîn ku hestyariya hemî 11 mîlyonan nîşan bide.
Ji ber vê yekê, bêtir bi destûra xwendinê û xilaskirina 11 mîlyonên hûrgelan-ê ku dê bi desthilatdariyê ne mumkûn be. -Kin û karmendên xwe bi navnîşên piçûk yên piçûk ve tête nivîsandin û piştre fêrbûna çavdêriya hemî mesajan. Piştî ku ev tehlîlkirina vê analîzê de, ew bikarin ku, hinek tiştek ecêb kirin, hebûna potansiyonê ku jêbirinê veguhestin ne girêdayî bû ku ew nexwest ku dewleta an jî piştgiriya dewletê ye.
Di dawiyê de, qral û hevalên xwe dît ku tenê sê cureyên hiqûq bi rêkûpêk hate derxistin: pornography, rexnegirên sensors, û yên ku tevgerê çalakiya kolektîf (ihtim, amadekariyê ji bo xwenîşandanek mezin-ê). Bi hejmareke pir hejmarek mesajên ku jêbirin û mesajên ku nehatiye jêbirin, qral û hevalên xwe bûn ku fêr bibin ka sansors çawa bi çavan û binirxînin kar dikin. Wekî din, pêşniyar kir ku di vê pirtûka vê pirtûkê de, dê nêzîkbûna fêrbûna çavdêriya ku ew hinek encamên bi kar anîn-hûrgelan têne çêkirin û paşê hinek modela fêrbûna makîneyê ava bikin ku ji bo lêkolînên civakî yên di temenê dîjîtal de gelemperî damezirandin. . Hûn ê wêneyên pir bi heman rengî dibînin ku 2.5 bi beşan di 3 (şirove kirin) û 5 ((hevkariya girseyî biafirîne) binivîse; Ev yek ji çend fikrên ku di gelek pirtûkan de tê xuya ye.
Ev nimûne - rexnegirên xebatkar ên li New York û şexsiyona sosorshipê ya sosorshipa civakî ya sosorshipê ya hukumeta çînî-nîşan dide ku hejmareke hêsan ên çavkaniyên daneyên mezin ên mezin dikarin, di rewşên girîng de lêkolînek balkêş û girîng e. Di her du rewşan de, lêbelê, lêkolîner bûn ku pirsên balkêş yên bi çavkaniya daneyên mezin Daneyên xwe bi xwe ne bes.