本文的作者是滴滴出行數據科學部負責人宋世君,曾在 Facebook 、Google 核心部門就職,是知名的華人數據分析總監。在此分享給大家,希望讓大家理解數據分析師的背后——數據對于一個產品的核心價值,無論把握數據的是 DS,還是研發、產品同學。希望能夠幫到你。
DS 在市場上是近些年出現的一個新的職能,比起研發、算法、產品、運營等等這些已經演進二三十年的職能,我們還是在非常年輕的階段。
一方面,從市場上人才的供需關系可以看出來這個職能的發展和需求,但是另一方面,和任何新事物一樣,這個新的職能也有很多挑戰,今天我想談談我怎么看待 DS 這個職能,和我們的發展方向。
首先,我們要明確 DS 并不是一個公司的”必要”職能,但是在一個公司的發展壯大過程中又會有 DS 出現的必然性和存在的合理性。我們就像一把槍上的準星,沒有準星也能開槍,但是準星能使這把槍更加有用。公司沒有任何人做數據分析,短期也依然能運行,只是很多地方運行地會不太好;如果有一天公司里做數據分析的人都消失了,公司短時間內也不會垮掉,但是時間長一些肯定會有影響。
當我們不是”必要”職能的時候,我們就要問自己“DS 是誰”、“DS 做什么”、“DS 存在的價值是什么”、 “DS 要往哪個方向發展”?
DS 是誰
用心理學的術語,這個其實是 DS 的“本我”。我們是一群在相關量化領域受過專業的訓練,并且希望應用自己的量化能力,在數據中挖掘對業務有用的信息,并且通過這些信息為業務發展提供助力但是同時又保持數據的中立性的人。
一個職能 (或者說公司里的一個崗位) 是由他應該做什么決定的,而不是由他正在做什么決定的。所以,我們描述 DS ,更多的是從我們自己覺得我們應該做什么,而不是我們現狀做什么。比如很多同學有這樣的疑問” DS 做大量取數的事情”,甚至很多業務合作方”期待我們滿足很多取數的需求”。這些都與 DS 是誰無關,這只能說明我們還沒有做好我們的工作,還有很多地方需要努力 ( 后面會展開談 )。
從個體的角度,這也意味著我們看待 DS 并不是看這個人的學術專業,而是看這個人的動機和意愿。公司里跟數據有關的職能是多樣的,有些是把數據作為拿到業務結果的抓手。要對業務結果負責,這些是數據運營。有些是把數據作為研發的對象,對跟數據相關的這些產品負責,這些是工程研發。有些是基于數據做實時地在線實現,這些是算法工程師的工作。
這些都是我們的合作伙伴, 但是我們又有我們自己的定位, 跟這些都不同. 我們應該為我們工作的中立性和科學性負責. 我們需要有業務的思想, 但是我們并不是要做業務本身, 我們希望做業務發展的催化劑。
DS 做什么
我總結我們做的事情,可以抽象成三類 (1) 描述現狀 (2) 尋找規律 (3) 推動改進。這三類事是逐層推進地,但是都很重要。
DS 首先要描述現狀,也就是我們常說的 “數數”。
當我們連客觀現狀都描述不清楚的時候,是談不上尋找規律和推動改進的。我們工作中大量的取數工,我們做指標,做數據報表看板等等都是在這一類之中。但是為什么很多同學對 “取數”工作有很大疑惑或者是覺得沒有成就感呢?我覺得這是因為我們在被動地取數,或者說我們并沒有把取數本身和自己業務的主線聯系起來,而僅僅是在做填空題。
另外,我在數據分析十條中提到 “分析什么問題,往往比用什么方法更重要”,應用在取數上就是 “取什么數”、“為什么取”往往比 “怎么取”、“是多少”更重要。很多時候,從業務角度思考 “為什么取”就能給我們更強的價值感,如果能主動去思考 “為什么取”,則更加會有參與感。雖然這是第一步,但是價值是極大的,如果不能幫助公司描述現狀,公司就是在盲目前進。這第一步就要求我們的每位同學有獨立思考尤其是批判性思考的能力。
DS 還要尋找規律。
數據分析的本質就是要尋找規律,尋找那些數據信息中隱含,但是別人還沒發現的規律。我們常說的統計推斷、因果關系、增長推動、預測建模、實驗評估等等都是在尋找規律。這些規律就是我們常說的 “洞見”。
當然, 有含金量的規律是不容易發現的, 這也正是我們 DS 存在的價值. 如果我們能看到的規律大家都能看到,那么我們就沒有提供價值;誰能挖掘的深, 誰能看到更本質的規律, 誰就提供了更大的價值,所以我們的學術訓練、科學方法、實踐經驗、數據敏感度等等都是在幫我們發現別人看不到的價值。所以我鼓勵大家在描述自己的工作的時候,出發點不應該是我用了什么方法,而是我發現了什么規律 ( 洞見 )。這要求我們的每位同學有很強的好奇心和堅定的信念。
我們描述現狀和尋找規律,最終的目的都是為了推動改進,這也就是我們常說的影響。我總結過 DS 的影響可以分成四類: (1) 改善重要指標 (2) 影響產品決策 (3) 影響操作流程 (4) 創造可持續解決方案。
如果我們做了一些事,但是沒有直接或間接地實現這四類里面的任何一類,那我們要反過來思考下我們是不是把時間花在了正確的地方。以及我們以后要怎么做,才能讓我們的單位時間投入產出最大化?更理想的情況,是在做事之前,先想想 ( 如果是被動需求的話,問問需求方 ) 我們要做的事會在哪些方面產生影響。要實現這些影響,還要求我們的每位同學有同理心和業務 (產品 / 運營 / 市場等)思維,同時還要有精煉的能力,優秀的溝通技巧,說服的能力。理解了我們影響力可以發揮的四個維度,也就解釋了“ DS 存在的價值是什么”。從心理學的概念,這相當于 DS 的 “超我”。
DS 要往哪個方向發展
這相當于是 DS “自我”的問題。
我把這個問題總結成兩個方面 “能力建設”和 “文化建設”。在能力建設方向,打鐵還需自身硬。我們要有能力做更加深入的分析,應用更加科學的工具,讓別人做不了的東西我們能做,別人看不到的規律我們能看到。這里要強調一點,就是能力不光是技術能力,還有業務思考的能力。我們組織 Delta 計劃就是為了幫助同學們提高這種能力。我們也鼓勵大家多通過行程學習小組、輪崗、和團隊里的資深專家交流的方式。提高自己的能力。同時,我們也鼓勵大家多站在業務的角度,思考數據能發揮什么作用,。多從各業務 leader 那里學習他們的思維方式和角度,然后結合我們的數據積累形成我們自己的東西。
跟能力建設同等重要甚至更重要的是文化建設。我們改變環境 ( 同事、公司、行業 ) 怎么看待 DS ,首先要堅定我們自己怎么看待自己。這里有自信的問題。我們的價值是由我們做的事情決定的 ( 自我 ) ,這個并不依賴于外界對我們的認知和肯定;我們要提高自己的價值,本質上也是如何讓自己做的事情更有價值。有了自信,我們才能有方向去引導我們的合作同事怎么看待我們,怎么知道我們能做什么更有意義,別人怎么看待自己,本質上反應地是自己怎么看待自己。如果我們自己就覺得自己應該取數,那在別人眼里就是取數。如果我們告訴別人,我們的時間用在其他 ( 更有價值 ) 的地方對業務幫助更大,那么我們和對方都有意愿去這樣做。而我們通過努力能夠兌現這些,會讓對方更加認定我們這個定位,形成正反饋。
大家在 DS 團隊遇上的問題,我若干年前在 Google 和 Facebook 都遇上過,但是通過我們整體團隊的努力,逐步證明自己,在市場上樹立了 DS 的品牌和認知,并被市場上認定為這個職能的標桿。DS 作為一個職能,也獲得跟工程、產品相類似的地位,近期多次被評為最有前景的工作。這個過程是逐步的,是需要時間的,也需要我們一起努力。
我們在滴滴其實也是在做這么一件事,DS 和數據驅動的理念在中國發展尚早,很多事情還停留在理論和感性層面,相當于硅谷若干年前的狀態。這也是為什么我們這個部門的同學面臨這么大的迷茫,而我們這些 leader 要幫助大家堅定方向,因為我們是市場上引領這個職能的一群人,在探索和拓展著這個職能的邊界,而這個過程注定是有挑戰的。和其他職能不同,我們的各位 leader 和基層同學, 在做具體事情的同時,還在創造著這個職能的歷史。
數據分析十條
最后,我還想重新提一下我總結過的 “數據分析十條”,上面講的很多方面都在這十條里面有反映:
分析師的核心能力是思辨 [DS 做什么]
對講真話負責,保持中立 [DS 是誰]
論據充分,論證嚴謹,觀點簡明 [推動改進]
數據先于觀點,而不是觀點先于數據 [DS 做什么]
不要把問題復雜化,也不要懼怕復雜度 [DS 是誰, DS 做什么]
分析什么問題,往往比用什么方法更重要 [描述現狀]
好的分析師給別人輸入,而不只是幫別人輸出 [文化建設]
分析沒有什么價值,除非洞見改變了什么其他的東西 [非必要職能]
如果可能應該基于問題收集數據,而不只是基于數據來問問題 [本文未提]
不是所有問題都可以分析出答案,以開放的心態采納其他的觀點 [本文未提]
來源:滴滴技術








