聚焦最佳實踐案例

引領產業數字化升級

——————

百分點首席數據科學家杜曉夢:零售數字化,要從“快贏”業務場景入手

作者 | 趙子夢

無論是品牌商還是渠道商,零售企業對零售數字化及數據智能應用的認知和實踐都在不斷進化。 如今,“新零售”的步伐已進入“深水區”,雖然線上零售的巨頭生態已經較爲成熟,但直播、私域等渠道新物種仍在不斷萌生、發展。多元化、碎片化的營銷、運營通路給零售企業的數據智能協同能力提出了更高的要求。 而零售行業的數據智能應用已不僅停留在營銷、運營層面。面對消費者日漸提升的個性化消費需求,不少零售企業已經在探索“C2M”,基於對終端消費者的數據挖掘,反推至產業鏈上游的供應鏈、生產、原材料採購。數字化、智能化正在深入零售產業鏈條的更多環節。 面對這樣的數據智能應用挑戰,爲了能將精力更加集中在自身的核心業務經營上,越來越多的零售企業正在開放地引入數據智能技術專業合作伙伴,幫助他們將自身的最佳實踐實現技術落地。 百分點是中國領先的數據智能技術企業,覆蓋政府、公安、媒體出版、零售快消等多個行業。在零售領域,百分點通過整合客戶數據資產,並圍繞客戶業務場景需求,利用自身積累的豐富數據智能模型,幫助零售企業實現全鏈路的數據智能。 近期,愛分析對百分點首席數據科學家杜曉夢博士進行了訪談,對於傳統零售行業的數字化轉型、數據智能的發展,以及行業實踐案例進行了深度交流。現將部分精彩訪談內容分享如下。百分點首席數據科學家杜曉夢:零售數字化,要從“快贏”業務場景入手
杜曉夢,百分點首席數據科學家,北京大學營銷模型專業博士。專長於跨學科數據科學建模、消費者行爲預測、互聯網廣告、社會媒體營銷、歸因模型、流失預警模型、社會網絡分析;曾在 Information System Research 等國際頂級學術期刊上發表論文;現帶領百分點企業業務事業部,負責零售、快消、金融、地產等行業業務。

深挖內部數據價值,零售企業數字化向上遊延伸 愛分析: 近年來,零售行業的數字化進程經歷了哪些發展變化的分水嶺?
杜曉夢: 倒退到五年以前,很多零售企業對大數據的概念就是收集外部數據,或者是做很多互聯網投放引流 。 再進一步發展,零售企業開始意識到外部數據也不見得有很大的價值,還是要採集更多的內部數據。所以,近三到五年的時間,企業主要在修煉內功,做信息化建設、內部數據系統的拉通、數據價值的提升。這個階段,數據通常會先應用在更能直接看到效果的領域,所以大部分的大數據建設都是支持營銷和運營的。 到最近一兩年,很多企業在營銷側和銷售運營側已經做得比較好了,這方面的技術也比較趨同,服務商的能力也是類似的。再加上流量入口非常壟斷,所以這方面沒有特別多新的東西出來。因此,很多零售企業都把目光放到更上游,看採購、生產有沒有能利用數據做驅動的事情。 當然,這對企業的要求比較高,涉及的投資額、對原有系統的改動也會比較大。所以很多企業在考慮做這個事情,但是比較慎重,遲遲沒有動,我覺得這會是未來的一個方向。 愛分析: 從百分點的實踐經驗來看,零售企業在數字化方面的投入力度如何? 杜曉夢: 普遍來看,品牌的投入度要高於做“場”的零售渠道商的投入度。 零售企業挺願意在基礎設施上做投入的,比如智能硬件的搭建,品牌商和購物中心這樣的渠道商都在做,包括多媒體屏、人臉識別、電子價籤等等這些硬件投入。整合了更多的數據,才能讓我們這樣的服務商進行更多的分析。 另外一些品牌商在做智能工廠和智能生產線排期的時候,還會涉及到流水線的改造。這方面動作就會比較大了,目前大家都比較慎重。 零售渠道將更多元,應用場景將更協同 愛分析: 如今線上流量基本上處於一種壟斷局面,品牌商怎麼做自己可掌控的消費者運營? 杜 曉夢: 我認爲未來信息獲取的渠道和營銷的通路一定是越來越多,越來越碎片化的。比如現在我們說騰訊和淘系是兩個比較大的入口,但是它不妨礙我們可以做抖音、微信、微博,可以建立一些私域流量,做微信羣運營等等。 所以,未來營銷側或者流量運營、會員運營是可以通過多通路和多層次去實現的,電商、微商的綁定也不會特別大。我們看到新的渠道,包括直播的興起,其實都是好事情,它讓企業可選擇的營銷渠道和會員運營的方式方法更加多元化。 技術的突破是一方面,另外一方面是消費者也會出現分層化。有些人就是會到天貓店去買,有些人就是去微商,有些人願意在微信羣擁有貼身服務。所以把不同需求取向的消費者維護好,也是零售企業需要考慮的事情。 未來零售營銷會碎片化和多元化,所以零售企業要做很好的技術拉通和數據拉通。比如你是一個品牌商,你的售賣渠道一定是多元的,營銷渠道也一定是多元的,如何多元的數據拉通,形成一個統一的消費者視角?比如你可以做積分通兌,讓消費者在任何一個平臺上的積分可以用在任何一個平臺上,他的體驗一定會很好,這是需要企業利用技術和數據去解決的問題。 另外一個就是調控和內容控制,在不同的渠道會有不同的團隊去負責,這些渠道有可能形成同時向一個消費者發送消息的可能性。怎樣做到合理的頻次控制,不對消費者形成打擾?各個渠道的內容和方式方法是否是一致的,比如你在一個渠道強調了品牌高大上,另一個渠道馬上做促銷,是否會讓消費者感覺到認知失調?這是企業在未來營銷渠道多元化上需要考慮的重點問題。 愛分析: 現階段零售企業數字化應用主要是某些業務環節,未來如何走向全鏈路智能? 杜曉夢: 這兩個場景是大多數,還有一些內部經營的,比如 BI、財務層面的應用。現在大部分企業還是偏獨立地去解決這些業務場景和問題,我們認爲未來會形成協同和整合。 比如營銷側怎麼與生產側協同起來。我們現在看到很多零售企業已經在做 C2M,基於消費者的訂單反推生產,根據不同門店消費者的情況以及這個門店的庫存去規劃柔性生產,企業是從消費者的角度去考慮生產,就能把供應鏈和營銷結合起來。所以內部運營、財務等等任何一個環節跟不上,都有可能對企業的效率產生巨大的損失。 我們說全鏈路智能,它的基礎就是各個鏈條上的每一個環節都做到智能,然後協同起來,纔是一件很自然的事。 愛分析: 零售企業該怎麼做線下數據採集或數據補充? 杜曉夢: 首先,我們不會給客戶補充個人層面的數據,如果客戶需要一些羣體用戶分析或一些行業的分析等等,我們是可以提供服務的。 在做線下數據整合的時候,我們通常是建議客戶更好地利用一線員工以及激發消費者自主地去做數據的貢獻。 舉個例子,零售店其實有很多一線銷售員。比如百麗,在全國有 2 萬個門店,每個門店裏有 4 個銷售人員,如果把這 8 萬人賦能好了,他們就可以收集很多線下的信息。再比如便利店的 POS 機,它把一個標籤系統內置到 POS 機裏面。每個人結賬的時候,一線員工會看你一眼,然後打上你是男是女,是什麼樣的年齡等等這些標籤。再比如一些電器公司,在送貨上門安裝的時候,都會要求員工收集一些消費者家庭的數據。這些都是很好的數據採集方式,讓一線員工變得更加智能,是未來線下零售一個很好的數據抓手。 另外就是如何激勵消費者有動力把數據補齊。比如洋河的酒一瓶一碼,每次掃碼都可以驗真。通過防僞驗真方式把會員吸引到線上的洋河之家,我們再通過一系列的積分、優惠券、社交裂變等方式,鼓勵消費者把自己的標籤和數據補齊,這也是很好的採集方法。這些都屬於比較合理、合法、合規的數據收集。 愛分析: 數據資產化後,中層的數據挖掘實踐過程中,零售場景的數據挖掘複雜度和其他行業相比是怎樣的? 杜曉夢: 我們認爲零售數據還是比較結構化的,可解釋性也比較強。從量級上來說,也不如安防、交通場景那麼大量級,所以分析的難度不是特別大。但是把數據分析完之後怎麼去應用是比較難的。 而且,因爲零售行業數據是與人相關的,所以數據模型的有效時間比較短,不像工業或設備的數據挖掘,它們的數據模型一旦形成,是幾年內不會變化的。零售行業的變化性比較強,比如一個商場的客羣定位,做了客羣的分羣模型,可能三年之後,這個區域方圓 3 到 5 公里的人羣變了,就要重新去做數據模型的迭代和優化。所以零售場景的數據挖掘不是說有多複雜,而是變化速度比較快。要持續關注數據有哪些變化,是不是產生了新的數據源沒有捕捉到。 組織層級需協同推進,持久戰中尋找“快贏”愛分析:** 數據科學或數據智能的相關技術在零售場景落地的時候,零售企業需要注意哪些問題?項目實際實施過程中會遇到哪些挑戰? 杜曉夢: 我們做了很多項目,出現最多的問題不會是某一個技術問題,大部分的技術困難都會找到解決方案。更多其實是組織或制度上面的一些問題。 因爲做數字化轉型或者大數據,會牽扯到傳統業務,會和業務部門、技術部門、數據部門等等各個部門產生交互。所以很多時候要先梳理清楚相關部門有哪些影響,我們會給相關部門提供哪些價值,讓他們從第一天起就認可這個價值,項目推進就會比較順利。反而,如果 IT 部門牽頭來做這個事情,如果封閉性比較強,不與業務部門溝通,這個項目很有可能會失敗掉。 愛分析: 很多零售企業希望基於中臺做數字化轉型,但中臺建設投入是比較高的,您從對零售企業的中臺建設有哪些建議? 杜 曉夢: 首先,企業要先評估一下自己的數據規模、數據複雜度、業務規模,大概需要一個什麼樣規模的中臺,是中型、大型、超大型,還是這個階段不太需要做?這需要企業先評估一下,不要一上來就上一個大中臺,這樣會很重。 第二,一定要帶着場景的思維去考慮數據中臺的建設,在建設數據中臺時,就要思考這些數據將來能爲哪些現有和未來的業務服務。 第三,數據中臺的建設一定不是一個一次性的項目,一定是長期優化和不斷迭代的,因爲數據域會不斷地擴寬,數據深度會越來越深。所以不要打算三個月之內建好數據中臺以後再也不動,那是不對的想法。 最後,既然數據中臺建設是一個長期的事情,那麼零售企業需要在前一兩期的時候就讓業務部門從某種程度看到回報,數據中臺能支持哪些業務場景。一般來說,找一兩個“快贏”的業務場景,在中臺建設的前一兩期就讓這個業務看到價值,後面就會比較好推進。 愛分析: 除數據挖掘技術之外,行業知識圖譜在零售行業有哪些落地的價值? 杜曉夢: 行業知識圖譜在零售裏表現得可能更多的是品牌、品類、產品部分的相關關係,比如家庭式會員的關係網等等。 比如你的一張卡可以掛一個副卡給老婆用,老婆又給小孩買了東西,又給父母買了東西,會牽扯到很多人。這些人之間的 ID 和關係的拉通,以及消費行爲的記錄和基於圖譜的快速搜索、定位的能力,這是零售裏面知識圖譜用得會比較多的“人”的部分。 另外一個部分就是不同的品類、品牌、SKU 的關係網絡。甚至可以到屬性,比如把一個口紅的顏色、型號、包裝、規格都屬性化,這些屬性可以橫向拉通,比如搜索某一種顏色的所有口紅產品,如果想實現快速搜索的話,這也是可以基於圖譜網絡進行優化的應用。 愛分析: 零售行業知識圖譜的構建相對其他行業是否會更簡單? 杜曉夢: 不會很簡單,因爲知識圖譜一是看數量,二是看學習的語料夠不夠完整充足。很多領域,比如法律,知識圖譜的構建有很多法典可以學;再比如醫療領域,有海量醫學論文可以學。零售領域其實沒有這麼多語料庫和現成的資料,更多是基於人工標註或者現有數據結構的盤點等等去做。 有一方面是通用的,就是基於知識圖譜的問答體系。現在淘寶或京東的客服基本上很多都是被 AI 支撐的,它就是利用之前人工客服的數據建立了一套知識圖譜,基於這個知識圖譜,什麼樣的問題怎麼回答,把這個東西都學了,就可以做 AI 客服了。零售企業其實都可以考慮去做這個事情,能節省很多人工。 底、中、上三層數據智能,業務場景思維是關鍵愛分析:** 百分點在零售行業的產品和服務體系是怎樣的? 杜曉夢: 我們的定位是爲客戶提供以產品和技術爲驅動的整體解決方案,從底層、中臺,到上層應用三個層面都涉及。 底層包括數據的治理,數據 ETL (抽取、轉換、加載),還有數倉的工作,這是基本上所有零售數字化轉型的基礎。 在中層,我們有以數據挖掘和認知智能爲核心的一系列產品,主要是讓數據資產應用化,構建各種各樣的用戶畫像標籤、產品標籤,用戶的生命週期模型、流式預警模型等一系列以挖掘爲核心的應用。這裏也有一些我們的產品,例如標籤系統、數據監測系統等等。我們還會幫零售企業去做一些非結構化數據的採集和挖掘,很多品牌都會監測線上用戶的評論,包括產品售賣反饋等等,會用到我們的文本分析工具。 在頂層主要做的是應用智能化。其實越到頂層,面向業務場景的業務線就越多,所以在頂層我們基本上會看到零售不同的業務場景。 從前端到後端有很多業務應用場景。前端的智能應用偏生產、進銷存、採購部分,比如基於銷量預測的庫存優化、生產排期優化等部分,與貨比較相關。“人”的部分應用也比較多,主要是支持客戶的營銷和銷售側的部門,比如精準營銷系統、會員營銷系統、會員運營、優化等等,是偏零售裏面消費者,也就是“人”的部分。在“場”的部分其實表現更多的是一些運營方面的事情,比如 BI 指標梳理、智能採購、線上線下流量監測等等。所以頂層應用是非常業務場景化的。 愛分析: 百分點爲客戶提供服務的方式更多是幫企業從底層開始搭建方案,還是從上層解決具體的業務問題切入? 杜曉夢: 都有。我們相對比較多的是 Bottom-up 自下而上的模式,先從底層數據治理開始,然後一步步向上,做完治理做數據挖掘,再到應用和場景的構建。有時我們是 Top-down 自上而下的模式,我們會選取一兩個業務特別緊迫的場景,這個和客戶的優先級相關。 比如客戶有一個特別具體的場景,就是想監測各個電商平臺的價格和銷售情況。之前我們給某大型連鎖超市做的,首先它有一個政策是 everyday low price。所以它的場景是每天選出一個 SKU,這個 SKU 在當天不能有任何一個線下或線上的平臺比它賣得便宜。我們就會依據這個場景反推要做什麼應用,要整合哪些數據,要用到什麼技術和產品,這是從上往下的過程。 愛分析: 百分點積累了哪些與不同應用場景結合的模型庫? 杜曉夢: 零售裏有很多營銷相關的場景,我們正好在營銷建模領域比較擅長,所以我們在營銷側有很多模型,例如生命週期模型、價值度模型、流失預警模型、價格敏感度模型、促銷關聯搭售模型、定價模型、銷量預測、柔性庫存、調撥模型、選址等等,都可以通過模型來做。 愛分析: 爲客戶落地具體的產品化應用的時候,模型準確度是如何做驗證的? 杜曉夢: 我們通常做模型都要驗證它的效果。驗證效果有很多種方式,比較多的首先是樣本內的檢測和樣本外的預測,就是用數據建一個模型,看模型的主要捕獲率、準確率、均方根誤差等等,這些都可以說明模型的效果。 另外一種是在實地業務中去檢驗。比如我們給王府井百貨做潛客挖掘的模型,模型出的名單會跟隨機出的名單做 AB 測試,我們看到店率和轉化率,AB 組有顯著的差異。 愛分析: 百分點是如何用模型幫助零售企業做銷量預測的? 杜曉夢: 不同行業、不同品類的產品銷量預測模型、指標都不一樣。我們沉澱了“6P”模型,根據不同維度,比如產品、促銷、政策、競爭等等,不同維度選取不同變量,綜合起來對一個 SKU 的銷量做出預測。 我們會先採集數據,之後做數據的預處理,然後做算法的選型、模型的選型,再去做挖掘、評估。評估證明效果之後,我們纔會把這個模型落地,和客戶的業務系統做一個整合,基本上是這麼一個流程。 愛分析: 在服務交付過程中,是以什麼樣的團隊結構? 杜曉夢: 零售行業是我們整合的一條業務線,我們有幾十人的團隊規模來服務客戶。 我們的服務團隊包括項目經理、諮詢顧問、技術經理、技術團隊、數據建模團隊、數據分析團隊、測試等等,他們會在不同的階段進入到項目現場。


諮詢、合作、進羣,請聯繫愛分析工作人員

微信 ifenxi-dpr

百分點首席數據科學家杜曉夢:零售數字化,要從“快贏”業務場景入手

來源鏈接:mp.weixin.qq.com