數據產品的制作早在人工智能初露鋒芒之前就已經開始了。但是,數據產品管理崗的設立與完善則是相對新近的事。這是直接發揮數據既是關鍵產品、又具備比較優勢的新職能。今天,數據的規模化使用有利于降低成本(如數據中心運行管理的優化)、提高收入(如電子商務領域的交叉銷售與追加銷售)、推動技術進步(如自動汽車的深度學習功能)。
在人工智能的熱潮中,動物分類算法與Go-playing智能體代表了數據產品管理的兩大基石。但算法只是整個數據產品生態系統中的一部分。在大部分商業場景下,算法模型可能只占結果的極小部分。一家公司要想讓數據像水流一樣暢通無阻地流動,必須具備一個大型支持生態體系,并完成三大任務:
第一, 收集和存儲于原始事件與交易行為并為之服務。
第二, 與相關團隊共同處理、開發和分享數據。
第三, 制作并部署算法模型,并在生產過程中加以監督。
這三項工作,最終都要有看得見、摸得著的商務成果。在數以萬計的方向里,企業應該先做什么,再做什么?
Insight企業數據平臺已幫助上萬名員工成功轉型數據產業,找到各式各樣的崗位。在這個平臺上,業界對能為數據團隊掂量出輕重緩急、處理好協調問題的項目經理的需求增加。這篇文章試圖描述理想的行業項目經理的形象,并闡明其重要意義。
數據產品管理究竟有什么用?
如果是小型項目團隊,沒有正式的項目經理,那么像機會評估、技術路線圖、股東管理這些常規性的產品責任基本上是技術經理和個體工作者來做。放在大型團隊里,這種分工就有很多不足,最主要的是以下四點:
其一,產品工作占據所有個體工作者的時間
其二,不是每個個體工作者都有能力或者有意愿從事規模性的產品工作。
其三,企業單元和技術團隊之間的距離越拉越大。
其四,個人技術團隊之間的距離越拉越大。
在這個拐點上,企業有兩條應對之道。一是把任務分解成若干個子項目,并確保個體工作者或小型技術團隊有能力全程跟進,不必涉及其他團隊,也就不用設立某種形式的總協調員。
第二條應對方案是建立一個正式的產品管理組織,專門負責維護數據源路線圖,并在各團隊與個體工作者之間協調任務的執行情況。這種方案對于電子商務和按需服務這種功能高度交叉的產品來說尤為普遍。
第一種方案要想發揮出全部威力,必須得是某個體工作者能夠對產品進行調整,迅速取得客觀的運行反饋,并在最差的情況下以不作大改為前提完成回滾。這種方案或許適用于免費的社交網絡產品,但對于付費型、任務繁重的產品(如按需服務),基本上是毀滅性的。比來比去,大部分規模性的公司還是選擇了第二種方案,專門成立一個產品管理組織。
數據項目經理的角色發展到了哪個階段?
在數據演進的初期,像軟件工程、軟件數據、軟件建模這種無關的數據技能,都是同屬于數據科學的門類。現在,它們均已快速發展成為獨立的崗位,比如數據工程師、數據科學家、研究人員、機器學習工程師等等。
類似的潮流也正出現在產品管理業內部。在數據項目經理這一寬泛的崗位類別之下,出現了若干個子崗位,例如基礎設施、分析、應用機器學習/人工智能、探索與標準化、平臺等。這些具體化的過程與技術項目崗曾經的演變如出一轍。不同的是,對數據項目經理崗來說,上述頭銜還沒有塵埃落定。其發生發展,不過是反映了數據產品工作相對獨特的分工現象。
雖然每個數據用例都要求不同形式的技術理解和域理解(下文將會涉及),但就一般情況而言,項目管理技能仍然是成功的主要原因。我要強調這一點,因為一個數據項目經理每天的主要工作,還是處理優先級、溝通、股東管理、設計以及規范。
基礎設施
規模條件下,個體項目團隊的用例和數據需求各不相同。但為了盡快啟動,這些團隊往往傾向于打造獨立的數據基礎設施。這種傾向會造成重復勞動、數據孤島,最終各個團隊都會遭遇同樣的數據規模性問題。
對基礎設施項目經理來說,最終交付的產品應該是一個通用的數據基礎設施,它可以永久地收集、存儲、處理相關數據,從而降低用例。有了這個產品,團隊就能將重點放在原始數據的使用上,而不是收集和存儲。
基礎設施項目經理的關鍵績效指標是數據可用性、規模性與可靠性。基礎設施項目經理應該精通數據工程技術,例如數據接入、批量實時處理、文件系統與發送。
分析
當代職場,決策者越來越依靠數據。從戰略到產品和運營,從線下到實時,大量決策都是建立在分析的基礎上。如果說,基礎設施項目經理的職責是確保查詢任務能夠在海量數據背景下有效運行,那么項目分析經理則專注于將這些原始數據轉化成可操作的見解,提供給經理、項目經理、運營團隊等決策方。除此之外,項目分析經理還積極投身于關鍵績效指標的認定工作與數據的探索工作,為商務決策建言。
在產品建造的語境下,一名項目分析經理的職責是創建一個自助分析、定制儀表盤和報告工具的混合體,促進觀點在全公司層面的提煉與分享。項目分析經理涉及到多元化的相關方,既有睿智的數據科學家,也有經理這種“只讀型”的消費者。
項目分析經理的關鍵績效指標,主要是由查詢任務的運行數量,發送的報告數量等證明該項目便捷性的因素。正是由于這種便捷性,數據用戶才能從原始數據中提煉出需要的觀點。
應用機器學習/人工智能
某些產品和功能本身會自然而然地從機器學習/人工智能中尋找解決方案,例如搜索、推薦、詐騙檢測等。應用機器學習項目經理專注于把數據用在既有產品上——例如分析聊天記錄,使客戶服務路由實現自動操作,以及用高級人工智能設計出一種全新體驗——例如照片分享軟件的篩選器。說到底,他們的工作就是為了直接改進面向客戶的功能的關鍵指標。
致力于上述功能的項目經理雖然并不總是冠以數據項目經理的名號,但他們一般都對數據科學的工作流及其機器學習模型有著深刻理解。他們天生就知道如何利用機器學習的力量,并且比起嚴守規則的職員,他們更懂得如何在極限邊緣設計產品,提供優質的用戶體驗。
平臺
公司規模越大,對標準化框架的需要也就越現實,特別是在實驗和機器學習方面。這兩個工作流程的用例往往與產品自身的本質緊密結合在一起。正是基于這個原因,開源方案才會這么難以滿足眾人的需求。
考慮到這個背景,大公司的個體數據團隊會先著手建設專屬的一次性系統,從而導致重復勞動和拖沓的生產周期。因此,谷歌、臉書、Uber之流已經正式把目光轉向平臺——以通用的框架來減少花在加工、調用、監視等普通任務上的精力。
之所以建立這些平臺,目的之一就是為了取消管理數據、調用和監視結果的必要性,讓數據團隊能夠把重心放在模型和實驗上。還有一個目的,就是因為有了這些平臺,所有用戶都可以獲取通用數據和特征,從而增強了可重用性。
平臺項目經理的工作首先是證明平臺如何發揮用途,然后是讓早期使用者愿意付出嘗試。一旦平臺到達拐點,項目經理的角色就轉變為找出舉有高回報率的公分母,并將其嵌入平臺。平臺項目經理的關鍵績效指標包括:平臺上運行的模型、實驗、投入市場所需的平均時間等。
標準化與探索
這也是規模團隊的一個問題。公司越大,個體團隊和人員所創造的數據量也會出現指數級的增長。數據的迅速輸出造成一個問題:遍尋公司上下,沒有一個中央場所可以查看到全部數據。
如果缺少一個記載、整合、顯示海量數據的結構,那么組織對于數據源的掌握情況就受制于數據擁有者。結果,數據真正意味著什么,從何而來,有多可信,這些問題全都變得不確定。不僅如此,如果最熟悉那塊數據的員工離職,關于這些數據源的知識也將一同消失。第三個常見的問題是,使用了相同數據的團隊對于本質上一樣的指標往往會給出不同定義。例如,最后七天在這個組可能叫做“整整最后七天”。到了另一個組,就可能叫做“最后168個小時”。
數據標準化與探索項目經理的職責是確保整個公司意識到數據的存在,并且以一套固定的方式使用這些數據。這個崗位經常生產數據目錄和數據通道,為數據、儀表盤和指標的探索與定義提供便利條件,同時也負責識別和聯系數據所有者,以便建立進一步對話。
數據通道的一個高級版本是降低計算指標的獲取難度,并將其融合到建模、分析等各個用例中。
結語
數據產品管理依然在發展之中,本文也無意窮盡業界數據產品崗位的所有內容。數據項目經理可以是上述職責的混合體。至于是哪些職責,取決于公司發展階段和組織結構。分析可以是基礎設施的一部分,標準化與探索也可以是平臺的一部分。而應用機器學習項目經理也可能負責整合資源,以構筑基礎設施和調配環境,為模型的生產提供必要條件。
說到底,這些崗位都要創造一場有價值的、以數據為基礎的用戶體驗,也要掃除所有障礙,確保團隊能夠提供這份價值。文章來源:微信公眾號pinjue_ali