數據產品利用數據科學來提升產品表現。它們依賴一種良性循環,產品收集的數據能夠改進算法,而算法的改進又會提升用戶體驗。
在你收集到這些數據前會發生什么呢?產品的最初版本必須解決數據科學所謂的“冷啟動”問題——它必須提供“足夠好的”體驗來開啟數據收集和數據驅動的良性循環。要拿出這種足夠好的解決方案,我們要依賴產品經理和工程師。
舉例來說,當Instacart的用戶訪問網站時,我們的應用會在“再次購買”標簽下展示其最近購買的商品。這是一項用戶喜歡的功能,但它幾乎不需要用到數據科學——或者大量數據。當我們希望向用戶推薦他們之前沒有買過的產品時,數據科學就有了用武之地。這需要分析所有用戶的購買行為,找出哪些用戶是相似的,最終基于相似用戶的購買記錄來推薦產品。這就是數據科學的舞臺,利用數據創造價值,讓用戶能夠輕易發現自己可能忽視的新產品。
為了提升產品,數據科學家必須跟工程師長期密切合作。你還需要決定,是讓數據科學家獨自完成產品的提升,還是讓他們與工程師合作。兩種方式都可以,但最好將之規范化,并在整個公司內形成一種預期。否則,產品改進將難以應用到生產中,而且你會失去那些有才華的數據科學家,因為他們感到勞無所獲,遭到輕視。
利用數據科學做出更好的決策
決策科學利用數據分析和可視化技術來為業務和產品決策提供信息支持。決策者可能身在公司的任何位置——可能是需要確定優先事項的產品經理,也可能是負責公司戰略決策的高管團隊。
決策科學涵蓋的范圍很廣,但它們往往具有幾個共性:它們是公司之前沒有遇到過的新問題;它們往往是主觀性的,需要數據科學家應對未知變量和缺失的背景信息;它們是復雜的,涉及大量缺乏明確因果關系的不確定因素。與此同時,決策科學又至關重要——決策的結果是具體的,對業務有著重大影響。
以上所說的可能很像是數據分析,實際上,數據分析與決策科學之間的差異并不總是很明顯。盡管如此,決策科學不應該僅僅只是制作報表和指示板,數據科學家所做的工作不應是那種可以利用現成商業工具便可完成的工作。
LinkedIn的高管團隊利用決策科學做出了一項關鍵的業務決策,即讓用戶資料出現在搜索結果中。以往情況下,只有付費用戶才可以看到自己網絡中所有人的完整資料。可見性的規則很復雜,LinkedIn希望簡化它們——但使用的方法不能損害公司營收。這里面的賭注是巨大的。
LinkedIn提出的可見性模式是對非付費用戶的每月用量進行限制,超出用量即停止服務。該公司的決策科學家模擬了這一改動帶來的影響,他們利用歷史行為數據來預測營收和用戶黏性可能受到的影響。分析結果表明,公司可以走出這一步。
結果,新模式不僅對公司業務產生了積極影響,也令數百萬用戶拍手稱贊,不僅如此,它還消除了產品開發過程中的一大難題。有些人對用量限制發出抱怨,但這部分人正是LinkedIn認為應該付費的用戶。
并非所有的決策都需要運用決策科學。有些決策太過瑣屑,運用數據科學所產生的成本并不值當。其他決策可能很重要,但公司可能缺乏能夠進行有效分析的數據。在這些情況下,公司需要依靠直覺和實驗來進行決策。優秀的決策科學家了解自身的局限性,并可以判斷自己的努力是否會徒勞無功或適得其反。
雖然決策科學和數據產品需要某些相同的技能,但很少有數據科學家能夠同時擅長兩個領域。決策科學依靠的是業務和產品意識、系統思維以及強大的溝通能力。而數據產品則要求機器學習知識和生產層面的工程學技能。如果你有一支小型數據科學團隊,你可能需要找到同時擅長這兩個領域的優秀人才。不過,隨著團隊規模的擴大,你將從專業分工中受益。