大數(shù)據(jù) 發(fā)表時間:2018/3/5 9:42:11??作者:huizhansh??
大數(shù)據(jù) 發(fā)表時間:2018/3/5 9:42:11??作者:huizhansh??
數(shù)據(jù)科學(xué)是一門極其特殊的新興學(xué)科,具有與其他學(xué)科不同的新特征,例如思維模式的轉(zhuǎn)變(從數(shù)據(jù)范式到知識范式的轉(zhuǎn)變)、對數(shù)據(jù)認(rèn)識的變化(從數(shù)據(jù)的被動屬性到主動屬性的轉(zhuǎn)移)、指導(dǎo)思想的變化(實用主義和現(xiàn)實主義的回歸)、以數(shù)據(jù)產(chǎn)品開發(fā)為主要目的(數(shù)據(jù)成為傳統(tǒng)產(chǎn)品的主要創(chuàng)新點(diǎn))、專業(yè)數(shù)據(jù)科學(xué)與專業(yè)中的數(shù)據(jù)科學(xué)的差異性以及數(shù)據(jù)科學(xué)的三要素(不僅涉及理論和實踐,而且還包括精神素質(zhì))。因此,數(shù)據(jù)科學(xué)的研究不能簡單照搬傳統(tǒng)學(xué)科的經(jīng)驗,應(yīng)尊重其特殊使命和屬性。為此,我們對數(shù)據(jù)科學(xué)研究者提出如下幾點(diǎn)建議:
(1)正確認(rèn)識數(shù)據(jù)科學(xué)。正確認(rèn)識數(shù)據(jù)科學(xué)的內(nèi)涵是有效學(xué)習(xí)和規(guī)范研究數(shù)據(jù)科學(xué)的前提。目前,部分學(xué)者誤以為“數(shù)據(jù)科學(xué)=統(tǒng)計學(xué)+機(jī)器學(xué)習(xí)”,過于強(qiáng)調(diào)統(tǒng)計學(xué)和機(jī)器學(xué)習(xí),而忽略了數(shù)據(jù)科學(xué)本身。其實,統(tǒng)計學(xué)和機(jī)器學(xué)習(xí)是數(shù)據(jù)科學(xué)的理論基礎(chǔ),而并非其核心內(nèi)容。數(shù)據(jù)科學(xué)具有區(qū)別與其他學(xué)科的獨(dú)特的研究使命、研究視角、思維模式、做事原則和知識體系。如果脫離了這些獨(dú)到之處,數(shù)據(jù)科學(xué)的學(xué)習(xí)和研究將發(fā)生方向性的誤讀和本質(zhì)性的扭曲。
(2)突出數(shù)據(jù)的主動屬性。數(shù)據(jù)科學(xué)的一個重要貢獻(xiàn)或價值就在于改變了人們對數(shù)據(jù)的研究方向,即從被動屬性轉(zhuǎn)向主動屬性。一直以來,人們習(xí)慣性地把數(shù)據(jù)當(dāng)做被動或死的東西,關(guān)注的是“你能對數(shù)據(jù)做什么?”,如模式定義,結(jié)構(gòu)化處理和預(yù)處理,都試圖將復(fù)雜數(shù)據(jù)轉(zhuǎn)換成簡單數(shù)據(jù)。但是,大數(shù)據(jù)時代更加關(guān)注的是數(shù)據(jù)的另一個屬性——主動屬性,強(qiáng)調(diào)的是“數(shù)據(jù)能給你帶來什么?”,如數(shù)據(jù)驅(qū)動型應(yīng)用、以數(shù)據(jù)為中心的設(shè)計、讓數(shù)據(jù)說話、數(shù)據(jù)洞見等,將復(fù)雜性認(rèn)為數(shù)據(jù)的自然屬性,開始接受數(shù)據(jù)的復(fù)雜性。研究方向從數(shù)據(jù)的被動屬性到主動屬性的轉(zhuǎn)變是學(xué)習(xí)和研究這一門新學(xué)科的基本出發(fā)點(diǎn)。如果忽略了這一點(diǎn),容易將數(shù)據(jù)科學(xué)當(dāng)成數(shù)據(jù)工程來學(xué)習(xí)和研究。
(3)平衡數(shù)據(jù)科學(xué)的三個要素。與其他課程,尤其是技術(shù)類課程不同的是,數(shù)據(jù)科學(xué)既包括理論和實踐,更需要精神——原創(chuàng)性設(shè)計、批判性思考和好奇性提問的素質(zhì)。因此,數(shù)據(jù)科學(xué)的學(xué)習(xí)中不僅要強(qiáng)調(diào)理論聯(lián)系實際,而且還不能忽略對數(shù)據(jù)科學(xué)家精神的培養(yǎng)。積極參與數(shù)據(jù)科學(xué)相關(guān)的開源項目和競賽類項目是兼顧數(shù)據(jù)科學(xué)的三個基本要素的兩個重要捷徑。
(4)側(cè)重培養(yǎng)信心和興趣,學(xué)會跟蹤數(shù)據(jù)科學(xué)的最新動態(tài)。一方面,數(shù)據(jù)科學(xué)建立在統(tǒng)計學(xué)和機(jī)器學(xué)習(xí)等基礎(chǔ)理論之上,學(xué)習(xí)門檻較高,因此,培育自己對數(shù)據(jù)科學(xué)的學(xué)習(xí)信心和興趣尤為重要;另一方面,數(shù)據(jù)科學(xué)仍屬于一門快速發(fā)展的新興學(xué)科,其理念、理論、方法、技術(shù)和工具在不斷變化之中,要求我們必須掌握動態(tài)跟蹤數(shù)據(jù)科學(xué)領(lǐng)域的國際頂級會議、重要學(xué)術(shù)期刊、主要研究機(jī)構(gòu)、代表性人物和標(biāo)志性實踐的能力。
(5)重視試驗設(shè)計及假設(shè)檢驗。試驗設(shè)計是數(shù)據(jù)科學(xué)項目的重要活動之一。數(shù)據(jù)科學(xué)家應(yīng)根據(jù)數(shù)據(jù)科學(xué)項目的研究目的,有創(chuàng)造性地提出研究假設(shè),并設(shè)計對應(yīng)的試驗,最終通過這些試驗達(dá)到假設(shè)檢驗的目的。以華盛頓大學(xué)和加州大學(xué)伯克利分校的數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)方案為例,分別開出了課程《應(yīng)用統(tǒng)計與試驗設(shè)計(Applied Statistics & Experimental Design)和《試驗與因果分析(Experiments and Causality)》,重點(diǎn)培養(yǎng)學(xué)生的試驗設(shè)計和假設(shè)檢驗的能力。
(6)不要忽視因果分析。在大數(shù)據(jù)時代,很多人誤以為“因果分析不再重要了”,并把研究重點(diǎn)僅限在相關(guān)分析。相關(guān)分析只能用于識別事物之間的關(guān)聯(lián)關(guān)系,而無法指導(dǎo)如何優(yōu)化和干預(yù)這種相關(guān)關(guān)系。因此,當(dāng)相關(guān)關(guān)系發(fā)生變化或需要人為干預(yù)相關(guān)關(guān)系時,必須進(jìn)一步研究其因果關(guān)系。在數(shù)據(jù)科學(xué)項目中,數(shù)據(jù)科學(xué)家的關(guān)注重點(diǎn)是發(fā)現(xiàn)各種可能的關(guān)聯(lián)關(guān)系,而關(guān)聯(lián)關(guān)系的產(chǎn)生機(jī)制和優(yōu)化方法需要由領(lǐng)域?qū)<彝瓿?。加州大學(xué)伯克利分校和哥倫比亞大學(xué)分別開設(shè)《實驗與因果分析(Experiments and Causality)》和《因果推理與數(shù)據(jù)科學(xué)(Causal Inference for Data Science)》,均反映了因果分析在數(shù)據(jù)科學(xué)中的重要地位。
(7)以數(shù)據(jù)產(chǎn)品開發(fā)為主要抓手。數(shù)據(jù)產(chǎn)品開發(fā)是學(xué)習(xí)與研究數(shù)據(jù)科學(xué)的主要抓手之一。需要注意的是,數(shù)據(jù)產(chǎn)品不限于數(shù)據(jù)形態(tài)的產(chǎn)品,任何用數(shù)據(jù)來幫助目標(biāo)用戶實現(xiàn)其某一目的的產(chǎn)品都可視為數(shù)據(jù)產(chǎn)品。數(shù)據(jù)是未來產(chǎn)品的創(chuàng)新點(diǎn)和增值點(diǎn)。因此,向數(shù)據(jù)產(chǎn)品的轉(zhuǎn)變是傳統(tǒng)產(chǎn)品的重要發(fā)展趨勢。以Google眼鏡[111]為例,其創(chuàng)新源自數(shù)據(jù),而不在于其外觀和選材,以數(shù)據(jù)為中心的產(chǎn)品設(shè)計才是該產(chǎn)品與傳統(tǒng)的眼鏡類產(chǎn)品的根本區(qū)別??梢姡瑪?shù)據(jù)產(chǎn)品開發(fā)是數(shù)據(jù)科學(xué)的最為直接且最為普遍的應(yīng)用。
(8)準(zhǔn)確定位人才培養(yǎng)目的。數(shù)據(jù)科學(xué)的學(xué)習(xí)和人才培養(yǎng)的目的是培養(yǎng)數(shù)據(jù)科學(xué)家而不是數(shù)據(jù)工程師。二者的區(qū)別在于,數(shù)據(jù)工程師負(fù)責(zé)的是“數(shù)據(jù)本身的管理”,而數(shù)據(jù)科學(xué)家的主要職責(zé)是“基于數(shù)據(jù)的管理”,包括基于數(shù)據(jù)的分析、決策、流程定義與再造、產(chǎn)品設(shè)計和服務(wù)提供等。因此,相對于數(shù)據(jù)工程師,數(shù)據(jù)科學(xué)家對人才的要求更高,不僅要有理論功底和實踐經(jīng)驗,而且還要求有精神素質(zhì),即創(chuàng)造性設(shè)計、批判性思考和好奇性提問的能力。
基于家族經(jīng)銷商生意,自身作為經(jīng)銷商業(yè)主,從事商品經(jīng)銷行業(yè)二十余年,期間在數(shù)個著名企業(yè)兼任業(yè)務(wù)經(jīng)理及培訓(xùn)師等職。
第23屆SIA上海智能工廠展暨工業(yè)自動化及機(jī)器人展,于2025年7月29-31日在虹橋國家會展中心,同期舉辦SIA上海國際軸承展。
悅頓體育照明品牌創(chuàng)始人,20年來專注于各級各類體育運(yùn)動場館的專業(yè)化照明!點(diǎn)亮精彩,照亮運(yùn)動!有需要的朋友攜手合作!賬號為微信號,運(yùn)動健康,你我共享!