資訊 發表時間:2018/4/23 8:39:16??作者:lulu??
資訊 發表時間:2018/4/23 8:39:16??作者:lulu??
要實現馬云所說的“未來30年,我們將機器變成人”,情感計算是人工智能發展離不開的話題。4月21日,在杭州舉行的第七屆UCAN用戶體驗設計論壇上,阿里巴巴人機自然交互實驗室聯合達摩院機器智能技術實驗室和浙江大學推出了一款可以基于圖文內容自動生成短視頻的人工智能Aliwood。
給定一個商品詳情頁地址,該人工智能即可自動分析商品的多重信息,在1分鐘內將靜態內容動態化,自動合成一段短視頻。
值得一提的是,該團隊在研發過程中引入了“情感計算”能力,給視頻所配的音樂建立起了情感模型,以更好地抓住觀眾的情緒。
從平面海報到短視頻
阿里巴巴達摩院自然交互體驗實驗室負責人傅利民告訴澎湃新聞,視頻能增加2.6%的線上購買量,增加顧客5%的次均停留時間。目前,淘寶只有不到1%的商品實現了視頻化表達,如果要在1年內滿足這個需求,需要50萬設計師。
阿里巴巴的電商場景為新興人工智能技術提供了大量數據和應用可能,由此吸引了高校方面的科研力量。2018年,浙大-阿里IDEA Lab和清華-阿里巴巴自然交互體驗實驗室相繼成立,重點探討設計、體驗、審美等下一代人際交互研究,試圖讓機器懂得人類的“情感”。
Aliwood給音樂建立了一套情感模型,將音樂劃分為“高喚起度” 和 “低喚起度”以及“正向情緒”和“負向情緒”。Aliwood會優先選擇那些“高喚起度”和“正向情緒”的音樂作為視頻的音頻。
傅利民介紹道,團隊后續還會結合“知識圖譜”將視覺元素構建起一套模型,用以做優選和表達。同樣也會將更多情感計算方面的能力納入進來,逐步優化視聽體驗。
所謂知識圖譜,是一種整合知識的形式。短視頻AI所需的電商、電影、音樂等知識,很難被個體設計師全部掌握。知識圖譜則將這些領域知識背后可計算的點,以類似星系的結構連接起來。
此前,阿里在平面設計上已經有一些嘗試。其推出的人工智能設計師“魯班”,在2017年雙十一期間實現每秒制作8000張海報。阿里巴巴智能設計實驗室負責人樂乘這次透露,“魯班”在2018年雙十一期間預計可以達到高級設計師的水平,即可以擔綱中等設計項目的主創人員。
從平面到動態,知識圖譜需要進一步的跨領域拓展。浙江大學國際設計研究院副院長、浙大-阿里IDEA Lab 負責人孫凌云說道:“我們整個團隊要學習導演鏡頭語言、學習編曲配樂知識,短視頻AI讓我們一下子把所有事打通了。從平面到視頻后,我們發現節奏和韻律是很重要的點,20秒視頻結束后,觀眾腦子里會記住什么東西,又是很重要的點。我們把這些可計算的點梳理出來,組織成知識圖譜不斷推進。”
把人性變成算法
4月初剛剛宣布成立的清華-阿里巴巴自然交互體驗實驗室,則會進一步幫助機器構建“五感”(語音、聽力、嗅覺、觸覺、乃至內心和大腦活動等)。
清華大學計算機系“長江學者”特聘教授、人機交互研究所所長史元春教授對“情感計算”在行業上的應用和數據驗證感到興奮。她負責AI產品在審美方面的評估。
盡管審美和情感聽起來都是十分抽象的詞匯,但史元春強調問題的本質還是算法:“從計算的角度,如果沒有公式什么都算不了。我們的優勢是把所有和人類性能相關的研究變成可計算的算法,改善人機交互關系。”
舉簡單的平面設計為例,色彩、角度和幾何關系分布都能影響人類的整體認知。這些可計算的影響在心理學、認知學上都有了一些研究依據,可以用數據進行驗證。
史元春介紹道,一方面,現在淘寶上的大量數據,包括用戶評價,都可以作為算法的對比參考。另一方面,團隊也在探索更為“客觀”的生理參數,比如心率、血壓、血氧飽和度等。研究人員試圖以這些指標反映出用戶觀看淘寶頁面的過程中是否接受、滿意、輕松,并與后續行為建立關聯。
史元春說道,阿里巴巴這樣的企業往往會提出綜合性的任務要求,而不僅僅是讓團隊算一下一張圖片帶來的情感,或是一段音樂帶來的情感。在交易場景中,拿著手機或是iPAD、場景中多了一個人,都會產生更為復雜的情感影響。在這個意義上,與企業界的合作會對情感計算帶來大場景上的提高。
孫凌云總結道:“不管是短視頻設計也好,以后的語音交互界面、自動駕駛環境也好,凡是與人相關的應用空間,必然涉及到情感問題。”