大數據 發表時間:2019/7/3 15:28:45??來源:iwangshang??
大數據 發表時間:2019/7/3 15:28:45??來源:iwangshang??
近日,在斯坦福等院校和機構發起的“多輪對話型閱讀理解評測”(QuAC)上,阿里巴巴人工智能模型“TransBERT”擊敗全球對手,不僅拿下了評測的桂冠,更刷新了該項測試的世界紀錄。這也意味著,以阿里巴巴AI為代表機器閱讀理解能力,又往前邁進了一步。
QuAC(多輪對話型閱讀理解評測)由華盛頓大學、斯坦福大學和艾倫人工智能研究院等研究機構聯合發起,與SQuAD(文本理解挑戰賽)、CoQA(對話型機器閱讀理解挑戰賽)并稱世界級閱讀理解評測競賽,吸引了全世界頂級科學家和技術團隊參與。本次競賽的難點在于,要求參賽的AI模型閱讀篇幅更長的多輪對話,題目中還有“指代”和“省略”,甚至還存在原文中沒有對應答案的模糊問題,這就要求AI模型要有如同人類般“聯系上下文”的能力,高度考驗聯想和推測能力。
阿里巴巴智能服務事業部算法專家計峰介紹說,此次測試中出現了多次以“他”、“他們”進行的第三人稱指代,需要機器進行上下文的主動聯想,并作出綜合判斷;還有無法在原文中找到對應答案的開放式問題,測試的是AI模型在基于文本的閱讀理解之外,調用日常儲備數據庫進行推想的能力,幾乎無限接近人類思考模式。
主辦方也認為,多輪對話型閱讀理解是目前人工智能對話領域復雜性最高、最考驗自然語言理解技術的,已經接近人類日常交流的真實場景。
評測案例接近人類日常交流的真實場景,高度考驗AI模型的聯想和推測能力
憑借自主研發的“TransBERT”AI模型,阿里巴巴智能服務事業部、計算平臺事業部聯合浙江大學人工智能研究所,打敗國內外競爭者,以三個指標總分144.1拔得頭籌,刷新了此測試的最高紀錄,其中兩項指標大幅超過第二名。
“TransBERT”AI模型以三個指標總分144.1拔得頭籌,兩項指標大幅超過第二名
AI技術面對多輪次對話,以及“指代”、“省略”、“模糊語義問題”等場景早已并非僅在測試環境中發生,在阿里巴巴平臺的客服機器人“阿里小蜜”的日常應用中,此類較為復雜的閱讀理解場景早已成為AI機器人發揮實質性作用的“賽場”。
在阿里巴巴早前公布的一段視頻中,阿里小蜜已經能夠以文字和語音等形式,與消費者進行多輪次的復雜對話,問題覆蓋售前售后服務中,常見的打斷、指代、省略、轉換話題等現實情況。
阿里小蜜被突然打斷對話
這也是阿里巴巴AI技術顯著區別于學界競爭者的最大不同之處,阿里AI模型在阿里小蜜系列產品的長期實際應用中得到完善和突破,其技術能力立足現實場景,注重與人類對話的真實互動體驗,因此能夠在QuAC這類測試中達到接近人類對話的水平。