百度以新的AI語(yǔ)言培訓技術(shù)擊敗Google

2020-02-09 14:40:00    來(lái)源:    作者:

根據TechnologyReview 的一份報告,中國科技巨頭百度創(chuàng )造了一種向人工智能授課的新方法。與Google和Microsoft使用的新方法相比,新方法提供了更好的結果,在通用語(yǔ)言和理解評估(GLUE)競爭中擊敗了兩家公司。

百度以新的AI語(yǔ)言培訓技術(shù)擊敗Google

BERT和ERNIE

百度的新模型被稱(chēng)為通過(guò)知識集成增強表示,即ERNIE。之所以以芝麻街角色命名,是因為Google將前冠軍模型命名為來(lái)自Transformers或BERT的雙向編碼器表示形式。為了從Google奪冠,ERNIE在GLUE的9種不同語(yǔ)言測試中都跑贏(yíng)了競爭對手。測試AI理解上下文,專(zhuān)有名稱(chēng)和語(yǔ)言其他方面的能力。人們在100分測驗中的平均得分為87%。ERNIE的平均水平超過(guò)90%,這是有史以來(lái)的第一個(gè)AI。

BERT的革命性在于名稱(chēng)的雙向部分。較早的語(yǔ)言模型可以在目標單詞之前或之后使用該單詞來(lái)確定上下文。BERT可以使用一種稱(chēng)為掩蔽的技術(shù)方法,使用句子中的所有單詞來(lái)解密目標單詞,這意味著(zhù)隱藏了某些單詞,而AI則嘗試使用上下文線(xiàn)索來(lái)預測它們。ERNIE將掩碼擴展為字符串。這對于理解中文時(shí)至關(guān)重要,因為在中文中各個(gè)字符會(huì )根據周?chē)淖址淖兒x,但是同樣的技術(shù)對于訓練用英語(yǔ)和其他語(yǔ)言編寫(xiě)的AI也很有用,尤其是對于非正式的言語(yǔ)和口語(yǔ)交流。

百度以新的AI語(yǔ)言培訓技術(shù)擊敗Google

這不是ERNIE訓練AI理解語(yǔ)言的唯一方法。程序中還可以進(jìn)行連續訓練,句子順序和其他元素的訓練,但是字符屏蔽是最重要的改進(jìn)。隨著(zhù)研究人員不斷提高AI學(xué)習能力,ERNIE的統治可能不會(huì )持續很長(cháng)時(shí)間。但是,百度創(chuàng )作的概括性意義重大,并且可能會(huì )影響所有未來(lái)的AI語(yǔ)言培訓系統。

更智能的教學(xué),更好的語(yǔ)音助手

百度已經(jīng)開(kāi)始使用ERNIE來(lái)改善其Xiao Du AI助手對與其說(shuō)話(huà)的人的反應。更好的語(yǔ)言解釋引擎將對百度和任何其他開(kāi)始使用它的語(yǔ)音助手開(kāi)發(fā)人員產(chǎn)生巨大的推動(dòng)作用。了解人們在說(shuō)什么是語(yǔ)音助手開(kāi)發(fā)人員之間競爭的核心部分。這就是為什么兩家公司關(guān)注諸如Loup Ventures的語(yǔ)音助手智商測試之類(lèi)的原因的一部分,盡管亞馬遜的Alexa正在縮小差距,但Google Assistant最近贏(yíng)得了該獎項。另一方面,Perficient最近的一份報告顯示,語(yǔ)音助手準確回答問(wèn)題的能力普遍下降。

百度以新的AI語(yǔ)言培訓技術(shù)擊敗Google

小杜在這兩種情況下均未經(jīng)過(guò)測試,因此無(wú)法將中國語(yǔ)音助手與美國競爭對手進(jìn)行直接比較。更好的語(yǔ)言學(xué)習引擎的額外優(yōu)勢可能會(huì )在不久的將來(lái)為百度帶來(lái)優(yōu)勢,盡管百度在全球范圍內的存在已在迅速上升。一年之內,它從一小部分智能揚聲器發(fā)展成為全球第二大銷(xiāo)售商和中國第一大銷(xiāo)售商,并擁有超過(guò)4億臺設備的助手。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。