醴陵市聯洲電器有限公司為您提供tbbq1-40聯洲電器橫掃六大榜單后、阿里達摩院開。聯洲牌 tbbq1-40#聯洲電器# 橫掃六大榜單后,阿里達摩院開
近日,阿里巴巴達摩院已正式開源語言模型體系alicemind。
alicemind 是業界的預訓練語言模型體系。具體來說,預訓練語言模型是當前自然語言處理nlp領域的研究---之一,“預訓練+精調”已成為nlp任務的新范式。
阿里巴巴達摩院作為###早投入預訓練語言模型研究的團隊之一,歷經三年研發出語言模型體系alicemind,包括通用語言模型structbert、多語言veco、生成式palm、多模態structvbert、結構化structurallm、知識驅動latticebert、機器閱讀理解ued、模型plug等模型。
它們先后了glue、clue、xtreme、vqa challenge、docvqa、ms marco在內的自然語言處理領域的的 六大榜單,業界,相關工作被ai/nlp頂會接收。
圖片來源:阿里巴巴
達摩院相關負責人表示,希望通過開源來降低業界研究和應用的門檻,助推語言ai進入大工業時代。
自然語言處理nlp被譽為ai皇冠上的明珠,傳統nlp模型制作復雜,耗時耗力,且用途單一,難以復用,手工作坊。但近幾年興起的預訓練語言模型,正在改變局面,有望讓語言ai走向入可規模化的工業時代。如果用煉鋼來類比,以前要獲得一個可用的nlp應用模型,要從鐵礦石開始煉鋼,周期長,費用高,產量低;但現在有了開源的預訓練語言模型,相當于有了現成的粗鋼,只需要把粗鋼煉成所需的特定鋼材,效率大為提升。
據介紹,達摩院語言模型體系alicemind,包括通用語言模型structbert、多語言veco、生成式palm、多模態structvbert、結構化structurallm、知識驅動latticebert、機器閱讀理解ued、模型plug等,此次大部分已開源。
alicemind先后了glue benchmark、多語言xtreme在內的六大ai榜單,上周再次的多模態榜單vqa challenge 2021,類似看圖問答,給定一張圖像和關于圖像的自然語言問題,ai需要提供準確的自然語言。
alicemind戰勝了微軟、-等幾十家國際團隊,將紀錄從去年###名的76.36%提升到79.78%,接近人類水平80.78%。
霸榜背后,是alicemind持續和進化。達摩院團隊在bert基礎上提出優化模型structbert,2020年多次在nlp###賽事glue benchmark上。
該模型通過在和詞級別引入兩個新的目標函數,好比給ai裝上“語法識別器”,在面對語法錯亂時,ai依然能準確理解并給出正確回應,提高機器對語言的整體理解力。而此次在vqa challenge 2021的多模態模型strucvbert,融合了通用模型structbert和結構化模型structurallm,同時引入文本和圖像模態,利用更的視覺特征和的注意力機制在統一的多模態語義空間進行聯合建模。
據了解,alicemind掌握語言超過100種,具有閱讀、寫作、翻譯、問答、搜索、摘要生成、對話等多種能力,目前已成為阿里的語言技術底座,日均調用量超過50億次,活躍場景超過200個,已在跨境電商、、廣告等數十個業務應用落地。在阿里之外,alicemind廣泛運用于---、能源、金融等多個行業。其中,浙江電網公司以alicemind為底座為員工構建智能化運維平臺,應用于變壓器檢修、供電搶修等業務,已經開始在###電網公司統一推廣。
阿里達摩院語言模型團隊負責人黃松芳表示,“預訓練語言模型已成為nlp領域的基石和原材料,alicemind開源將降低nlp領域研究和應用的門檻,助推行業從手工業時代走向大工業時代。”