農林漁牧網

您現在的位置是:首頁 > 農業

AI大模型落地大考,浪潮交出了怎樣的答卷?

2022-07-12由 智慧進化論V 發表于 農業

響應的應什麼意思

導讀:易用性、開放性已成為大模型新一輪PK的考場。

隨著高考成績公佈,AI“做題家”再度引發熱議。不久前,浪潮“源1。0”大模型模仿魯迅、金庸文風成功挑戰最難高考作文,並出色完成了文言文閱讀,歷史、地理等科目考題。

其實,“做題”只是AI大模型的小試牛刀。

AI大模型的真正考場在落地應用。

因為直面長尾場景和AI開發高門檻等痛點,大模型被視為解決AI落地難的一劑良方。過去兩年內大模型雨後春筍般湧現,有實力的科技企業紛紛推出自家的大模型,引數、資料集的規模也不斷攀升。

然而,大模型雖好但面臨落地應用難題,成為產業界共同的挑戰。當下,易用性、開放性成為大模型新一輪PK的考場,不妨看看浪潮“源1。0”大模型交出了怎樣的答卷。

AI大模型落地大考,浪潮交出了怎樣的答卷?

大模型,智慧時代的演算法基礎設施

大模型在今天成為產業熱點絕非偶然。可以說,它的出現為困境中的AI產業化推開了一扇門。

在大模型出現之前,人工智慧模型的通用性不高,一個模型僅專用於特定領域,即“一個模型一個場景”,換個場景就要從0開始重新開發。而且,傳統的AI模型開發成本高,週期長,迭代慢,無法適配企業敏捷創新的業務需求。隨著AI技術從高頻主流場景到低頻長尾場景的滲透,場景碎片化與“手工作坊式”開發的矛盾日益加劇,對AI技術提出了挑戰,也限制了AI的產業化程序。

大模型提供了一種

“預訓練大模型+下游任務微調”

的全新模式,可以大大提高模型的泛化能力,提高AI的通用求解能力。而且,經過預訓練的大模型可以讓研究機構和企業“不必從0做起,而是可以在大模型的基礎上,從60、或者從90開始做到100”。

“大模型最重要的優勢是進入大規模可複製的工業落地階段,只需小樣本的學習也能達到比以前更好的效果,且模型引數規模越大這種優勢越明顯,這能大大降低各類使用者的開發使用成本。”浪潮資訊AI軟體研發總監吳韶華表示。

正是由於出色的泛化能力,大模型被譽為智慧時代的演算法基礎設施。正如發電廠和高速公路一樣,大模型將成為各行各業應用AI技術的底座和創新的源頭。

目前,在探索大模型落地的道路上,產業界已經做了很多嘗試。其中,輕量化做場景適配以及開源開放,已成為行業共識的兩大趨勢。目前,兩個方向都做得好的企業並不多,浪潮是其中之一。

AI大模型落地大考,浪潮交出了怎樣的答卷?

如何讓大模型分身有術

將大模型蒸餾成相對輕量的、更垂直的模型,已經成為產業界的普遍做法。其原理是知識蒸餾(Knowledge Distillation),它是一種基於“教師-學生網路”模式的模型壓縮方法,可以將已經訓練好的大模型包含的知識,蒸餾提取到另一個小的模型中去。

近日,

浪潮基於“源1.0”千億大模型蒸餾出4個百億引數規模的技能模型:對話問答技能模型、知識檢索技能模型、中英翻譯技能模型、古文理解技能模型,

在細分領域精確度業內領先,獲得權威評測基準CLUE、CUGE榜單榜首,並已在南京智慧計算中心成功落地執行。「智慧進化論」認為,浪潮的技能模型具有“輕、快、強”的特點。

AI大模型落地大考,浪潮交出了怎樣的答卷?

浪潮技能模型的百億引數規模,大幅降低了訓練、推理、部署的門檻,並極大降低了開發訓練成本。相當於巨量模型一下子有了N個輕量化“分身”,可以直接面向對話、問答等主流場景化應用。

浪潮技能模型將過去動輒幾個月甚至幾年的大模型開發訓練週期,縮短至不足一個月,加速了企業利用技能模型不斷創新的速度。

分身是為了更專注,浪潮技能模型在效能上並不減配。

4個技能模型在相同任務上可保留98%的大模型效果,在特定領域任務中,甚至能得到比大模型更好的效果,但引數量僅是“源1.0”大模型的1/10,推理速率提升9倍。

在各自領域,浪潮四大技能模型在國際權威測評和榜單中都是學霸。比如,對話問答技能模型(源曉問)在業界權威測評WebQA開放問答資料集及CUGE兩項榜單均位居榜首,可廣泛應用於虛擬人、智慧助手、智慧客服等場景。中英翻譯技能模型(源曉譯)在業內權威WMT資料集及CUGE兩項榜單均位居榜首,可輕鬆應對日常中英翻譯任務。知識檢索技能模型(源曉搜)在WebQA任務上以55。97%的準確度領先業界,可廣泛應用於醫療、法律、保險及娛樂等領域的智慧客服、個人助理等場景。

在實際場景中,浪潮四大技能模型的能力已經得到了充分驗證。比如,基於業界領先的kdConv多輪對話精度,對話問答技能模型(源曉問)在日常對話場景已經具備相當的情商,達到了“人機難辨”的程度。

AI大模型落地大考,浪潮交出了怎樣的答卷?

此外,正如“三人行必有我師”,技能模型和巨量模型如同身份靈活轉換的師生,可以在雙方協同中持續進化。透過將執行結果反饋給巨量模型,技能模型和巨量模型的知識與能力可以同步進化,從而實現落地場景越多,模型進化得“越聰明”。

讓大模型成為所有人的遊戲

如果說,大模型的研發是一場激動人心的遊戲,那麼它不該只是少數科學家的專利,所有人都應該擁有探索AI想象力的能力。

目前,

“源1.0”大模型已經相繼完成了模型API、高質量資料集、模型訓練程式碼、推理程式碼和應用程式碼等內容的開源開放,

在GitHub社群、浪潮源官網均可以申請獲取相關的資源。已經有超過600家使用者參與到“源1。0”大模型開放開源平臺中。

AI大模型落地大考,浪潮交出了怎樣的答卷?

吳韶華表示,為了打造高品質的AI開源社群,“源1。0”大模型從四個方面為開發者提供便利:

第一, 開源了直接可用的程式碼示例。

開發者無需關心底層技術,無需配置程式設計環境,就可以直接將應用構建於AI大模型的能力之上,在降低開發門檻的同時,讓開發人員將精力聚焦核心業務邏輯。

不久前刷屏的AI劇本殺就是開源帶來的一個驚喜。基於“源1。0”的開放開源平臺,一位普通開發者僅用一個月時間就開發出了“人機難辨”的AI劇本殺遊戲。劇本殺中的AI像人類一樣,會忽悠,會撒嬌耍賴,為了贏得遊戲還會撒謊,騙過了不少人類玩家。

AI劇本殺的創作者表示:“可以說源1。0是我見過的大模型開源專案中給到的質量最高的示例程式碼,好到什麼程度呢?好到了我們直接拿來用的程度。”

“在大模型出現之前,如果要做這樣一個劇本殺的遊戲,需要很強大的模型,既要有對話能力,也要有邏輯推理能力,這對於模型的開發、資料的選擇門檻很高。”吳韶華表示。

AI大模型落地大考,浪潮交出了怎樣的答卷?

第二, 向開發者提供大模型API和豐富的開發工具,顯著降低了應用開發的門檻。

比如,源的官網同步開放和上線了APIExp和Web應用Sandbox(沙箱)開發工具,開發者可在APIExp上設定引數,零程式碼呼叫和測試所有已開放的模型服務。Sandbox可以讓開發者僅修改少量程式碼,即可完成包含web互動的應用示例,從而快速驗證業務邏輯和功能效果。

第三, 將“源1.0”大模型相關的訓練資料開源。

目前,已經有開發者直接利用開源的資料集對其模型進行二次訓練,得到了明顯的精度提升,訓練結果甚至登頂CLUE基準評測榜單。

第四,為開發者提供持續的支撐,實現開源社群交流共贏。

比如,浪潮有專門的運營團隊與開發者無縫溝通。針對深入的技術問題,也有專門的研發團隊進行研究和支援,交流成果還會以程式碼的方式進行開源。

低程式碼、低門檻,開發工具齊全、開箱即用……這些特點以及NLP巨量模型自身的魅力與潛力,讓更多的、不限技術水平的開發者都有機會嘗試大模型應用。

未來,“源”還會進一步開放模型線上蒸餾、領域模型下載等服務,並完善和豐富更多基於大模型的應用示例。

“數字世界與實體世界的深度融合,為大模型的應用帶來了更為廣闊的前景。我們願與各位夥伴一起聯合創新,積極探索基於“源”的各類智慧化應用。最後期待基於‘源’大模型,我們能夠‘結四方之曠友,資數實以相融。’” 吳韶華表示。

目前,大模型還處在非常早期的發展階段。易用性和開放性決定了大模型的生命力。前路漫漫,未來大模型需要面對的考試還有很多。也許有一天,當大模型人人用得起,當中小企業也可以用大模型來解決問題,大模型才算真正完成了畢業考試。

END

本文為「智慧進化論」原創作品。