AI大模型落地大考，浪潮交出了怎樣的答卷？

響應的應什麼意思

導讀：易用性、開放性已成為大模型新一輪PK的考場。

隨著高考成績公佈，AI“做題家”再度引發熱議。不久前，浪潮“源1。0”大模型模仿魯迅、金庸文風成功挑戰最難高考作文，並出色完成了文言文閱讀，歷史、地理等科目考題。

其實，“做題”只是AI大模型的小試牛刀。

AI大模型的真正考場在落地應用。

因為直面長尾場景和AI開發高門檻等痛點，大模型被視為解決AI落地難的一劑良方。過去兩年內大模型雨後春筍般湧現，有實力的科技企業紛紛推出自家的大模型，引數、資料集的規模也不斷攀升。

然而，大模型雖好但面臨落地應用難題，成為產業界共同的挑戰。當下，易用性、開放性成為大模型新一輪PK的考場，不妨看看浪潮“源1。0”大模型交出了怎樣的答卷。

大模型，智慧時代的演算法基礎設施

大模型在今天成為產業熱點絕非偶然。可以說，它的出現為困境中的AI產業化推開了一扇門。

在大模型出現之前，人工智慧模型的通用性不高，一個模型僅專用於特定領域，即“一個模型一個場景”，換個場景就要從0開始重新開發。而且，傳統的AI模型開發成本高，週期長，迭代慢，無法適配企業敏捷創新的業務需求。隨著AI技術從高頻主流場景到低頻長尾場景的滲透，場景碎片化與“手工作坊式”開發的矛盾日益加劇，對AI技術提出了挑戰，也限制了AI的產業化程序。

大模型提供了一種

“預訓練大模型+下游任務微調”

的全新模式，可以大大提高模型的泛化能力，提高AI的通用求解能力。而且，經過預訓練的大模型可以讓研究機構和企業“不必從0做起，而是可以在大模型的基礎上，從60、或者從90開始做到100”。

“大模型最重要的優勢是進入大規模可複製的工業落地階段，只需小樣本的學習也能達到比以前更好的效果，且模型引數規模越大這種優勢越明顯，這能大大降低各類使用者的開發使用成本。”浪潮資訊AI軟體研發總監吳韶華表示。

正是由於出色的泛化能力，大模型被譽為智慧時代的演算法基礎設施。正如發電廠和高速公路一樣，大模型將成為各行各業應用AI技術的底座和創新的源頭。

目前，在探索大模型落地的道路上，產業界已經做了很多嘗試。其中，輕量化做場景適配以及開源開放，已成為行業共識的兩大趨勢。目前，兩個方向都做得好的企業並不多，浪潮是其中之一。

如何讓大模型分身有術

將大模型蒸餾成相對輕量的、更垂直的模型，已經成為產業界的普遍做法。其原理是知識蒸餾（Knowledge Distillation），它是一種基於“教師-學生網路”模式的模型壓縮方法，可以將已經訓練好的大模型包含的知識，蒸餾提取到另一個小的模型中去。

近日，

浪潮基於“源1.0”千億大模型蒸餾出4個百億引數規模的技能模型：對話問答技能模型、知識檢索技能模型、中英翻譯技能模型、古文理解技能模型，

在細分領域精確度業內領先，獲得權威評測基準CLUE、CUGE榜單榜首，並已在南京智慧計算中心成功落地執行。「智慧進化論」認為，浪潮的技能模型具有“輕、快、強”的特點。

輕

浪潮技能模型的百億引數規模，大幅降低了訓練、推理、部署的門檻，並極大降低了開發訓練成本。相當於巨量模型一下子有了N個輕量化“分身”，可以直接面向對話、問答等主流場景化應用。

快

浪潮技能模型將過去動輒幾個月甚至幾年的大模型開發訓練週期，縮短至不足一個月，加速了企業利用技能模型不斷創新的速度。

強

分身是為了更專注，浪潮技能模型在效能上並不減配。

4個技能模型在相同任務上可保留98%的大模型效果，在特定領域任務中，甚至能得到比大模型更好的效果，但引數量僅是“源1.0”大模型的1/10，推理速率提升9倍。

在各自領域，浪潮四大技能模型在國際權威測評和榜單中都是學霸。比如，對話問答技能模型（源曉問）在業界權威測評WebQA開放問答資料集及CUGE兩項榜單均位居榜首，可廣泛應用於虛擬人、智慧助手、智慧客服等場景。中英翻譯技能模型（源曉譯）在業內權威WMT資料集及CUGE兩項榜單均位居榜首，可輕鬆應對日常中英翻譯任務。知識檢索技能模型（源曉搜）在WebQA任務上以55。97%的準確度領先業界，可廣泛應用於醫療、法律、保險及娛樂等領域的智慧客服、個人助理等場景。

在實際場景中，浪潮四大技能模型的能力已經得到了充分驗證。比如，基於業界領先的kdConv多輪對話精度，對話問答技能模型（源曉問）在日常對話場景已經具備相當的情商，達到了“人機難辨”的程度。

此外，正如“三人行必有我師”，技能模型和巨量模型如同身份靈活轉換的師生，可以在雙方協同中持續進化。透過將執行結果反饋給巨量模型，技能模型和巨量模型的知識與能力可以同步進化，從而實現落地場景越多，模型進化得“越聰明”。

讓大模型成為所有人的遊戲

如果說，大模型的研發是一場激動人心的遊戲，那麼它不該只是少數科學家的專利，所有人都應該擁有探索AI想象力的能力。

目前，

“源1.0”大模型已經相繼完成了模型API、高質量資料集、模型訓練程式碼、推理程式碼和應用程式碼等內容的開源開放，

在GitHub社群、浪潮源官網均可以申請獲取相關的資源。已經有超過600家使用者參與到“源1。0”大模型開放開源平臺中。

吳韶華表示，為了打造高品質的AI開源社群，“源1。0”大模型從四個方面為開發者提供便利：

第一，開源了直接可用的程式碼示例。

開發者無需關心底層技術，無需配置程式設計環境，就可以直接將應用構建於AI大模型的能力之上，在降低開發門檻的同時，讓開發人員將精力聚焦核心業務邏輯。

不久前刷屏的AI劇本殺就是開源帶來的一個驚喜。基於“源1。0”的開放開源平臺，一位普通開發者僅用一個月時間就開發出了“人機難辨”的AI劇本殺遊戲。劇本殺中的AI像人類一樣，會忽悠，會撒嬌耍賴，為了贏得遊戲還會撒謊，騙過了不少人類玩家。

AI劇本殺的創作者表示：“可以說源1。0是我見過的大模型開源專案中給到的質量最高的示例程式碼，好到什麼程度呢？好到了我們直接拿來用的程度。”

“在大模型出現之前，如果要做這樣一個劇本殺的遊戲，需要很強大的模型，既要有對話能力，也要有邏輯推理能力，這對於模型的開發、資料的選擇門檻很高。”吳韶華表示。

第二，向開發者提供大模型API和豐富的開發工具，顯著降低了應用開發的門檻。

比如，源的官網同步開放和上線了APIExp和Web應用Sandbox（沙箱）開發工具，開發者可在APIExp上設定引數，零程式碼呼叫和測試所有已開放的模型服務。Sandbox可以讓開發者僅修改少量程式碼，即可完成包含web互動的應用示例，從而快速驗證業務邏輯和功能效果。

第三，將“源1.0”大模型相關的訓練資料開源。

目前，已經有開發者直接利用開源的資料集對其模型進行二次訓練，得到了明顯的精度提升，訓練結果甚至登頂CLUE基準評測榜單。

第四，為開發者提供持續的支撐，實現開源社群交流共贏。

比如，浪潮有專門的運營團隊與開發者無縫溝通。針對深入的技術問題，也有專門的研發團隊進行研究和支援，交流成果還會以程式碼的方式進行開源。

低程式碼、低門檻，開發工具齊全、開箱即用……這些特點以及NLP巨量模型自身的魅力與潛力，讓更多的、不限技術水平的開發者都有機會嘗試大模型應用。

未來，“源”還會進一步開放模型線上蒸餾、領域模型下載等服務，並完善和豐富更多基於大模型的應用示例。

“數字世界與實體世界的深度融合，為大模型的應用帶來了更為廣闊的前景。我們願與各位夥伴一起聯合創新，積極探索基於“源”的各類智慧化應用。最後期待基於‘源’大模型，我們能夠‘結四方之曠友，資數實以相融。’” 吳韶華表示。

目前，大模型還處在非常早期的發展階段。易用性和開放性決定了大模型的生命力。前路漫漫，未來大模型需要面對的考試還有很多。也許有一天，當大模型人人用得起，當中小企業也可以用大模型來解決問題，大模型才算真正完成了畢業考試。

END

本文為「智慧進化論」原創作品。

農林漁牧網

AI大模型落地大考，浪潮交出了怎樣的答卷？

相關文章