毫末的勇氣與膽量：堅持資料驅動和漸進式路線，劍指自動駕駛3.0

模有幾個讀音分別念什麼

編輯：Mark

出品：紅色星際（ID：redplanx）

頭圖：毫末智行四位創始人圖片

毫末智行為什麼最有可能成為中國第一個踏入自動駕駛3。0時代的公司？

1. 毫末的“勇氣”：“以終為始”選擇技術路線

在最近的一次毫末智行技術分享會上，一個朋友問道，“僅僅三年的發展，是什麼因素促使毫末成為中國量產自動駕駛公司的第一名？”

技術分享人思考了片刻，答道，如果用一個詞總結，就是“勇氣”。這個詞可能說起來比較簡單，但對我們的挑戰很大，特別是幾位老闆壓力很大。老闆最大的壓力是量產交付，是商業，我們作為技術人員雖然也會受到挑戰，但相對而言，主要是在技術上和自己較勁。

自毫末成立之後，整個公司逐漸地將高效的資料閉環作為首要任務，先把資料能力建立起來，然後再考慮盈利的問題。

如果你一開始就做小模型，或者使用高精地圖，在城市中面對一些特殊的場景，可能很快就能上車，但是這不符合終局思想。毫末選擇了一條“以終為始”的道路，從大模型出發，站在以終為始的角度，思考最終的技術架構到底是什麼。

這個可能和毫末智行的管理團隊有關，管理團隊並不想把毫末做成一個短期利益公司，而是從終局的角度考慮公司的技術架構和商業模式，大家都是想做成一個真正的對這個社會有價值的公司。

於是毫末在2021年12月，基於國際最先進的AI技術理念釋出了國內首個自動駕駛資料智慧體系MANA，目前階段，這個基於大資料驅動的智慧體系已基本搭建完畢。

（毫末智行資料智慧體系MANA）

截止到2022年9月，毫末MANA體系學習時長已經超過31萬小時，虛擬駕齡相當於人類司機4萬年。在資料積累方面已經完成數十萬全要素、多模態CLIPS 的標註。在場景庫積累方面，已經建設完成300 萬小時中國道路駕駛認知場景庫。

這個也可以解釋，為什麼毫末在短短3年時間，就得到了投資人的認可，躋身自動駕駛獨角獸公司，相信投資人更懂這個團隊。

在傳統計算機視覺領域的二維資訊的處理上，CNN是絕對的主流選擇，但是CNN最大的問題是面對巨量資料時有很大侷限性，而基於Attention機制的Transfomer大模型，在處理海量資料和複雜場景方面優勢更明顯。

所以毫末整個技術團隊，從2021年7月開始就啟動了對Transformer的研究和落地嘗試，因為它非常適合於多模態資料處理，特別是大資料的處理。

經過一年多的時間，毫末完成了訓練平臺的改造升級，完成了資料規格和標註方法的切換準備，完成了針對感知、認知具體任務的模型細節探索，終於應用在毫末城市NOH功能中。

並在今年8月份的成都車展，毫末智行聯合魏牌摩卡、高通聯合推出了中國第一個量產的城市導航輔助駕駛，這套最新的智慧駕駛系統HPilot3。0已經搭載在魏牌摩卡DHT-PHEV鐳射雷達版上，將於今年9月底量產，年內交付使用，相信大家應該能很快感受到這套系統的威力了。

毫不客氣地說，毫末是中國第一個大規模投入基於Attention機制的Transfomer大模型架構的公司，這個架構不僅為毫末在各條自動駕駛產品線上的視覺演算法落地帶來成倍的效率提升，還可以大幅提升後續的規劃和控制等相關技術，最後可以使駕駛行為像老司機一樣，順滑舒適。

單純從模型結構來看，Attention機制最大的特點就是結構簡潔，可以無限堆疊基本單元得到巨大引數模型。而且多方資料顯示，隨著資料引數量的增加和訓練方法的提升，Attention大模型很多方面的人工智慧水平都超過了人類。

（AI模型發展變化圖片）

對於一般的公司而言，我相信他們在面對量產交付和新的技術架構選擇方面，肯定會猶猶豫豫，或者說並沒有毫末這麼有勇氣（因為毫末堅持“以終為始”選擇技術路線）。

當然，新架構雖然好，但是也會帶來一系列的問題，我們稱之為，牽一髮而動全身。一般Transformer所需算力是CNN的100 倍，但是存在很大的算力浪費，平均6。9%的算力貢獻了94%的價值，很多弱關聯、低價值的運算產生了很多浪費。

而且，基於Attention的大模型對算力的需求遠遠超出了摩爾定律，這導致大模型的訓練成本非常高、落地很難、尤其是在終端裝置上的落地尤其困難。

如何改進車端模型和晶片的設計，實現大模型的車端落地；如何透過低碳超算平臺，降低自動駕駛成本，這些都變成了新的課題。

在大模型時代，巨量的模型引數給模型訓練帶來很大的難度。在當前主流配置的伺服器上，用資料並行方式訓練所花的時間是近百個小時。所以毫末正在透過建設低碳超算中心來降低自動駕駛成本，透過改進車端模型和晶片的設計來實現大模型的車端落地，透過資料的組織讓大模型發揮更大效力。對於低碳超算中心，毫末的目標是滿足千億引數大模型，訓練資料規模100萬clips，整體訓練成本降低200倍。

之所以毫末選擇不斷地折磨自己，主要是和公司的戰略有關，毫末在很早的時候，管理團隊就認為，在選擇技術路線時，一定要以第一性原理作為判斷基礎，能將資料規模優勢快速轉化為能力優勢的技術路線就是好路線，否則我們就重新推倒，再構建一套資料系統。

正是由於毫末智行團隊的堅持和持續攻堅，毫末在自動駕駛量產方面，穩居中國第一。

而且隨著測試的深入，資料的累積，毫末發現當初自己的決定越來越正確。過去用的分場景小模型方法漸漸顯露弊端，有的時候運動起來太機械，舒適感不足；有時候太依賴一些感測器，導致成本降不下來。

特別是高精地圖的使用，毫末認為它也是一個感測器，一個很重要的感測器，雖然在某些場景這個感測器很管用，但是因為成本和更新的問題，高精地圖的置信度並不能得到保證，你永遠不知道什麼時候什麼地方它就會失效。

所以毫末成為中國第一個在大規模量產城市NOH時，提出“重感知、輕地圖、大算力”的技術路線，擺脫高精地圖這個不確定的感測器。

不過話說回來，所有的這些選擇都和毫末公司的戰略有關。如果大家關注過毫末的成長曆程，就會發現，毫末在感知、認知、模式建設上，都是按照資料驅動的方式建設的，這就是毫末穩當中國量產自動駕駛公司第一的法寶。

1. 毫末的“勇氣”：“以終為始”選擇技術路線

對於毫末智行而言，先進的技術是底層框架，優秀的工程化能力是執行層，而公司戰略則是整個架構的大腦。

公司從成立之初，毫末就確定了走漸進性線路的戰略思想。一直以來，自動駕駛行業都有“漸進式”和“躍進式”的路線之爭。毫末認為，漸進式發展路線可以以更低的成本來獲得更大規模、更多場景覆蓋的優質資料，會成為推動人類實現自動駕駛的最佳路徑。

在公司堅定走漸進性戰略的指導下，毫末智行透過研究資料驅動的各個環節，於2021年9月，提出了毫末制勝法則：毫末制勝法則=（資料智慧*全面安全*穩定量產）^生態，它也成了公司最高的指導思想。

（毫末智行制勝公式）

在這個思想下，毫末始終將安全作為自動駕駛的底線，不斷地擴充套件自己的生態合作，在乘用車自動駕駛領域，毫末將繼續堅持“6P 開放合作原則”，與客戶夥伴進行各種型別開放式的合作探索，持續賦能行業夥伴；在末端物流自動配送領域，毫末正透過“5S 服務體系”，與客戶夥伴一起，共同推動末端物流自動配送車規模化商用的行業程序。

關於漸進性路線，董事長張凱把它分為三個階段：第一個階段是自動駕駛能力的實現，這個階段，大多數在自動駕駛這個賽道創業的公司都已經實現了。

第二個階段是自動駕駛系統的規模化部署。只有將自動駕駛系統大規模的部署到車上，投入市場，才能弄清楚市場真正的需求，才能驗證產品的市場競爭力。

2022年，對於一個在自動駕駛賽道創業的公司而言，如果沒能夠解決自動駕駛規模化部署問題，將是一件非常致命的事。而橫亙在Demo與規模化部署之間的一道障礙，就是技術的工程化能力。

目前很多公司大量的時間和精力要花費在解決技術工程化的問題。用毫末管理層的講話，我們接觸自動駕駛之後深刻感覺到，只有多工種協同才能夠做好這件事情。有的做域控制器，有的做車輛適配，有的搞軟體，對於毫末而言，因為自身團隊的多元化特性，天生就具備這種能力。毫末的研發團隊彙集了眾多十年以上經驗汽車研發高階工程師，同時得到長城汽車開放的所有的車型平臺和零部件資源支援，技術工程化能力自毫末成立以來，就像血液一樣流淌在身體裡。

透過團隊基因和MANA體系的加持，毫末智行內部已經形成一整套高效的智慧駕駛產品開發流程。目前，雲端工程化基本搭建完成，車端工程化也已經在大規模落地，截至目前，毫末已推出三代乘用車輔助駕駛產品HPilot，兩年6 次OTA 升級，實現搭載超過十款乘用車型量產落地，同時並行30 個專案非同步開發。

目前正在陸續交付中的車型有摩卡DHT-PHEV 鐳射雷達版、尤拉閃電貓、尤拉芭蕾貓、全新一代長城炮等。截止到2022年9月，毫末使用者輔助駕駛行駛里程突破1700萬公里，位列中國自動駕駛公司第一名。截止到2022年底，HPilot預計搭載車型近30款，未來搭載車型達到百萬量級。

（毫末智行產品落地圖片）

第三個階段是自動駕駛能力的逐步完善。這個階段，資料積累的成本和質量直接決定這個過程的週期。

透過大規模的自然語言領域的應用實踐，毫末發現數據規模不但要足夠大，資料的多樣性也要足夠充分，各種感測器的資料，包括不同型別、不同畫素、不同角度對於大模型訓練都有非常大的價值，包括毫末末端物流自動配送車的執行資料。

2022年4月，毫末推出了行業首款十萬元級末端物流自動配送車“毫末小魔駝2。0”，正在面向商超、物流行業客戶，提供穩定、高效地無人化投遞服務。截至2022 年9 月，小魔駝訂單量已突破9萬單，切實推進了末端物流自動配送車規模化商用的行業程序。

毫末預計無人配送行業將在2023年，2024年之間迎來爆發。目前階段，“毫末小魔駝2。0”已經具備L4級自動駕駛、遠端駕駛、低成本部署、車輛管理平臺、遠端監控平臺、訂單管理平臺、微信小程式等七大核心功能，在業界處於領先水平。

結合海量資料和實踐，無論從資料成本還是資料量的處理上，資料智慧體系MANA正在發揮決定性作用，特別是現在很多公司都走上了這條路，側面也說明毫末的道路是正確的，這也是為什麼毫末能做到中國量產自動駕駛公司第一很重要的一個原因。

在毫末制勝法則的指引下，MANA資料智慧體系和強悍的工程化能力雙管齊下，毫末在大規模、多車型自動駕駛量產戰役，末端物流自動配送車技術成本戰役，大規模資料處理及大模型應用戰役都取得了突破性的進展。

1. 毫末的“勇氣”：“以終為始”選擇技術路線

何為自動駕駛3。0時代？用毫末智行CEO顧維灝的說法，自動駕駛分為3個階段：

自動駕駛1。0 時代主要是硬體驅動。硬體數量決定能力高低，自動駕駛車輛依靠鐳射雷達等硬體進行“全副武裝”，整車成本高、數量少、技術效果一般，自動駕駛里程僅在100 萬公里左右。

自動駕駛2。0時代主要是軟體驅動。AI 技術，大算力計算晶片亮相，車規級感測器個數在快速增加，整車成本下降、效果提升，自動駕駛里程快速增加至上千萬公里。

但這個時代還是寫規則的階段，我們現在正處於第二和第三階段之間。

自動駕駛3。0時代是真正的資料驅動。大模型+海量資料“雙劍合璧”，資料開啟自訓練模式，自動駕駛里程飆升至1 億公里以上。

這個階段以資料的自訓練為主，我們所做的一切，都是為了能夠做出資料通道和計算中心，以便可以更高效的獲取資料，並把資料轉化為知識。

（自動駕駛發展的3個階段）

自動駕駛3。0時代，我們擺脫了寫規則的年代，資料真正成為驅動自動駕駛能力的核心。為此毫末結合自身的發展，制定了毫末智慧駕駛產品能力迭代鐵三角：“場景化使用者體驗設計、AI 人工智慧技術、技術工程化能力”。

首先是場景化使用者體驗設計，這個是入口，是產生資料的第一步。

張凱表示：“如果使用者一開始就不喜歡用，認為輔助駕駛不好用，那我們就連學習的機會都沒有，更不要說形成資料閉環，持續迭代產品能力了。因此，持續最佳化的使用者體驗是自動駕駛商業化落地的重中之重，也可以說漸進式發展路線的關鍵環節就是使用者體驗。”

在場景化使用者體驗設計方面，毫末有大量的使用者互動體驗和產品開發的一體化設計經驗，並在2年時間裡完成了6次產品OTA 升級。同時透過將感性的使用者體驗細化成為可衡量的指標，在各個細化的成本上不斷做功。

為了提高使用者體驗，毫末此次又點亮了城市NOH六大功能，包括智慧識別交通燈、智慧左右轉、智慧躲避障礙物、智慧變道和基於真實世界的智慧交通流處理。

為此，毫末聯合阿里雲、浙江德清發布了“中國首個基於車路協同雲服務的大規模自動駕駛場景庫”，這是中國第一個使用真實交通資料生成的自動駕駛場景庫，讓自動駕駛更像人類的駕駛方式。

其次，人工智慧技術是靈魂，只有擁有支援大規模資料的處理能力，自動駕駛才能真正進入自我迴圈，自我迭代階段。

毫末過去近2年打造的基於自動駕駛的資料智慧體系MANA，就是在為此做準備，透過超算中心的建設，真正的讓資料在大模型中完成自我訓練和系統迭代升級。

過去我們都是用感測器感知和演算法預測周圍交通參與者的意圖，當我們進入城市環境，發現交通參與者的活動變得更復雜了，預測的難度也更大了。此時如果每個感測器都獨自工作，用一些小模型來做預測，顯然是不能適應更復雜的城市交通的。

所以需要從大架構出發，在BEV 框架下的3D 空間重建一致性目標。和一般的Mask重建圖片或者影片的訓練目標相比，這種基於3D空間一致性的自監督訓練能夠更有效迫使模型理解道路場景的三維結構，從而更好的適應自動駕駛的各種感知任務需求。

最後，技術工程化能力是保障。

目前，毫末智行在過去的兩年時間裡，實現10餘款不同平臺車輛量產落地，成為國內智慧駕駛技術落地經驗最豐富的公司，也是中國唯一一個具備非同步並行開發超過30 個智慧駕駛專案能力的公司。

（毫末智行

智慧駕駛產品能力迭代鐵三角

）

有入口、有靈魂、有保障，智慧駕駛的產品能力才能夠快速迭代。毫末判斷，全球自動駕駛正在進入以特斯拉為代表的，資料驅動為核心的自動駕駛3。0時代，隨著思想鋼印和MANA能力的進化，加上獨有的智慧駕駛產品能力迭代鐵三角，讓毫末最有可能成為中國第一個進入自動駕駛3。0時代的自動駕駛公司。

面對即將到來的3。0時代，毫末已經在幾個核心難點上，包括資料處理成本，資料效率，大模型架構，自動駕駛可解釋性和模擬等幾方面更新了MANA體系。

在資料處理過程中，樣本標註是一個時間成本和金錢成本都很高的環節。MANA透過使用大規模量產車無標註資料的自監督學習方法打造模型效果，相比只用少量標註樣本訓練，訓練效果提升3 倍以上，可以讓資料優勢快速高效轉化為模型效果。

同時為了應對巨大資料規模下的“資料效率”難題，MANA構建了增量式學習訓練平臺，抽取部分存量資料加上新資料組合成一個混合資料集。相比常規做法，整體算力節省80%，響應速度提升6 倍。

面對高精地圖覆蓋範圍小的問題，MANA建立強感知的時空理解能力，透過使用時序的Transformer模型在BEV 空間上做了虛擬實時建圖，讓感知車道線的輸出更加準確和穩定，可以在不依賴業界常用的高精地圖的情況下，只依靠普通導航地圖就可以準確感知道路環境。

自動駕駛演算法可解釋性也一直是個難點，毫末基於典型場景挖掘海量司機的實際駕駛行為，構建Task Prompt，訓練一個基於時空Attention的駕駛決策預訓練大模型，使得自動駕駛決策更像人類實際駕駛行為，以保證實現自動駕駛決策的可控、可解釋。

為了解決模擬不夠真的問題，MANA在模擬系統中引入了高價值的真實交通流場景，與阿里、德清政府合作，將路口這一城市最複雜場景引入模擬引擎，構建自動駕駛場景庫，透過自動駕駛的真實模擬驗證，快速提升自動駕駛系統的城市路口透過能力。

目前毫末的三大戰役已經到了決戰時刻，而先前的準備工作都已經做完，無論是大規模資料處理及大模型應用戰役，還是大規模、多車型自動駕駛量產戰役，末端物流自動配送車技術成本戰役，毫末都已經萬事具備，只等未來1-2年時間，毫末將他們全拿下，成為中國自動駕駛行業的領頭羊。

-END-

農林漁牧網

毫末的勇氣與膽量：堅持資料驅動和漸進式路線，劍指自動駕駛3.0

相關文章