農林漁牧網

您現在的位置是:首頁 > 林業

小米借生態鏈入局 AI 翻譯機,社交屬性將是翻譯硬體的新靈魂

2022-08-27由 DeepTech深科技 發表于 林業

魔芋屬性是什麼意思

在《麻省理工科技評論》今年十大突破性技術中,有一項就是以 AI 技術進行實時翻譯的巴別魚耳塞,不過實現實時翻譯的硬體不只是耳塞,特別是在國內,翻譯機的市場似乎更大,比如科大訊飛的“曉譯”翻譯機、搜狗旅行翻譯寶等,在微軟今年的 Build 開發者大會上,微軟 CEO Satya Nadella 在主題演講拿出了一箇中國初創團隊的翻譯機,這個符合微軟策略——把 AI 從 Cloud 雲端延伸到 Edge 邊緣裝置的產品,就是小米旗下生態鏈企業香蕉出行所推出的魔芋 AI 翻譯機。

老將的新戰場

小米預計於 7 月中旬在香港 IPO 掛牌,市場推估將籌募 61 億美元的資金,成為近幾年來科技行業最受矚目的 IPO 案,根據招股書內容,小米 IPO 募得的資金將用到四個方面,其中一個就是投資物聯網、人工智慧生態鏈。

而香蕉出行就是獲得小米投資的生態鏈公司之一,其魔芋 AI 翻譯機以小米硬體慣有的價格破壞者的特性殺入市場,只賣 249 元,是目前市面上翻譯機三分之一、甚至是四分之一的價錢,5 月初在小米的有品網上架,首賣不到 10 分鐘就賣出破萬臺,讓外界好奇這個在行業中掀起一陣腥風血雨的新公司是什麼來頭。

香蕉出行合夥人鍾雨飛,小米第 21 號員工。2011 年新浪微博崛起時,小米內部相當看好新媒體的發展潛力,當時便在內部正式成立新媒體組,由鍾雨飛負責團隊的組建及發展。當時小米的訊息傳播、新聞釋出都是靠微博,每天微博私信高達萬條之多,光是維護微博渠道的團隊就達 40 多人,做客服、做熱點創意,一句“米粉在哪裡、我們就在哪裡”的主張,讓小米透過微博、微信、百度貼吧、知乎等新媒體帶來了巨大的傳播聲量,之後就是大家都知道的“小米模式”、“米粉經濟學”等傳奇故事。

香蕉出行 CEO 於世璿,在硬體圈摸爬滾打數十載,曾是富士康集團董事長郭臺銘的特助,後來隨著在富士康時期的老闆一起創業,成立萬魔聲學(1More)耳機,以金屬機殼、醫療級矽膠打造的耳塞卻只賣 99 元,在市場上一戰成名,而 1More 耳機就是小米的第一家生態鏈公司。後續他創立鎖定車載出行的小貝汽車。由於過去他在小米合作專案上與鍾雨飛合作多年,建立了深厚情誼,加上有志一同看好出行領域的創新應用,因此將兩間公司業務合併,香蕉出行負責運營平臺,合併後的小貝汽車則負責供應鏈、產品與銷售。

小米借生態鏈入局 AI 翻譯機,社交屬性將是翻譯硬體的新靈魂

圖|香蕉出行三位合夥人:CTO於亮(左)、合夥人鍾雨飛(中)、CEO於世璿(右)。(圖片來源:DeepTech)

注入 AI 活水,老產品也有新玩法

不論是實時翻譯耳塞還是強調 AI 特色的翻譯機,都離不開三項核心:自動語音識別(Automatic Speech Recognition)、機器翻譯(Machine Translation)、語音合成(Speech Synthesis、或稱 Text to Speech)。當麥克風聽到對方講話的內容,先辨識出這是什麼語言如英文、西班牙文等,並且把語音轉成文字,第二步透過機器翻譯引擎進行文字對文字的翻譯,把原始語言翻成目標語言,最後把翻譯後的內容進行語音合成,播放出來。近年來因深度學習神經網路的興起,這三項技術在品質上均獲得很大的提升,翻譯機這一項老產品也在人工智慧相關技術的注入下重獲新生。

目前在多語言機器翻譯領域,被業界視為技術領先的有三家公司:谷歌、微軟、Facebook,他們的優勢在於掌握網際網路上龐大的資料以及使用者反饋,能夠快速且持續地最佳化其機器學習模型及翻譯引擎。

其中微軟 3 月在官方部落格公佈新研發的 AI 機器翻譯,將中文的新聞翻譯成英文已經達到人類專業水準,引起了大量的關注,到了 5 月又挑戰機器翻譯的難題——口語用法和方言,透過遷移學習和半監督式學習方法,解決方言中對應語句訓練資料不足的問題,向外界證實其在機器翻譯領域的能力絲毫不遜於對手谷歌。

小米借生態鏈入局 AI 翻譯機,社交屬性將是翻譯硬體的新靈魂

圖|微軟在自動語音識別、機器翻譯、語音合成的實力在全球名列前茅(圖片來源:微軟)

在國內推出 AI 翻譯機的公司多是強調擁有相關核心技術,像是科大訊飛的強項在於語音識別,搜狗則是機器翻譯,不過,香蕉出行的策略很務實,他們清楚自己的強項在硬體和社交,而非自然語言處理及機器翻譯,因此他們選擇站在巨頭的肩膀上,透過與微軟的深度合作,以微軟的語音識別及機器翻譯做為魔芋翻譯機的 AI 技術核心。

另外,微軟的雲計算資料中心和伺服器分佈在全球範圍,也是香蕉出行選擇微軟的重要因素之一,當翻譯機的使用者到海外旅行,後端系統會選擇當地或鄰近的伺服器執行翻譯任務,香蕉出行 CTO 於亮解釋,市場上很多翻譯機強調支援離線翻譯,離線就必須把模型弄小,準確性往往不如線上模式,因此他們的作法是透過 WiFi 串連雲計算,以確保翻譯準確性有好的質量,目前魔芋 AI 翻譯機可支援 14 種語言,開賣短短一個月,截至目前使用者已經帶著魔芋翻譯機到超過 40 個國家旅遊。

翻譯機變撩妹神器?社交屬性才是未來關鍵

翻譯一直是人類想要解決的溝通痛點,然而對此,一派從軟體出發,例如智慧手機裡的翻譯 APP,或谷歌在相機加入實時翻譯,把攝像頭對準想要翻譯的選單、影象、標示等,就會立刻在手機螢幕上呈現翻譯結果;另外一派則做成硬體,不論是耳塞、翻譯機、還是 WiFi 分享器等,什麼樣的方式使用起來最便利、最不突兀尷尬,眾人各有不同的看法。

香蕉出行 CEO 於世璿接受 DT 君專訪時表示,耳機場景我們考慮過,但是耳塞很難做到真正的人際互動。耳塞要配合手機使用,而且翻譯的內容只有戴耳塞的人才聽得見,有些 AI 翻譯耳塞為了解決這個問題,採取分享耳塞的做法,對話者一人各戴一個耳塞,但多人就不適用,而且可能受限於衛生方面的考量,難以讓多數人接受。

小米借生態鏈入局 AI 翻譯機,社交屬性將是翻譯硬體的新靈魂

但是,只單純做一個翻譯硬體,並不是這家創業公司所想的事,於世璿指出:“純硬體的產品就像是殭屍,沒有靈魂,不過,在我們看來,翻譯機不只是翻譯,更是一個社交化產品,AI 社交網路才是香蕉出行著眼的方向,”他很明確的說。

當然,讓講著不同語言的人能夠互動,本質上就是一種社交,但對香蕉出行來說,翻譯只是落地場景之一,所以他們先把小米的智慧語音助理小愛放進了魔芋 AI 翻譯機中,滿足使用者快速查詢知名景點、天氣、播放音樂等需求,翻譯機立刻變成一個迷你版、隨身版的智慧音箱,未來還會接入更多以 AI 最佳化且圍繞社交的雲端服務,這就是他所說的 AI 社交網路平臺。

對於未來產品的方向或功能,於世璿表示基於商業考量還不便對外說太多,但他仍透露一些方向,例如,他們已經透過演算法挖掘使用資料,進一步分析出使用者的應用情境,他們發現除了出行問路之外,其實許多人是用來結交朋友。

在今年的臺北國際電腦展(Computex)上,微軟的攤位就展示了魔芋 AI 翻譯機,由於 Computex 有來自世界各地的參展商和買家,香蕉出行的同仁就拿著產品在現場做測試、推廣,當對方聽到翻譯機說出自己國家的語言時,往往會感到非常開心,是一個讓初次見面、陌生的人們很好“破冰”的工具。

因此,他們已經規劃了一項新功能:在產品中加入傳送語音訊息的功能,而且是已經翻譯好的訊息,例如使用者說一段話,選擇要翻譯的語言,當對方接收到這條語音訊息時,就會聽到是說英文、西班牙文或日文。另外,後續還會進入語言學習及商務翻譯兩大市場。

於世璿指出,全球翻譯產業規模將達 530 億美元,還有很大的發展空間,“小米的生態鏈產品都有一個特點,就是做小眾市場的大眾產品”,就像小米先前推出耳機、手環,都是用一個很有殺傷力的價格,快速攻城掠地。因此魔芋 AI 翻譯機採用同樣的策略,直接以 249 元殺入市場。

除了耕耘國內市場外,他們也與日本業者洽談合作,除了提供一般遊客翻譯機之外,還會在出租車中配置一個專屬翻譯硬體,除了日本是旅遊大國,每年吸引眾多遊客造訪,另一個重點就是 2020 年東京奧運,勢必湧入大量的遊客、商務客,因此香蕉出行積極出海,希望讓魔芋 AI 翻譯機打進日本。

249 元背後的秘密

目前國內市場上的翻譯機大多超過 1000 元,便宜一點的也接近 700 元,魔芋 AI 翻譯機只賣 249 元,而且還用了 CNC 加工技術定製音腔,外觀則是採取類似蘋果 Macbook 的一體成形金屬機身設計。但為什麼能賣這麼便宜?或許不少人心中都有這個疑問。

小米借生態鏈入局 AI 翻譯機,社交屬性將是翻譯硬體的新靈魂

於世璿回答得很誠實,也很理性,第一個關鍵就是渠道及供應鏈優勢,小米生態鏈有眾多的公司,許多零部件可以透過集體採購得到較好的價格,另外他們是透過小米有品售賣,能省下一般渠道 25~30%的抽傭費。再加上於世璿從富士康到 1More 耳機的數十年資歷,對於深圳硬體供應鏈的掌握包括供應商來源、製造控管,對他來說早已是家常便飯,這也是魔芋 AI 翻譯機價格能如此犀利的原因之一。

第二個原因在於“只解決一個痛點”,“市面上有很多翻譯機反而像智慧手機”,有些可以拍照、有些則帶螢幕,加了攝像頭、面板價格就不可能低,“但是做產品不應該是疊加,只應做一個痛點,”他說,省略其他看似有用、但不實用的功能,就能把產品價格控制在一定水準。

最後一個原因倒是有點像對雷軍的致敬,承襲小米的商業理念。雷軍先前在小米 6X 手機發佈會丟下一句話:“小米硬體綜合淨利潤率永遠不會超過 5%,如有超出的部分將全部返還給使用者”。這番話儘管遭到行業人士揶揄,但不可否認,小米生態圈的產品像是耳機、掃地機器人、空氣淨化機等給人的印象往往就是“價格厚道”。而希望讓大多數的消費者能夠沒有負擔地享受科技帶來的樂趣,這就是香蕉出行的策略:只要讓翻譯機的價格落在合適的區間,就能從小眾市場變成一個大眾產品。

香蕉出行三位合夥人於世璿、鍾雨飛、於亮過去在網際網路社交、聲學硬體領域寫下成功,走上了自己的創業路,香蕉出行的香蕉二字就是取自讓人類能夠“相”互“交”流的意思,現在的他們要在出行領域創造一個新的社交模式。