扎克伯格並非閩南話AI翻譯“頭號玩家”,廈大版早就有了
2023-01-04由 澎湃新聞客戶端 發表于 漁業
潮汕英語怎麼寫
最近,馬克·扎克伯格的一段影片刷屏了朋友圈,影片中扎克伯格展示了最新的AI翻譯技術,可以實現閩南話和英語的無障礙交流 。
不過,閩南話翻譯扎克伯格不算是“頭號玩家”。
早在2019年,來自廈門大學的科研團隊就推出了會聽、會說、會寫的閩南話智慧語音系統 ↓ ↓ ↓
廈門大學的閩南話智慧語音系統出自資訊學院洪青陽和人文學院許彬彬的科研團隊之手。
這個系統到底能做些什麼?可實時翻譯還能識別文字,不僅聽得懂、說得清,這套系統還會寫,
可以實現文字和閩南話的互相轉換。
洪青陽團隊認為,從現有資料看,扎克伯格釋出的這項技術只是語音到語音的翻譯,沒有涉及文字。比如,不能形成識別文字,要延伸到其他應用就比較難。在這點上,廈大版閩南話智慧語音系統“更勝一籌”。
經過不斷的迭代升級,目前廈大的這套語音系統不僅可以精準翻譯,還可以識別不同地區、不同口音的閩南話。
這要歸功於科研團隊建立的龐大語音資料庫,裡面有足夠多不同人群、不同口音的語音,並及時擴充詞典和語言材料。
與此同時,系統後臺要不斷完善演算法,以便學習更多口音和生僻詞彙。
眼下,研發團隊還在開發多語種和方言混雜的智慧系統,其中,針對普通話和閩南話混合語音的轉換技術預計將在年底上線。
一個是識別要準,一個是要看得明白,這裡面兩大挑戰都整合在一套系統裡面。後面還要更強大,也就是有普通話和閩南話混雜的。我們內部已經有研發了一個版本,還沒正式釋出,普通話、英文、閩南話三種合起來的,這是我們下一步的目標。
目前,
廈大團隊的閩南話智慧語音系統已經上線
,透過小程式和APP,就可以實現閩南話和普通話的無障礙溝通。
同時,經過定製化處理後,系統還被
應用在一些特定場景裡。
廈門大學資訊學院副教授 洪青陽:
比如鄉村的喇叭,農村需要閩南話播報,輸入文字就可以直接播報出來,這個很便利。更多的我們還是希望走進千家萬戶,更多的可能會結合一些硬體,讓小孩子可以直接操作,相當於一個益智玩具,真正讓更多人感受到方言AI技術給他們帶來的便利。
★
全球約七千萬人說閩南話
在美國Meta公司公佈閩南話翻譯系統後很多人很吃驚:
為什麼是閩南話?
原因也很簡單,目前,
全世界大約有7000萬人在說閩南話
,分佈在福建的廈、漳、泉地區,臺灣地區,廣東潮汕,雷州半島,海南島部分地區以及浙江溫州部分鄉鎮等,此外還有廣闊的東南亞。
與此同時,閩南話被稱為“中國最難學方言之一”。
2013年,
洪青陽和許彬彬團隊開始閩南話翻譯系統研究,洪青陽說,這源於團隊中不少人都是閩南人,有閩南情懷
。而且,
閩南話是我國重要方言之一
。與此同時,許彬彬深耕閩南方言等漢語方言研究多年。
當然,Meta公司認為,之所以選擇閩南話,還有一個原因:為了解決缺乏文字語種的語言翻譯難題。但是,洪青陽說,其實閩南話是有用於書面記載的文字和發音詞典。
微信公眾號“廈門廣電”綜合整理自:廈視新聞、廈門網 記者/徐佳妮 戴丞
原標題《扎克伯格親自演示閩南話AI翻譯!其實廈門早就有了!》