作者 ZMTL (Zaious.)標題 Fw: [LLMs] Meta發布可數十種語言互譯的AI模型時間 Wed Aug 23 13:28:16 2023
※ [本文轉錄自 AI_Art 看板 #1avPSA8_ ]
作者 ZMTL (Zaious.)標題 [新聞] Meta發布可數十種語言互譯的AI模型時間 Wed Aug 23 13:20:03 2023
https://udn.com/news/story/6811/7388253
https://uc.udn.com.tw/photo/2023/08/23/realtime/24375092.png
臉書(Facebook)母公司Meta周二發布一套人工智慧(AI)模型,能翻譯數十種語言並轉
成文字,為日後建立跨語言即時溝通工具打下基礎。
Meta在網誌公布,他們的SeamlessM4T模型可以支援近100種語言的文本和語音之間的翻譯
,以及35種語言的全語音對譯,將原本只能在單獨模型中使用的技術結合在一起。
Meta執行長祖克柏已表示,他預見這種工具可以促進全球用戶在元宇宙(metaverse)中
互動。他正將臉書的未來押注在這個虛擬世界網路上。
Meta在網誌中說,這套AI翻譯工具將公開供非商業使用。
這個全球最大社群媒體公司已發表一系列免費使用的AI模型,包括名為Llama的大型語言
模型,對微軟支持的OpenAI和Google 形成嚴厲挑戰。
不過,Meta也和業界一樣面臨相同的法律問題,這些問題都跟創建模型時所攝取的訓練數
據有關。
就SeamlessM4T模型來說,Meta研究人員在一篇研究論文中說,他們從400萬小時的「原始
音檔」收集語音訓練數據,「原始音檔來自一個可公開使用的網路數據資料庫」。
-
參考資料:
https://youtu.be/ulU2q0sRQjY?t=83
AI Meetup 台灣人工智慧小聚之AIGC探索: 台英語音翻譯 - Meta 陳鵬仁研究員
之前Meta公司 台語(閩南語)跟英語的即時口譯Demo,
以及參與開發的該台灣工程師,一小時的的開發細節講解。
-
其實也不一定要到虛擬實境的Metaverse,
想像一下以後的國際服MMORPG,各語系玩家可以即時文字或語音溝通,
甚至連遊戲開發商都可以輕鬆完成多國語言版本的未來...
好吧,就算以玩家的角度很夢幻,對於翻譯工作者未必是好事就是了。
--
AI_Art AI藝術與創作板 歡迎各方前來討論AIGC創作與相關議題!
AI情報屋營業中
噗浪:
https://www.plurk.com/Zaious
IG :
https://www.instagram.com/zaious.design/
日曆:
https://zaious.notion.site/zaious/22c0024eceed4bdc88588b8db41e6ec4
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.98.115 (臺灣)
※ 文章代碼(AID): #1avPSA8_ (AI_Art)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1692768010.A.23F.html
※ 編輯: ZMTL (36.226.98.115 臺灣), 08/23/2023 13:27:10
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: ZMTL (36.226.98.115 臺灣), 08/23/2023 13:28:16
推 lolic: 以後詐騙集團就算是跨國企業了2F 08/23 13:35
推 PyTorch: 技術來講沒有關鍵瓶頸 剩下只複雜度語術巨量4F 08/23 13:41
→ ZMTL: 連台語這種沒有直接文字(他們並非採用台羅)的都搞定了6F 08/23 13:46
→ ZMTL: 但這個案例(我指我參考資料中的台英互譯專案)也彰顯了,
AI發展中幾乎無法繞過未授權資料,畢竟需要的資料集量太恐怖八卦版有人說有兩個國際級的麥塊伺服器實裝類似的AI翻譯了?8F 08/23 13:50
推 Porops: LLaMa已經有好幾個額外特劃過中文的模型了,針對台灣的也有11F 08/23 14:08
→ ZMTL: 台語那個參考資料有一小時的詳細說明,可以自己看XD14F 08/23 14:19
--