比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

在元宇宙里怎么交朋友?Meta發布跨語種交流語音模型 支持128種語言無障礙對話_MET

Author:

Time:1900/1/1 0:00:00

改名 Meta 之后,Facebook 的元宇宙愿景正在一點點實現。這一次,Facebook 把目光投在了元宇宙社交上。

Meta 發布語音處理模型 XLS-R

近日,Meta 正式發布 XLS-R——一套用于各類語音任務的新型自監督模型。據悉,XLS-R 由海量公共數據訓練而成(數據量是過去的十倍),能夠將傳統多語言模型的語言支持量增加兩倍以上。目前,XLS-R 共支持 128 種語言。

Meta 認為,語音交流是人們最自然的一種交互形式。“隨著語音技術的發展,我們已經能夠通過對話同自己的設備及未來的虛擬世界直接互動,由此將虛擬體驗與現實世界融為一體。”

麥當勞將在元宇宙慶祝中國農歷兔年新年:1月14日消息,麥當勞宣布與Karen X Cheng合作在元宇宙慶祝中國農歷兔年新年,通過虛擬現實、增強現實和3D動畫,用戶可以在麥當勞元宇宙中探索各種活動,比如圍棋和麻將等中國經典游戲、VR動物園、烹飪比賽等,每個用戶還將獲得可定制的3D頭像。(NFT Evening)[2023/1/14 11:11:56]

這與扎克伯格此前宣稱的“公司業務將以元宇宙優先”不謀而合。此前,扎克伯格曾概述了他建立“元世界”的計劃:一個建立在我們自己的數字世界之上的數字世界,包括虛擬現實和增強現實。“我們相信元宇宙將會接替移動互聯網”。

而 XLS-R 作為元宇宙社交中必不可少的一環,可以幫助母語不同的人在元宇宙無障礙對話。

值得一提的是,為了通過單一模型實現對多種語言的廣泛語音理解能力,Meta 對 XLS-R 進行了微調,使其獲得語音識別、語音翻譯及語言識別等功能。據介紹,XLS-R 在 BABEL、CommonVoice 以及 VoxPopuli 語音識別基準測試,CoVoST-2 的外語到英文翻譯基準測試,以及 VoxLingua107 語言識別基準測試中都取得了不錯的成績。

風語筑:預計公司在元宇宙領域的發展和實際經營情況將存在重大不確定性和風險:12月16日消息,風語筑在接受機構調研時表示,公司早在2012年開始就一直在運用全息技術、CG視覺、裸眼3D技術等等對展館現場和文化空間進行視覺和體驗效果增強,公司擅長運用VR/AR、全息影象和裸眼3D打造沉浸式交互體驗,這些技術和內容在公司主營業務中有較多的應用。但基于元宇宙概念存在重大不確定性,預計未來公司在元宇宙領域的發展和實際經營情況將存在重大不確定性和風險。(鞭牛士)[2021/12/16 7:43:55]

為了盡可能降低功能訪問門檻,目前,Meta 與 Hugging Face 聯手發布了模型本體,并通過 fairseq GitHub repo 全面開放。

試用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

俄羅斯國家博物館宣布將在元宇宙構建“數字版本博物館Celestial Hermitage”:金色財經報道,據俄羅斯國家博物館當代藝術部負責人德米特里·奧澤科夫 (Dmitry Ozerkov)透露,該館正在構建一個“數字版本冬宮”,其中將展示NFT藝術。位于圣彼得堡的俄羅斯國家博物館The State Hermitage Museum是世界上最大的美術館,擁有約 300 萬件藝術品。2021 年 9 月,該博物館就以 NFT 形式出售了5 件最著名作品的數字復制品,在 NFT 世界邁出了第一步,并籌集到近 450,000 美元資金。11 月時還推出了第一個完全數字化的展覽,名為“The Ethereal Aether”,在博物館的數字重建中展示了 38 個 NFT。[2021/12/11 7:31:45]

XLS-R 工作原理

涂子沛:在元宇宙里每個人都不會死:12月6日消息,由南方日報社主辦的“數據新價值”2021南方智享會主題沙龍在廣州舉行,大數據專家、科技作家涂子沛現場作《數據價值的歷史、未來和想象》的主題分享。涂子沛表示,\"盡管這個世界已經沒有新的大陸空間可以被發掘,但人類正在打造一個新的空間,即數據空間,甚至可以稱之為“元宇宙”。在元宇宙里每個人都不會死,你的孫子的孫子也可以跟你對話,因為你留下了數據,甚至可以請教問題。元宇宙就變得有生命,它是基于數據孿生之上的一個空間。\"(南方日報)[2021/12/6 12:52:53]

據介紹,XLS-R 在 wav2vec 2.0 訓練集上接受了超過 43 萬 6 千小時的公開語音錄音訓練,從而實現了對語音表達的自監督學習方法。這樣的訓練量已經達到去年發布的當時最強的模型 XLSR-53 的 10 倍。利用從會議記錄到有聲讀物的多種語音數據來源,XLS-R 的語言支持范圍擴展到 128 種,涵蓋的語種量達到前代模型的近 2.5 倍。

作為 Meta 打造的有史以來最大模型,XLS-R 中包含超過 20 億個參數,性能遠高于其他同類模型。Meta 表示,事實證明,更多參數能夠更充分地體現、數據集中的各類語種。此外,Meta 還發現,規模更大的模型在單一語言預訓練方面的性能也同樣優于其他較小模型。

Meta 在四種主要多語言語音識別測試中對 XLS-R 做出評估,發現它在 37 種語言上獲得了超越以往模型的效能。具體測試場景為:BABEL 中選取 5 種語言,CommonVoice 中選取 10 種語言,MLS 中選取 8 種語言,以及 VoxPopuli 上選取 14 種語言。

BABEL 上的單詞錯誤率基準測試結果。XLS-R 較前代模型實現了顯著改進。

此外,Meta 還評估了語音翻譯模型,即將錄音資料直接翻譯成另一種語言。為了打造一套能夠執行多種任務的模型, Meta 同時在 CoVoST-2 基準測試的數個不同翻譯方向上對 XLS-R 進行了微調,使其能夠在英語與多達 21 種語言之間實現內容互譯。

在使用 XLS-R 對英語以外的其他語言進行編碼時,獲得了顯著的效能提升,這也是多語言語音表達領域的一次重大突破。據 Meta 介紹,XLS-R 在低資源語言學習中實現了顯著改進,例如印尼語到英語的翻譯,其中 BLEU 準確率平均翻了一番。BLEU 指標的提升是指模型給出的自動翻譯結果與處理同一內容的人工翻譯結果間重合度更高,代表著模型在改進口語翻譯能力方面邁出了一大步。

以 BLEU 指標衡量的自動語音翻譯準確率,其中較高值表示 XLS-R 從高資源語言(例如法語、德語)、中資源語言(例如俄語、葡萄牙語)或低資源語言(例如泰米爾語、土耳其語)語音記錄翻譯至英語時的準確率。

Meta 認為,XLS-R 證明擴大跨語言預訓練規模可以進一步提高低資源語言的理解性能。它不僅提高了語音識別率,同時也將由外語到英語的語音翻譯準確率提高了一倍以上。

“XLS-R 是我們朝著以單一模型理解多種不同語言(語音)目標邁出的重要一步,也代表著我們在利用公共數據推進多語言預訓練方面做出的最大努力。我們堅信這是一條正確的探索方向,將讓機器學習應用更好地理解所有人類語音、并促進后續研究,大大降低語音技術在全球范圍內、特別是服務匱乏社群中的使用門檻。我們將不斷開發新方法,通過低監督學習拓展模型的語言理解能力、逐步使其覆蓋全球 7000 多種語言,實現算法的持續更新。”Meta 提到。

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

Tags:XLS元宇宙ETAMETPIXLS價格元宇宙app官方版下載網易云METAROID小狐貍metamask

芝麻開門交易所下載
V神再次批評跨鏈橋方案_Solana

1月20日,在一檔線上采訪節目上,Vitalik Buterin 再次強調跨鏈存在很大安全問題.他提到在單鏈中,您可以方便的恢復鏈,每個人都可以把資產恢復到初始狀態.

1900/1/1 0:00:00
中國互聯網巨頭的數字藏品布局_KTO

近日,明星周杰倫推出了旗下品牌的NFT(Phanta Bear),并頻頻為其造勢。可以說,NFT是2021年以來最火熱的領域之一.

1900/1/1 0:00:00
美聯儲白皮書:貨幣與支付 數字化轉型時代的美元_JONES

美聯儲會議紀要:無法即時提高債務上限或對金融體系造成嚴重破壞:金色財經報道,美聯儲5月會議紀要中表示,一些與會者指出,他們擔心聯邦債務法定上限可能無法及時提高,這可能會對金融體系造成嚴重破壞.

1900/1/1 0:00:00
ARK Investment 年度報告節選:比特幣、以太坊和 Web3 的未來十年_比特幣

由Cathie Wood 領導的 ARK Investment 今日發布《ARK''s Big Ideas 2022》,其中談到比特幣、DeFi、Web3的發展現狀和未來十年的發展趨勢.

1900/1/1 0:00:00
刷完1427頁專利文件 我們發現了Meta的元宇宙秘密_ETA

57項專利解密Meta元宇宙布局!如何盈利,小扎都幫你想好了。為了自己的元宇宙大計,社交巨頭Meta已經砸入了100億美元的資金!近期,無論是Meta的硬件設備,還是其元宇宙市場布局都不斷有新的.

1900/1/1 0:00:00
互聯網的下一個烏托邦會是Web3嗎?_WEB

“這是我能看到的保護自由世界的唯一方式,這是我們過去 70 年來享受的生活,也是我們讓它在未來 70 年繼續運行的唯一方法。”Web3,正在成為互聯網的新爆點.

1900/1/1 0:00:00
ads