Tag Archives: 文字轉語音

VALL-E 2 成為首個達到人類水準的 TTS,基於風險微軟不打算公開發表

作者 |發布日期 2024 年 07 月 15 日 8:00 | 分類 AI 人工智慧 , Microsoft

去年初微軟推出 VALL-E 文字轉語音(TTS)生成器時,便展現了只要聽取說話者 3 秒鐘的聲音、便能以原說話說者一模一樣的聲音說出任何講話內容的能力。如今微軟推出 VALL-E 2 生成器,能夠更進一步生成和真人說話時一樣準確、自然又流暢的語音。由於生成的語音太過逼真,微軟擔心會有被惡意濫用的可能風險,所以決定不對外公開。 繼續閱讀..

新創 ElevenLab 推出 Multilingual v2 模型,能用你的聲音說 30 種語言

作者 |發布日期 2023 年 08 月 30 日 8:30 | 分類 AI 人工智慧 , 網路 , 資訊安全

AI 語音複製(Voice Clone)是一個發展迅速但卻充滿爭議的新興 AI 技術,它可以帶來正面的個性化體驗及商業效益,同時也會引發像是深度造假(Deepfake)等詐騙攻擊的安全疑慮。成立於美國舊金山的新創公司 ElevenLabs 22 日宣布推出可以流利模仿約莫 30 種不同語言聲音的全新多語言語音生成模型,這對多語言有聲書的製作是一大福音,但對於網路詐騙犯而言更是如虎添翼的攻擊利器。 繼續閱讀..

只需 3 秒音訊,微軟新 AI 模型就能模仿某人聲音念稿

作者 |發布日期 2023 年 01 月 12 日 7:45 | 分類 AI 人工智慧 , Microsoft , 會員專區

很多人見識過有心人用 Deepfake 技術合成超逼真假影片的能耐,如今 AI 深度學習技術又進一步模擬特定人物聲音展現強大威力。5 日微軟研究人員宣布推出 VALL-E 全新文字轉語音(Text-to-Speech)AI 人工智慧模型,只要餵給它某人 3 秒鐘音訊,模型就能模擬出聲音、語調及情緒講出任何話。 繼續閱讀..

微軟有限開放自家「自訂神經語音」技術,AT&T、華納及 Duolingo 一試成主顧

作者 |發布日期 2021 年 02 月 06 日 0:00 | 分類 AI 人工智慧 , Microsoft , 會員專區

微軟(Microsoft)已對外有限開放名為「自訂神經語音」(Custom Neural Voice)的文字轉語音(Text-to-Speech, TTS)AI 人工智慧技術,該技術允許開發人員創建自定義合成語音。該技術是名為 Speech 之 Azure AI 服務的一部分。企業可以將該技術用於諸如語音驅動的智慧助理和裝置、聊天機器人、線上學習,乃至於閱讀有聲讀物或新聞之類的事情。企業必須先向微軟申請存取權限並獲得批准,然後才能使用 Custom Neural Voice 技術。  繼續閱讀..