Tag Archives: 文字轉語音

VALL-E 2 成為首個達到人類水準的 TTS，基於風險微軟不打算公開發表

作者 Evan|發布日期 2024 年 07 月 15 日 8:00 |

分類 AI 人工智慧 , Microsoft

去年初微軟推出 VALL-E 文字轉語音（TTS）生成器時，便展現了只要聽取說話者 3 秒鐘的聲音、便能以原說話說者一模一樣的聲音說出任何講話內容的能力。如今微軟推出 VALL-E 2 生成器，能夠更進一步生成和真人說話時一樣準確、自然又流暢的語音。由於生成的語音太過逼真，微軟擔心會有被惡意濫用的可能風險，所以決定不對外公開。繼續閱讀..

新創 ElevenLab 推出 Multilingual v2 模型，能用你的聲音說 30 種語言

作者 Evan|發布日期 2023 年 08 月 30 日 8:30 |

分類 AI 人工智慧 , 網路 , 資訊安全

AI 語音複製（Voice Clone）是一個發展迅速但卻充滿爭議的新興 AI 技術，它可以帶來正面的個性化體驗及商業效益，同時也會引發像是深度造假（Deepfake）等詐騙攻擊的安全疑慮。成立於美國舊金山的新創公司 ElevenLabs 22 日宣布推出可以流利模仿約莫 30 種不同語言聲音的全新多語言語音生成模型，這對多語言有聲書的製作是一大福音，但對於網路詐騙犯而言更是如虎添翼的攻擊利器。繼續閱讀..

只需 3 秒音訊，微軟新 AI 模型就能模仿某人聲音念稿

作者 Evan|發布日期 2023 年 01 月 12 日 7:45 |

分類 AI 人工智慧 , Microsoft , 會員專區

很多人見識過有心人用 Deepfake 技術合成超逼真假影片的能耐，如今 AI 深度學習技術又進一步模擬特定人物聲音展現強大威力。5 日微軟研究人員宣布推出 VALL-E 全新文字轉語音（Text-to-Speech）AI 人工智慧模型，只要餵給它某人 3 秒鐘音訊，模型就能模擬出聲音、語調及情緒講出任何話。繼續閱讀..

微軟有限開放自家「自訂神經語音」技術，AT&T、華納及 Duolingo 一試成主顧

作者 Evan|發布日期 2021 年 02 月 06 日 0:00 |

分類 AI 人工智慧 , Microsoft , 會員專區

微軟（Microsoft）已對外有限開放名為「自訂神經語音」（Custom Neural Voice）的文字轉語音（Text-to-Speech, TTS）AI 人工智慧技術，該技術允許開發人員創建自定義合成語音。該技術是名為 Speech 之 Azure AI 服務的一部分。企業可以將該技術用於諸如語音驅動的智慧助理和裝置、聊天機器人、線上學習，乃至於閱讀有聲讀物或新聞之類的事情。企業必須先向微軟申請存取權限並獲得批准，然後才能使用 Custom Neural Voice 技術。繼續閱讀..

微軟研發人工智慧語音技術，只需少量訓練即可運作

作者 Unwire Pro|發布日期 2019 年 05 月 29 日 8:45 |

分類 AI 人工智慧 , Microsoft

目前文字轉語音的技術已相當普及，由於應用範圍廣泛，不少科技公司努力開發新技術，帶來更自然流暢的效果。最近微軟就開發出只需少量訓練就可運作的人工智慧語音技術。繼續閱讀..

登入裝置已達上限