myshell开源开放式voice:即时的声音克隆AI库,该库短…
Myshell具有开源的OpenVoice,这是一个语音封闭的AI库,仅从一个简短的音频剪辑中迅速产生听起来像人类的声音。 OpenVoice于2021年12月推出,旨在为非技术用户定制视频,音频,游戏和其他创意项目的声音。它可以使用Python代码集成到其他软件中。
OpenVoice的创建者认为,它有可能彻底改变人们与数字内容互动的方式。该公司在2月14日的博客文章中说:“文本到语音是使无法阅读的人可以访问文字的深刻突破。” “如果过去是关于阅读的,未来将是关于聆听的。OpenVoice将使创作者能够将生活融入到以前从未像现在这样的故事和数字角色。”
AI库具有多种语音模型,用户可以从中选择,并支持13种语言和方言,包括英语(多个口音),西班牙语,中文,法语,德语,意大利语,日语,韩语,印地语,俄罗斯和葡萄牙语(两个方言)。
OpenVoice可以生成三种不同类型的语音音频:
*** tts(文本到语音):**将书面文本转换为口语。
*** ss(语音综合):**综合语音说外语。
*** VC(语音克隆):**从用户提供的简短音频剪辑中克隆语音。
OpenVoice的语音克隆通过将原始音频波形转换为MEL光谱图,然后将其转换为嵌入。
要使用OpenVoice,请通过PIP安装库或从Github克隆存储库。该库还包括一个Python API,具有用于克隆和综合语音的功能,更改语言率和音调以及使用内置声音效果库添加背景噪声。
OpenVoice仍在开发中,Myshell鼓励开发人员在Github上提交请求或问题,并加入其Discord Server进行讨论。该公司致力于通过添加更多语音模型,语言和导出格式来维护图书馆并开发新功能。
Myshell是一家专门从事音频和语音人工智能的软件公司。它为音频恢复和增强,语音克隆,文本到语音等提供服务。