微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。
该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E
可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

IT之家了解到,康奈尔大学的一篇论文使用 VALL-E 合成了几种声音,大家可以在 GitHub 上聆听这些 AI 合成的音频。
研究人员指出,在许多情况下,Vall-E
的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模仿某些声音,尤其是带有口音的声音。
像其他 AI 新技术一样,VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E
的道德声明,但未来的使用用途方面没有明确说明。
目前,微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库,但目前只包含一个描述文件。
相关推荐
-
GPT-4模型超越90%人类表现 AI技术崛起何去何从?
【Aigcmore.com】3月15日消息,近日,有消息称OpenAPI发布了一款名为GPT-4的新型语言模型,相比现在使用的GPT-3模型更为强大。该模型支持图形,并在考试中表现…
2023年 4月 22日 -
信息系统教授呼吁不要用人工智能取代新闻编辑
站长之家(ChinaZ.com)6月27日 消息:据报道,德国最畅销的报纸《图片报》正在采用人工智能(AI)来取代某些编辑角色,以削减成本。 6月19日,一封泄露的内部电子邮件显示…
2023年 7月 3日 -
Spotify删除使用人工智能生成的歌曲 回应流量欺诈问题
【Aigcmore.com】5月10日消息,据报道,由于存在“刷流量”嫌疑,Spotify删除了数万首由人工智能创业公司Boomy生成的歌曲。这些歌曲中使用机器人冒充人类听众,虚增…
2023年 5月 10日 -
Altman、Hinton 中国首秀:GPT 终将过时,AI 是当今世界最迫切的问题!
声明:本文来自于微信公众号CSDN(ID:CSDNnews)),作者:CSDN,授权站长之家转载发布。 OpenAI、DeepMind 和 Stability AI 的科学家科普 …
2023年 6月 14日 -
高考志愿填报相关 App 会员费不菲,AI 填报不靠谱
6 月 26 日消息,高考志愿填报是每年高考后的重要环节,也是考生和家长最关心的话题之一。随着互联网技术的发展,越来越多的平台推出了基于人工智能和大数据的志愿填报咨询服务,声称可以…
2023年 7月 6日 -
北京晨学教育科技有限公司应用大数据及AI技术,为学员规划出更优的学习计划和路径
如今,职业教育迎来了数字化转型和高质量发展阶段。面对职业教育的转型发展,职业教育老兵北京晨学教育科技有限公司表示,目前北京晨学教育科技有限公司正在不断加大科研力度,致力于更充分地将…
2023年 4月 17日 -
万达集团打造智能导游"小丹",开启旅游服务新篇章
【Aigcmore.com】6月5日消息,万达集团今日宣布推出了中国首个旅游景区AI导游“小丹”。这一数字化智能导游是由万达集团企业文化中心专门为贵州丹寨万达小镇开发的。这标志着旅…
2023年 6月 6日 -
亚马逊云科技与携程集团成立“联合创新实验室”
【Aigcmore.com】4月26日消息,亚马逊云科技和携程集团近日宣布成立“联合创新实验室”,旨在加速数字化、智能化创新以提供更好的旅行服务。据介绍,携程集团的旅游业务遍布全球…
2023年 4月 28日 -
快来体验PandasAI数据分析,将Pandas和ChatGPT结合起来
Pandas是一个开源工具包,它为数据科学家和分析师提供了使用Python数据操作和分析能力。Pandas库在机器学习和深度学习的预处理阶段非常流行。但现在有了AI的加持,你可以用…
2023年 5月 26日 -
OpenAI创始人:人工智能开源是不理智的行为
【Aigcmore.com】3月17日消息,人工智能公司OpenAI最近表示,他们不会开源他们最新的人工智能模型GPT-4,因为人工智能开源是不明智的行为。OpenAI创始人Ily…
2023年 4月 22日