微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。
该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E
可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

IT之家了解到,康奈尔大学的一篇论文使用 VALL-E 合成了几种声音,大家可以在 GitHub 上聆听这些 AI 合成的音频。
研究人员指出,在许多情况下,Vall-E
的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模仿某些声音,尤其是带有口音的声音。
像其他 AI 新技术一样,VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E
的道德声明,但未来的使用用途方面没有明确说明。
目前,微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库,但目前只包含一个描述文件。
相关推荐
-
直击RSAC现场:人工智能工具成为今年最热门话题!
今年在旧金山举行的RSAC大会上有一个热门话题:人工智能工具。生成式人工智能在网络安全工具中的潜力引发了网络安全专业人士的兴趣。但是人们对人工智能在网络安全中的实际应用,以及用于建…
2023年 5月 6日 -
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力
随着大语言模型(Large Language Models)的爆火,例如 ChatGPT,GPT-4,PaLM,LLaMA 等,如何让大语言模型更好的应对有很长的上下文信息(超出其…
2023年 7月 3日 -
生成式人工智能服务管理办法公开征求意见
【Aigcmore.com】4月11日消息,为促进生成式人工智能技术健康发展和规范应用,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,现向社会公开征求意见…
2023年 4月 25日 -
三星电子新政策:禁止员工使用ChatGPT等AI系统
【Aigcmore.com】5月2日消息,据悉,三星电子公司因担心安全问题,暂停员工使用ChatGPT、GoogleBERT和Bing等生成式人工智能工具。该公司认为,这些人工智能…
2023年 5月 3日 -
中国工程院院士郑纬民:AI算力基础设施设计需要遵循三大平衡原则
C114讯 4月24日消息 在4月21日举办的首届超互联新算力产业暨第三届中国IDC行业DISCOVERY大会上,中国工程院院士郑纬民表示,AI算力是算力基础设施的重要组成部分,是…
2023年 4月 25日 -
机器视觉是实现流畅的打印与应用工作流程的关键所在
斑马技术大中华区技术总监 程宁 对于制造商、仓储经营者或其他需要遵守多项行业、政府和客户要求的下游供应链企业而言,信任不能替代验证,这是防患于未然的优选方式。因此,企业…
2023年 5月 3日 -
美国编剧工会宣布罢工 好莱坞电影电视陷入危机
【Aigcmore.com】5月4日消息,美国编剧工会宣布罢工,引发了好莱坞电视和电影业界的震动。这是自2007年以来15年来发生的首次罢工事件,导致加州陷入衰退,并造成约21亿美…
2023年 5月 5日 -
拜登政府投资1.4亿美元启动7个新AI研究机构
【Aigcmore.com】5月5日消息,据知情人士透露,美国总统拜登正在试用ChatGPT,这是一种人工智能技术。此举表明美国政府已经开始关注AI的风险和如何加以限制。 据Aig…
2023年 5月 6日 -
Essential AI由谷歌前研究人员创立 专注于构建大型语言模型软件
【Aigcmore.com】5月5日消息,据路透社报道,谷歌前研究人员Ashish Vaswani和NikiParmar已经为他们的新创公司Essential AI筹集了800万美…
2023年 5月 6日 -
世界上个人工智能DJ亮相波特兰广播电台
站长之家(ChinaZ.com)7月3日 消息:据外媒报道,世界首个由人工智能驱动的电台DJ于六月在波特兰的一家电台亮相。 据了解,波特兰一家名为Live95.5的电台让模仿了该电…
2023年 7月 4日