微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。
该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E
可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

IT之家了解到,康奈尔大学的一篇论文使用 VALL-E 合成了几种声音,大家可以在 GitHub 上聆听这些 AI 合成的音频。
研究人员指出,在许多情况下,Vall-E
的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模仿某些声音,尤其是带有口音的声音。
像其他 AI 新技术一样,VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E
的道德声明,但未来的使用用途方面没有明确说明。
目前,微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库,但目前只包含一个描述文件。
相关推荐
-
谷歌发布全新机器人模型RT-2,赋予智能垃圾分类能力
【Aigcmore.com】7月30日消息,谷歌公司近日发布了一款名为Robotics Transformer2(RT-2)的全新机器人模型。这款机器人采用了最新版本的大语言模型,…
2023年 7月 31日 -
多款绝杀!苹果年度大招来袭!
51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan) 编译丨千山 作为机圈巨头,苹果的一举一动都备受瞩目。而6月,则是苹果的主场! 今年以来,在ChatG…
2023年 5月 26日 -
Stack Overflow CEO:正开发旗下AI工具,人工智能将导致开发人员爆炸式增长
Stack Overflow 是一个程序员问答平台,该平台的 CEO Prashanth Chandrasekar 在日前接受外媒 VebtureBeat 采访时,表示该公司正投入…
2023年 7月 14日 -
谷歌工程师警告说大型科技公司可能会在人工智能竞赛中输给开源技术
站长之家(ChinaZ.com) 5月6日消息:谷歌公司一位工程师警告称,该公司没有赢得人工智能竞赛的能力,可能会输给普遍可得的开源人工智能技术。 这一份谷歌工程师的文件泄露到网上…
2023年 5月 7日 -
联合NeRF与特征网格,实现超大规模城市渲染,高效且逼真
纯基于 MLP 的神经辐射场(NeRF)由于模型容量有限,在大规模场景模糊渲染中往往存在欠拟合现象。最近有研究者提出对场景进行地理划分、并采用多个子 NeRF,分别对每个区域进行建…
2023年 5月 8日 -
英伟达收购人工智能初创公司 OmniML 押注边缘 AI
站长之家(ChinaZ.com) 7月5日消息:英伟达在今年 2 月悄悄收购了人工智能初创公司 OmniML。OmniML 的技术可以将机器学习模型小型化,使其能够在边缘设备上运行…
2023年 7月 5日 -
13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 只需一段提示词,让GPT-4变成你的“梦中情导”,在GitHub上揽星上万。 学习的内容、难度可任意指…
2023年 6月 17日 -
企业在2023年应该使用的35种生成式人工智能工具
2022年是生成式人工智能发展的一个重要转折点,在这一年推出了更强大、更可访问、更适用的ChatGPT等大型语言模型。虽然OpenAI公司推出的ChatGPT只是一个开始,但位于前…
2023年 5月 1日 -
科大讯飞AI学习机和学而思学习机,选购指南新鲜出炉
买智能学习机,到底要选科大讯飞AI学习机T20 Pro还是学而思学习机Xpad?对于众多初次接触这一品类的家长朋友来讲确实是一个比较头大的问题。考虑到暑假即将到来,在这里也为众多家…
2023年 6月 3日 -
“AI教父”杰弗里·辛顿告别谷歌:称自己为发展人工智能而后悔
快科技5月2日消息,近日,研究AI技术将近半个世纪,被称为AI教父”的杰弗里辛顿宣布,已经从谷歌离职。 在离职的同时,杰弗里辛顿宣布,自己正式加入A批评人士的行列。 他认为,这些公…
2023年 5月 3日
