微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。
该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E
可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

IT之家了解到,康奈尔大学的一篇论文使用 VALL-E 合成了几种声音,大家可以在 GitHub 上聆听这些 AI 合成的音频。
研究人员指出,在许多情况下,Vall-E
的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模仿某些声音,尤其是带有口音的声音。
像其他 AI 新技术一样,VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E
的道德声明,但未来的使用用途方面没有明确说明。
目前,微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库,但目前只包含一个描述文件。
相关推荐
-
自己动手使用AI技术实现数字内容生产
背景 今年以来以chatgpt为代表的大模型的惊艳表现彻底点燃了AICG这个领域的。各类gpt,各种AI作图产品如雨后春笋般出现。每个成功产品的背后都是一个个精妙的算法,本篇文章给…
2023年 6月 27日 -
五项将彻底改变世界的新兴技术
在快速发展的数字环境中,技术不断重塑我们的生活,并突破我们认为可能的界限。下一波创新浪潮已经来临,多项新兴技术有望改变各个行业并重新定义我们的生活、工作和互动方式。在本文中,我们将…
2023年 7月 27日 -
马斯克呼吁暂停GPT-4技术开发 比尔·盖茨表态反对
【Aigcmore.com】4月6日消息,近日全球范围内掀起了一股AI潮流,由ChatGPT引发的AI技术尤其备受关注。然而,对于最新发布的GPT-4技术,市场反应不一。 据了解,…
2023年 4月 25日 -
淘金先富卖铲人!OpenAI推企业版ChatGPT,英伟达造AI安全卫士!
作者 | 云昭 51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan) 借用陆奇在4月23日深圳的分享来说,GPT现在已经进入了淘金时代。虽然全球涌现出成千…
2023年 5月 9日 -
如何通过人工智能(AI)和机器学习应对零售劳动力和执行方面的挑战
斑马技术大中华区技术总监 程宁 面对不断增长的需求,零售团队人员数量及具体运营执行是否能及时匹配,正成为零售商们不得不面临的挑战。零售团队人员的短缺将使商店难以正常运营。当商店经理…
2023年 6月 8日 -
AI竟能生成芯片了!GPT-4仅用19轮对话造出130nm芯片,攻克芯片设计行业巨大挑战HDL
GPT-4,已经可以帮人类造芯片了! 只用简单的英语对话,纽约大学Tandon工程学院的研究人员就通过GPT-4造出了一个芯片。 具体来说,GPT-4通过来回对话,就生成了可行的V…
2023年 7月 3日 -
一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型
一个「终极丐版」的「图灵测试」,让所有大语言模型都难住了。 人类却可以毫不费力地通过测试。 大写字母测试 研究人员用了一个非常简单的办法。 把真正的问题混到一些杂乱无章的大写字母写…
2023年 6月 8日 -
人工智能和大数据在能源效率中的作用
人口密度的增加和技术的发展导致了新的习惯和构想生活的方式。与此同时,由于能源在我国社会发展和经济增长中的高度参与和相关性,能源需求也出现了平行增长。能源对生产力、健康、教育、供应、…
2023年 5月 12日 -
关于OpenAI Gym的定义和使用
译者 | 布加迪 审校 | 重楼 如果您无法从头开始构建一个机器学习模型,或者缺少相应的基础设施,仅仅将应用程序连接到工作模型就可以填补这个缺口。 人工智能可供所有人以某种方式来使…
2023年 5月 16日 -
Meta 首席技术官称今年将推出创造广告的生成式人工智能
站长之家(ChinaZ.com) 4月6日消息:Facebook 的所有者 Meta 打算在 12 月前将其专有的生成式人工智能商业化,与谷歌一起为该技术寻找实际应用场景。该公司于…
2023年 4月 15日
