微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。
该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E
可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

IT之家了解到,康奈尔大学的一篇论文使用 VALL-E 合成了几种声音,大家可以在 GitHub 上聆听这些 AI 合成的音频。
研究人员指出,在许多情况下,Vall-E
的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模仿某些声音,尤其是带有口音的声音。
像其他 AI 新技术一样,VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E
的道德声明,但未来的使用用途方面没有明确说明。
目前,微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库,但目前只包含一个描述文件。
相关推荐
-
AIGC算力全景与趋势报告发布!一文解读AIGC算力构成、产业链条,还有五新趋势判断
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 AI算力从没有任何一个时刻,比现在更受瞩目。 大模型趋势发生以来,大模型的数量、规模,在短短几月内突增…
2023年 7月 31日 -
AI哨所|“解码”人类大脑:科学家开发出无创AI系统
凤凰网科技讯 《AI哨所》北京时间5月2日消息,根据周一发表在《自然神经科学》杂志上的一篇经过同行评议的研究,科学家已经开发出了一种无创人工智能(AI)系统,专注于将人的大脑活动转…
2023年 5月 3日 -
AI革命中的22个隐藏职业(上)
随着AI技术的不断发展,它正在创造大量以前闻所未闻的就业机会和角色。虽然数据科学家、机器学习工程师和AI研究人员等传统的AI角色得到了广泛认可,但在推动科技行业变革方面,还有一些鲜…
2023年 5月 2日 -
微软与OpenAI合作开发ChatGPT语言模型 可远程控制机器人
【Aigcmore.com】3月16日消息,微软和OpenAI联手研发的ChatGPT语言模型近日在远程控制机器人方面取得了重大突破,这意味着未来用户将无需学习编程语言即可与机器人…
2023年 4月 22日 -
基于GPT-4的 IDEA 神仙插件,无需魔法,亲测好用!
近日,Intellij IDEA的插件商店,悄然上线了一个新的插件——Bito,据说可以基于GPT-4和ChatGPT来写代码。短短几天,已经有50多K的下载量了。 我帮大家试用了…
2023年 5月 4日 -
微软发布Windows Copilot和通用AI插件平台:打造智能化Windows生态系统
【Aigcmore.com】5月24日消息,微软在今天的Build年度开发者大会上发布了一系列重大更新。微软首席执行官纳德拉在会上重点介绍了五个新产品,并宣布了一项通用AI插件平台…
2023年 5月 24日 -
Meta提出新模型MegaByte 可增强AI生成
站长之家(ChinaZ.com)6月6日 消息:来自Facebook母公司Meta的人工智能研究人员提出了一种新颖的方法MegaByte,以加快自然语言处理等用途的内容生成。 据介…
2023年 6月 7日 -
网络安全公司警告:超过一半常规密码可在1分钟内被破解
【Aigcmore.com】4月8日消息,网络安全公司 Home Security Heroes 近日发布了一份报告,称使用了名为 PassGAN 的新型AI 工具,能够在不到1分…
2023年 4月 25日 -
GPT-4最大竞争对手Claude 2震撼发布!一次10万token免费用,代码、数学、推理史诗级提升
ChatGPT的最大竞争对手Anthropic再次上新! 就在刚刚,Anthropic正式发布了全新的Claude 2,并推出了更加便捷的网页测试版(仅限美国和英国的IP)。 相较…
2023年 7月 25日 -
人工智能如何在2023年为组织赋能
自从 2022 年底 ChatGPT 发布以来,互联网上一直充斥着各种或悲观、或乐观的情绪。不管你是喜欢还是讨厌,人工智能都会进入你的开发团…
2023年 5月 25日
