支持 1100 种语言文本、语音互转,Meta 推出开源 AI 项目 MMS
Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。
Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。
Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。
相关推荐
-
速度恐怖!华为AI芯片获得鸡血优化:7倍性能于苹果M1处理器
尽管由于限制,华为拥有设计先进芯片的能力但没法制造出来,但是软硬件优化还是让华为的平台展示出了优秀的性能,日前OpenCV就实现了对华为AI平台晟腾的优化,速度提升很恐怖,差不多是…
2023年 4月 19日 -
OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%
前些天,OpenAI 的 CEO Sam Altman 在全球巡回演讲中,透漏了 OpenAI 近期发展路线,主要分两个阶段,2023 年的首要任务是推出更便宜、更快的 GPT-4…
2023年 6月 27日 -
GPU占据所有头条新闻,但人工智能的未来是实时数据
人工智能时代的到来令人兴奋,与互联网时代相比有些不同,在互联网时代,任何一家公司只要推出任何新技术或新产品,就会立即升值,而人工智能时代似乎更具选择性。 英伟达公司在5月22日这一…
2023年 6月 17日 -
深圳市发布推动人工智能高质量发展方案 努力创建全球人工智能先锋城市
5月31日,广东省深圳市人民政府印发《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》(以下简称《行动方案》),提出推动人工智能高质量发展和…
2023年 6月 13日 -
一文聊聊激光雷达与相机标定的时间戳同步问题
01 相机特性-曝光和读出 相机获取一帧图像分为曝光和读出两个阶段。相机使用的传感器不同,相机的曝光时间和读出时间的重叠关系也有所不同,分为交叠曝光和非交叠曝光两种。 叠曝光和非交…
2023年 5月 19日 -
用ChatGPT写PPT的另一种玩法
之前给大家介绍了GPT+mindshow的自动化ppt的操作流程,主要步骤:先用GPT生成PPT的内容并以markdown的语法形式输出,其次把这种格式的内容复制到mindshow…
2023年 6月 30日 -
承认百度仍在AI第一梯队没那么难
Image source: Generated by AI 2025 年,百度的“天”变了。 “前 Deepseek 时代”,圈里不少人还悲观地认为,中国没有模型能跟上 GPT 的…
2025年 3月 18日 -
GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升
近期,华为联和港中文发表论文《Progressive-Hint Prompting Improves Reasoning in Large Language Models》,提出 …
2023年 5月 24日 -
WPP 首席执行官:人工智能在广告中的应用是「机遇」而非威胁
站长之家(ChinaZ.com) 4月28日消息:WPP 首席执行官 Mark Read 表示,与一些评论家的担忧相反,人工智能是「优化创意业务的重大机遇」,而不是威胁。 他在接受…
2023年 4月 29日 -
百度智能云技术交流会:文心一言推理性能10倍提升、Turbo服务性能增长50倍
【Aigcmore.com】6月6日消息,百度智能云在成都的技术交流会上发布了令人振奋的消息。经过两个月的内测,百度智能云的文心一言推理性能已经取得了惊人的进展,实现了10倍的提升…
2023年 6月 7日