支持 1100 种语言文本、语音互转,Meta 推出开源 AI 项目 MMS
Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。
Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。
Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。
相关推荐
-
沙特计划创建400亿美元基金投资人工智能
近日,有报道称,创建一支约400亿美元的基金,用于投资人工智能(AI)技术。若顺利成立,这支基金将使沙特成为全球最大的AI投资者。 最近几周,沙特公共投资基金(PIF)的代表已经与…
2024年 3月 20日 -
苹果工程师提议明年对Siri进行AI改进
站长之家(ChinaZ.com) 4月28日 消息:一位苹果软件工程师建议将ChatGPT等聊天机器人背后的机器学习技术应用到Siri语音助手中。然而,虽然Siri的开发一直以来都…
2023年 4月 30日 -
多模态 DNN 模型在药物相互作用预测任务中的应用
一、背景介绍 首先和大家分享下药物发现的相关背景。 1、背景介绍 药物发现领域近几年非常火热,特别是借助 AI 来辅助药厂的药物发现工作,包括药物研发。药物研发过程的周期非常长,通…
2023年 5月 20日 -
Meta 发布新型「类人」人工智能图像生成模型「I-JEPA」:填补图像缺失部分更准确
站长之家(ChinaZ.com) 6月14日消息:Meta 周二宣布,将向研究人员提供一种新的「类人」人工智能模型的组件,该模型可以比现有模型更准确地分析和填补未完成的图像。 图片…
2023年 6月 15日 -
人工智能计算机视觉第一人是谁?
人工智能计算机视觉是现代计算机科学中的一个重要分支,它主要研究如何让计算机“看懂”图像和视频,从而实现自动识别、分类、跟踪等功能。而在这个领域中,第一人指的是在该领域中做出重大贡献…
2023年 5月 23日 -
刷新20项代码任务SOTA,Salesforce提出新型基础LLM系列编码器-解码器Code T5+
大型语言模型 (LLMs) 最近在代码层面的一系列下游任务中表现十分出彩。通过对大量基于代码的数据 (如 GitHub 公共数据) 进行预训练,LLM 可以学习丰富的上下文表征,这…
2023年 7月 4日 -
重庆印发AI产业“新政”,3年内创建国家人工智能创新应用先导区
7月24日,《重庆市以场景驱动人工智能产业高质量发展行动计划(2023—2025年)》印发。 发展目标 到2025年,基本形成多维度、多层次、多元化的人工智能场景创新体…
2023年 7月 27日 -
OpenAI 承诺将很快推出 ChatGPT 安卓版
OpenAI 已在 iOS 的 App Store 上推出了一款新应用 ChatGPT,进入移动世界。另外 OpenAI 还承诺 ChatGPT 应用程序将“很快&rd…
2023年 5月 24日 -
消息称 Meta 考虑放宽开源 AI 大模型,允许开发者商用化赚钱
6 月 16 日消息,Meta CEO 马克 扎克伯格和他的副手们希望其他公司可以自由使用 Meta 正在开发的人工智能新软件,并能从中获利。对于那些越来越多地采用人工智能的开发者…
2023年 6月 17日 -
昇腾AI大模型训推一体化解决方案将在WAIC发布
7月6日,以“智联世界、生成未来”为主题的2023 世界人工智能大会(WAIC)将在上海拉开序幕。作为大会的重磅一环,当天由新一代人工智能产业技术创新战略联盟(AITISA)、…
2023年 7月 14日