支持 1100 种语言文本、语音互转,Meta 推出开源 AI 项目 MMS
Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。




Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。
Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。
相关推荐
-
马斯克:人形机器人Optimus将使用FSD系统 数量超过特斯拉汽车
5月17日消息,美国当地时间周二,特斯拉2023年年度股东大会在该公司位于美国得州奥斯汀的工厂召开。该公司首席执行官埃隆·马斯克(Elon Musk)现场回答了股东诸多提问,包括C…
2023年 5月 20日 -
GPT-4突破性进展:成功通过注册会计师考试
【Aigcmore.com】5月23日消息,人工智能的发展速度令人瞩目,同时其使用方式和应用场景也在不断扩大,给人们的生活带来了前所未有的变化。 据悉,人工智能公司OpenAI于今…
2023年 5月 24日 -
OpenAI首席执行官坦言:公司结构奇特,无意上市
【Aigcmore.com】6月7日消息,OpenAI首席执行官SamAltman近日在阿布扎比的一次会议上表示,该公司目前没有计划让OpenAI上市,原因是公司结构非常“奇怪”。…
2023年 6月 7日 -
GPT大语言模型Alpaca-lora本地化部署实践
模型介绍 Alpaca模型是斯坦福大学研发的LLM(Large Language Model,大语言)开源模型,是一个在52K指令上从LLaMA 7B(Meta公司开源的7B)模型…
2023年 6月 7日 -
Mosaic浏览器创始人马克安德森:人工智能将成为孩子们的终身“伙伴”
站长之家(ChinaZ.com) 7月24日 消息:据businessinsider消息,亿万富翁科技投资者、Mosaic浏览器创始人之一的马克·安德森(Marc Andreess…
2023年 7月 25日 -
AR/VR如何推动自动化和机器人制造业发展
AR/VR技术如何为机器人提供动力以及它们如何使工厂和工业受益,本文对此进行探讨。 由于新冠疫情持续蔓延行,以及供应链中断、劳动力短缺和通货膨胀挑战等衍生问题,导致2022年商业环…
2024年 3月 20日 -
工程师利用GPT-4,实现对 AI 可穿戴设备进行编程
站长之家(ChinaZ.com) 5月19日 消息:Project Ring 是一款腕戴式小型计算机,它使用 AI 实时分析环境,并进行文本描述,再通过 ChatGPT 对环境进行…
2023年 5月 22日 -
MosaicML发布300亿参数的MPT-30B语言模型,训练成本大幅降低
【Aigcmore.com】6月25日消息,AI创业公司MosaicML近日发布了一款名为MPT-30B的语言模型,该模型拥有300亿参数,训练成本远低于其他竞争对手,有望推动AI…
2023年 6月 26日 -
PS直接革自己命!AI功能迎来史诗级加强,网友:改变游戏规则
好家伙,Adobe这回是下定决心要用AI革自己的命了! 率先动刀的,就是大家伙儿最为熟悉的修图软件PS(Photoshop)。 语言有些苍白,咱们直接上效果—— 想给马路增设条中央…
2023年 5月 30日 -
Gartner调查发现:CEO将AI视为影响行业的顶级颠覆性技术
Gartner杰出副总裁分析师Mark Raskino表示:“生成式AI将对业务和运营模式产生深远的影响。然而,害怕错过是技术市场一个强大的驱动力。AI正达到临界点,那些尚未投资的…
2023年 5月 25日
