支持 1100 种语言文本、语音互转,Meta 推出开源 AI 项目 MMS
Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。




Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。
Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。
相关推荐
-
四年了,基础开源模型没有真正进步,指令调优大模型评估惊人发现
指令调优大语言模型的出现标志着 NLP 领域迎来一个重要转折点。从 ChatGPT 这类会话助手到解决复杂问题,这些指令调优大模型的变革能力在应用中瞩目。此类模型还包括 GPT-4…
2023年 6月 26日 -
比亚迪将搭载英伟达DRIVE Hyperion平台 实现车辆智能驾驶和智能泊车
【Aigcmore.com】3月22日消息,英伟达在GTC2023上宣布,其已与全球最大电动车生产企业比亚迪达成合作,将在下一代王朝系列和海洋系列的多款车型中使用英伟达DRIVEO…
2023年 4月 22日 -
1499 元,百度旗下小度智能手机开启预售,内置 AI 学习大模型
5 月 22 日,小度青禾学习手机 V20 上架预售,浅蓝色和粉色两款,只有 6 128G 一个配置,预售预估到手价 1499 元。 小度青禾青少年学习手机内置专为青少年定制系统,…
2023年 5月 23日 -
金山官方发布中文官方版GPT——WPS AI
站长之家(ChinaZ.com)4月19日 消息:金山办公室也发布了中文办公室官方版GPT——WPS AI,将搭载到金山办公新一代在线内容协作编辑产品——轻文档上,而在未来,WPS…
2023年 4月 21日 -
耗时一年,AIGC绘制首份百米长卷《新西湖繁胜全景图》面世
你一定知道《清明上河图》,那是中国最知名的传世名画,描述了北宋都城河南开封的繁盛图景。 但你知道《西湖清趣图》吗?宋室南渡后,流传下一幅19米长卷《西湖清趣图》,画面始于钱塘门,途…
2023年 6月 3日 -
会呼吸还会出汗!美国科学家推出首个流汗机器人,全身35个人工出汗的合成毛孔
大数据文摘出品 作者:Caleb 在美国亚利桑那州立大学坦佩校区最东北角,一扇带小玻璃窗的4英寸厚金属门后面,站着一个机器人。 这个机器人名叫ANDI,是世界上第一个能进行呼吸和排…
2023年 6月 17日 -
AI前哨|世界最牛计算机课程开始使用AI:哈佛大学CS50接受改造
凤凰网科技讯 《AI前哨》北京时间6月3日消息,生成式人工智能(AI)的大势似乎难以阻挡。现在,就连世界上最受欢迎的在线计算机学习课程、哈佛大学的计算机科学导论(CS50)都在接受…
2023年 6月 5日 -
效果可达 OpanAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布
6 月 8 日消息,国产多模态大语言模型 TigerBot 近日正式发布,包含 70 亿参数和 1800 亿参数两个版本,目前已经在 GitHub 开源。 ▲ …
2023年 6月 14日 -
AI专属社交平台爆火,全体人类被禁言只能围观
声明:本文来自于微信公众号量子位(ID:QbitAI),作者:衡宇,授权站长之家转载发布。 玩腻了推特和微博?有个新的社交平台火爆外网! 成千上万的用户连夜涌入,每日积极发帖,活跃…
2023年 5月 3日 -
全球顶尖风投公司投资OpenAI 人工智能前景可期
【Aigcmore.com】4月29日消息,OpenAI 完成了一轮 103 亿美元的融资,估值达到 270 亿-290亿美元。本轮融资的风投公司包括红杉资本、加州Andreess…
2023年 4月 30日
