支持 1100 种语言文本、语音互转,Meta 推出开源 AI 项目 MMS
Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。
Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。
Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。
相关推荐
-
WPS AI二次亮相 展示类微软Copilot能力
5 月 16 日,金山办公旗下生成式人工智能应用 WPS AI 正式对外展示了类微软Copilot的能力,继 4 月 18 日搭载在轻文档落地后,WPS AI 加速进化,接入了文字…
2023年 5月 17日 -
百度推出文心一言 加速AI技术应用和创新!
【Aigcmore.com】3月16日消息,近日,百度在北京总部召开新闻发布会,宣布发布新一代大语言模型——文心一言。这是继2019年发布文心大模型后的新版本,每年发布一个新版本,…
2023年 4月 22日 -
OpenAI首席执行官坦言:公司结构奇特,无意上市
【Aigcmore.com】6月7日消息,OpenAI首席执行官SamAltman近日在阿布扎比的一次会议上表示,该公司目前没有计划让OpenAI上市,原因是公司结构非常“奇怪”。…
2023年 6月 7日 -
谷歌警告员工使用聊天机器人时要小心,包括自家的 Bard
6 月 19 日消息,据路透社报道,四名知情人士称,谷歌母公司 Alphabet 在向全球推广其聊天机器人 Bard 的同时,也提醒员工在使用聊天机器人时要小心,包括其…
2023年 7月 1日 -
斯坦福大学李飞飞团队新作:孪生掩码自编码器SiamMAE,刷榜视觉自监督方法
在计算机视觉领域,想要建立图像和场景(scene)之间之间的对应关系是一项比较困难的任务,尤其是在存在遮挡、视角改变或是物体外观发生变化的情况下。 最近,斯坦福大学李飞飞团队对MA…
2023年 6月 7日 -
Adobe Lightroom 添加 AI 功能:用于降噪、蒙版和人像
站长之家(ChinaZ.com) 4月19日消息:Adobe 最新版本的 Lightroom 功能旨在让没有专业经验的人更容易进行照片编辑——无论任务有多具体。该公司已经扩展了「选…
2023年 4月 21日 -
微软和西门子将在工业工作流程中部署生成式AI
站长之家(ChinaZ.com)4月14日 消息:西门子正在与微软合作,使用生成式人工智能工具来改进其工业工作流程中。 微软的生成人工智能工具库包括人工智能聊天和代码生成,将用来加…
2023年 4月 16日 -
AMD新驱动打鸡血:AI性能飙升2倍
快科技6月2日消息,AMD放出了最新的AMD Software Adrenalin 23.5.2版显卡驱动,重点更新只有两条,一个是正式支持《暗黑破坏神4》,另一个就是优化了AI性…
2023年 6月 3日 -
前美团高级副总裁陈亮将于AI大模型领域创业
凤凰网科技讯 4月14日消息,前美团高级副总裁、最高决策机构S-team成员陈亮于近期投身AI大模型相关创业,目前已与少量投资机构接触。知情人士表示,目前陈亮尚未组建完整的技术团队…
2023年 4月 16日 -
会呼吸还会出汗!美国科学家推出首个流汗机器人,全身35个人工出汗的合成毛孔
大数据文摘出品 作者:Caleb 在美国亚利桑那州立大学坦佩校区最东北角,一扇带小玻璃窗的4英寸厚金属门后面,站着一个机器人。 这个机器人名叫ANDI,是世界上第一个能进行呼吸和排…
2023年 6月 17日