谷歌推出多模态VLOGGER AI:让静态肖像图动起来“说话”
谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
VLOGGER AI 是一种适用于虚拟肖像的多模态 Diffusion 模型,使用 MENTOR 数据库进行训练,该数据库中包含超过 80 万名人物肖像,以及累计超过 2200 小时的影片,从而让 VLOGGER 生成不同种族、不同年龄、不同穿着、不同姿势的肖像影片。
研究人员表示:“和此前的多模态相比,VLOGGER 的优势在于不需要对每个人进行训练,不依赖于人脸检测和裁剪,可以生成完整的图像(而不仅仅是人脸或嘴唇),并且考虑了广泛的场景(例如可见躯干或不同的主体身份),这些对于正确合成交流的人类至关重要”。
Google 将 VLOGGER 视为迈向“通用聊天机器人”的一步,之后 AI 就可以通过语音、手势和眼神交流以自然的方式与人类互动。
VLOGGER 的应用场景还包括可以用于报告、教育场域和旁白等,也可剪辑既有的影片,如果对影片中的表情不满意就能加以调整。
相关推荐
-
AI在劳动节淘汰7800打工人,永久的
“这不是演习,AI让人失业来真的了!” 就在这个劳动节假期,科技巨头IBM宣布: 暂缓可以被AI取代的岗位的招聘,约7800人将被永久淘汰。 尽管“我们要被AI取代”的唬人消息不是…
2023年 5月 6日 -
QPS提升近10倍!百度文心一言关键数据曝光
C114讯 4月23日消息(南山)近日,一份《飞桨针对文心一言定制优化例会》的会议纪要在网络上流传。该文件显示,百度文心一言自3月16日发布以来,已经悄然进行了四次版本迭代,本周(…
2023年 4月 24日 -
特斯拉官方推特新建与AI相关的推特附属账号
站长之家(ChinaZ.com)6月25日 消息:财联社报道称,特斯拉公司在推特上创建了一个名为“Tesla AI”的账号。据称,特斯拉正在研制自主机器人的基础模型。 该推特页面显…
2023年 6月 26日 -
元宇宙业务表现欠佳 Meta高管开始将目光投向AI
【Aigcmore.com】4月28日消息,meta在一季度业绩会议上聚焦于AI,高管们共提及了47次AI,成为焦点。与此同时,元宇宙则几乎缺席,仅有1处有关财务的问题提了一嘴元宇…
2023年 4月 29日 -
OpenAI CEO 威胁过度监管将退出欧盟,欧议员称立法者不该被“勒索”
5 月 26 日消息,几个月来,人工智能研究公司 OpenAI 首席执行官萨姆 奥特曼 (Sam Altman) 始终在呼呼世界各地的立法者起草管理这项技术的新规则。但在周三,他威…
2023年 5月 26日 -
重磅!OpenAI官方发布了GPT的最佳实践指示
官方发布了一个GPT提示词的最佳实践指南,主要包括六个方面的优化策略,而且每个策略给出了相应的案例 策略1:写清楚说明 GPT 对您想要什么的猜测越少,您获得它的可能性就越大。 比…
2023年 6月 16日 -
英国首相宣布成立AI工作组,投入1亿英镑推动人工智能发展
【Aigcmore.com】06月13日消息,英国首相里希·苏纳克(RishiSunak)在今天举行的2023年伦敦科技周上宣布成立了一支AI工作组,并计划投入1亿英镑,以确保人工…
2023年 6月 13日 -
网易《逆水寒》手游上线AI云捏脸 “玉言”模型很懂中文
站长之家(ChinaZ.com)6月8日 消息:网易的手游《逆水寒》日前宣布,其“云捏脸”功能正式上线,其中的AI“玉言”经过升级改善后,支持文字和图片捏脸。这意味着,并不仅仅是外…
2023年 6月 9日 -
美国多名作家联合上书,要求 AI 使用版权内容生成作品时需给予作者补偿
7 月 19 日消息,据 actionnetwork 报道,近 8000 名作家日前联名纽约著作人协会(Authors Guild),签署了一份公开信。他们要求 OpenAI、Al…
2023年 7月 31日 -
Java 程序员从零开始学 LangChain —模型组件
前面的文章了不起给大家介绍了 LangChain 的一些基本知识,没看过的小伙伴可以点击这里去看下,今天了不起给大家介绍一下 LangChain 的第一个很重要…
2023年 6月 8日
