商汤与上海AI实验室等发布“书生·浦语”大模型
站长之家(ChinaZ.com)6月7日 消息:近日,商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。“书生·浦语”具有1040亿参数,是在包含1.6万亿token的多语种高质量数据集上训练而成。
全面评测结果显示,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各个科目的数据集(GaoKao)。
“书生·浦语”不仅显著超越了GLM-130B和LLaMA-65B等学术开源模型,还在AGIEval、C-Eval,以及Gaokao等多个综合性考试中领先于ChatGPT;在以美国考试为主的MMLU上实现和ChatGPT持平。
“书生·浦语”技术报告:https://github.com/InternLM/InternLM-techreport
相关推荐
-
国际货币基金组织警告:AI可能会对就业市场造成“重大破坏”
国际货币基金组织(IMF)第一副总裁吉塔 戈皮纳特(Gita Gopinath)警告称,生成式人工智能将“严重扰乱劳动力市场”,并呼吁决策者迅速制定管理该技…
2023年 6月 6日 -
万字长文说清大模型在自动驾驶领域的应用
随着ChatGPT的火爆,大模型受到的关注度越来越高,大模型展现出的能力令人惊叹。 在图片生成、推荐系统、机器翻译等领域,大模型已经开始发挥作用。给定一些提示词,图片生成网站Mid…
2023年 6月 14日 -
OpenAI CEO :OpenAI还没有开始训练GPT-5大模型
OpenAI 首席执行官 Sam Altman 在印度经济时报主办的一场会议上表示,该公司仍未开始训练 GPT-4 的后继者 GPT-5。 Altman 说:“在我们开…
2023年 6月 8日 -
集成多关系图神经网络
一、统一视角的 GNN 1、现有 GNN 传播范式 空域的 GNN 是如何传播的?如下图所示,以节点 A 为例: 首先其会将其邻居节点 N (A) 的信息聚合成一个 hN…
2023年 5月 9日 -
百度李震宇:预计到2026年完成汽车智能化“跨沟”
C114讯 4月18日消息(南山)近日在中国电动汽车百人会上,百度集团资深副总裁、智能驾驶事业群组总裁李震宇发表演讲介绍,工信部原部长苗圩曾经表示,中国汽车产业在新能源转型的上半场…
2023年 4月 19日 -
谷歌最新的人工智能大型语言模型 PaLM 2 在训练中使用的文本数据是其前身的近五倍
站长之家(ChinaZ.com) 5月18日消息:据 CNBC 披露,谷歌上周宣布的新型大型语言模型 PaLM 2 使用的训练数据量几乎是 2022 年前身的 5 倍,可执行更高级…
2023年 5月 18日 -
AI聊天机器人ChatGPT面临新的挑战:如何防止产生有害输出?
【Aigcmore.com】4月20日消息,AI聊天机器人ChatGPT自上线以来,受到了广泛的关注,其可以进行自然对话、编写代码、生成诗歌、作曲、通过律师资格考试、计算复杂的数学…
2023年 4月 29日 -
谷歌生成式AI扩展至 Google Play,提升应用商店使用体验
谷歌的生成式 AI 应用现在正式扩展到 Google Play 了 。在 Google I / O 2023 大会上,谷歌鼓励开发者更多地利用新上线的 AI 工具来完善 App 详…
2023年 5月 11日 -
梵蒂冈发布自己的人工智能道德手册
站长之家(ChinaZ.com)6月29日 消息:梵蒂冈也加入了人工智能的热潮。罗马教廷发布了一本教皇定义的人工智能伦理为基础的手册。 该指南是弗朗西斯和圣克拉拉大学马库拉应用伦理…
2023年 7月 3日 -
谷歌内部文件泄露 AI对手竟不是ChatGPT
人工智能的优势,但赢家不是chatgpt的开发商openai,而是开源社区创建的人工智能。这位工程师认为,谷歌与openai的竞争分散了该公司对开源技术快速发展的注意力,在开源技术…
2023年 5月 7日
