阿里天猫精灵推出AI治理开源数据集 预计在6月份开放批问答数据
站长之家(ChinaZ.com) 6月3日 消息:日前,阿里巴巴旗下的天猫精灵与通义大模型团队联合多位领域学者和组织,推出了一个名为100PoisonMpts的大语言模型治理开源中文数据集,宣布十余位知名专家学者成为首批“给AI投100瓶毒药”的标注工程师。标注人各提出100个含有偏见和歧视回答的棘手问题,并标注出大型模型的回答,完成由AI "投毒"和"解毒"的攻防。
据阿里联合团队负责人介绍,与国外公司的治理方法相比,100PoisonMpts数据集在技术方法上将具备更完整的标注流程、更隐性的问题领域、更全面的效益。标注数据对模型继续训练、微调、强化学习、线上服务等多个环节都有益处。
目前,首批领域数据涉及到反对歧视、同理心、商榷式表达等目标,该数据囊括了法律、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公正等多个维度。100PoisonMpts数据集预计在6月份开放第一批问答数据,目前正在魔搭等技术社区征集更多垂直领域专家。
相关推荐
-
加州法律明确对AI聊天机器人的监管
站长之家(ChinaZ.com)6月12日 消息:当下,各国正加强对AI的监管,以及相关法规的完善。据外媒报道,美国加州《商业和职业法》对“机器人”进行了规范,其中第17940节定…
2023年 6月 13日 -
聊天机器人正在消化互联网,而互联网希望拿到回报
人工智能公司正在利用无数人在互联网上创作的内容,但没有征得他们的同意,也没有给予任何报酬。如今,越来越多的科技和媒体公司开始要求支付费用,希望从聊天机器人的热潮中分一杯羹。 以下是…
2023年 5月 6日 -
ai绘画生成器哪个好用?12个优秀AI艺术生成器推荐(附网址)
人工智能 (AI) 不仅影响商业和医疗保健等行业,还在创意产业中发挥着越来越重要的作用。人工智能技术和工具通常可供任何人广泛使用,这有助于创造全新一代的艺术家。 我们经常听说人工智…
2023年 4月 15日 -
OpenAI向美国专利商标局申请"GPT"商标被驳回
【Aigcmore.com】4月26日报道,OpenAI是一家致力于人工智能技术研究的公司,旗下的聊天机器人ChatGPT采用了基于“生成预训练变换器”技术,简称“GPT”。近日,…
2023年 4月 28日 -
LinkedIn 推出生成式 AI 辅助撰写帖文功能,将向所有用户开放
6 月 26 日消息,职场社交平台 LinkedIn 早前推出了广告创建支持功能,允许广告商通过生成式 AI 快速生成营销文案。如今,该平台开始将生成式 AI 应用到了更大范围 —…
2023年 7月 6日 -
LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT
过去十多年,AI的飞速发展主要是工程实践上的进步,AI理论并没有起到指导算法开发的作用,经验设计的神经网络依然是一个黑盒。 而随着ChatGPT的爆火,AI的能力也被不断夸大、炒作…
2023年 6月 14日 -
OpenAI CEO:人工智能对于人类和科技来说是「必须迈出的最重要一步」
站长之家(ChinaZ.com) 6月26日消息:OpenAI 首席执行官 Sam Altman 表示,人工智能技术的迅速发展存在许多可能出错的方式。但他辩称,收益超过成本:「我们…
2023年 6月 26日 -
图片+音频秒变视频!西交大开源SadTalker:头、唇运动超自然,中英双语全能,还会唱歌
随着数字人概念的火爆、生成技术的不断发展,让照片里的人物跟随音频的输入动起来也不再是难题。 不过目前「通过人脸图像和一段语音音频来生成会说话的人物头像视频」仍然存在诸多问题,比如头…
2023年 5月 1日 -
Meta AI曾涵清:子图神经网络可扩展应用与表达力应用
图神经网络作为深度学习的一大活跃领域,受到人工智能学家广泛关注。由于可以将图论和深度学习紧密融合在一起,充分利用图上拓扑信息,图神经网络为解决传统深度学习单纯欧氏空间中分析非欧氏空…
2023年 7月 14日 -
借助ChatGPT快速上手ElasticSearch dsl
作为一个SQL玩家,接触到 ElasticSearch 以后,被其dsl奇奇怪怪的写法所困扰,比如 bool should filter 什么场景下应该嵌套,什么时候 bool q…
2023年 6月 25日