您所在的位置:东南网 > 第50个世界地球日 > 新闻动态 > 正文

大模型的“诊疗师”和“防护盾”!“蚁天鉴”亮相国家网安周

2023-09-11 11:29:07?作者:?来源:东南网  责任编辑:    我来说两句

11日,2023国家网络安全宣传周在福州开幕。记者探营发现,蚂蚁集团发布的大模型安全一体化解决方案“蚁天鉴”成为亮点。该方案包含了大模型安全检测平台“蚁鉴2.0”、大模型风险防御平台“天鉴”两大产品,目前这两项产品已对外开放。

a91582b4b14ed1321b7035f9147844c.jpg

生成式大模型安全检测平台“蚁鉴2.0”

在“百模大战”的当下,AIGC(生成式人工智能)的安全问题日益备受关注。现场工作人员表示,大模型安全问题产生的本源主要为“用于训练的数据源头有毒、推理过程不可控、外部恶意诱导”三个因素。此次发布的“蚁天鉴”,主要从大模型安全性检测度量、智能风险防控、数据去毒对齐等方面,来保障大模型在生产和使用过程中更加安全、可控、可靠。

“蚁鉴2.0”就像是大模型安全性的“诊疗师”,在大模型上线前对其进行全方位的安全扫描,从数据安全、内容安全、科技伦理等类型的数百种风险维度,提前识别和挖掘风险漏洞。

现场工作人员介绍,“蚁鉴2.0”是业内首个产业级支持文本、图像等全数据类型的AI安全检测平台。它相当于站在“黑产”角度,通过智能攻击对抗技术,自动生成数百万的诱导性问题,对生成式大模型进行诱导式问答,并对大模型的回答实时、自动化的检测计算,24小时不眠不休“找茬”大模型存在的弱点和安全问题。

“天鉴”则相当于在大模型外围又加上了一个“防护盾”,通过智能化风控技术,帮助大模型挡住外界的恶意提问,同时对生成的回答内容进行风险过滤,保障大模型上线后从用户输入到生成输出的整体安全防御。

据介绍,“天鉴”平台集大数据底座、AI计算平台、智能运营、应用场景为一体,可实现低成本、规模化快速应用,服务零售、金融、直播、游戏等提供生成式人工智能服务的业务场景。

此外,针对数据源头有毒、深度黑盒不可控等问题,蚂蚁集团结合“天鉴”平台在大模型的训练和应用过程中,也在通过数据去毒、对齐训练、可解释研究等手段保障模型安全。

本届网络安全博览会上,蚂蚁集团还展示了可信AI决策大脑、隐私计算技术栈隐语、蚂蚁链摩斯多方安全计算平台、安全平行切面等网络安全领域核心前沿技术的创新突破。

相关阅读:

打印 | 收藏 | 发给好友 【字号