您的位置:招采网 > 意向公示 > 面向漏洞分析领域的可私有化部署深度学习模型意向公开(2024-YK01-F1242)(第1包)

面向漏洞分析领域的可私有化部署深度学习模型意向公开(2024-YK01-F1242)(第1包)

采购意向公开

为便于供应商及时了解军队采购信息,根据《军队物资服务集中采购需求管理暂行办法》等有关规定,现将某单位面向漏洞分析领域的可私有化部署深度学习模型采购意向公开如下:

序号

采购项目名称

需求概况

初步技术
参数

预算金额

(万元)

预计采购时间

备注

1

面向漏洞分析领域的可私有化部署深度学习模型

面向漏洞分析领域的可私有化部署深度学习模型,按照功能模块分为“通用自然语言分析能力”、“代码分析能力”、“漏洞分析能力”和“技术服务”4个部分。其中,在通用自然语言分析能力方面,需具备自然语言对话与推理等通用型大语言模型的功能,提供基本的自然语言分析功能,如对话问答、语言生成等,并且可为应用到其它垂直领域提供基础能力支撑;在代码分析能力方面,需具备基本的程序代码分析与理解能力,包括代码解释、代码生成、代码纠错等功能,为应用到程序漏洞分析领域提供支撑;在漏洞分析能力方面,需具备漏洞代码检测、漏洞知识问答、漏洞修复等功能;在技术服务方面,在使用与开发模型的过程中,需提供运行保障服务等相关技术支持等。要求:合同生效后,中标方在6个月内完成安装及调试。中标方提供设备的各项技术性能指标必须达到合同和技术文件规定的要求

详见指标参数

200

202410

指标参数:

1.功能指标

(1)支持私有化部署运行,并提供交互接口,其中接口类型包括但不限于本地web服务、API函数调用等方式;

(2)具备通用自然语言分析能力,包括但不限于命名实体识别、事件要素抽取、文本分类、文本摘要、文章生成、自由问答、多轮对话、机器翻译等;

(3)具备对源代码进行功能理解、功能分类与功能解释的能力,能够输出代码注释等对代码功能的自然语言描述;

(4)具备基于用户对功能需求的描述,生成对应功能源代码的能力;

(5)具备对代码语法类型缺陷的判别和分析能力,能够输出是否存在缺陷、缺陷位置和缺陷类型;

(6)具备对代码语法类型缺陷的修复能力,能够输出修复后的代码;

(7)支持使用来自多种语言、包含多种漏洞类型的漏洞代码标注数据(漏洞代码样例数据和关联的漏洞类型),对模型进行有监督微调;

(8)具备对源代码的漏洞检测能力,给定源代码文件作为输入,能够输出源代码中的漏洞存在位置,以及漏洞类型;

(9)具备对代码漏洞成因的分析解释能力,能够对检测到的代码漏洞成因进行解释说明;

(10)具备漏洞领域知识问答能力,能够针对用户提出的漏洞领域相关问题,使用专业知识进行自然语言形式问答对话;

(11)具备对代码漏洞的修复能力,能够输出代码漏洞修复建议。

(12)提供模型运行和微调相关的技术支持和相关代码,支持使用本地私有数据,在本地对模型进行有监督微调;

(13)提供适用有监督微调的自然语言、代码分析、漏洞分析等相关的标注数据。

2.性能指标

(1)深度学习模型参数规模不低于百亿级;

(2)模型预训.练所使用的数据不少于6TB;

(3)上下文长度最大支持4000 token;

(4)答案生成速度不低于20 token/s;

(5)支持对不少于5种编程语言的代码理解,包括但不限于C/C++、Java、Python等;

(6)支持对不少于5种编程语言的代码生成,包括但不限于C/C++、Java、Python等;

(7)支持对不少于5种编程语言的代码缺陷进行检测与修复,包括但不限于C/C++、Java、Python等;

(8)给定代码并判断是否存在缺陷、缺陷位置与缺陷类型,缺陷检测准确率不低于80%;

(9)给定含有缺陷代码并指定生成修复后代码,判断修复后代码能否成功编译或执行,缺陷修复成功率不低于80%;

(10)支持对不少于5种编程语言源代码进行漏洞分析,包括但不限于C/C++、Java、Python等;

(11)支持对不少于5种类型漏洞的检测,漏洞类型包括但不限于堆溢出、栈溢出、格式化字符串、空指针解引用、释放后重用等;

(12)支持对不少于5种类型漏洞的成因分析,漏洞类型包括但不限于堆溢出、栈溢出、格式化字符串等;

(13)给定代码并判断是否存在漏洞、漏洞位置与漏洞类型,漏洞检测准确率不低于80%;

(14)漏洞领域知识问答能力覆盖不少于5个领域,包括但不限于Web安全、移动安全、物联网安全、区块链安全、主机安全等领域;

(15)给定含有漏洞的代码并指定提供修复建议,判断代码修复建议是否与官方补丁一致,漏洞修复建议与官方补丁的一致率不低于80%。

(16)支持不少于4种模型微调方法,包括但不限于全参数微调、Freeze微调、Lora微调及Qlora微调;

(17)提供可适用模型微调的自然语言数据,自然语言标注数据不少于500GB;

(18)提供可适用模型微调的代码分析数据,提供TB级别代码数据,适用微调的源代码语义标注数据不少于100M;

(19)提供可适用模型微调的漏洞分析数据,漏洞代码数据集函数数量不少于100万个,漏洞代码标注数据集覆盖的漏洞类型不少于5种,包括但不限于堆溢出、栈溢出、格式化字符串等。

注:1.本次公开的采购意向仅作为供应商了解初步采购安排的参考,采购项目具体情况以最终发布的采购公告和采购文件为准;

2.供应商可以通过军队采购平台反馈参与意向和意见建议。

联系人:李老师 联系电话:18758028516