当前位置: 【招标信息】→【招标公告
20210008号苏州科技大学关于高性能GPU服务器等谈判采购公告
日期:2021/1/27 18:41:52  发布:招投标管理办公室  浏览: 3153
苏州科技大学关于高性能GPU服务器等谈判采购公告
【发稿时间:2021-01-27

项目概况

高性能GPU服务器等采购项目的潜在供应商应在苏州政府采购交易管理平台获取采购文件,并于202122  930分(北京时间)前提交响应文件

一、项目基本情况

项目编号: HXZX2021-BS-T-001

项目名称:高性能GPU服务器等

采购方式:竞争性谈判

预算金额:人民币肆拾玖万捌仟元整(¥498000.00)

采购需求:

采购清单:                   

序号

货物名称

 技术指标

单位

数量

1

高性能GPU服务器(核心产品)

 

1. 服务器外观:≥1U机架式,带导轨,深度小于1000mm,可装入标准机柜

2. 处理器:配置≥2颗CPU,每颗CPU核心数≥12核、线程数≥24、单核主频≥2.0GHz, x86-64处理器架构

3. 内存:配置≥4*32GB DDR4 2933MHz ECC内存,配置≥16个DIMM插槽扩展,支持内存ECC保护、内存镜像、内存热备

4. 存储:配置≥2块480G SSD;配置≥1块4T的硬盘,I/O性能需大于等于7.2K转速规格硬盘的性能;主板支持≥4个硬盘位;配置≥1块12Gbps阵列卡,支持RAID 1/5/10, ≥2GB闪存,支持电容掉电保护

5. I/O插槽:配置≥6个PCIe 3.0插槽

6. 网卡:配置≥2个千兆网络接口 ,配置≥2个万兆网络接口,配置≥4个万兆多模光模块(能兼容现有DELL N4032F交换机)

7. GPU:配置≥4块NVIDIA Tesla V100 SXM2 32G GPU卡,NVLink总线安装方式  

8. 电源:配置≥2个2000W及以上热插拔冗余电源

9. 风扇:N+1冗余风扇

10. 配套机柜:1个标准机柜,42U-600*1000*2000cm-黑色-网孔门-标配3块固定板

、2组风扇; 配置1个8位32A PDU(3孔32A工业插头),能够匹配本次采购服务器的电源使用

11. 系统维护:支持独立的远程管理控制端口,实现与操作系统无关的远程对服务器的完全控制,远程开机、关机、重启、虚拟设备挂载等操作;实时监控服务器内部关键部件运行状态和温度信息,CPU、内存、硬盘、风扇、电源、扩展卡

12. 服务:3年原厂整机质保,3年原厂免费上门服务

13. 产品认证:提供3C、节能和环境标志认证证书复印件

1

2

高性能GPU服务器

 

1. 服务器外观:≥1U机架式,带导轨,深度小于1000mm,可装入标准机柜

2. 处理器:配置≥2颗CPU,每颗CPU核心数≥12核、线程数≥24、单核主频≥2.0GHz, x86-64处理器架构

3. 内存:配置≥4*32GB DDR4 2933MHz ECC内存,配置≥16个DIMM插槽扩展,支持内存ECC保护、内存镜像、内存热备

4. 存储:配置≥2块480G SSD,配置≥6块4T的7.2K及以上转速的SATA硬盘;支持≥8个热插拔硬盘位;配置≥1块12Gbps阵列卡,支持SAS,SATA硬盘,支持RAID 1/5/10, ≥2GB闪存,支持电容掉电保护

5. I/O插槽:配置≥6个PCIe 3.0插槽和一个内置Raid卡插槽。

6. 网卡:配置≥2个千兆网络接口 ,配置≥2个万兆网络接口,配置≥4个万兆多模光模块(能兼容现有DELL N4032F交换机)

7. GPU:配置≥4块NVIDIA RTX3090 24G GPU卡,涡轮式机箱尾部排气

8. 电源:配置≥2个2000W及以上热插拔冗余电源

9. 风扇:N+1冗余风扇

10. 系统维护:支持独立的远程管理控制端口,实现与操作系统无关的远程对服务器的完全控制,远程开机、关机、重启、虚拟设备挂载等操作;实时监控服务器内部关键部件运行状态和温度信息,CPU、内存、硬盘、风扇、电源、扩展卡;

11. 服务:3年原厂整机质保,3年原厂免费上门服务

12. 产品认证:提供3C、节能和环境标志认证证书复印件

1

3

高性能计算集群管理与作业调度软件

 

基本要求

商业版的集群管理与调度系统软件套装产品;包含3个节点授权,可兼容市面上不同品牌的主流服务器。响应单位须承诺,若再次购买该软件,每节点收费不得高于本次软件中标的每节点价格。

集群软硬件需对接我单位以下两个设备:

1.  华为存储 OceanStor IP SAN,接口为IP SAN;

2.  万兆光交换机DELL N4032;

软件的第三个节点授权需要安装至以下设备,并与本次招标设备组成集群:

联想SR860服务器(配2块TESLA V100 GPU卡)

集群软硬件需由专业工程师实施,完成部署、安装、调试服务器硬件、网络、操作系统和集群管理软件等工作,完成高性能计算集群基本测试,并提供相关的测试报告。提供集群系统管理员手册、用户手册、功能测试报告、性能测试报告等文档。部署培训,包括软硬配置培训、使用及功能培训。3年7*24原厂远程支持服务。

 

集群管理功能

一、WEB功能

统一的集中式监控平台,管理软件基于B/S架构,能使用主流浏览器进行管理,中文管理界面;

 

二、节点监控

1.支持按节点查看服务器CPU利用率、GPU利用率、内存、网络I/O、负载、归属资源组、CPU核数在用/空闲、GPU在用/空闲和任务列表;

2.支持按节点查看各GPU卡的型号、GPU利用率、显存利用率、温度、功率和运行在上面的任务;

3.支持按节点查看实时性能详情:CPU温度、节点网络、GPU、节点磁盘分区、节点负载、节点内存、本地磁盘、Infiniband卡的性能监控;

4.支持按节点查看I/O状态、cpuIoWait百分比、网络IO、infinibandIO;

5.支持按节点查看服务器静态信息:OS-type、本地磁盘总量、CPU类型、CPU核数、GPU类型、GPU卡数;

6.支持监控集群整体的存储的已用、剩余和总量统计情况

 

三、GPU监控

1.集群GPU资源使用监控:开发环境使用数量、训练任务使用数量和空闲数量

2.集群GPU资源性能监控:集群GPU平均利用率和平均显存利用率监控

3.节点GPU使用及性能监控:针对节点上各GPU卡,支持按颜色标识GPU卡的当前使用状态及性能情况;

4.GPU卡性能详情监控:GPU利用率、显存使用情况、温度、功率、时钟频率、PCIe带宽等实时性能信息;

 

四、统计功能

1.资源统计:支持从集群、资源组、节点三个维度进行资源的性能及使用统计情况,包括CPU利用率、GPU利用率、显存利用率、内存利用率、CPU使用核数、GPU使用卡数等信息;

2.任务统计:支持统计一段时间内集群整体的任务总量、人均任务量、任务平均时长、任务平均GPU时长等信息;支持按任务规模和任务时长进行数量统计;支持按天展示集群处理任务数量;

3.用户/用户组统计:支持集群活跃用户统计;支持按用户和用户组统计某段时间内的任务数量、GPU卡时、CPU核数等资源使用情况;

 

五、报警功能

1.支持计算节点监控项的报警设置和报警策略,达到报警阈值时自动报警,支持包括GPU利用率、GPU温度、GPU掉卡、CPU利用率、磁盘空间、磁盘I/O、网络I/O、节点掉线等报警项,支持故障报警/一般报警/严重报警三种报警等级设置;

2.支持通过站内信、邮件等方式进行报警信息推送;

3.支持报警信息列表信息的查看、筛选和导出等操作;

 

六、节点管理

1.支持节点资源的动态添加、移除操作,支持通过模板进行节点的批量添加/删除操作;

2.支持节点列表信息查看,包括节点名称、状态、型号、IP、交换机名称等物理信息,支持节点上线/下线操作,支持节点IPMI跳转;

3.支持节点上缓存数据的列表信息查看,包括目录、大小、最近使用时间、是否在用,支持管理员手动选择数据进行清理操作;

 

作业调度功能

一、WEB功能

1.提供基于WEB界面的调度系统设置、队列设置、权限设置、作业提交、报表功能等;

2.支持WEB界面的资源申请、作业查询、删除、挂起和释放等操作;

 

二、用户管理功能

1.创建用户组,删除用户组和修改用户组相关信息,在用户组中批量导入用户的功能。

2.支持用户目录安全隔离,可以存储自己的文件和数据,并可进行管理。

3.支持创建及管理不同权限不同组别的用户/组,支持用户在线注册及管理员审批

4.可以修改用户组、组内成员删除和增加、GPU卡数、CPU核数、资源组等配额信息。

 

三、配额管理

1.提供任务配额管理:支持对用户/组配置最大作业数、最大处理器数、内存和硬盘等限制,支持用户按GPU显存申请资源分配;

2.提供常用高性能计算软件的应用模板,支持用户自定义应用模板;

 

四、作业管理

1.支持tensorflow、mxnet、pytorch、caffe等主流AI框架在作业调度系统上运行。

2.支持用户按需申请训练所需计算资源,包括CPU、GPU、内存等资源,支持自动适配计算节点或人工指定计算节点;

3.提供多种作业提交方式: WEB界面、E-shell命令行、作业脚本和可执行文件等

4.支持集群资源统一调度,支持多用户,多作业同时运行,通过调度器来给作业动态分配资源,支持单节点单GPU, 单节点多GPU,多节点多GPU以及多节点GPU,以及CPU/GPU混合等多种调度方式。

5.支持作业的列表查看,支持具体任务的资源使用、日志输出、容器实例、资源性能等任务信息的查看

6.支持tensorflow,pytorch, mxnet, caffe框架通过MPI的方式扩展分布式训练;通过简单的GPU计算资源、训练脚本配置即可提交单机多卡,多机多卡的MPI训练任务支持作业生命周期管理,包括任务查看、停止、恢复、删除等;

 

五、调度功能

1.提供主流的调度策略,公平竞争、QoS、抢占、轮询、回填、资源预留等;软件支持以优先级为准则的调度策略;

2.支持以资源限额为准则的调度策略;支持以负载均衡为准则的调度策略;数据交换支持预约机制;

3.支持对于因为系统临时错误导致的异常数据交换任务进行自动重新调度;

4.支持对于宕机(或网络不通的)节点上数据交换任务进行自动重新调度;

5.支持对数据交换任务的残留进程和非法任务进程的自动清理;

 

3

合同履行期限:合同签订生效后30天内供货完成并安装调试完毕。如不能如期供货,采购单位有权终止合同,成交单位须承担由此对采购方造成的损失。

本项目不接受联合体。

二、申请人的资格要求

1、满足《中华人民共和国政府采购法》第二十二条规定;

2、落实政府采购政策需满足的资格要求:无

3、本项目的特定资格要求:单位负责人为同一人或者存在直接控股、管理关系的不同供应商(包含法定代表人为同一个人的两个及两个以上法人,母公司、全资子公司及其控股公司),不得参加同一合同项下的政府采购活动。

三、获取采购文件:

1、时间:2021127日至202121

2、报名方式:

1)申领CA:办法详见苏州市公共资源交易中心网上《关于办理苏州市(市级)政府采购交易系统CA证书的通知》。有效期内的CA证书可以反复使用。

2)原市级政府采购供应商网上报名系统用户需换CA证书、办理电子签章业务及激活政府采购模块;

3)区级政府采购交易系统用户,无需再次办理;

4)未参与过苏州市政府采购交易的用户,需办理CA证书、电子签章业务及激活政府采购模块,详情参见《政府采购CA证书办理指南》。

5)登录报名:供应商进入“苏州市公共资源交易中心”,进入“政府采购(网上报名)”,选择“苏州市政府采购管理交易平台”,进入“供应商”系统,进入报名界面点击“报名”按钮报名。报名成功并下载采购文件后,点击投标确认函下的“编辑”按钮,进入编辑投标确认函并签章,签章成功后打印投标确认函以供参与项目使用。详见《苏州市政府采购交易管理系统供应商操作手册》。

3、文件获取:本项目不出售采购文件,供应商需在苏州市公共资源交易中心网站报名成功后,根据提示,到左侧采购文件页面下载招标文件,报名日期视同为依法获取招标文件日期。未依照采购公告要求实行网上报名的供应商,视为未参与该项政府采购活动,不具备对该政府采购项目提出质疑的法定权利,但因供应商资格条件或报名时间设定不符合有关法律法规规定等原因使供应商权益受损的除外。

4、网上询问。报名成功的供应商在下载招标文件后,对招标文件有疑问的,可在“苏州市公共资源交易平台”网上交易系统中进行询问,询问信息不显示询问人的相关资料。代理机构通过网上交易系统收到询问后以网上答复的方式予以解答,询问人通过系统查阅。

5、技术咨询:供应商在响应过程中如有软件操作方面疑问,请拨打1.注册咨询:0512-69820846;CA办理咨询电话:0512-81876166;或在线咨询客服QQ: 805640413、442456465、864274166。咨询电话:13961452091。

6、有关该采购活动的澄清、修正及中标信息亦在苏州市政府采购网发布,请定期关注。

四、响应文件提交:

截止时间:202122930分(北京时间)

地点:苏州市姑苏区平泷路251号城市生活广场西楼五楼(苏州市公共资源交易中心)

标:

时间:202122930分(北京时间)

地点:苏州市姑苏区平泷路251号城市生活广场西楼五楼(苏州市公共资源交易中心)

六、公告期限

自本公告发布之日起3个工作日。

七、其他补充事宜

公告发布媒体:苏州市政府采购网、江苏政府采购网。

八、凡对本次采购提出询问,请按以下方式联系

1、采购人信息

    称: 苏州科技大学

    址: 苏州市学府路99号

  人: 殷明

    话: 0512-69379123

2、采购代理机构信息

名称:苏州鸿鑫工程咨询有限公司

地址:苏州市相城区嘉元路1018号元联大厦10层

联系方式0512-65981595-81218122

3、项目联系方式

项目联系人:赵雷吴极

电话:0512-65981595-81218122

苏州鸿鑫工程咨询有限公司

2021年1月27日

 【打印本页】 【关闭窗口】 

普通高考招生电话:0512-68096117 研究生招生电话:0512-68093182

苏ICP备11028812号 苏公网安备 32050502000334号