第271章 韩熹(2/2)
一辆自动导引车无声地从脚边滑过,车上的传感器闪烁着蓝光,托盘上码着六只液氮罐,罐体外壁挂着一层白霜,在室温下嘶嘶地冒着冷气。
“你们超算中心现在跑仿真的主力机型,还是那批A100?”
“对,用的一直都是A100,之前采购的时候走的科工委特殊通道,没经过正常的出口管制审查。”
邹杨的声音沉下来,目光扫过周围来往的人流,确定两人说话的声音不会被旁人听了去,才继续道:
“但三个月前老美那边突然收紧了对华算力芯片的限制条款,还说禁止向特定实体提供任何可用于高性能计算的技术支持,这个技术支持四个字,弹性太大了。
A100的后续驱动更新、固件补丁、还有配套的CUDA工具链升级,全都被算进了技术支持的范畴里,厂家那边不敢顶风作案,一夜之间就把我们的更新通道全掐了。”
林槿的眉头微微皱起来。
这件事他知道,去年年底的专项汇报会上,工信部的李精武专门提过一嘴,说现在拿到了卡但拿不到更新,等于花天价买了一堆迟早要过期的硬件。
但当时上面的判断是这个问题短期内没有办法从源头上解决,只能等国产替代方案成熟。
现在看来,几个月过去了,局面比他预想的要严峻得多。
“影响有多大?”林槿问。
“目前还能撑。”
邹杨翻开文件夹,快速扫了一眼数据,“我们的做法是把现有A100集群按任务优先级做了分级调度,高优先级的仿真任务,比如发动机燃烧室的全三维流固耦合仿真、再入热流的非定常计算这些都跑在还能用的那批A100上,低优先级的结构力学校核和网格划分工作扔给退役下来的V100。
问题是,最近连续跑了两组变推力针栓喷注器的长程燃烧仿真,A100集群的负载率连续一周维持在百分之九十五以上,有两张卡已经开始报显存校验错误了。
硬件本身也在老化,加上没有固件更新做维护,估计再用一年就会出现不可逆的损耗。”
他说这话的时候语气很平,像是在客观陈述一个事实,但林槿听得出来,邹杨心里压着一团火。
一个工程师眼睁睁看着自已手里的硬件被一点一点卡死,明明有机器的潜力却发挥不出来,这种感觉跟一个赛车手被限速器锁在六十迈一样。
两个人穿过大厅,走进一条编号为C-07的走廊。
走廊两侧的墙壁上嵌着半人高的观察窗,透过玻璃能看到两边的实验室。
左边的实验室里并排摆着三台五轴数控机床,每台都有卡车车厢那么大,此刻正在加工一批形状古怪的金属零件,刀具切削工件的声音被隔音玻璃挡去大半,传到走廊里只剩下闷闷的嗡鸣。
右边的实验室更像是一个干干净净的手术室,几个穿白色无尘服的技术员正围着一面光学平台操作,平台上的激光干涉仪正在做对准校准,屏幕上的干涉条纹一条一条地缓缓移动,技术员的呼吸都压低了。
邹杨带着林槿在C-07的尽头右拐,又穿过一道气密门,上了一部货运电梯。
电梯大到可以开进来一辆皮卡,轿厢的四面墙上挂满了各种安全规程和应急逃生路线图,电梯按钮旁边贴着一张泛黄的即时贴,上面用马克笔写了一行字:电梯运行期间禁止讨论涉*密*事项。
字迹潦草而有力,能在这种地方随便写字的,除了韩熹不作他想了。