生成式AI浪潮下的算力挑战:存储芯片容量不足、计算接口待统一

2023-08-13
关注

经济观察网 记者 沈怡然 8月10日,第五届OCP China Day 2023(开放计算中国技术峰会)在京召开。会上,三星电子、安谋科技、浪潮信息、世纪互联等多家计算设施提供商提出,AI大模型对传统计算设施带来新的挑战,企业作为提供大模型装备方,需要尽快解决关键芯片容量不足、计算接口和生态不统一的问题。

OCP(OpenComputeProject开放计算项目)起源于Facebook为解决自身数据中心建设需求而成立一个基金组织,发展至今,吸引众多重量级企业参与其中。

会上,三星电子副总裁、半导体事业软件开发团队负责人张实完表示,生成式AI浪潮引爆了企业对芯片元器件的需求,其中,对存储芯片的容量和性能的需求急剧增加,内存芯片正面临内存墙限制的挑战。

内存墙限制指的是在计算机系统中,中央处理器(CPU)和主内存之间的数据传输速度不断提高,而存储设备的访问速度却没有同样的增长。这种速度不匹配导致了计算机性能瓶颈,在某种程度上形成了一道堵塞的“墙”。

三星电子在2023年Q2财报会上表示,随着大型企业之间加剧竞争生成式AI服务,公司收到了来自客户的大量需求,这是发生在半导体下行周期中的罕见现象。尤其是用户对 HBM(一种高带宽存储芯片)的需求正快速增长,公司考虑对HBM扩产,同时迭代该产品技术。

张实完称,“首要的解决方案是引入主动存储(Active Memory)建立全新内存层次结构,其次是发展以数据为中心的计算技术”。

张实完表示,实际上,“内存墙”并不是三星面临的唯一挑战,以更快的速度处理数据需要大量的功耗,这将不可避免地导致大量碳排放。为此,三星开发以及应用了生命周期评估(LCA)流程来计算和检测所有产品的碳排放量,以减少产品生命周期和半导体供应链中对环境的影响。

会上,浪潮信息服务器产品线总经理赵帅表示,中国企业发布的大模型数量超过110个,引发了对人工智能更为剧烈的算力需求。但是,由于各厂商技术路线不同,芯片的接口互联协议和兼容性也有所不同,从而导致整个计算基础设施在建设中不得不面临着硬件分裂化和生态离散化的挑战。

赵帅称,将专有的硬件系统集成到整机系统中的“烟囱式”发展模式,需要花费更多的时间和成本,这会阻碍了应用的创新和算力产业的普惠发展。

会上,浪潮信息发布了《开放加速规范AI服务器设计指南》。赵帅称,这是为了进一步发展和完善规范AI服务器的设计理论和设计方法。通过开放设计指南对主机接口、供电方式、散热方式、管理接口、卡机的互联等进行梳理,可以显著降低AI算力产业化成本,提速多元算力普惠的进程。

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘