倪光南:发展算力要重视存力,建议数据存储列入信创范围

2023-07-26
关注

编辑|信创纵横公众号(ID:xinchuangzh)

出品 | 安东工作室

来源|综合自半导纵横创咨询、e公司等


  随着算力网络的建设发展,业内对存储环节的关注度也直线上升。

  7月20日在2023世界半导体大会上,中国工程院院士、中国科学院计算技术研究所研究员倪光南表示,当前AI算力中心蓬勃兴起,但是广义算力不仅包括算力,还包括存力、运力。数据显示,预计2025年中国数据量将从7.6ZB增至48.6ZB,超过美国成为全球第一。当前,全球各国都在加快制定国家数据战略,其中,存储技术和产业成为共同关注的战略重点。

  当前中国算力中心存力不足,存在重算力轻存力的倾向,国内的存储发展跟不上数据量的增长。根据倪光南提及的一组数据,中国算力中心采用SSD(固态硬盘)先进算力占比仅为24.7%,约为美国一半。中国单位GDP的数据存储量只有美国70%左右,而人均数据存储量,美国是中国的9倍。美国为212GB/人,中国约为25GB/人,说明中国数据存储产业大有可为、前景广阔。

  倪光南建议制定算力和存力适当比例范围,重视高效存储产业人才培养,以及将数据存储列入信创范围、设立国家科技攻关计划和相关数据存储专项,协同上下游产业攻关等。

  现在AI大模型崛起,进一步推动了算力的需求。虽然AI算力中心不断兴起,但是倪光南指出,目前普遍对算力的理解有片面性,广义算力不仅包括算力,还包括存力、运力。当前中国算力中心的存力相对不足,存在重算力轻存力的倾向。

  他进一步分析道,中国存储容量增长快,但主要用机械硬盘HDD,先进半导体存储技术滞后。比如,存储领域闪存市场占比中,全球平均水平为41.3%,美国为56.4%,中国为20.3%,仅是全球水平的一半。再看算力中心采用SSD(固态硬盘)先进存力占比,美国为52.8%,中国为24.7%。

  面对新一轮存储技术变革,在倪光南看来,随着国产存储整机和闪存生产能力提升,SSD(固态硬盘)取代HDD(机械硬盘)的时机已经到来。

  谈及存储芯片产业链,倪光南介绍道,中国的新型半导体存储产业链比较完整,比如在产业链上游,长江存储的NANDFlash和长鑫存储的DRAM芯片已经达到全球主流的水平和生产能力;在SSD主控芯片方面,国内已经有十几家厂商的产品得到商用,产品能力与国外主流厂商持平。

  而在产业链中游,我国存储整机的核心能力和竞争力构筑在自主的核心存储芯片、系统架构和软件之上,也已具备国际领先技术水平,目前国产品牌厂商在国内市场占比85%,在全球市场份额占比20%,在海外有巨大增长空间。

  在他看来,我国新型存储产业在实现国产化的情况下已经具备了国际竞争力,今后如能通过双循环拉动,迅速扩展规模,提升性价比和营销服务能力,有望成为IT领域的“5G”产业,成为中国的又一新名片。

  对于存储产业发展,倪光南建议制定算力和存力适当比例范围,重视高效存储产业人才培养,以及将数据存储列入信创范围、设立国家科技攻关计划和相关数据存储专项,协同上下游产业攻关等。

  倪光南院士表示,随着信息技术的快速发展,数据存储作为一个重要的产业分支以后会成为一个广为人知的产业。

  

  2021年美国提出《创新与竞争法》,要拿出大量资金来发展十大关键技术,包括数据存储,数据管理技术。目前国内对存储的概念还停留在一个小的部件,没有把它上升到一个产业的高度。

  

  据预测2025年中国的数据存储量将超过美国,未来有望成为世界第一数据大国。作为数据大国,数据存储产业就需要跟上,中国应该抓住这个机遇,有强大先进的数据存储产业作为支撑,才能有发展的主动权。

  

  中国新增数据量年复合增长率是30%左右,目前数据存储市场规模还不够大,市场还跟不上数据量的发展,需要充分用好数据量的拉动,把成熟数据成熟产业带动起来。

  

  从人均的数据存储量来看,目前美国人均存储量是212 GB/人,中国是25 GB/人,美国是中国的8倍,这说明中国数据存储产业是大有可为的,前景是非常光明的。

  

  当前,数据存储产业一个很大的推动因素来自于大语言模型。大模型正在带动各地建设AI算力中心,但是产业主要关心的都是运算力。实际上算力中心的计算能力由三个因素决定:存力、算力、运力。倪光南院士认为,用广义算力去定义一个算力中心,才更准确。

  美国的算力中心存算比为1.11TB/GFlops,中国约为美国的37.8%。相对来说,走在更前列,经过市场检验的美国算力中心的存算比会更合理一点。当算力中心可能会出现算力发挥不了作用,这时候就需要把存力提高了。产业应该去研究算力建设,确定一个适当的比重,充分发挥我们投资的效益。确定合适的存算比,有助于当前AI算力中心的建设。

  

  从技术变革方面来看,存储领域正在发生一项新的技术变革,即基于半导体技术的新型产品替代基于机械技术的传统产品,这一个正在加速进行的客观趋势。

  全球SSD占存储市场比重是41.3%,这一比例在美国是56.4%,在中国约为20.3%,说明在国内还是传统存储占了很大的比重,而发达国家已经走在前面了,用先进的半导体存储替代了传统的机械存储,这是一个很重要的启示。有差距也说明有市场潜力。

  

  SSD对机械硬盘替代的进度慢很大一个问题是价格。不过SSD在性能、能耗方面仍有优势。图上蓝线就是半导体存储的价格变化,红线是机械存储的变化,绿线是SSD与机械存储的比较,在今年大概是2.2,两者有望在2026年实现平衡。

  倪光南院士强调,对于存储产品不应该只关注价格问题,综合各种性能来看SSD的性价比已经超出了机械硬盘。

  SSD可以实现用先进的压缩算法,把数据更好的压缩,可以去重,可以更好的加密解密,用新的文件系统等等。在招标中只考虑价格,不考虑其他因素,这是不对的,倪光南院士也建议有关方面在招标项目规划之中,更加全面考虑存储产品的多种性能。各方面共同努力推动半导体存储替代机械存储的产业变革。

  用SSD替代机械硬盘从供应链安全的角度来看也有好处,因为现在的机械硬盘市场完全被外国厂商垄断。倪光南院士提到,在新型存储的产业链上游国产公司布局是比较完整的,目前来讲主要的芯片像NAND,DRAM芯片都可以自己生产。从中游来讲,国内在核心存储设备、系统架构软件都有自主创新的东西,达到了国际领先的技术水平,比如像华为的存储在全球仅次于EMC。在新型存储领域,中国品牌有足够的国际竞争力。

  

  当前是发展中国数据存储产业的好时机,倪光南院士给出了几点建议。

  1、产业发展,标准先行。为促进产业更好地发展,以“行标”或“团标”的方式,发布“算力中心建设指南”;提出“算力”与“存力”的适当比率范围;提出“存力”中采用SSD先进存力的适当比率范围,避免大力发展算力中心建设中的某些倾向,均衡部署,均衡发展,抢占新一轮科技革命和产业变革的制高点。

  2、政策引导,力推SSD取代HDD。存储设备的政府采购、招标等项目中,应优先支持SSD,不得以单一价格指标作为评标依据;重要基础设施的存储设备,政府应政策引导指定采用国产SSD以此促进国产SSD的产业发展。

  3、安全测评,公平公正。美光未通过中国政府对其的安全审查,为国产存储产业发展提供发展窗口期。存储领域应以此为契机,重视对存储产品的安全审查,包括供应链安全、信息安全、数据安全等等。尤其是对于存储整机、主控芯片、存储文件系统等等关键核心技术,建议参照信创工作经验,实施“自主可控测评”,根据第三方测评机构给出的自主可控测评分值作为选择依据。

  4、千秋大业,人才为先。重视高校存储产业人才培养。存储产业为技术密集型产业,产品研发需要大量具有存储技术研发能力的人才。北美有60+高校开展存储领域研究,领军教授80+,博士团队500+;西欧有20+高校开展领域研究,领军教授30+、博士团队200+;目前国内仅有10+高校开展存储领域研究,领军教授10+,博士队伍100+,硕士不足300人。数据看出,人才基数与中国整个存储产业和应用市场体量来讲显然是不匹配的,建议在高校要增设存储专业、课程、实验室等,扩大存储人才培养规模,并从收入、激励机制、基本公共服务等多角度构建新的人才政策,吸引并聚集国内外优秀人才。

  5、集聚产业,协同攻关。建议将数据存储列入信创范围,与上下游产业协同促进国产信息技术生态发展。同时设立国家科技攻关计划和相关产业链中数据存储专项,组织国内产学研用各界联合攻关,实现全产业链风险可控;成立存储国家实验室、国家级科创平台等,开展前沿技术研究,形成原创性成果,提升国产存储全球技术竞争力。

  小知识:数据存储的那些事儿

  写在前面

  对于运维来说,数据读取、安全与存储,也是至关重要的一点,数据存储的技术点也是相当的多,面比较广,今天,民工哥来给各位小伙伴聊一聊有关于数据存储的“那些事儿”

  存储的概念介绍

  数据存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。数据以某种格式记录在计算机内部或外部存储介质上。数据存储要命名,这种命名要反映信息特征的组成含义。数据流反映了系统中流动的数据,表现出动态数据的特征;数据存储反映系统中静止的数据,表现出静态数据的特征,解释来源于百度百科。

  

  民工哥用一句话总结:数据存储就是将一定量的数据通过不同的存储架构存储到不同的存储介质当中

  存储介质介绍

  磁盘和磁带都是常用的存储介质

  磁盘又分机械式磁盘、SSD等类型

  

  数据存储组织方式因存储介质而异。在磁带上数据仅按顺序文件方式存取;在磁盘上则可按使用要求采用顺序存取或直接存取方式。数据存储方式与数据文件组织密切相关,其关键在于建立记录的逻辑与物理顺序间对应关系,确定存储地址,以提高数据存取速度。

  存储方式

  DAS直接附加存储方式

  就与普通的PC机存储一样,将外部的存储设备直接加在服务器内部来存储数据

  这种存储方式,比较适用于小型网络结构,数据量小,对数据的传输与读取速度要求不高的场景下

  NAS网络存储方式

  它是采用独立于应用服务器,单独为网络数据存储而开发的一种文件服务来连接所有的存储设备,通过这种方式来存储数据,可单独为所有应用服务共享使用

  这种存储方式安装布署比较简单,可以即插即用,而且不依赖于操作系统,缺点就是存储的性能不太好

  SAN存储方式

  这种存储方式是1991年IBM公司推出的,基于光纤介质的一种存储方式,它的组成如下:

  1)存储和备份设备:包括磁带、磁盘和光盘库等。

  2)光纤通道网络连接部件:包括主机总线适配卡、驱动程序、光缆、集线器、交换机、光纤通道和SCSI间的桥接器

  3)应用和管理软件:包括备份软件、存储资源管理软件和存储设备管理软件。

  磁盘阵列系统介绍

  由于数据存储量的增长,单块磁盘设备不能满足正常的存储量需求了,因此引入了磁盘阵列系统这个概念,常用的磁盘阵列有以下几个

  RAID 0

  RAID0是所有磁盘阵列中读写性能最好,也是最简单的实现方式

  但它缺点是没有数据冗余及恢复机制,它至少需要两块盘进行组建,从而将两块磁盘的空量叠加在一起,形成一个新的大的存储容量磁盘,由于它的缺点,当其中一块磁盘损坏,就会造成数据丢失无法恢复,这种阵列可以存储一些大量的日志数据

  RAID 1

  RAID 1它被称为镜像阵列,因此结构中的磁盘是互为镜像互备的

  

  此结构最少需要两块盘组成,当一块磁盘损坏可以即时恢复数据,它的读取性能比较好,存储的性能较差,因为同一份数据需要写入到两块磁盘中

  RAID 10 01

  RAID10需要四块盘进行组建,理论上两块盘也可以,不过没有任何实际可用的意义

  

  这类结构要求最好磁盘的容量最好一致,否则整个阵列只能识别最小容量的磁盘设备,它是独立工作的两组RAID1,然后再组成RAID0这样的阵列结构

  RAID01(或称之为RAID0+1)

  

  它的结构是先将磁盘组成RAID0,然后再组成多个独立的RAID1

  RAID5

  这种结构至少需要三块磁盘组成

  

  它是基于基偶校验的原理,它的算法核心是XOR,可以允许损坏一块磁盘,然后通过这种XOR算法,能很快的完成数据的恢复。

  更多精彩内容欢迎点击==>>电子技术应用-AET<<

  • 数据存储
  • 倪光南
  • 固态硬盘
您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘