AI大模型带动存储变革 业界呼吁重视存力建设
眼下,AI大模型正重塑着千行百业,也包括与之息息相关的算力产业链。
在AI芯片屹立风口之时,业内对存储芯片、存储设备的关注度也直线上升,HBM(高带宽存储)、近存计算等概念大热。
(资料图片仅供参考)
大模型建立在数据和算力之上,而海量数据需要更强悍的存储性能,从而更好地释放算力,因此在大模型的推动下,存储产业正在新需求下升级变革。
近日,华为数据存储产品线总裁周跃峰就向记者谈到了存力的重要性:“大模型时代,数据决定AI智能的高度。作为数据的载体,数据存储成为AI大模型的关键基础设施。”
一直以来,计算、存储和网络被视为数据中心三大件,它们是关系紧密的有机体系,分别对应着算力、存力和运力。如今在算力蓬勃发展的同时,存力正越来越受到重视。近年来国内建设了诸多算力中心,现在的新趋势是开始建设大量的存力中心。
大模型面临的四大挑战
打造AI大模型是一个复杂的系统过程,其间面临着不少挑战。在华为看来,企业在开发及实施大模型应用过程中存在四大挑战。
首先,数据准备时间长,数据来源分散,归集慢,预处理百TB数据需10天左右,这不利于系统的高效利用。
其次,如今大模型的规模越来越大,达到千亿甚至万亿的参数级,训练需要海量的计算资源和存储空间。比如多模态大模型以海量文本、图片为训练集,但是当前海量小文件的加载速度不足100MB/s,训练集加载效率低。
其三,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,需要Checkpoint机制恢复训练,故障恢复耗时超过一天。
最后,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%。比如,它需要非常专业的软件、硬件甚至是维护工程师来进行实施并进行后续的维护。
可以看到,大模型的到来,给数据和存储提出了新的要求。华为分布式存储领域副总裁韩振兴向21世纪经济报道记者表示:“在AI刚兴起的时候,针对小模型,很多客户会找一些服务器的本地盘来解决。但是随着大模型的兴起,需要一个外置的非常灵活扩展的存储。如果数据量载入过慢,会造成建设的算力都在闲置,所以需要一个不仅是外置的存储,而是一个极高性能的新品类和解决方案。”
为了解决这些瓶颈,头部的企业们已经开始牵头进行产业界合作。近期,华为针对不同行业、不同场景大模型应用,推出OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。
其中,前者是面向基础/行业大模型场景,支持96闪存盘,带宽可达400GB/s,IOPS达到1200万;后者面向行业大模型的训练、推理一体化的场景,集成了存储、网络、多样性的计算,降低企业使用AI大模型的门槛。目前,华为的存储产品已在国内的十大模型厂商得到部署,包括科大讯飞、中国科学院等。
据悉,目前全球高端的存储设备厂商主要有三家,分别是华为、戴尔EMC和日立。随着AI大模型日新月异,企业对于高端存储的需求也将更进一步,华为、戴尔、日立等也将在存储的顶级战场上展开新一轮竞争。
业界呼吁重视存力建设
周跃峰向21世纪经济报道记者算了一笔成本账单:在AI的大模型训练过程里,包括数据准备、接入实施等整体成本中,算力的成本占25%左右,即买服务器和GPU;数据准备、清洗与处理这些工作(包括人工)的成本大概占22%。
同时,周跃峰还举了一个例子来说明存储的重要性,由于英文的数字化记录资料远远多于中文,ChatGPT训练英文的效率比中文高很多。他表示,中国如果不重视存力,对未来AI的产业发展以及人工智能的潜力的发挥会有巨大制约作用。
数据显示,预计2025年中国数据量将从7.6ZB增至48.6ZB,超过美国成为全球第一。当前,全球各国都在加快制定国家数据战略,其中,存储技术和产业成为共同关注的战略重点。
虽然AI算力中心不断兴起,但是中国工程院院士、中国科学院计算技术研究所研究员倪光南指出,目前普遍对算力的理解有片面性,广义算力不仅包括算力,还包括存力、运力。当前中国算力中心的存力相对不足,存在重算力轻存力的倾向。
韩振兴也表达了类似观点,他谈道,在算力和存力的建设有一个最佳的算存比,并不是靠推算力就能把AI做好。算力建设过多、存力建设过少,这会导致算力闲置,造成资源的浪费。所以一定要去重视存力,达到一个最佳的整体算存比。
当前国内的存储发展还跟不上数据量的增长。根据倪光南提及的一组数据,中国单位GDP的数据存储量只有美国70%左右,而人均数据存储量,美国是中国的9倍。美国为212GB/人,中国约为25GB/人,说明中国数据存储产业大有可为、前景广阔。
在业界呼吁关注存力建设的同时,国内在政策面也有了更多支持计划。为进一步加快推动我国算力高质量发展,日前工信部新闻发言人赵志国表示,将出台指导算力基础设施高质量发展的政策文件,加大高性能智算供给,加强先进存储产品部署,开展算力网络优化行动,加快构建云边端协同、算存运融合的一体化、多层次的算力基础设施体系。
标签:
-
AI大模型带动存储变革 业界呼吁重视存力建设
AI大模型带动存储变革业界呼吁重视存力建设 眼下,AI大模型正重塑着
-
季勇(关于季勇简述)
,你们好,今天0471房产来聊聊一篇勇,勇简述的文章,网友们对这件事情
-
通州杨洼闸泄洪口被堵,30名消防员移走巨大浮桥残骸
北京日报客户端|记者张宇近期,北京市出现持续强降雨天气,通州区北运
-
农行转账要手续费吗 农行转账
1、农行企业网银单笔转账交易录入的操作:请您登录企业网银,点击“付
-
强军之路 | 超震撼!鲲鹏与飞鲨首次同框
运油-20和歼-15,首次空中加油对接。空军航空兵某师郭政是第一批运油-2
-
暗黑破坏神2重制版符文之语有哪些(暗黑破坏神2符文之语大全1.10版本)
暗黑破坏神2重制版符文之语有哪些?暗黑破坏神2重制版中有许多种符文之
-
高质量发展调研行|湖北襄州:“链”出农业高质量发展新动能
高质量发展调研行|湖北襄州:“链”出农业高质量发展新动能---智能化
-
【中指快评】7月土地市场延续降温态势
【中指快评】7月土地市场延续降温态势,土拍,推地,土地市场,一线城市
-
武警福建总队机动支队官兵在“战位”与家属共庆八一
中新网福州8月1日电(黄祖万涂创林周伟汪喜超)近日,为庆祝中国人民解放
-
正方形周长怎么算边长(正方形周长怎么算)
诸多的对于正方形周长怎么算边长,正方形周长怎么算这个问题都颇为感兴
-
万丰集团董事局主席陈爱莲:民营企业健康稳健发展有了“护身符”
潮新闻客户端记者王燕平国家发改委等部门发布促进民营经济发展28条举措
-
CINNO Research:手机面板传统旺季来临 7月LTPS面板价格率先止跌
7月LTPS面板价格率先迎来止跌,a-Si 柔性AMOLED面板价格也将在Q3’23趋
-
北京暴雨财险报案近7000件,报损金额已达1.66亿元
北京暴雨财险报案近7000件,报损金额已达1 66亿元,报损,车损险,北京市,
-
「港股异动」中国财险(02328.HK)跌3.08%
【财华社讯】中国财险(02328 HK)截至15:17下跌3 08%,现报8 82港元,跌
-
收到灾害预警,我们该用什么态度来对待
“雨大就大去吧,省得去花钱游泳了呢。”日前,面对前来劝说撤离的街道
-
东至县青山乡中心学校党支部:开展庆“八一”慰问退役军人、军属活动
7月31日,东至县青山乡中心学校党支部书记李国灿及委员们一行先后来到
-
备战世预赛 国足9月约战叙利亚队、马来西亚队
原标题:备战世预赛国足9月约战叙利亚队、马来西亚队北京青年报讯(记
-
京津冀强降雨 | 北京房山:全区约6万户停电,将空投食品保障群众生活
2023年8月1日中午,北京市房山区官方微信“北京房山”发布情况通报称,
-
2023年8月1日1#铅价格最新行情预测
中国报告大厅2023年8月1日1 铅价格最新走势监测显示:广东南储有色现货
-
京东与永辉接洽收购事宜?京东回应:目前没有这个意向
新浪科技讯8月1日午间消息,京东方面回应传闻其与永辉接洽收购事宜一事
-
青海华鼎: 截止2023年7月31日公司股东人数为27451名
青海华鼎(600243)08月01日在投资者关系平台上答复了投资者关心的问题。
-
「港股异动」长城汽车(02333.HK)涨3.03%
【财华社讯】长城汽车(02333 HK)截至10:31上涨3 03%,现报10 88港元,
-
市南区以啤酒为媒开启全域欢动模式 促进文旅消费
海湾似镰刀,收割夏日清凉,海湾也似酒杯,装满市南的时尚与烟火,活力
-
山东21个先进典型入选
全国学雷锋志愿服务“四个100”先进典型名单发布山东21个先进典型入选
-
(巴蜀韵 中国风)外国运动员大运村“中医奇遇”:拔罐太神奇了
中新网成都8月1日电 (记者 贺劭清张浪)“拔罐太神奇了!感觉背后
-
慕思股份8月1日快速上涨
以下是慕思股份在北京时间8月1日10:04分盘口异动快照:8月1日,慕思股
-
5.5小时的北冰洋科考“作战”
新华社|作者魏弘毅“拽住了啊!”“慢慢放、慢慢放!”他们的动作,有
-
2023年中国功能文胸行业深度研究及投资战略咨询
本报告由华经产业研究院出品,对中国功能文胸行业的发展现状、竞争格局
-
扎实落实国家助学贷款政策
“终于考进了梦想的大学!”7月下旬,来自广西壮族自治区梧州市的刘尚
-
教大家学交规怎么进行模拟考试的办法
近期学交规怎么进行模拟考试学交规怎么进行模拟考试问题在网上得到了很