智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
DeepSeek不出手则已(yi),一出手便(bian)轰动国(guo)产智算产业(ye)。
智东西8月22日报道,在DeepSeek-V3.1正式发布并放出“针对即将发布的下一代国产芯片设计”讯息后,今日国内AI芯片概念股一片飘红,寒武纪、海光信息、云天励飞、科德教育(杭州AI芯片企业中昊芯英股东)纷(fen)纷(fen)以20%涨停,多只股票股价创60日新高。
寒(han)武纪尤其势头凌人,股价首(shou)次突破1000元大关(guan),市值首(shou)度突破5000亿元大关(guan),超越海光信(xin)息、中芯国(guo)际登顶科创(chuang)板市值榜,开创(chuang)国(guo)产AI芯片新里程碑。
其(qi)最新价冲到1243.20元(yuan)/股,与贵州茅台仅差220元(yuan)。
这(zhei)一(yi)(yi)切源自沉(chen)寂(ji)2个月(yue)23天(tian)之久的(de)杭州大模型(xing)企业(ye)DeepSeek,昨日正式发(fa)布(bu)新一(yi)(yi)代大模型(xing)DeepSeek-V3.1,宣布(bu)该模型(xing)在(zai)需要(yao)多步(bu)推理的(de)复杂搜索测(ce)试与多学(xue)科专家级难题测(ce)试上(shang),性能已大幅领先(xian)于今(jin)年5月(yue)发(fa)布(bu)的(de)DeepSeek-R1-0528,并放出跟下一(yi)(yi)代国产(chan)AI芯(xin)片有关(guan)的(de)重磅消息:
“DeepSeek-V3.1使用(yong)了UE8M0 FP8 Scale的参数精度。”
“UE8M0 FP8是针对即(ji)将(jiang)发布的下一代国产芯片设计。”
开源页面显示,DeepSeek-V3.1模(mo)型“使(shi)用(yong)UE8M0 FP8 scale数据(ju)格式进行训练,以确保与(yu)Microscaling数据(ju)格式的兼容性”。
Hugging Face地址://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
消息一(yi)出,AI算力产业一(yi)片哗(hua)然。
AI芯(xin)片设计的(de)核心目的(de)是加速AI计算(suan)。模型由(you)参数(shu)组成,参数(shu)用(yong)的(de)位(wei)数(shu)越多,计算(suan)越准(zhun)确,但对应也更(geng)加费时低(di)效。业界一(yi)直在探索通(tong)过采(cai)用(yong)较低(di)精度(du),在不显著牺牲(sheng)模型性(xing)能的(de)情况(kuang)下减少(shao)内(nei)存和带宽的(de)使用(yong),提高计算(suan)速度(du)。FP8表示位(wei)宽位(wei)8的(de)二(er)进制(zhi)浮点(dian)数(shu)。相比FP32/FP16,FP8能减少(shao)50%-75%的(de)内(nei)存占用(yong)。
FP8有多种(zhong)表(biao)示方式,包括E5M2、E4M3、E3M4、E2M5等。DeepSeek提到的“UE8M0”是FP8的一种(zhong)变体,“U”指无符号位(wei),“E8”是8位(wei)指数,“M”指尾数位(wei)。“M0”通过去尾数可减(jian)少(shao)位(wei)宽占(zhan)用,压(ya)缩内(nei)存开销(xiao)。UE8M0用在Scale能够补偿精度(du)。
这种(zhong)策略既能实现更极致(zhi)的(de)(de)计算效(xiao)率(lv)和节省存储资源,又能优化(hua)对国(guo)产AI芯(xin)片的(de)(de)适配,使(shi)大模型能在国(guo)产芯(xin)片上(shang)稳(wen)定(ding)运行,缩小(xiao)与国(guo)际先进芯(xin)片的(de)(de)实际差距(ju)。
而DeepSeek预告的“即将发布的下一代国产芯片设计”,更加引人遐想。
目前仅少数AI芯片支持FP8。英伟达是从Hopper架构Tensor Core开始支持FP8。国内摩尔线程MTT S5000、燧原科技燧原L600等AI芯片产品已原生支持FP8低精度格式。根据招股书,沐曦股份在研的曦云C600也将支持FP8格式。
其(qi)中(zhong)摩尔线程MTT S5000 GPU已大规模量产。据介绍,其(qi)MUSA架构能很好支持UE8M0 FP8 Scale,利(li)用(yong)硬件原生(sheng)FP8,相对于传(chuan)统(tong)的FP16计算可实现2倍的浮点算力提升(sheng)、访(fang)存(cun)和通信带宽(kuan)效率提升(sheng)和存(cun)储容量利(li)用(yong)率提升(sheng),同时最(zui)优化(hua)张量表(biao)达精度。
华为、寒武纪(ji)、海光信(xin)息(xi)等企业的下一代(dai)AI芯片也可能支持FP8。
自今年开年以来,DeepSeek一直在给国内AI芯片产(chan)业及生态(tai)的发展踩油门(men)。
今年2月,在DeepSeek爆火后,华为昇腾、沐曦股份、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能、芯动力科技、墨芯、后摩智能、瀚博、爱芯元智、芯瞳、进迭时空、江原科技、奕斯伟计算等(deng)国(guo)内AI芯片公司(si)相(xiang)继宣(xuan)布适配或(huo)上架DeepSeek模型(xing)服务。
8月,中国信通院发布AISHPerf基准DeepSeek大模型适配测试结果,首批通过DeepSeek适配测试的企业有8家,分别是中国电信、华为、寒武纪、昆仑芯、海光、沐曦、中昊芯英、中科嘉禾,其中华为、寒武纪、昆(kun)仑芯、海光、沐曦、中昊芯英均(jun)有自研(yan)AI芯片(pian)。
中(zhong)国信(xin)通(tong)院通(tong)过(guo)开展(zhan)DeepSeek适配测试工作发现:
- 在适配支持性方面,通过软硬件协同优化,我国参测产品部署DeepSeek模型在语言理解、逻辑推理等典型任务中的精度已基本与国外系统持平。
- 在部署环境方面,我国已有系统实现单机8卡推理DeepSeek 671B满血版模型(INT8/FP8精度),与英伟达所需硬件规模持平,大部分国产设备需两机16卡或四机32卡完成同参数量模型部署。
- 在产品形态方面,硬件芯片、框架平台、云服务等产业链关键主体均积极推动适配工作。国内厂商能够在短时间内完成在软硬件系统上运行无报错的基础适配,目前适配重点主要集中在产品功能及面向业务场景性能的调优阶段。
DeepSeek的(de)产(chan)(chan)业号召(zhao)力显而易见,其新一(yi)代模型支持FP8精(jing)度和国产(chan)(chan)芯片,将推动(dong)国产(chan)(chan)芯片与(yu)AI模型的(de)适配,对国产(chan)(chan)算力芯片落地与(yu)生态发展起(qi)到极为积(ji)极的(de)催化作用(yong)。
受此激励,今日,寒武纪、海光信息、中科曙光、云天励飞、科德教育等5只AI算力芯(xin)片(pian)股集体涨停(ting)。
北京AI芯片上市公司寒武纪今日(ri)20%涨停,最新市值达到(dao)5200.93亿元,在科创(chuang)板市值榜排名(ming)第一。该公(gong)司今年7月宣(xuan)布拟向特(te)定对象(xiang)发行股票募(mu)资39.85亿元,用(yong)于面向大模型的芯片(pian)平(ping)(ping)台(tai)项目、软件平(ping)(ping)台(tai)项目和(he)补充(chong)流动(dong)资金。2025年第一季度(du),寒(han)武纪营收(shou)为(wei)11.11亿元,归母净(jing)利(li)润(run)为(wei)3.55亿元,实(shi)现(xian)盈利(li)。
国产CPU及GPU龙头海光信息今(jin)日20%涨停(ting),最(zui)(zui)新市值为4324.66亿(yi)元,位列科创板市值榜第二。海(hai)(hai)光(guang)(guang)(guang)(guang)信(xin)息(xi)2025年上半年营收为54.64亿(yi)元,归母净(jing)利润为16.39亿(yi)元。今(jin)年5月,海(hai)(hai)光(guang)(guang)(guang)(guang)信(xin)息(xi)发(fa)公告宣布(bu)拟吸收合并国产服务器大(da)厂中(zhong)科曙光(guang)(guang)(guang)(guang)。今(jin)日中(zhong)科曙光(guang)(guang)(guang)(guang)也(ye)以10%涨停(ting),最(zui)(zui)新市值为1211.90亿(yi)元。
深圳AI芯片上市公司云天励飞同(tong)样今(jin)日(ri)飙涨20%,在7月(yue)(yue)世(shi)界人工智能大会期间宣布全面(mian)聚焦AI芯片,并已于(yu)7月(yue)(yue)30日(ri)递表港交所。
油墨上市公司科德教育近年(nian)(nian)来一(yi)直在谋(mou)求转型,除(chu)了(le)切入教育赛道外,还在2023年(nian)(nian)以1.3亿元对(dui)杭(hang)州(zhou)AI芯(xin)(xin)片创企中昊(hao)(hao)芯(xin)(xin)英(ying)进行增(zeng)资及(ji)股(gu)权收购,截至今年(nian)(nian)4月持有中昊(hao)(hao)芯(xin)(xin)英(ying)5.99%的股(gu)权。中昊(hao)(hao)芯(xin)(xin)英(ying)2024年(nian)(nian)营收为5.98亿元,归母(mu)净利(li)润为8590.78万元。
另一家跟中昊芯英相关的上市公司天普股份,今日(ri)开(kai)盘即封死涨(zhang)停板。天(tian)普(pu)股(gu)份昨日(ri)发公告(gao)宣布其控股(gu)股(gu)东天(tian)普(pu)控股(gu)、天(tian)昕贸易(yi)、尤(you)建(jian)义拟合计向中昊(hao)芯(xin)英(ying)转(zhuan)让10.75%股(gu)份,将使中昊(hao)芯(xin)英(ying)和海南芯(xin)繁合计持有天(tian)普(pu)控股(gu)50.01%的股(gu)份,中昊(hao)芯(xin)英(ying)创始人(ren)杨龚(gong)轶凡将成为天(tian)普(pu)股(gu)份的实际(ji)控制(zhi)人(ren)。
持有北京GPU企业摩尔线程1.244%股份的和而泰,今(jin)日股价上涨超(chao)过10%。
其他国产芯片股亦闻风而涨:恒烁股份涨13.30%,景嘉微上涨10.00%,澜起科技上涨8.70%,龙芯中科上涨7.30%,复旦微电上涨6.65%,天德钰上涨6.13%,瑞芯微上涨5.42%,国芯科技、炬芯科技、翱捷科技等涨超4%,北京君正、全志科技、航宇微等涨超3%,晶晨股份、星宸科技、国科微等涨超2%……
算(suan)(suan)力(li)股的(de)(de)暴涨不仅是对(dui)DeepSeek技术(shu)突破的(de)(de)短期反应,还体(ti)现了市场(chang)对(dui)国(guo)产(chan)AI技术(shu)生态长期发(fa)展的(de)(de)信心。随着更(geng)多国(guo)产(chan)先进模型及Agent应用加(jia)速(su)(su)普及、多地政策加(jia)大对(dui)国(guo)产(chan)算(suan)(suan)力(li)支持力(li)度、国(guo)产(chan)替代进程加(jia)速(su)(su),国(guo)产(chan)AI算(suan)(suan)力(li)基础设施产(chan)业链将迎来更(geng)广(guang)阔(kuo)的(de)(de)发(fa)展空间。