当前位置:首页 > 热点关注 > 正文内容

DeepSeek提到的FP8到底是啥 引发AI圈热议

2小时前热点关注5

   DeepSeek提到的FP8到底是啥 引发AI圈热议!DeepSeek V3.1发布后,一则官方留言在AI圈引起轰动。短短不到20个字的留言中提到新的架构和下一代国产芯片,信息量巨大。受此影响,国产芯片企业的股价纷纷上涨,例如寒武纪早盘盘中大涨近14%,总市值跃居科创板头名。半导体ETF也在半天内大涨5.89%。

  

   许多人对UE8M0 FP8这一概念感到困惑。UE8M0 FP8可以拆分为两部分解释。UE8M0是MXFP8路径中的“缩放因子”,而MXFP8是Open Compute Project在2023年发布的8 bit微缩块格式。Open Compute Project是一个由Facebook(现Meta)、英特尔、Rackspace等发起的开源硬件协作计划,旨在通过共享数据中心及服务器设计推动行业效率提升。其成员包括微软、谷歌、亚马逊、AMD、英伟达以及国内的阿里、腾讯、百度等公司。

  

   MXFP8基于FP8建立,将常规浮点格式压缩到8 bit。MXFP8的核心思想是将张量切成固定长度的“块”,为每个块指定一个2的整数次幂作为“缩放因子”,然后将块内所有数值除以这个系数后再写成FP8。这种块级的缩放方式保留了8 bit位宽,同时扩展了可用动态范围。UE8M0中的U表示无符号,E和M分别代表指数位和尾数位分配到的bit数。UE8M0指8个bit全部分配给了指数位。

   采用全指数表示缩放因子的方式有多个好处热点话题。首先,处理器在根据缩放因子复原数据时只需移动指数位,无需进行浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。此外,UE8M0的动态范围覆盖2^(−127)到2^128,为后续块缩放提供了充足空间。它还能解决单尺度FP8无法同时处理大/小值的问题,减少了信息损失。

  

   UE8M0 FP8更适配“下一代国产芯片”。目前,大部分已量产的国产AI加速器仍使用FP16/BF16 + INT8计算通路,未集成完整的FP8乘加单元。但摩尔线 NPU等新款国产芯片已在宣传资料中列出“原生 FP8”或“Block FP8”支持,并与多家厂商联合验证UE8M0格式。虽然下一代国产芯片在HBM/LPPDDR带宽方面仍有差距,但UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统FP32节省75%流量,成为重要优化方向。DeepSeek提到的FP8到底是啥 引发AI圈热议 DeepSeek提到的FP8到底是啥 引发AI圈热议

相关文章

《百家讲坛》 20250428 食物的历史(第一部) 4 “脱胎换骨”的大豆

   本期节目主要内容:作为《孟子》中所赞美的五谷之魂,小小的大豆在漫长的中华历史中,不仅出现在千千万万家的餐桌上,更是历史中重要的组成部分,影响着中华文明的走向。(《百家讲坛》 2025...

震惊!酒店机器人3年亏了8个亿 20亿负债压顶 酒店:不能为酒店节约人工成本!

   酒店机器人3年亏了8个亿    【酒店机器人3年亏了8个亿】近日,北京云迹科技股份有限公司(以下简称“云迹科技...

五一假期高铁宠物托运预约量翻倍:近百只猫狗享受旅途

   4月30日上午10点05分,两只布偶猫从北京南站搭乘G121次高铁列车,与主人一同前往上海度过“五一”假期。中铁快运相关负责人透露,自4月8日开放宠物托运服务预约以来,已有近百只宠物...

董某莹父亲为国企总经理?官方回应 正在核实中

董某莹父亲为国企总经理?官方回应 正在核实中

   近日,北京中日友好医院胸外科副主任医师肖某被举报婚内出轨多人,此事引发了广泛关注。与此同时,该院规培住院医师、协和医学院4+4博士董某莹也成为了焦点人物。   ...

银川无人机烟火秀在览山公园举办 焕新览山多彩文旅季

   4月29日,银川市林草和园林管理局与银川文化旅游发展集团有限公司宣布,览山公园将于4月30日预开园,并于5月1日正式开放。    览山公园因山体沉降实施加固工程后,...

146元一斤!浙江人都出动摘蓬蘽 野果采摘热潮再现

146元一斤!浙江人都出动摘蓬蘽 野果采摘热潮再现

   这几天,你的朋友圈是否被一种红红的野果刷屏了?据观察,山里都红了,不少人都在晒图。对许多杭州人来说,这些红果子是刻在骨子里的儿时回忆。不同镇街的人们给它起了不同的名字,余杭人叫它磨子...