开云体育

DeepSee开云体育k-V31发布:专为国产AI芯片设计浮点数格式

2025-08-26
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!8月21日消息,DeepSeek今天正式发布了DeepSeek v3.1版,这版整合了思考和非思考模型,各方面表现大幅提升,继续坐稳开源大模型榜首位置。

  不过DeepSeek这次还准备了更大的惊喜,那就是官宣支持下一代国产AI芯片,在官方公众号的评论中,DeepSeek明确提到UE8M0 FP8是即将发布的下一代国产芯片设计。

  从DeepSeek这番表态来看,有2个重点,一个是支持了FP8,一个是支持了下一代国产AI芯片,先说第一点UE8M0 FP8,这指的是指数位8位、尾数位0位的FP8子格式,这是专为矩阵乘法等AI核心运算优化设计的精度格式。

  目前NVIDIA的AI芯片早已支持FP8甚至FP4,而国产的很多AI芯片还没做到这一点,支持的还是FP16格式,而FP8精度更低,性能更强,同样的面积下性能至少翻倍,功耗也大幅降低,只有FP16的1/4,同时对带宽的要求也更低,优势明显。

  第二点则是DeepSeek确认支持下一代国产AI芯片,而且还是即将发布的,虽然他们没有明确说明是哪家的,但很容易猜到是谁家的AI芯片,大家等着看就好了。

  DeepSeek 在软硬件协同优化方面的战略布局,也让人不禁思考:在AI芯片竞争日趋激烈的背景下,国产新芯是否真的能够借此实现技术破局?

  从技术层面来看,FP8(8位浮点数)并非全新概念。它属于IEEE浮点算术标准中的一种数据类型,相比传统FP16或FP32,能在保持相对较高数值精度的同时,显著减少内存占用和计算开销,尤其适合大规模AI推理与训练。而“UE8M0”这一命名,则体现出其定制化特性。根据官方表述,它针对国产芯片架构做了专门优化。这一点至关重要,因为它不仅涉及算法与硬件的适配,更可能影响到整个AI计算生态的构建。

  目前,全球AI芯片市场仍由英伟达(NVIDIA)主导,其GPU配合CUDA生态几乎成为大模型训练的事实标准。而国内虽有多家企业投入AI芯片研发,如华为昇腾、寒武纪、天数智芯等,但在软件栈、开发者工具、模型兼容性等方面仍面临挑战。DeepSeek 此次明确将模型精度与“国产芯片”进行绑定,显示出一种推动国产化全栈技术发展的意图。通过从模型层面主动适配新型硬件,或许能在一定程度上缓解国产芯片在生态支持上的不足。

  此外,DeepSeek-V3.1 本身也体现出显著的技术进步。据官方信息,其Base模型在V3基础上新增训练了840B tokens,模型规模与性能进一步提升。同时,团队将Base模型及经过后训练的完整模型均在Hugging Face和魔搭ModelScope平台开源,体现出较强的开放性和社区共建意识。这一做法有助于吸引更多开发者参与测试、优化乃至应用于实际场景,从而加速技术迭代与应用落地。

  然而,能否真正实现“破局”,仍存在多方面挑战。首先,国产芯片在制程工艺、内存带宽、互联技术等硬件基础上与国际顶尖水平仍存差距。其次,软件生态的成熟非一日之功,需要芯片厂商、算法公司、应用开发者共同长期投入。再者,国际市场政策环境的不确定性,也可能影响相关技术的全球推广与合作。

  总体来看,DeepSeek 此次发布不仅是一次模型升级,更可视为对国产AI计算体系的一次重要推动。通过模型与芯片的协同设计,有望在特定场景下实现更高效的计算,并逐步减少对国外技术的依赖。但能否真正打破现有市场格局,仍需看后续硬件性能、软件适配、开发者接受度以及商业落地等多方面的实际表现。

  国产芯片的崛起绝非单点突破所能实现,它需要产业链上下游的紧密配合与持续创新。DeepSeek-V3.1 及其所代表的软硬件协同策略,或许正是这条长路上的重要一步。

搜索