首页 > 资讯 > 商家新闻 > DeepSeek开源第三日行业影响几何加速AI计算生态构建【热搜】

DeepSeek开源第三日行业影响几何加速AI计算生态构建【热搜】

日期：2025-02-26 23:35:12 来源：互联网作者：微材之窗网浏览：28

核心提示：2月26日，在开源周第三天，DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关，偏向技术层面

2月26日，在开源周第三天，DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关，偏向技术层面。大模型生态社区OpenCSG创始人陈冉举例说，以前DeepSeek直接提供一个产品并说明其性能，现在则深入探讨实现高性能的具体方法和框架。这些“脚手架”的开源有助于后续生态建设。

DeepSeek开源第三日行业影响几何

此次发布的关键词是GEMM（通用矩阵乘法），这是一种线性代数中的基本运算。FP8 GEMM是一种使用8位浮点数进行矩阵乘法的操作，适用于深度学习和高性能计算，能在保持高效率的同时减少内存占用和带宽需求。据DeepSeek介绍，DeepGEMM支持传统稠密模型和MoE（混合专家）模型的GEMM运算，为基于英伟达Hopper架构（如H100 GPU）的V3/R1系列硬件提供高效训练和推理支持。

在英伟达Hopper架构的GPU上，DeepGEMM可实现超过1350 FP8 TFLOPS的性能，充分利用了算力。该代码库设计简洁，只有一个核心内核函数，约300行代码，但在大多数矩阵规模上优于专家调优的内核。DeepGEMM通过FP8和硬件级优化解决了大模型计算效率和资源消耗问题，尤其是对MoE模型的支持。开源行为加速了技术民主化，可能成为AI计算生态的基础设施，推动行业向更高效、低成本的方向发展。

FP8作为AI计算的新兴标准，可以加速千亿参数模型的训练，降低显存需求。在边缘设备或云端部署时，FP8的低精度计算能显著提升吞吐量，降低成本。因此，开源DeepGEMM有助于推动FP8生态普及，降低开发者使用门槛，促进更多框架和模型适配FP8，加速行业向低精度计算迁移。此外，DeepGEMM的开源还提供了高效实现MoE模型的参考，可能催生更多应用，如多模态模型和边缘端高效模型。

标签： DeepSeek开源第三日行业影响几何

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。微材之窗网对此不承担任何保证责任, 微材之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://news.gzbj58.com/311798.html

打赏

更多>同类资讯

推荐图文

小米16系列盲约启动	“麒麟芯片”再度现身
陈祥榕妈妈和王伟遗孀	警医联动跪地抢回跳停

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,微材之窗网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：wfzcw@qq.com

DeepSeek开源第三日 行业影响几何 加速AI计算生态构建【热搜】

DeepSeek开源第三日行业影响几何加速AI计算生态构建【热搜】