DeepSeek开源第三日 行业影响几何 加速AI计算生态构建【热搜】_商家新闻_微材之窗网
推广 热搜: 广州  SEO  贷款  深圳    网站建设  医院  摩托车  机器人  用户体验 

DeepSeek开源第三日 行业影响几何 加速AI计算生态构建【热搜】

   日期:2025-02-26 23:35:12     来源:互联网    作者:微材之窗网    浏览:2    
核心提示:2月26日,在开源周第三天,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关,偏向技术层面

2月26日,在开源周第三天,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关,偏向技术层面。大模型生态社区OpenCSG创始人陈冉举例说,以前DeepSeek直接提供一个产品并说明其性能,现在则深入探讨实现高性能的具体方法和框架。这些“脚手架”的开源有助于后续生态建设。

DeepSeek开源第三日 行业影响几何

此次发布的关键词是GEMM(通用矩阵乘法),这是一种线性代数中的基本运算。FP8 GEMM是一种使用8位浮点数进行矩阵乘法的操作,适用于深度学习和高性能计算,能在保持高效率的同时减少内存占用和带宽需求。据DeepSeek介绍,DeepGEMM支持传统稠密模型和MoE(混合专家)模型的GEMM运算,为基于英伟达Hopper架构(如H100 GPU)的V3/R1系列硬件提供高效训练和推理支持。

在英伟达Hopper架构的GPU上,DeepGEMM可实现超过1350 FP8 TFLOPS的性能,充分利用了算力。该代码库设计简洁,只有一个核心内核函数,约300行代码,但在大多数矩阵规模上优于专家调优的内核。DeepGEMM通过FP8和硬件级优化解决了大模型计算效率和资源消耗问题,尤其是对MoE模型的支持。开源行为加速了技术民主化,可能成为AI计算生态的基础设施,推动行业向更高效、低成本的方向发展。

FP8作为AI计算的新兴标准,可以加速千亿参数模型的训练,降低显存需求。在边缘设备或云端部署时,FP8的低精度计算能显著提升吞吐量,降低成本。因此,开源DeepGEMM有助于推动FP8生态普及,降低开发者使用门槛,促进更多框架和模型适配FP8,加速行业向低精度计算迁移。此外,DeepGEMM的开源还提供了高效实现MoE模型的参考,可能催生更多应用,如多模态模型和边缘端高效模型。

 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。 微材之窗网对此不承担任何保证责任, 微材之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。

本文地址:http://news.gzbj58.com/311798.html

打赏
 
更多>同类资讯

推荐图文
推荐资讯
点击排行

网站首页  |  付款方式  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  粤ICP备11090451号
免责声明:本站所有信息均来自互联网搜集,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!并不代表本站观点,微材之窗网对此不承担任何相关法律责任!如有信息侵犯了您的权益,请告知,本站将立刻删除。
友情提示:买产品需谨慎
网站资讯与建议:wfzcw@qq.com