资讯在沃

当前位置：沃资讯 > 游戏 > 正文内容

美团INT8量化技术：老型号GPU也能满血运行DeepSeek R1

发布时间：2025-03-07 19:25 来源：ITBEAR 作者：杨凌霄

近期，美团技术团队传来新进展，他们成功对DeepSeek R1模型实施了INT8精度量化处理，此举意味着该模型将不再受限于特定型号的GPU，能够在更多设备上实现高效部署。

自DeepSeek R1发布以来，众多企业和个人用户纷纷尝试部署其满血版本。然而，该模型原生版本的权重格式为FP8，这一格式对GPU芯片类型有着严格要求，仅支持英伟达的新型GPU，如Ada和Hopper架构芯片，而像A100这样的老型号GPU则无法直接部署。

面对这一挑战，用户曾尝试将FP8权重反量化为BF16权重，以便在A100等GPU上进行推理。然而，这种方法不仅将显存需求提升了一倍，还导致了推理吞吐量的下降。这显然不是最优解。

为了打破这一僵局，美团搜索和推荐平台部技术团队决定对DeepSeek R1模型进行INT8精度量化尝试。经过努力，他们惊喜地发现，量化后的模型在精度上几乎没有损失。这一发现为DeepSeek R1的广泛应用打开了新的大门。

通过INT8量化，DeepSeek R1模型成功解锁了芯片限制，现在可以在A100等其他型号的GPU上部署。与BF16格式相比，INT8量化后的模型在推理吞吐量上实现了50%的提升，进一步降低了推理成本。这对于那些希望在不同硬件环境中部署DeepSeek R1的用户来说，无疑是一个重大利好。

美团技术团队已经将量化代码开源到了LLM推理框架SGLang上，供行业内外人士参考和使用。同时，量化后的DeepSeek R1模型也已经在Hugging Face社区发布，用户可以直接下载和使用。这一举措无疑将促进DeepSeek R1模型的广泛应用和进一步发展。

对于对DeepSeek R1模型量化过程感兴趣的用户，可以查阅美团官方发布的技术报告，以获取更详细的信息和了解背后的技术原理。

更多>同类内容

RTX 5060系列新卡即将官宣，上市还需等待一个多月？

03-07

英国玩家有福！索尼PlayStation推出PS5等设备月租计划

03-07

索泰RTX 5070 XGAMING OC显卡图赏：白色涂鸦风格，散热性能再升级！

03-07

焕新Model Y试驾体验：性能依旧强劲，舒适性配置升级更贴中国消费者

03-07

小米SU7 Ultra汽车设计手稿曝光，细节之处尽显匠心独运！

03-07

华硕ProArt创16 2024：AI专业创作本，助力创意工作事半功倍！

03-07

RTX 50笔记本ROP单元问题引关注，NVIDIA官方紧急回应

03-07

小米汽车交付超18万，SU7 Ultra爆单！下款YU7能否再成爆款？

03-06

罗永浩力挺雷军：新能源车绿牌或拖设计后腿？

03-06

真我MWC25展新招：手机影像革新，可更换镜头概念机引关注！

03-06

蓝宝石RX 9070 XT显卡美图鉴赏：纯白外观彰显科技美学

03-06

索泰RTX 5070 SOLID OC显卡图赏：硬朗线条，散热强劲，性能如何？

03-06

MWC 2025智能手机新潮流：传音领跑，五款奇特新机闪耀登场

03-06

vivo Y300 Pro+电池容量破7300mAh，性能再升级？

03-06

RTX 5070一卡难求还加价，RX 9070系列却货源充足原价售

03-06

点击查看更多 +

全站最新

努比亚Flip 2小折叠新机亮相：AI萌宠、双屏预览，售价2899元起！

努比亚Flip 2小折叠新机亮相：AI萌宠、双屏预览，售价2899元起！

RTX 5060系列新卡即将官宣，上市还需等待一个多月？

RTX 5060系列新卡即将官宣，上市还需等待一个多月？

本田中国2月销量大跌，新能源汽车转型慢成主因？

本田中国2月销量大跌，新能源汽车转型慢成主因？

RTX 50系列游戏本将至，是该等还是入手RTX 40？一文解析帮你决定

RTX 50系列游戏本将至，是该等还是入手RTX 40？一文解析帮你决定

小米澎湃OS 2月狂发355版，超级小爱等新功能全面上线！

小米澎湃OS 2月狂发355版，超级小爱等新功能全面上线！

英国玩家有福！索尼PlayStation推出PS5等设备月租计划

英国玩家有福！索尼PlayStation推出PS5等设备月租计划

影驰RTX 5070 FIRE显卡开箱：暗黑机械风，小机箱玩家的轻薄新选择

影驰RTX 5070 FIRE显卡开箱：暗黑机械风，小机箱玩家的轻薄新选择

一加 13旗舰新体验：硬件强劲，细节优化，极致享受等你来探

一加 13旗舰新体验：硬件强劲，细节优化，极致享受等你来探

热门内容

本栏最新

RTX 5060系列新卡即将官宣，上市还需等待一个多月？

RTX 5060系列新卡即将官宣，上市还需等待一个多月？

英国玩家有福！索尼PlayStation推出PS5等设备月租计划

英国玩家有福！索尼PlayStation推出PS5等设备月租计划

索泰RTX 5070 XGAMING OC显卡图赏：白色涂鸦风格，散热性能再升级！

索泰RTX 5070 XGAMING OC显卡图赏：白色涂鸦风格，散热性能再升级！

焕新Model Y试驾体验：性能依旧强劲，舒适性配置升级更贴中国消费者

焕新Model Y试驾体验：性能依旧强劲，舒适性配置升级更贴中国消费者

小米SU7 Ultra汽车设计手稿曝光，细节之处尽显匠心独运！

小米SU7 Ultra汽车设计手稿曝光，细节之处尽显匠心独运！

华硕ProArt创16 2024：AI专业创作本，助力创意工作事半功倍！

华硕ProArt创16 2024：AI专业创作本，助力创意工作事半功倍！

RTX 50笔记本ROP单元问题引关注，NVIDIA官方紧急回应

RTX 50笔记本ROP单元问题引关注，NVIDIA官方紧急回应

小米汽车交付超18万，SU7 Ultra爆单！下款YU7能否再成爆款？

小米汽车交付超18万，SU7 Ultra爆单！下款YU7能否再成爆款？

沃资讯门户 · 资讯在沃千万用户的默认资讯主页合作微信：netspread（注明:沃资讯）
Copyright © wwo.com.cn All rights reserved. 鲁ICP备11015305号-23