分类分类
关注+2025-03-28作者:xy
3月28日消息,腾讯云AI代码助手最新宣布,正式搭载DeepSeek-V3-0324顶级模型。
无需配置,下载/更新AI代码助手插件即可用,官方号称开发效率能直接提升100倍。
腾讯云AI代码助手正式搭载DeepSeek-V3-0324顶级模型" src="http://pic.chinaz.com/2025/0328/2025032807573846790.jpg" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid black; --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>
DeepSeek-V3-0324是DeepSeek-V3系列的小版本迭代,模型参数从初代V3的6710亿小幅增至6850亿,依然采用混合专家(MoE)架构,每个token激活约370亿参数,在推理、编程、数学、中文处理等多个领域达到行业领先水平。
甚至最近讨论火热的7米甘蔗过2米门”AI测试题也能自主发现隐藏解法,给出合理答案。
腾讯云AI代码助手正式搭载DeepSeek-V3-0324顶级模型" src="http://pic.chinaz.com/2025/0328/2025032807573846791.jpg" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid black; --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>
腾讯总结了DeepSeek-V3-0324的五大强项:
创新的训练策略
-采用无辅助损失的负载均衡,避免传统方法的性能损失
-多token预测训练提升推理速度,FP8混合精度训练显著降低计算成本
-在超大规模模型上验证FP8训练的有效性,提高训练效率
优化的MoE架构
-动态调整偏差项,防止路由崩溃,性能提升15%以上
-节点受限路由机制减少跨节点通信流量至1/3,结合FP8调度与RDMA优化,训练效率提升40%
-支持128K超长上下文,可处理50页PDF或完整代码库,多轮对话记忆更强
综合能力大幅提升
-关键指标突破性进步,在各项权威基准测试中相较于初代V3,在关键指标上展现了突破性进步。
MMLU-Pro:75.981.2( 5.3)-多领域知识理解能力
GPQA:59.168.4( 9.3)-专业问答能力
AIME:39.659.4( 19.8)-数学竞赛解题能力,进步最为显著
LiveCodeBench:39.249.2( 10.0)-代码生成与调试能力
-数学推理能力突出,AIME竞赛正确率提升近20%,超越Grok3
顶尖的编程生成能力,代码生成质量达到行业顶尖水平
-单一提示词中,可精准生成800行无错误网页代码(含动态交互,视觉美观)
-代码可运行率92%,支持20 编程语言,前端开发效率提升80%
-在kcores-llm-arena评测超越Claude 3 Sonnet普通版
高效的推理与开发者体验
-推理任务显著提升,借鉴DeepSeek R1模型训练技术,上线每秒20 token生成速度(M3 Ultra设备),响应比前代快40%
-智能补全、代码纠错、API兼容性检测等功能大幅提升开发效率
-支持复杂逻辑问题(如7米甘蔗过2米门),自主发现隐藏解法
相关文章
更多+相同厂商
热门推荐
点击查看更多
点击查看更多
点击查看更多
说两句网友评论