当前位置:首页 > 热点关注 > 正文内容

DeepSeek-V3.1正式发布 新版本效率大幅提升

2个月前 (08-22)热点关注55

   DeepSeek用户期待的R2模型尚未到来,但V3.1版本已经发布。8月21日,DeepSeek官方公众号宣布最新大语言模型DeepSeek-V3.1正式上线,距离上一个版本DeepSeek-V3-0324已有五个月。

  

   新版本在三个方面进行了升级:混合推理架构、更高的思考效率以及更强的Agent能力。从命名来看热点话题,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。该模型支持两种工作模式——思考模式和非思考模式。面对简单问题时,它以非思考模式快速作答;处理复杂问题时,则切换到思考模式,提供更具深度和逻辑的答案。用户可以通过官方App或网页端的“深度思考”按钮来切换这两种模式。

  

   与之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短时间内给出答案,并且经过思维链压缩训练后热点话题,token消耗量减少了20%至50%,同时保持了与R1-0528相当的任务表现。此外,在非思考模式下,新模型的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的性能。

   通过Post-Training优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1的表现显著优于以往模型。社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了多个知名模型,完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

   随着V3.1的发布,DeepSeek调整了API接口调用价格,并取消了夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens;输出价格调整为12元/百万tokens。DeepSeek还在评论区提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。UE8M0 FP8是针对即将发布的下一代国产芯片设计的。DeepSeek-V3.1正式发布 新版本效率大幅提升 DeepSeek-V3.1正式发布 新版本效率大幅提升

相关文章

两男子参与开盒190余人获刑 侵犯隐私被判刑罚

   周某和唐某以取乐、获利为目的,通过国外社交平台非法获取并发布明星、网红及新闻热点人物的个人信息。截至案发时,二人共参与网络“开盒”190余人。2024年4月30日,杭州市临安区法院以...

电梯内恐吓幼童面具女已道歉 家长诚恳致歉获谅解

电梯内恐吓幼童面具女已道歉 家长诚恳致歉获谅解

   4月28日,福建龙岩龙地华庭小区两名小女孩在电梯内被一名戴面具的女孩阻止关电梯门并多次恐吓。事发后,两名小女孩的母亲向警方报了案。辖区警方当天出警处理此事。   ...

美方多次主动向中方传递信息想谈 谈判诚意待观察

   5月2日,商务部新闻发言人就中美经贸对话磋商情况回答了记者提问。有记者询问关于美方多次表示正在与中方进行经贸谈判并会达成协议的情况。    发言人表示,中方注意到美...

特朗普承认关税影响美物价上涨 玩具和日用品价格飙升

   美国总统特朗普在4月30日的白宫内阁会议上讨论了现行关税政策对美国人生活的影响。他表示,受关税影响,货架可能变空,孩子们以前能买30个玩具,现在只能买两个,而且这两个玩具也会比之前更...

太稳定!申京vs勇士集锦:砍21+14+6+3断将比赛拖入抢七 力克强敌

太稳定!申京vs勇士集锦:砍21+14+6+3断将比赛拖入抢七 力克强敌

   直播吧5月3日讯 系列赛G6火箭115-107力克勇士,大比分3-3将系列赛拖入抢七!本场比赛申京出战37分钟,20投8中,三分2中0,罚球7中5砍下21分14篮板6助攻3抢断,正负...

男子举国旗夜爬石头山众人为他打光 山顶飘扬引欢呼

男子举国旗夜爬石头山众人为他打光 山顶飘扬引欢呼

   5月1日,在宁夏银川的滚钟口风景区,一名游客手持国旗夜爬石头山。周围的游客纷纷用电筒为他照亮上山路。当国旗在山顶飘扬时,现场所有人都欢呼起来。   ...