DeepSeek宣布涨价 智能体竞争加剧
8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式热点话题。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。
根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。
此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。
值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。DeepSeek宣布涨价 智能体竞争加剧 DeepSeek宣布涨价 智能体竞争加剧