当前位置:首页 > 热点关注 > 正文内容

DeepSeek宣布涨价 智能体竞争加剧

2个月前 (08-22)热点关注76

   8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式热点话题。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  

   根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。

  

   此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。

  

   值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。DeepSeek宣布涨价 智能体竞争加剧 DeepSeek宣布涨价 智能体竞争加剧

相关文章

美国通用汽车Q1业绩超预期 成本增加与关税不确定性影响未来规划

   美国通用汽车Q1业绩超预期 成本增加与关税不确定性影响未来规划。美国通用汽车第一季度业绩超出华尔街预期,尽管如此,考虑到成本可能上升以及美国总统特朗普持续推行的汽车关税政策带来的不确...

美方多次主动向中方传递信息想谈 谈判诚意待观察

   5月2日,商务部新闻发言人就中美经贸对话磋商情况回答了记者提问。有记者询问关于美方多次表示正在与中方进行经贸谈判并会达成协议的情况。    发言人表示,中方注意到美...

《一线》 20250501 一线探案 “大师”的预言

   本期节目主要内容: 老赵是个远近闻名的算命先生,他自诩精通占卜,能够帮人预测吉凶。几日前,老赵突发疾病离世,他的离世让全家人陷入到巨大的悲痛之中。而此时,老赵的女儿觉得父亲的死是遭人...

武汉三孩家庭购新房补贴12万 支持多子女家庭购房

武汉三孩家庭购新房补贴12万 支持多子女家庭购房

   4月30日,武汉市住房和城市更新局官网发布了《关于持续巩固我市房地产市场稳定态势的通知》。该通知在优化青年群体住房贷款服务方面,鼓励商业银行面向在汉就业创业的青年群体提供特色化住房贷...

登陆少年演唱会内场 检票指南公布

   2025年TOP登陆少年组合·无所畏计划·演唱会将在晋江第二体育中心主体育馆举办,相关检票指南已经公布。    观演人需携带与购票时提供的对应观演人有效证件一致的身...

业内:巴菲特对科技股持谨慎态度 中美科技竞争重塑估值逻辑

   5月3日,2025年巴菲特股东大会将在奥马哈举行,今年也是巴菲特收购伯克希尔公司60周年。中午12点,凤凰“K说联盟”邀请了国家金融与发展实验室特聘高级研究员邵宇、中航基金副总经理兼...