当前位置:首页 > 热点关注 > 正文内容

DeepSeek宣布涨价 智能体竞争加剧

2小时前热点关注5

   8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式热点话题。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  

   根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。

  

   此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。

  

   值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。DeepSeek宣布涨价 智能体竞争加剧 DeepSeek宣布涨价 智能体竞争加剧

相关文章

山西男篮拉拉队被处以严重警告 干扰比赛受罚

山西男篮拉拉队被处以严重警告 干扰比赛受罚

   北京时间4月30日,CBA官方发布公告,山西男篮拉拉队因在比赛中干扰北京首钢队罚球,且经劝阻后仍未改正,被严重警告,并取消其优秀拉拉队评选资格。此外,拉拉队负责人刘晶因在个人抖音账号...

一季度印度智能手机出货量下降7% 高端市场需求强劲

一季度印度智能手机出货量下降7% 高端市场需求强劲

   5月1日,调查机构CounterPoint Research发布最新报告显示,2025年第一季度,印度智能手机市场出货量同比下降7%,但高端市场需求依旧强劲,品牌竞争格局出现新变化。...

爱彼迎Q1营收23亿美元 高于市场预期 净利润超预期

   当地时间5月1日,爱彼迎发布了第一季度财报。财报显示,该公司每股收益为0.24美元,高于预期的0.23美元;营收达到23亿美元,超出预期的22.5亿美元;净利润为1.54亿美元,也高...

6旬大爷光脚夜跑一路领先00后大学生 真青年来了!

6旬大爷光脚夜跑一路领先00后大学生 真青年来了!

   昨晚,在浙江大学玉泉校区的操场上,一位光脚跑步的老人吸引了所有人的目光。这位名叫裘惠焕的大爷已经60岁了,他穿着运动背心,脚上只有一双磨得发亮的袜子,却以轻盈的步伐连续超越了多名年轻...

《百家讲坛》 20250502 食物的历史(第一部) 8 玉米养大的帝国

   本期节目主要内容:自明朝传入中国,玉米就以“生命斗士”的姿态在中华大地深深扎根,在炊烟中幻化出千般滋味。从北方热气腾腾的玉米粥,到南方清甜软糯的煮玉米棒,百年沧桑,这份质朴的香甜仍然...

老外也来挤“五一”了 体验中国式旅游新热潮

老外也来挤“五一”了 体验中国式旅游新热潮

   都说中国人爱在假期“报复性旅游”,没想到今年五一,一群金发碧眼的老外也加入了中国景区的人潮中。他们不逛埃菲尔铁塔,不挤东京银座,反而在中国景区啃煎饼果子、学广场舞——原来“中国式旅游...