DeepSeek推出的新模型，号称在智能体AI上超越R1

2025-8-22 06:32| 发布者: dootbear | 查看: 7483| 原文链接

彭博社：DeepSeek推出的新模型，号称在智能体AI上超越R1

DeepSeek发布了对旧模型的更新版本，称其在关键基准测试中超越了标志性的R1，使这家中国初创企业在业界等待下一代旗舰产品时继续保持竞争力。

公司周四在微信发文表示，V3.1能更快回答问题，并标志着该公司迈向打造AI智能体的第一步。

该平台已在Hugging Face上线，并针对新一代国产AI芯片进行了定制优化。

DeepSeek今年1月凭借高性能、低成本的R1震动硅谷，之后一直站在中国AI研发浪潮前沿。

周四，公司还公布了对V3版本的新收费计划，上调部分价格、取消夜间优惠，但降低了部分场景的费用，新方案9月6日生效。

DeepSeek的模型挑战了美国的OpenAI等巨头，显示中国企业即便没有最尖端芯片也能在AI领域取得突破。

业界正等待R1继任者的推出，该机型原定今年早些时候发布。

DeepSeek在微信发文称，DeepSeek-V3.1的UE8M0 FP8精度格式已针对“即将发布的新一代国产芯片”进行优化，但公司未透露具体的芯片型号或制造商。

FP8，即8位浮点数，是一种数据处理格式，可让AI模型更高效运行，用更少的内存并比传统方法更快。

公司在微信中表示，DeepSeek-V3.1采用混合推理架构，使模型能够在推理模式与非推理模式间切换。

用户可通过其官方应用和网页平台上的“深度思考”按钮在两种模式间切换，这些平台已运行V3.1版本。

当地媒体称推迟原因在于创始人梁文峰坚持“要把它做好”，尽管他仍在经营盈利颇丰的高毅资产管理公司。也有人猜测是训练或研发中出现问题。

与此同时，阿里巴巴集团和腾讯控股等对手也在加速AI模型迭代。尤其是阿里巴巴的通义千问（Qwen）系列，已收获广泛人气。

来源：

https://www.bloomberg.com/news/a ... ?srnd=homepage-asia

https://www.reuters.com/world/ch ... support-2025-08-21/

By Bloomberg News
August 21, 2025 at 6:46 PM GMT+10

		自动登录	找回密码
密码			注册