DeepSeek 的最新 AI 升级挑战阿里巴巴的 Qwen3 和 OpenAI 的 o3 模型
2025-05-30 19:54 loading...

DeepSeek 推出了 R1-0528,这是这家中国初创公司于今年 1 月发布的 R1 推理模型的重大升级。就在一个月前,阿里巴巴集团控股的 Qwen3 在 LiveBench(开源人工智能模型在线基准测试)中击败了原版 DeepSeek R1。
DeepSeek 升级后的 R1-0528 模型如今在性能上与 OpenAI 和谷歌的领先 AI 模型并驾齐驱。此次回归表明,中国大型科技公司和新兴科技公司正在以惊人的速度改进其 AI 工具。
DeepSeek 在声明中表示,R1-0528 展现出了更佳的推理和创造性写作能力。此次更新还带来了更强大的编码能力。最重要的是,该公司声称该模型现在产生的“幻觉”减少了 50%。
DeepSeek 解释说,这些升级来自于在后训练阶段投入的额外计算能力,工程师在主要训练过程之后对模型进行微调。在后训练阶段,工程师的目标是提高模型的效率,并增强其准确性和安全性。
R1-0528 目前排名仅次于 OpenAI 的 o3 和 o4-mini
在衡量 AI 模型性能的 LiveCodeBench 上,R1-0528目前排名仅次于 OpenAI 的 o4-mini 和 o3 模型。
Hugging Face 的人工智能研究员 Adina Yakefu 表示:“DeepSeek 的最新升级在推理能力上更加敏锐,数学和代码能力更强,并且正在接近 Gemini 和 O3 等顶级模型。”
她补充说,新版本在“推理和减少幻觉方面取得了重大进展”,并证明这家初创公司不仅仅是在追赶,而且还在积极竞争。
在华盛顿限制对华先进芯片和其他技术出口之后,中国取得了快速进展。然而,中国企业仍在不断完善其系统。本月早些时候,百度和腾讯描述了他们在无法获得尖端半导体的情况下如何使其模型更高效运行的方法。
英伟达首席执行官黄仁勋周三批评了出口管制。“美国的政策建立在中国无法制造人工智能芯片的假设之上,”他表示。“这个假设一直值得怀疑,现在显然是错误的。问题不在于中国是否会拥有人工智能。它已经拥有了。”
DeepSeek 将阿里巴巴 Qwen3 8B 模型的性能提高了 10%
DeepSeek 还表示,它将 R1-0528 中使用的推理步骤提炼为阿里巴巴的Qwen38B 基础模型。据该公司称,这一过程创建了一个全新的、更小的模型,其性能比 Qwen3 高出 10% 以上。同时,该模型的体积缩小了 30 倍。
该公司表示:“我们相信 DeepSeek-R1-0528 的思路对于推理模型的学术研究和小型模型的工业工作具有重要意义。”
根据 路透社DeepSeek 的一位代表在微信群中表示,此次调整是一次“小规模的试用升级”,目前已开放公开测试。为了应对更激烈的竞争,谷歌降低了部分 Gemini 接入等级,而 OpenAI 则推出了成本更低的 o3 Mini 型号。
Cryptopolitan 学院:厌倦了市场波动?了解 DeFi 如何助你建立稳定的被动收入。立即注册
相关阅读
-
Cardano (ADA) 的最新进展、有趣的 ETH 价格预测等:5 月 30 日 Bits 回顾区块链资讯 2025-05-30 18:54
-
Puffverse(PFVS)价格预测2025年-2030:未来能达到 1 美元吗?WEB3.0 2025-05-30 18:27
-
比特币最新价格突破10.8万美元:市场波动与投资策略解析币种百科 2025-05-30 18:04
-
XCN显示出强烈的突破信号,因为市场从看跌变为看涨WEB3.0 2025-05-30 15:29
-
什么是全球美元Global Dollar(USDG稳定币)?USDG、USDT和USDC的有什么区别?WEB3.0 2025-05-30 15:28
-
OSMO币怎么买?OSMO币价格最新行情WEB3.0 2025-05-30 15:26
-
莉亚·瓦尔德(Leah Wald)在男性主导的加密货币行业中取得了成功WEB3.0 2025-05-30 12:27
-
莱特币峰会2025在拉斯维加斯开幕WEB3.0 2025-05-30 12:27
-
与集中的AI相比,分散的AI更有可能支持创新和进步,发现新的DCG委托哈里斯民意调查WEB3.0 2025-05-30 12:27
-
USDT和TRON主导着快速增长的Stablecoin支付行业WEB3.0 2025-05-30 12:27