DeepSeek推出全新AI推理方法，下一代模型备受期待

2025-04-07 00:23 loading...

摘要 DeepSeek-Grm模型能够胜过现有方法，通过强大的公共奖励模型实现了竞争性能。币圈网报道：

中国人工智能（AI）初创公司DeepSeek近日推出了一种全新的推理方法，市场对其下一代模型的发布充满期待。据报道，该公司通过与清华大学研究人员的合作，成功开发出一种结合生成奖励建模（GRM）和自适应调整技术的方法，从而显著提升了大型语言模型（LLMs）的推理能力。

根据报告，一篇最新发表的研究论文详细介绍了这一技术突破。该方法使DeepSeek开发的模型能够为各种查询提供更快、更准确的结果，极大优化了用户体验。

DeepSeek揭示新的AI推理方法

研究人员表示，新开发的DeepSeek-Grm模型在性能上超越了现有的多种方法，并通过强大的公共奖励模型实现了竞争性表现。奖励建模是一种帮助大型语言模型理解人类偏好的关键技术。此外，DeepSeek计划将GRM模型开源，但尚未公布具体的时间表。

这篇学术论文引发了业界对DeepSeek下一步动作的广泛猜测。此前，该公司凭借DeepSeek V3基础模型和R1推理模型获得了全球关注。尤其是今年早些时候发布的R1模型，因其性能优于包括OpenAI早期ChatGPT模型在内的多款产品而备受瞩目。

值得注意的是，R1模型不仅开源，还以远低于其他AI模型的成本运行，这让硅谷的技术巨头们感到意外。尽管近期市场关注度有所下降，但竞争对手们的快速进步表明，AI行业的竞争正进入白热化阶段。

然而，路透社上个月的一份报告提到，DeepSeek可能正在开发R1的继任者——DeepSeek-2。据知情人士透露，该公司可能会在本月底发布这一新模型，以进一步巩固其在AI行业的地位。不过，DeepSeek官方目前对R2模型保持沉默，并未回应相关传闻。

V3模型的开发持续推进

总部位于杭州的DeepSeek由企业家梁文峰于2023年创立，在过去几个月中因技术创新成为全球焦点。尽管如此，该公司选择低调行事，将所有资源集中于研发工作。虽然外界传言不断，但DeepSeek显然在稳步推进其技术布局。

上个月，DeepSeek宣布了其最新的开发成果，推出了升级版V3模型，名为DeepSeek-V3-0324。据公司介绍，这一升级版本具备“增强的推理能力、优化的前端网络开发以及改进的中文写作能力”。今年2月，DeepSeek开放了五个代码存储库，供开发者审查和贡献代码，展现了其对透明度和技术共享的承诺。

同月，梁文峰发表了一项关于本地稀疏注意力技术的研究，旨在提高大型语言模型处理海量数据时的效率。这位40岁的企业家同时也是DeepSeek母公司高级Quant的创始人。这家对冲基金为DeepSeek的技术研发提供了坚实的资金支持。今年2月下旬，梁文峰作为科技企业家代表之一，参加了由中国国家主席习近平主持的研讨会。会上，习主席高度赞扬了DeepSeek在面对美国遏制中国AI技术发展时所展现出的韧性。

加密大都会学院：即将推出 - 一种新的方式，在2025年通过DeFi赚取被动收入。了解更多