77.1%推理性能提升·1000万美元(约145亿韩元)安全支持…谷歌与OpenAI正式展开链上“推理+安全”竞争
2026-02-22 05:08 loading...
领先AI企业谷歌与OpenAI双双推出聚焦“推理性能”与“安全验证”的新工具,正加速针对加密货币与链上生态的竞争。谷歌强化复杂问题解决能力的“Gemini 3.1 Pro”,与瞄准智能合约漏洞的OpenAI“EVMbench”,均被视为能提升加密市场安全与基础设施水平的基础技术。
谷歌通过升级代表模型,发布了“Gemini 3.1 Pro”,并预告其将应用于从消费者服务到企业及开发者工具的整个产品线。此版本尤其强调其在“推理”与“复杂问题解决”性能上的增强。
据谷歌介绍,Gemini 3.1 Pro将前代“Gemini 3 Pro”在ARC-AGI-2基准测试中的得分提升了一倍以上,达到了经验证的77.1%性能。ARC-AGI-2是评估模型解决全新逻辑模式能力的指标,更接近于考察多步骤推理与问题解决能力,而非简单问答。谷歌以此分数为依据,强调Gemini 3.1 Pro已更适合“需要多步骤判断的工作流程”。
此模型同时面向开发者、企业与普通用户部署。开发者可通过Google AI Studio的Gemini API、Gemini CLI、“Google Antigravity”、Android Studio等访问预览版本。企业客户可通过Vertex AI和Gemini Enterprise体验,普通用户则可通过Gemini应用及“NotebookLM”内的Google AI Pro/Ultra订阅来使用新功能。
谷歌解释,此次升级基于近期发布的“Gemini 3 Deep Think”更新。Deep Think专注于针对科学、研究、工程等高精度领域优化的功能,而Gemini 3.1 Pro则在此基础上进一步扩展,旨在实现真正的“智能体工作流”。谷歌计划在预览期间于现实环境中测试各种复合工作流程后,进入全面可用阶段。
考虑到AI正日益应用于复杂的链上数据分析、衍生品清算结构、DeFi协议设计等高难度任务,Gemini 3.1 Pro推理性能的强化也可能对加密市场产生直接影响。预计其在智能合约设计、风险诊断、自动化合规检查等高级任务中的利用率将提高。
OpenAI发布安全专用评估工具
OpenAI发布了针对加密货币代币与智能合约安全的专用基准测试系统“EVMbench”。该工具旨在系统性评估AI代理在发现以太坊虚拟机兼容区块链上代码漏洞、构建实际攻击场景以及最终修复问题方面的能力。
EVMbench是与加密货币专业风险投资公司Paradigm合作开发的。双方着重梳理了EVM兼容链上反复出现的漏洞类型,并将其构建成标准化测试集,以衡量AI模型的实战应对能力。
该基准测试主要评估三大领域:其一,是否能准确捕捉智能合约内部的结构性弱点与逻辑错误;其二,是否能针对发现的漏洞提出实际的攻击路径;其三,是否能提供解决问题的代码修改与防御建议。这超越了传统的简单代码审查水平,是一种同时要求攻击者视角思维与防御者视角修复的结构。
EVMbench的发布与生态系统安全措施的扩大相呼应。OpenAI正扩展其用于智能合约与协议安全研究的专用代理“Aardvark”非公开测试计划,并通过“网络安全资助计划”提供总计价值1000万美元的API积分,以支持防御性研究。该计划特别强调围绕开源项目与关键基础设施,加强安全研究激励。
此次发布距OpenAI近期宣布收购“OpenClaw”仅数日。OpenClaw是一家拥有自主代理与安全领域技术的公司,外界解读此为OpenAI正式结合“自主型AI代理”与网络安全领域的布局。鉴于链上资产与智能合约正成为黑客的主要目标,基于AI的防御体系有望降低整个加密市场的风险溢价。
工具竞争推动生态进化
谷歌的Gemini 3.1 Pro与OpenAI的EVMbench表面上是不同的产品,但都立足于“复杂推理能力”与“实战型安全检查”这一共同轴心。区别仅在于,一个旨在成为自动化复合工作流的通用推理引擎,另一个则专注于针对EVM生态的专业安全基准测试。
预计在加密市场中,高级AI模型将越来越多地承担解读链上数据、分析经济激励结构乃至诊断智能合约漏洞的角色。此次发布的两款工具,正是在这一趋势下强化“推理”与“安全”核心基础设施的方向发展。
短期内市场发生剧变的可能性较小,更大的可能是随着开发者与安全研究人员采用新工具,协议设计与代码验证的标准将逐步提高。随着谷歌与OpenAI的竞争加剧,加密货币与智能合约生态将得以运用更精密的AI工具,这长期看来有望提升链上基础设施的可信度与安全性。
相关阅读
-
100万美元(约14.5亿韩元)72小时“售罄”…XRPL推出首个合规收益产品RLUSDDeFi 2026-02-22 05:08
-
100万美元(约145.1亿韩元)72小时“售罄”… XRPL推出RLUSD收益化及许可型DEX进军机构市场DeFi 2026-02-22 05:08
-
248亿美元(约合35.999万亿韩元)链上RWA… 现任总统特朗普启动"马尔代夫度假村贷款收益"代币化。DeFi 2026-02-22 05:08
-
1.6亿美元(约2321亿韩元)总锁定价值整体迁移… etherfi离开Scroll转投OptimismDeFi 2026-02-22 05:08
-
2.4万亿美元(约3.4788万亿韩元)加密货币市场反弹……面对特朗普“10%关税”构想,ETF资金流出比特币和以太币WEB3.0 2026-02-22 04:25
-
460万美元(约666.31亿韩元)热钱涌入Meme币……Ripple受邀参加白宫“稳定币利息”第三次会议,XRP监管会否迎来变局?WEB3.0 2026-02-22 04:25
-
估计外泄880万美元(约合127.5亿韩元)……IoTeX“Token Safe”异常交易导致IOTX暴跌10%WEB3.0 2026-02-22 04:25
-
7.231亿韩元瞬间蒸发...私钥完好无损,地址被投毒的“地址投毒”诈骗蔓延WEB3.0 2026-02-22 02:29
-
4.909亿美元(约合7.1156万亿韩元)新资金涌入…受阻2000美元的以太坊,蓄势信号增强?竞争币 2026-02-22 02:07
-
管理1.8万亿美元(约2607.3万亿韩元)资产……摩根士丹利正式启动比特币战略,建议配置“2~4%数字资产”竞争币 2026-02-22 02:06