发布时间:2026-06-25
浏览量图标 1次浏览

NVIDIA Blackwell 在 AA-AgentPerf DeepSeek V4 Pro 基準測試中表現優於 AMD MI355X

摘要

Artificial Analysis 推出了 AI 硬體界一直默默等待的東西:一個實際測量晶片在現實世界中處理代理式 AI 工作負載效能的基準測試。這個基準測試名為 AA-AgentPerf,其在 DeepSeek V4 Pro 上的初步結果所揭示的資訊,可能是 AMD 目前並不樂見的。

NVIDIA 的 Blackwell 系統,特別是 B200 和 GB300,在能效代理推理方面持續優於 AMD 的 Instinct MI355X GPU。

AA-AgentPerf 實際測量的內容

這是 Artificial Analysis 專為代理編碼任務的硬體效能設計的首個多供應商開放基準測試。

廣告

基準評估系統在滿足特定服務等級目標時所能支援的併發代理數量。這些服務等級目標涵蓋每秒 20 至 300 個輸出標記的速率,以及 3 至 10 秒的首個標記延遲(TTFT)目標。

與依賴合成評估方法不同,此基準測試利用實際的編碼軌跡。結果隨每個加速器和每兆瓦進行標準化,從而建立一個同時考慮原始性能和能耗的比較框架。

DeepSeek V4 Pro 進入聊天

此基準測試的核心模型為 DeepSeek V4 Pro,自 2026 年 4 月左右發布以來一直備受矚目。它在 GDPval-AA 基準測試中獲得 1554 分,穩居當今表現最出色的開源權重模型之列。

DeepSeek V4 Pro (Max) 在 Artificial Analysis Intelligence Index 上獲得 52 分,在開放權重推理模型中排名第二。

NVIDIA 對比 AMD 以及這對資料中心市場的意義

初始的 AA-AgentPerf 結果清晰地展現了競爭定位。由 B200 和 GB300 系統代表的 NVIDIA Blackwell 架構,在測試的代理工作負載中,每瓦效能優於 AMD 的 MI355X。

每兆瓦的規範化尤其具有說明性。資料中心日益受到的限制不再是機架空間或資本預算,而是電力供應。在每兆瓦電力消耗下能支援更多並行代理的晶片,具有可衡量的實際優勢,並直接反映在最終利潤上。

對於 NVIDIA 而言,這些結果強化了公司圍繞 Blackwell 效率特性的敘事。時機值得注意:性能領先數據是相對於 2026 年 6 月 12 日的爬取日期報告的,這表明 NVIDIA 快速通過其開發者部落格公布有利的結果。

🚀 主流数字货币交易所推荐

安全稳定的交易平台 | 新用户注册享专属福利

Binance币安交易所LOGO

Binance 币安

全球最大加密货币交易所

立即注册 下载APP
OKX欧易交易所LOGO

OKX 欧易

老牌知名数字资产平台

立即注册 下载APP
Bybit交易所LOGO

Bybit

专业合约交易平台

立即注册 下载APP

⚠️ 风险提示:数字货币交易存在风险,请理性投资,谨慎决策

声明:文章不代表币圈子观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部