
AMD顶级APU展现实力!锐龙AI Max+ 395跑DeepSeek R1:比RTX 5080快3倍以上

快科技3月18日消息,AMD展示了其最新的锐龙AI MAX+ 395 Strix Halo APU在DeepSeek R1 AI基准测试中的表现,比NVIDIA RTX 5080桌面版显卡高出3倍以上。
锐龙AI MAX+ 395 Strix Halo APU集成了16核、32线程的Zen 5架构处理器、50 TOPS的XDNA 2神经处理单元(NPU)和集成显卡。
RTX 5080显卡仅配备16GB的VRAM,这在处理大型语言模型时成为明显的瓶颈,而Strix Halo APU的128GB统一内存可以灵活分配,最多可将96GB内存转换为显存,使其在处理大型AI模型时具备显著优势。
在实际测试中,AMD使用了包括llama.cpp驱动的应用程序LM Studio在内的多种消费者AI工作负载进行基准测试。
结果显示,当LLM模型大小超过16GB VRAM时,Ryzen AI MAX+ 395的性能优势尤为明显,其性能比RTX 5080高出3.05倍。
即使与更高端的RTX 5090(32GB显存)相比,Strix Halo APU的128GB统一内存依然使其在处理大型模型时占据绝对优势。
AMD表示,锐龙AI MAX+ 395相较于Copilot+竞品的优势主要如下:
性能:
与英特尔Arc 140V相比,最高提升2.2倍的token吞吐量
最高可达4倍于Llama 3.2 3b Instruct等小型模型的首个token生成时间
最高可达9.1倍于7-8B参数模型的速度
14B参数模型最高比英特尔酷睿Ultra 258V快12.2倍
内存:
提供高达128GB的统一内存,而竞争对手的最大仅为32GB
可将高达96GB转换为显存
可运行其他APU无法处理的更大模型,如谷歌Gemma 3 27B Vision