×

评测 迷你AI工作站 锐龙AIMax+395 AMDRadeon8060S 本地大模型

零刻GTR9 Pro迷你主机评测:70亿参数大模型本地畅玩,AI工作站

阿木 阿木 发表于2026-02-15 05:47:36 浏览47 评论0

抢沙发发表评论

有时候我在想,我们到底需要一台多“大”的电脑?

只有看到零刻GTR9 Pro,才知晓,这般如巴掌大小之物(实际上要比巴掌稍大些,足有3L呢),竟然装入了128GB内存,并且还能够将96GB划分给显卡以供其使用。

96GB显存。

什么概念?

我抬起头,看向角落里那台不停地发出轰鸣声音的台式机,于此瞬间,我忽然感觉它好似一头异常笨重的恐龙。

当显存焦虑成为过去式

玩本地大模型的人都有个心病:显存焦虑。

跑去运行个体积为7B的模型,情况还算可以,倘若碰到14B那个级别,就显得有些勉强了,一旦动了念头去尝试一下体积为70B的QWEN3这类玩意,又或者是那个掺和了30B参数的有着视觉功能的模型,拥有8GB、12GB存贮容量的显性存储器立马就会给你点颜色瞧瞧。

数据需要于内存和显存之间来回倒腾呢,慢得如同在硬盘里边搜寻初恋时留下的短信那般呀。

但这个东西,它不讲武德。

UMA统一内存架构,再合上AMD可变显存技术,将内存与显存之间那堵墙直接推倒是了。

96GB啊。

你能够将QWEN3 - 72B完整地塞放入,并且还能够顺便扔几个coder模型作为替代的备用选项。

经过实际测试,当在跑动时,吐字的速度为秒速43.5个tokens,快到使旁人觉着难以置信这究竟是不是集成显卡。

它不是显卡,它是披着集显皮的怪兽

具有40组计算单元的Radeon 8060S,其拥有2560个流处理器。

冷冷冰冰的是数字,然而,滚烫热乎的是3DMark Time Spy跑出的11598分,这一分数,直接将满血140W的RTX 4060狠狠踩在了脚下。

你可能会说,跑分嘛,娱乐一下就好。

然而,当自己瞅见其于《赛博朋克2077》之中,以2.5K分辨率呈现出44帧的画面,又于《黑神话:悟空》高画质状况下,开启FSR后稳定于61帧之际,本人陡然察觉到:游戏本的末日兴许确实来临了。

当然,别太兴奋。

总功耗为95W就摆在那里,当CPU和GPU争抢资源的时候,CPU便只能憋屈地处在大约2GHz的频率上。

然而,换个角度去思索,以1.5kg的机身,去对人家的2.5kg游戏本发起挑战,这自身来说,已然属于降维打击了。

那个叫NPU的小透明

讲真,最开始我觉得NPU就是个噱头。

50 TOPS算力,听着唬人,但能干吗?

直到看见Amuse软件里那个叫XDNA Super的功能。

做出一幅“弹吉他的小熊”的图,使其分辨率为1024x1024 ,NPU暗暗静静在后台之内,将那分辨率提升到了2048x2048。

整个过程251秒,你不盯着看根本发现不了它在干活。

比那种非得你手动去点开的、被称作AI功能的东西,这种有着“润物细无声”特点的加速,高级的程度可不是只高了一个档次哦。

接口多到像在报复社会

存在两个USB4接口,其支持速度为40Gbps,还有两个万兆网口,具备DP2.1功能,同时拥有HDMI2.1,另外设有SD4.0读卡器……

说实话,有点夸张了。

万兆网口一插,这玩意儿立马变身服务器节点。

SD4.0读卡器对视频创作者简直是救命稻草。

而那两个USB4,外接显卡?

好像没必要,毕竟它自己就已经够强了。

但“可以有”和“有没有”是两回事,零刻选择了前者。

所以,它到底是谁?

如果你只是想上网看剧,别买。

浪费。

但要是你属于那种,在半夜三点的时候,还在对模型参数进行调试,因显存不足而近乎抓狂,两眼直勾勾盯着GPU-Z发呆的人——。

这台机器可能是2026年最让你心动的玩具。

具有十六个Zen 5核心,囊括了一百二十八个GB内存,承载着九十六GB显存,携有五十TOPS运算能力的NPU,在三L这个体积范围。

当这些东西塞进一个方盒子里,它就不再是简单的PC了。

这是一种表达,AI工作站,并非肯定非得是那种颜色为黑的,会发光的,运行起来嘈杂得仿佛飞机起飞一般的大型设备。

它可以安安静静地待在你桌上,像个现代艺术品。

然后在你需要的时候,爆发出让那些庞然大物汗颜的能量。

这就是零刻GTR9 Pro。

一个用96GB显存,温柔地解决了所有显存焦虑的小盒子。