AIPress.com.cn報(bào)道
1月6日消息,英偉達(dá)稱,其個(gè)人 AI 超算DGX Spark憑借最新的系統(tǒng)更新,在生成式 AI 和復(fù)雜工作負(fù)載處理上實(shí)現(xiàn)了飛躍式進(jìn)步。通過引入全新的NVFP4(4 位浮點(diǎn)數(shù))數(shù)據(jù)格式支持,兩臺(tái)通過 ConnectX-7 互聯(lián)的 DGX Spark 系統(tǒng)在運(yùn)行擁有 2350 億參數(shù)的Qwen 235B模型時(shí),推理速度提升了2.5 倍。
得益于 CUDA 核心的持續(xù)優(yōu)化,Omniverse Isaac Sim 的性能翻倍,而 Qwen3 30B、Stable Diffusion 3.5 等主流模型也獲得了超過 30% 的效率提升。
在英偉達(dá)展示的一個(gè)典型案例中,DGX Spark 與MacBook Pro協(xié)同工作,通過 NVFP4/NVFP8 精度與 RTX 視頻超分辨率(VSR)技術(shù),將 4K AI 視頻的生成時(shí)間從筆記本單獨(dú)運(yùn)行的 8 分鐘縮短至僅 1 分鐘,效率提升高達(dá) 8 倍。而在 3D 創(chuàng)作流(如 RTX Remix)中,用戶可以將繁重的材質(zhì)生成(Texture Generation)任務(wù)卸載至擁有 128GB 統(tǒng)一內(nèi)存的 DGX Spark 上處理,從而釋放主機(jī)的 RTX 5090 顯卡去應(yīng)付更高強(qiáng)度的渲染任務(wù)。
為了進(jìn)一步降低 AI 開發(fā)門檻,英偉達(dá)擴(kuò)展了其DGX Spark Playbooks教程庫,新增了包括 vLLM 推理、本地運(yùn)行 Nemotron-3-Nano、單細(xì)胞 RNA 測序、以及基于 Isaac Sim 的機(jī)器人工作流等七項(xiàng)全新指南。
值得注意的是,原本僅能在云端運(yùn)行的高級(jí)開發(fā)工具Nsight Copilot AI,現(xiàn)在憑借 DGX Spark 強(qiáng)大的 Blackwell 架構(gòu)和 128GB 顯存,已能實(shí)現(xiàn)完全本地化的離線運(yùn)行。這標(biāo)志著開發(fā)者從此擁有了一個(gè)無需聯(lián)網(wǎng)、隱私安全且具備“P級(jí)”算力的個(gè)人 AI 實(shí)驗(yàn)室。
目前,DGX Spark 已正式加入 NVIDIA 認(rèn)證系統(tǒng)計(jì)劃,這意味著它在穩(wěn)定性與兼容性上達(dá)到了企業(yè)級(jí)標(biāo)準(zhǔn)。對(duì)于那些需要在本地微調(diào) 70B 級(jí)別模型或進(jìn)行復(fù)雜物理 AI 仿真的用戶來說,DGX Spark 正在重新定義桌面計(jì)算的極限。(AI普瑞斯編譯)