不久前的5月底,GPU圈迎來一則重磅新聞,礪算科技旗下首顆GPU芯片宣告點亮,一度引發種種猜測與討論。
回望過去幾年,在“國產替代”驅動下,國產GPU在特定領域初步解決了“從無到有”的生存問題。但“從無到有”僅是起點,硬件效率提升和軟件生態建設尚需時日。
在此背景之下,礪算GPU才憑借全自研、高性能的預期獲得廣泛關注。
令人振奮的是,“點亮”僅兩個月,礪算GPU便快速邁過從實驗室到實際應用的門檻。
7月26日,“砥礪算芯 超越極限”礪算科技產品發布會在上海召開,礪算正式發布首款GPU芯片“7G100”系列和首款顯卡產品Lisuan eXtreme系列。
從礪算科技大膽秀出的游戲和專業應用視頻來看,這款諧音“奇跡100”的國產新銳GPU,已搶先經歷從“能用”到“好用”的蛻變。
堅持全自研技術路線,礪算首顆GPU登場
國產GPU的進階之路,開始于底層技術的實質性突破。
自研架構、先進制程、先進封裝,通過這些硬核技術的累積,國產GPU在峰值算力(TFLOPS)、能效比(TOPS/W)等關鍵指標上不斷提升,為其在更廣闊場景下“好用”奠定了物理基礎。
而礪算7G100系列GPU,就是國產自研GPU的典型代表。
據礪算科技在發布活動現場介紹,礪算7G100系列GPU從計算核心到指令集完全由自主設計,基于自研TrueGPU天圖架構,并自研指令集、自研軟件棧,非市場中常見的通過采購Imagination等現成IP授權,完全掌握著GPU架構的自主權。
公開信息顯示,礪算科技由硅谷GPU先驅S3 Graphics創始團隊成員宣以方領銜,團隊平均從業超過18年,擁有著15代以上GPU迭代量產經驗。
S3 Graphics是GPU歷史上的首個市場“霸主”,在上世紀九十年代初推動GPU市場進入2D圖形硬件加速時代。礪算科技創始團隊S3 Graphics的背景,讓這家中國GPU企業從初創之日起,就自帶傳奇性。如今,其首款GPU終于開啟揭幕時刻。
整體來看,7G100系列GPU既在技術參數上對標國際先進水平,也在技術創新上建樹頗深:7G100除了在提升GPU使用效率和負載均衡上下足功夫,還支持NRSS技術,直接對標目前國際主流的DLSS和FSR技術,支持到16路虛擬GPU,擴展性拉滿。
礪算eXtreme系列顯卡在大型游戲、專業應用、AIPC等領域的實測展示,更讓與會者連連驚嘆這款國產GPU的真實實力。有意思的是,為破除潛在市場疑慮,礪算產品發布會上展示的視頻多為真機直拍,力求不摻一點“水分”。
頂尖與務實兼具,打造中國高性能圖形GPU樣本
那么,在行業中被視為“有望成為國內圖形渲染GPU最快商業化落地企業”的礪算科技,到底能夠交出什么樣的產品力答卷呢?
先來看看技術指標:
一方面,礪算7G100系列GPU效率表現優異。
該產品最多可同時運行48個沒有依賴的任務,無需等待,能夠最大化GPU使用效率,實現“智能多任務處理”;通過打破三角形渲染的順序限制,在不依賴順序的場景下提升50%渲染效率,實現“智能亂序渲染”;支持FP32或INT32的指令雙發射,實現“硬件級智能分配”;在矩陣內存布局優化層面,礪算7G100系列GPU將矩陣數據以方塊形式存儲,更貼近實際使用模式,優化40%顯存使用效率。
另一方面,礪算7G100系列GPU展現出超強“平衡性”。
比如在平衡GPU負載上,通過硬件自動檢測與任務智能分配系統,GPU將巨量的3D渲染和通用計算任務劃分為更小的子任務,依據當前硬件負載情況動態分配給計算單元,實時平衡負載;在平衡GPU處理器資源上,由于Texture Unit和Load Store Unit的工作量往往不均衡,GPU通過TEX/UAV指令任務動態均衡系統,自動監控并調整任務分配,智能優化數據流,消除因應用程序偏好而導致的資源不均衡。
此外,礪算7G100系列GPU拓展性表現達到國際主流、國內領先。
例如,前面提到的支持NRSS動態優化渲染畫質,實現對英偉達DLSS技術和AMD FSR技術的對標。另外,7G100支持SRIOV技術,最多支持16路虛擬GPU,能夠為云端應用部署提供更多可能性。
可以看到,礪算7G100系列GPU以融合創新為特質,展現出了多重性能優勢。
再來看看Lisuan eXtreme系列顯卡的實際表現,需要指出,該顯卡在發布會現場的實測演示堪稱亮眼。
據現場演示視頻,不論是以FireStrike、Steel Nomad為代表的Benchmark跑分成績,還是在《黑神話 悟空》、《古墓麗影 暗影》等大型游戲上,亦或者是在渲染軟件Blender、視頻編輯軟件剪映等專業應用上,Lisuan eXtreme系列顯卡均表現驚艷。
根據實測,Lisuan eXtreme系列顯卡FireStrike跑分達26800,Steel Nomad跑分達2268。
作為對比,英偉達的RTX 4060的Fire Strike Extreme模式下得分為12765、Steel Nomad成績大概在2302。
另外,根據Geekbench最新曝光的測試數據顯示,搭配的AMD銳龍5 7600 CPU的平臺上,礪算G100在OpenCL得分為111,290分,高于英偉達的RTX 4060的101028分。
綜合來看,Lisuan eXtreme系列顯卡已經達到了英偉達RTX 4060的水平。
在實際游戲體驗上,Lisuan eXtreme系列顯卡運行國產3A大作《黑神話·悟空》的平均幀率也能夠達>70FPS(分辨率設置為:1080P,畫質:高)。
Lisuan eXtreme系列顯卡運行《古墓麗影:暗影》平均幀率也>80FPS。
讓人驚喜的是,新鮮出爐的國產第二款3A大作《明末:淵虛之羽》在礪算科技的顯卡上同樣能夠流暢運行??紤]到該游戲在7月24日才正式上線,對于兩天之后的礪算產品發布會而言,礪算工程師團隊顯然沒有時間針對這款游戲做特別優化,這充分證明了礪算顯卡強大的性能和良好的軟件兼容性。
與此同時,在當下熱門的大模型應用上,Lisuan eXtreme系列顯卡可以完全滿足個人AIPC對DeepSeek和文生圖等模型的需求。
礪算科技CEO宣以方表示,Lisuan eXtreme系列顯卡除了聚焦PC游戲、專業應用、AIPC,還會在云游戲、云渲染、數字孿生、虛擬/增強現實、智能座艙、具身機器人等領域廣泛應用。
根據產品發布會信息,Lisuan eXtreme系列顯卡包含專業版和消費級兩大類。其中,專業級顯卡采用的是7G105 GPU,集成了24GB GDDR6顯存;消費級顯卡采用的是7G106 GPU,集成的是12GB GDDR6。
預計eXtreme系列顯卡送樣時間為2025年8月,啟動量產時間為2025年9月。
近些年來,國產GPGPU正通過廣泛且深入的實際部署得到驗證,相關應用不再局限于早期政策驅動的政務桌面替代。但不可否認,在游戲、專業視覺渲染、數字孿生、工業設計與仿真等領域,國產尚未有一款合格的圖形GPU可以獲得行業客戶普遍認可和大量訂單。而這些真實、復雜的應用場景,恰恰是檢驗國產圖形GPU是否真正“好用”的終極考場。
從礪算7G100系列GPU已經展露出的技術實力看,礪算產品的競爭力已嶄露頭角,他在PC游戲、專業應用、AIPC等應用領域實力凸顯,很有希望能夠填補國產高性能圖形GPU的空白,并為行業提供數字孿生工廠、數字孿生城市等應用的國產方案。
未來,以礪算科技為代表的中國GPU企業,還會給GPU市場帶來哪些驚喜和突破?