壁仞推出全球最大算力晶片,號稱以7nm超越英偉達4nm最新GPU

問芯voice 發佈 2022-08-09T18:51:58.087654+00:00

壁仞在發布會上表示,正式發布首款通用GPU晶片BR100,採用7nm工藝技術,號稱世界上最大算力晶片,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單晶片峰值算力達到PFLOPS級別。

作者 | 連于慧


業界給壁仞創辦人張文很多稱號:「中國第一大獵頭」(找了英偉達、海思、高通、AMD等高手加入)、「融資機器」(累積募資47億人民幣)。這些稱號的背後,更代表數以千計雙眼睛在盯著看:花了三年時間的壁仞究竟會端出什麼樣的菜色?在 8月9日的發布會上,壁仞給出答案。


壁仞在發布會上表示,正式發布首款通用GPU晶片BR100,採用7nm工藝技術,號稱世界上最大算力晶片,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單晶片峰值算力達到PFLOPS級別。

同時,壁仞也為這次的BR100發布會下了一個註解:標誌中國企業第一次打破了此前一直由國際巨頭保持的通用GPU全球算力紀錄,中國的通用GPU晶片正式邁入「每秒千萬億次計算」新時代。


在發布會上,壁仞公布在四個峰值算力對比上,BR100都勝過國際廠商的最新旗艦產品,要用7nm工藝就能打造出超過國際巨頭的4nm工藝產品。

壁仞的BR100對標的是英偉達採用4nm工藝技術打造的H100。英偉達的GPU之所以能制霸全球,強大的的CUDA生態系統絕對是重要關鍵。壁仞認為,初期要能做到兼容主流生態。

張文進一步表示,首款通用GPU晶片產品——BR100創出全球算力紀錄,峰值算力達到國際廠商在售旗艦產品3倍以上,創下國內互連帶寬紀錄,還是國內率先採用Chiplet技術、率先採用新一代主機接口PCIe 5.0、率先支持CXL互連協議的通用GPU晶片。他也強調指出,BR100能實現領先算力的關鍵,是最底層自主原創的晶片架構。

對於BR100的誕生,張文以「幾十個人常常好幾個月都睡在辦公室,生活就是為了創造晶片。」來形容這一段歲月。

除了BR100通用GPU晶片之外,壁仞同時也發布了自主原創架構——壁立仞創造的OAM伺服器——海玄,以及OAM模組——壁礪100、PCIe板卡產品——壁礪104,以及自主研發的BIRENSUPA軟體平台。


在發布會上,壁仞科技聯合創始人、CTO洪洲,詳細介紹了原創架構——壁立仞。洪洲說,壁立仞架構以數據流為中心,對數據流進行深度的優化,通過六大技術特性,比較完整地解決了數據搬移的瓶頸和並行度不足的問題,使得BR100晶片在給定的工藝下實現了性能和能效的跨越式進步。

另外,洪洲也介紹BR100採用了Chiplet設計理念,讓晶片總面積可以突破光罩尺寸對單晶片面積的限制,集成更多的算力和通用性邏輯。此外,通過縮小單個計算芯粒的面積,可同時提升產能與良率,進而極大地降低矽片的成本,支持更靈活的產品策略。

在發布會上,也介紹了BR100系列的另一款產品BR104。壁仞號稱,該款晶片同樣基於壁立仞架構,擁有1個計算芯粒,性能約為BR100的一半,超越了國際廠商的在售旗艦產品。

洪洲指出,「Chiplet設計讓我們可以通過一次流片,同時得到兩種晶片,加快了疊代速度,同時覆蓋不同層級的市場。」

壁仞聯合創始人、總裁徐凌傑也和浪潮信息副總裁、AI&HPC產品線總經理劉軍共同揭幕OAM伺服器——海玄。

據介紹,海玄伺服器可以提供高達8PFLOPS(8000萬億次每秒)的浮點峰值算力,超過了此前的任何一台8卡加速計算設備的能力。

與此同時,壁仞科技還發布了基於BR104的主流產品壁礪104,基於標準PCIe形態,功耗控制在300W以內,其形態較為緊湊,部署廣泛、適應性強,可以適配多種2-4U的伺服器,與客戶現有的基礎設施做到高度的兼容。

徐凌傑介紹,從晶片到板卡模組到伺服器,以壁礪100和壁礪104為底座,壁仞科技形成了一條完整的數據中心加速計算產品線。壁礪104已經對部分用戶開放了邀測,即將量產出貨;海玄OAM伺服器目前正在進行緊鑼密鼓的內部測試,預計今年第四季度開放邀測。

除了研發大算力晶片之外,也提供軟硬一體的解決方案。壁仞科技聯席CEO李新榮介紹自主研發的BIRENSUPA軟體平台,該平台構建在BR100系列產品的底層硬體之上,由驅動層、編程平台、框架層、應用解決方案構成,支持各類應用場景。 BIRENSUPA編程平台位於軟體棧的中心位置,包括BIRENSUPA編程模型、加速庫、工具鏈、編譯器等組件。

關鍵字: