壁仞推出全球最大算力晶片，號稱以7nm超越英偉達4nm最新GPU

由問芯voice 發佈 2022-08-09T18:51:58.087654+00:00

壁仞在發布會上表示，正式發布首款通用GPU晶片BR100，採用7nm工藝技術，號稱世界上最大算力晶片，16位浮點算力達到1000T以上、8位定點算力達到2000T以上，單晶片峰值算力達到PFLOPS級別。

作者｜連于慧

業界給壁仞創辦人張文很多稱號：「中國第一大獵頭」（找了英偉達、海思、高通、AMD等高手加入）、「融資機器」（累積募資47億人民幣）。這些稱號的背後，更代表數以千計雙眼睛在盯著看：花了三年時間的壁仞究竟會端出什麼樣的菜色？在 8月9日的發布會上，壁仞給出答案。

同時，壁仞也為這次的BR100發布會下了一個註解：標誌中國企業第一次打破了此前一直由國際巨頭保持的通用GPU全球算力紀錄，中國的通用GPU晶片正式邁入「每秒千萬億次計算」新時代。

在發布會上，壁仞公布在四個峰值算力對比上，BR100都勝過國際廠商的最新旗艦產品，要用7nm工藝就能打造出超過國際巨頭的4nm工藝產品。

壁仞的BR100對標的是英偉達採用4nm工藝技術打造的H100。英偉達的GPU之所以能制霸全球，強大的的CUDA生態系統絕對是重要關鍵。壁仞認為，初期要能做到兼容主流生態。

張文進一步表示，首款通用GPU晶片產品——BR100創出全球算力紀錄，峰值算力達到國際廠商在售旗艦產品3倍以上，創下國內互連帶寬紀錄，還是國內率先採用Chiplet技術、率先採用新一代主機接口PCIe 5.0、率先支持CXL互連協議的通用GPU晶片。他也強調指出，BR100能實現領先算力的關鍵，是最底層自主原創的晶片架構。

對於BR100的誕生，張文以「幾十個人常常好幾個月都睡在辦公室，生活就是為了創造晶片。」來形容這一段歲月。

除了BR100通用GPU晶片之外，壁仞同時也發布了自主原創架構——壁立仞創造的OAM伺服器——海玄，以及OAM模組——壁礪100、PCIe板卡產品——壁礪104，以及自主研發的BIRENSUPA軟體平台。

在發布會上，壁仞科技聯合創始人、CTO洪洲，詳細介紹了原創架構——壁立仞。洪洲說，壁立仞架構以數據流為中心，對數據流進行深度的優化，通過六大技術特性，比較完整地解決了數據搬移的瓶頸和並行度不足的問題，使得BR100晶片在給定的工藝下實現了性能和能效的跨越式進步。

另外，洪洲也介紹BR100採用了Chiplet設計理念，讓晶片總面積可以突破光罩尺寸對單晶片面積的限制，集成更多的算力和通用性邏輯。此外，通過縮小單個計算芯粒的面積，可同時提升產能與良率，進而極大地降低矽片的成本，支持更靈活的產品策略。

在發布會上，也介紹了BR100系列的另一款產品BR104。壁仞號稱，該款晶片同樣基於壁立仞架構，擁有1個計算芯粒，性能約為BR100的一半，超越了國際廠商的在售旗艦產品。

洪洲指出，「Chiplet設計讓我們可以通過一次流片，同時得到兩種晶片，加快了疊代速度，同時覆蓋不同層級的市場。」

壁仞聯合創始人、總裁徐凌傑也和浪潮信息副總裁、AI&HPC產品線總經理劉軍共同揭幕OAM伺服器——海玄。

據介紹，海玄伺服器可以提供高達8PFLOPS（8000萬億次每秒）的浮點峰值算力，超過了此前的任何一台8卡加速計算設備的能力。

與此同時，壁仞科技還發布了基於BR104的主流產品壁礪104，基於標準PCIe形態，功耗控制在300W以內，其形態較為緊湊，部署廣泛、適應性強，可以適配多種2-4U的伺服器，與客戶現有的基礎設施做到高度的兼容。

徐凌傑介紹，從晶片到板卡模組到伺服器，以壁礪100和壁礪104為底座，壁仞科技形成了一條完整的數據中心加速計算產品線。壁礪104已經對部分用戶開放了邀測，即將量產出貨；海玄OAM伺服器目前正在進行緊鑼密鼓的內部測試，預計今年第四季度開放邀測。

除了研發大算力晶片之外，也提供軟硬一體的解決方案。壁仞科技聯席CEO李新榮介紹自主研發的BIRENSUPA軟體平台，該平台構建在BR100系列產品的底層硬體之上，由驅動層、編程平台、框架層、應用解決方案構成，支持各類應用場景。 BIRENSUPA編程平台位於軟體棧的中心位置，包括BIRENSUPA編程模型、加速庫、工具鏈、編譯器等組件。