在多元宇宙中,SAS探索下一代數據分析的生產力

雲科技時代雜誌 發佈 2022-10-11T22:10:32.421666+00:00

經過過去兩年的深度合作,在SAS Explore 2022上,雙方再次宣布SAS Viya將登陸Microsoft Azure Marketplace,全球用戶只需要點擊幾下即可獲得按使用時間計費、提供in-app學習中心和支持多種語言的SAS Viya最新版本,包括SAS Visual Analytics、SAS Visual Statistics、SAS Visual Data Mining和Machine Learning以及SAS Model Manager等全部SAS軟體。

今天,我們正開始進入多元宇宙時代。2022年9月底,Meta CEO馬克·扎克伯格一再宣稱元宇宙將掀開網際網路的「新篇章」,Meta Platforms宣布將斥資至少700億美元押注元宇宙。儘管元宇宙至少還將有十年時間才能漸成氣候,但以多個元宇宙平台所主導的未來網際網路已在人們的視野中。當所有人都生活在多元宇宙中,如何進行數據處理與數據分析?

SAS公司被Forbes雜誌譽為「數據分析之王」。隨著全球進入多元宇宙時代,SAS公司也在探索適配多元宇宙的數據分析技術及其生產力,這首先就是將數據分析帶入多元宇宙的「底座」——多雲、多邊緣之中。在2022年9月底舉辦的SAS Explore 2022大會上,SAS公司展示了與超級雲的合作進展以及正在探索的新型數據分析技術。

SAS公司執行長Jim Goodnight在SAS Explore 2022大會上強調:「今天的數據正在面臨前所未有的複雜程度,而充斥各種錯誤信息的環境則需要AI平台提供前所未有的AI生產力,這就是為什麼SAS公司一直大力投資雲原生大規模並行分析與AI平台SAS Viya的重要原因」。無論是前沿分析與AI技術還是行業解決方案,SAS公司都致力於讓分析能力更加平民化,為企業和組織帶來更高生產力。

繼續深化與超級雲的集成

毫無疑問,超級公有雲是多元宇宙的重要「基建」之一,而微軟雲則是超級公有雲陣營中的前兩大廠商,微軟也是元宇宙的重要技術提供商,而微軟Office 365更是全球商業辦公的通用雲平台之一,因此與微軟雲合作將數據分析與AI能力帶入全球企業和組織中,是必然之選。早在2020年6月的SAS Global Forum 2020上,SAS公司與微軟公司聯合宣布結成深度戰略合作夥伴,共塑數據分析與人工智慧的未來。

經過過去兩年的深度合作,在SAS Explore 2022上,雙方再次宣布SAS Viya將登陸Microsoft Azure Marketplace,全球用戶只需要點擊幾下即可獲得按使用時間計費、提供in-app學習中心和支持多種語言的SAS Viya最新版本,包括SAS Visual Analytics、SAS Visual Statistics、SAS Visual Data Mining和Machine Learning以及SAS Model Manager等全部SAS軟體。該模式還通過單一可視化界面支持全代碼、低代碼和無代碼編程,支持SAS和多種開源語言。

市場調研公司IDC的分析與信息管理業務群高級副總裁Dan Vesset就此評論,SAS Viya是市場中最全面的分析平台之一,為用戶帶來全生命周期的分析——從數據到模型部署與管理,而通過Microsoft Azure Marketplace可以讓用戶即刻使用和部署這些能力。IDC預測,到2024年,在公有雲上部署的分析軟體將持續增長,並將達到與在企業本地環境中部署相當的規模。

通過Microsoft Azure Marketplace獲取SAS Viya是SAS與微軟公司合作的一種方式,此前雙方已經合作提供了多種集成的雲環境,包括在Office 365中深度集成SAS分析能力。在SAS Explore 2022上,展示了如何在Word、Excel、PowerPoint、Outlook等Office 365應用中,無縫集成使用SAS技術。例如,可以將關聯到SAS數據源的數據以圖形化方式插入到Office 365應用中,簡單點擊就可以通過更新SAS數據源的方式對被插入的圖形進行刷新,或是切斷關聯而直接轉為靜態圖片。

前不久,SAS公司還宣布獲得微軟2022年度全球獨立軟體供應商(ISV)合作夥伴大獎,雙方共同為全球企業用戶帶來雲端的快速數據分析能力,進而提升企業生產力。希臘國家銀行(National Bank of Greece)就採用了部署在雲端的SAS Viya,顯著改善了新分析系統的部署,大幅降低了成本和流程複雜性,同時實現了分析系統的敏捷、速度和效率。

探索下一代分析技術

在將SAS Viya與微軟雲平台進一步深度集成的同時,SAS公司也在積極探索下一代分析技術。SAS公司執行長Jim Goodnight在SAS Explore 2022大會上表示,SAS公司在積極探索的下一代分析技術方向包括:更簡化的分析生命周期,從而將精力集中於利用所選擇的雲,發現新的洞察;更優化的算法,提供比市場上已有算法運行快數倍的速度,從而降低能耗;推進AI倫理,從而進行更有責任的創新;與各種語言集成,提升開發環境的生產力等。

SAS公司執行副總裁及首席技術官Bryan Harris和SAS公司高級分析副總裁Udo Sglavo介紹了SAS公司在探索下一代分析技術方面的具體實踐。Bryan Harris強調,SAS技術平台已經實現了Model Ops生命周期的簡化、效率和透明,提升了分析的生產力,接下來在雲經濟、負責任的AI、無處不在的分析以及可組裝AI等方面繼續探索。

SAS公司高級分析基礎技術(Advanced Analytics Foundation)部門專注於研究提升算法的速度、降低運行成本以及算法的可復用性。隨著越來越多的企業和組織轉向多個公有雲,算法的速度與運行成本就顯得十分重要,這就是雲經濟學的價值所在。對於現代公有雲架構來說,並非直接將算法部署到雲上就能獲得更多彈性資源的收益,例如並不是增加更多的計算核就能實現更快的算法運行速度,多數情況是「掛著高速擋位卻越開越慢」。

SAS公司從算法、硬體和軟體等方面,提升多雲環境中的算法速度與性能。簡單理解,就是SAS公司比用戶更懂數學和計算機實現,同樣的計算目標卻能用不同的數學模型和計算機實現,在不改變硬體和軟體的前提下,大幅提升算法的運行速度和性能。

在SAS Explore 2022上,SAS展示了在公共數據集測試中通過數學和計算機實現的優化所帶來的巨大效益:線性回歸算法比Spark快5倍多、比H2O快24倍多、比Viya 3.5快4倍多;懲罰線性回歸算法比Spark快8倍多、比H2O快28%,並在SAS Viya 4中首次發布;邏輯回歸算法比Spark快61%、比H2O快15倍多、比Viya 3.5還要快5倍多;隨機森林算法比Spark快91倍多、比H2O快5倍多、比Viya 3.5快7倍多;而在梯度提升算法方面,比H2O快4倍多、比Viya 3.5快9倍多,而Spark則出現了多次失敗。除了計算速度快,SAS對算法的優化還能大幅節約CPU資源,將釋放的CPU資源用於其它創新任務。

而在促進算法的可重複性及並行計算性能方面,SAS則通過改進浮點計算、計算線程的設計、計算節點的選擇、第三方計算編譯軟體的選用等多方面,實現高可重複和高並行計算性能的算法。特別是通過與公有雲廠商的深度合作,SAS獲得了更深的算法優化實踐經驗,能夠幫助企業用戶更好地獲得雲經濟效益。

在推進負責任的AI算法方面,SAS即將推出Model Card模型卡片,對於算法模型從開發者洞察、數據輸入和模型健康程度等方面,為任何對該算法模型感興趣者提供說明。例如,在開發者洞察方面,記錄了該算法的主要用途、主要針對的用戶群、超出範圍的用例、相關要素說明、警告和推薦等;在數據輸入方面,記錄了所使用的數據集,相關計算實例數量、目標變量、潛在敏感型變量等……通過普通人也能明白的文字說明,Model Card模型卡片幫助算法工程師、數據分析師等在模型的準確性和公平性之間更好地調節,從而構建更負責任的算法模型。

在無處不在的分析方面,SAS已經推出的極為創新的SAS Container容器,可以將SAS模型部署到筆記本電腦等輕量級環境中。而在可組裝的AI方面,SAS將BERT這樣的超大規模自然語言模型與基於規則的AI模型結合起來,讓企業用戶在開發智能客服等應用時可以選擇更能理解上下文語言的BERT模型或是簡單明了直接執行命令的基於規則的AI算法,從而獲得兩種AI算法的收益。

此外,SAS還即將提供合成數據功能。實際上,對於AI應用來說,更為稀缺的是輸入數據,特別是高質量的訓練數據。而產生高質量的訓練數據,有一種方法就是人工合成數據,也就是在已有的少量真實數據的基礎上,通過基於知識的方式產生新的合乎質量要求的數據,或是通過GAN生成對抗網絡等算法對已有數據集進行增強。

用黑客松普及數據分析

隨著與微軟雲戰略合作的深入,黑客松活動也成為了SAS公司的標誌性品牌活動之一。在微軟執行長Satya Nadella上任後,將原本小規模的面向開發者的一日黑客松活動,提升到了全公司層面並延長到一周的時間,以成長型思維推動來自員工的草根創新。而在2021年舉辦的首屆SAS黑客松活動,進一步拓展了微軟黑客松的組織方式:將時間延長到了一個月的時間,以虛擬化方式面向全球市場,提供與SAS一起用數據分析進行創新的機會。

SAS黑客松活動的宗旨是為全球需要利用數據分析進行創新的公司和商業組織,提供一個非正式商業合作的創新機會——作為公司和商業組織,如果需要用數據分析進行業務創新,就需要正式立項,而僅立項流程以及獲得公司高層的批准就需要數月的時間以及接受來自公司的監管。而SAS黑客松活動就可以打破現有公司和商業組織的內部流程,在30天的時間內與來自SAS公司世界級的數據分析專家一起解決實際的問題,從而驗證項目的可行性,甚至獲得初步的成果。

在2021年的首屆SAS黑客松活動中,來自30多個國家和地區,共千餘名申請者帶來了百餘個場景,涉及銀行、保險、能源、健康醫療與生命科技、製造、零售、媒體廣告、電信和公共服務等10餘個行業,他們使用SAS Viya和其它SAS 軟體、Microsoft Azure雲服務以及開源技術,進行大膽的想像和創新。在2022年的第二屆SAS黑客松活動中,來自75個國家的1300餘名申請者、代表了135家公司組織的70餘支團隊參與了活動,近50個團隊提交了項目。

2022 SAS黑客松全球冠軍團隊是由印度尼西亞數據科學家和技術愛好者組成的 JAKSTAT團隊,該團隊使用基於機器學習的數據分析平台,幫助雅加達政府優化抗疫資金的發放,從而救助了當地的數百萬中小微企業。JAKSTAT團隊由SAS合作夥伴 StarCore分析公司的 Muhammed Iqbal 領導,利用人工智慧和數據建模賦能雅加達政府。而JAKSTAT團隊預計,更多的城市將實施其解決方案,見證該創新項目的廣泛應用。

2021年7月,SAS公司宣布至2024年末將做好IPO的籌備。2021年,SAS公司的雲營收增長了18%,推動公司總體營收增長約10%;此外,SAS公司的欺詐與安全智能方案營收增長了21%、零售方案增長了13%、IoT方案增長了10%……這些都預示了SAS公司正穩步走在IPO的道路上。通過SAS Explore 2022大會,可以看到SAS公司在繼續加強與微軟雲的戰略合作,不斷探索下一代數據分析生產力,以及借用創新的模式向全球普及數據分析能力,這些都顯示了SAS公司正積極主導數據分析與AI的未來——在即將到來的多元宇宙中,SAS仍將占據數據分析與AI的「C位」。(文/寧川)

關鍵字: