數據短缺怎麼破?這家企業「零樣本」也能助力製造升級

南方plus客戶端 發佈 2021-10-23T01:20:24+00:00

工業生產對驗收要求極高,想要成品良率至少達到 99.9% 以上,每個零件的良率至少需達到 99.999%;因此當前能夠滿足工業生產場景需求的,往往是高度定製化算法和訓練方式。思謀科技結合各方研發出的算法,過去一個模型(算法開發+部署)需要10 人月,而現在僅需要0.3人月。

工業生產對驗收要求極高,想要成品良率至少達到 99.9% 以上,每個零件的良率至少需達到 99.999%;因此當前能夠滿足工業生產場景需求的,往往是高度定製化算法和訓練方式。

思謀科技結合各方研發出的算法,過去一個模型(算法開發+部署)需要10 人月,而現在僅需要0.3人月。

10月21日,2021第五屆全球智能工業大會「智能感知與機器視覺」分論壇在深圳舉行。思謀科技董事長、香港中文大學終身教授賈佳亞介紹了人工智慧在工業場景中的應用。

思謀科技董事長賈佳亞

奔現有風險?AI「一鍵卸妝」

賈佳亞回憶了一個故事:十幾年前去看一個醫生,醫生都是用手寫診斷書,結果看到藥方時非常震驚——不像中文,不像甲骨文,也不像隸書。這張紙拿到藥房時,拿到了該用的藥。

「這件事情給了我非常大的啟發,如果我能有一套自動的、智能的文字識別系統,豈不是可以把這些文字輕鬆抓取出來?」賈佳亞說,現在,這個願望已經實現了,思謀科技文字識別系統達到了100多類,超過10萬種不同的產品類型,自動識別產品、識別字符後,就可以找到每一個產品生產的位置、時間、工人及良率等信息。

賈佳亞還提了一個故事,很多年前他的一個學生,見女網友回來悶悶不樂,賈佳亞旁敲側擊才發現,他見網友有心理落差,照片形象和實際形象差別太大。後來同學奮發圖強,幾周時間研發出了一款軟體,並命名為「一鍵卸妝」,把網絡上經過修飾的面容,通過軟體處理,恢復到原來的模樣。

這樣的技朮忽然有了新的應用:可把一個20年前、30年前所拍攝的視頻,通過現在的技術,還原成高清、高碼率、高解析度的效果。

「20年前拍攝電影,因為原有的技術不能夠承載像素和色彩,最後照出來的視頻和照片沒有今天這麼好看,應用這個技術,我們做了一套設備,可以讓很多以前的視頻做高清化處理。」賈佳亞說,目前該被全球超過10多家的視頻企業、網絡媒體以及電視台採用。

AI走向了更專業化道路

在演講中,賈佳亞回顧了人工智慧發展的歷程。在1940年代,全球出現自動化生產的公司,當時以發那科、安川自動化為突破口,製造業實現了用自動化設備製造設備。

到20世紀70年代,世界開始出現信息化,以西門子、IBM為代表,把所有的數據打通,能夠連上網絡,數據能夠被數位化。

發展至今,工業迎來了新的發展機會,即智慧化的過程,數據能夠做自動決策,生產流程逐步的擺脫了主觀的人為因素,使得所有的製造流程變得更加自動化和高速化。

「工廠會招聘一些技術工人,他們也都會退休,必須找新一批年輕人承擔同樣的崗位,做同樣的事情,這樣相當於一個系統重新地找到新的新鮮血液,替換老的知識和經驗。而人工智慧在產業裡面最大的作用是它永遠不會有這個過程,它一旦進入學習階段,積累的知識永遠在系統裡面,這是工業4.0最大的契機。」賈佳亞說。

與此同時,人工智慧走向了更加專業化的道路。2000年,賈佳亞團隊做的是普適型視覺的AI研究,包括醫療圖象、自然圖象還有普通的2D、3D圖像,而到了2017年,方向變得越來越窄,開始鑽研一些更深入網際網路問題,到了2019年底,賈佳亞把研究方向更加縮窄,只做智能製造和產業智能化升級。

「當我把目光放得越來越狹小,處在一個特定領域的時候,我發現對這個領域的理解越來越深刻。」賈佳亞說,生產是一個龐大的過程,有產品設計、管理、服務以及和客戶的交互等,當電腦發現有新的產品要上線時,這個新產品是沒見過,也能做到自己學習產品的特性,自決策、自執行、自適應,「如果把工廠從東部地區搬到中部地區或者更加內陸地區,環境發生變化,工廠的調試和生產系統能夠達到和原有廠房一樣的生產效率,這個叫自適應」。

解決零樣本難題

智能製造的提升,並不是一件容易的事情。做教授時,賈佳亞一身西裝革履經常外出演講,而現在花費大量時間在第一線研究製造,把西服一脫、穿上工作裝,衝到廠房的無塵車間,觀察整個生產工藝。

「AI應用中,以定位為例,產品需要定位每一個部分的厚度、位置、材料,定位又需要很多硬體,需要有鏡頭、光源、機械臂,還需要AOI設備,如果哪個產線軟體壞了,換了另外一個鏡頭,定位系統軟體也要跟著換。」賈佳亞說,龐大的硬體,如何適配相應的軟體算法,本身很複雜。

其次,當產線更換算法或硬體時,比如把20納米的工作區域提升到5納米乃至更小,也意味著大量算法也要隨之更換。

「還要面對數據短缺的困境。」賈佳亞說,人臉識別場景有超過2億張圖片,但工業場景截然不同,因為絕大部分的產品在正式生產前甚至少於10張圖,就要去判斷產品是否合格,「即使算法再牛,也很難得出結論。」

賈佳亞用「十年不遇」來形容他的一個遭遇:在一個工廠的無塵車間,連灰塵都沒有的一個車間,居然板上會有一隻死蒼蠅,這樣的缺陷在所有的訓練群體裡面是不可能出現的,等於說這樣的樣本是為零的,沒見過這樣差的樣本,卻要解決這樣的問題。

對此,賈佳亞提出了一個概念來破解這個難題,即區域感知異常檢測器,這是一個機器學習的一個算法,記住一百個錯誤答案,不如掌握一個正確標準,當確定正確標準之後,就不關注錯誤答案了,只要跟它相背離的就是錯誤答案,就可以在工廠中,即便零樣本也可以做得很好。

【記者】郜小平

【作者】 郜小平

南方產業智庫

來源:南方+ - 創造更多價值

關鍵字: