「我覺得AI領域乙烷」網友:你說的太多了,讓AI來總結一下

機器之心pro 發佈 2022-08-10T08:19:40.116989+00:00

「我覺得 AI / 機器學習前途的令人震驚的黯淡,幾乎沒有救贖的希望」一位 AI 從業者最近在 Reddit 的機器學習板塊發了一個帖子。

機器之心報導

編輯:澤南、蛋醬

如果圖靈、馮諾依曼看到現在這個樣子,他們會怎麼說?

毫無疑問,人工智慧是最近的熱門專業,同時也是高收入的保證,吸引著越來越多的學生和從業者。但新技術快速的發展背後,也一直有人在擔心未來的問題:深度學習是真正有效的方向嗎?不斷增大的模型,會不會讓 AI 研究變成僅限科技巨頭的遊戲?

在這些話題上,既有紐約大學教授 Gary Marcus 和圖靈獎得主 Yann LeCun 的論戰,也有在論壇和推特,機器學習社區經年累月的討論。

不過最近這一篇,討論出了新的高度。

「我覺得 AI / 機器學習前途的令人震驚的黯淡,幾乎沒有救贖的希望」一位 AI 從業者最近在 Reddit 的機器學習板塊發了一個帖子。

我最近看到了 Google Research 的 PaLM(Scaling Language Modeling with Pathways)論文,它打開了一大堆新的思路,其中很多我感覺自己已思考了一段時間,但一直無法表達——我肯定不是唯一一個這樣想的。

有時候我想知道 AI 的最初先驅者——圖靈、馮諾伊曼、麥卡錫等——如果他們能看到現在 AI 領域的狀態,現在會怎麼想。

PaLM 論文有 67 位作者,83 頁,模型包含 5400 億個參數,以至於沒有人可以自信地說他們理解內部結構,谷歌用來訓練它的 6144 塊 TPU 是其他研究難以企及的條件,模型的訓練使用了人類一生也無法處理的大量數據。這篇論文的一頁是關於道德的,其中包含在其他研究中一遍又一遍地重複,但沒有什麼解決方案的相同想法——偏見、種族主義、惡意使用等——這又有什麼目的呢?

2016 年,當我作為 AI 研究工程師開始職業生涯時,我對兩種類型的任務最感興趣——1)大多數人可以做的那些,但通常被認為是乏味且不可擴展的。我說的是圖像分類、情感分析,甚至是文檔摘要之類。2)人類由於各種原因缺乏執行能力的任務——預測、風險分析、玩遊戲等等。我仍然熱愛我的職業,我嘗試只在這些領域的項目上研究,但它們正變得越來越難。

這是因為,在技術的發展過程中,我們把人工智慧推入原本是人類獨有的領域這件事已變得流行,並且毫無疑問是被接受的,這些領域在自我實現方面位於馬斯洛需求層次的頂端——藝術、音樂、寫作、唱歌、編程等等。這些領域的能力曲線呈負對數——絕大多數人根本做不到,大約 10% 的人可以做得很好,1% 或更少的人可以做得非常出色。

人工智慧生成的一個很少討論的問題是:在沒有極端威脅的情況下,我們以技術改變世界為名犧牲最頂尖那批人的成就,直到人工智慧能力範圍成為常態。這是因為相對於人類,人工智慧是廉價、快速和無限的,以至於對人類成就的投資將在社會、教育和個人層面逐年減少。與幾十年前取代人類的 AI 遊戲不同,我們不能僅僅取消機器的資格並繼續玩,就好像它們不存在一樣。

不論我在哪裡,甚至在這個論壇(機器學習討論區)上,我都會遇到對當前業內最佳(SOTA)AI 生成系統,如 GPT-3、CODEX、DALL-E 等技術的普遍讚賞,卻幾乎沒有人將其影響延伸到邏輯結論,在研究者聲稱要解決甚至重點關注的領域中,未來的一切可能都會歸於平均值,歸於平庸。

如果你是藝術家或作家,並且正在使用 DALL-E 或 GPT-3 來「增強」你的工作,或者如果你是一名程式設計師,會說出「GitHub Co-Pilot 讓我成為一個更好的程式設計師」這樣的話嗎?這可能意味著你在打亂自己的創作過程,即思想→(可選文字)→行動→反饋→重複,變成了在畫布上播種來自機器的想法,你無法理解其出處,也無法理解機器解釋的可靠性。你做的越多,你的創作過程就越依賴於機器,直到你必須質疑沒有它你是否可以保持這樣水平的工作。

當我還是一名大學生時,有一段時間,我認為我的想法是革命性的和開創性的,直到我真正開始寫下這些想法,然後在清醒的時候回顧它們,我意識到它們根本沒有那麼特別。

我相信當前人工智慧的發展對人類產生負面影響的風險是巨大的,尤其是從跨越幾代人的長期階段去看,而我們大多數人甚至不會意識到它已經發生了,就像沸水中的青蛙一樣。

如果你像我一樣有孩子,你怎麼能意識到目前這些領域的 SOTA 預計 20 至 30 年會如何,然後告訴孩子他們在藝術、寫作或音樂的天賦是值得追求的?你怎麼能假裝誠實地告訴他們,多年來自動糾錯的廣泛應用並沒有讓你和其他人在拼寫方面變得越來越糟糕?(即使我相信大多數人都會同意這個任務是有必要自動化的)

此外,我還沒有討論 AI 生成系統的長期應用所導致的「訓練 - 生成 - 訓練 - 生成」反饋循環。這些模型的第 1 代是根據人類生成的大量網絡數據進行訓練的,但如果允許這些系統在不受限制或驗證的情況下不斷吐出內容,從長遠來看,那麼第 4 代或第 5 代會發生什麼?最終我們一定會遇到這種情況,即 AI 幾乎只在 AI 生成的內容上進行訓練,因此隨著每一代的更迭,它逐漸陷入平庸,而使用當前的方法將再也不能解決這個問題。

經過熱情地、堅持不懈地追求這個方向,我確信我們的 AI/ML 開發人員、公司和國家已經上了一條不歸路,這主要是因為我們在時間和金錢上的投資,以及與我們競爭對手之間的囚徒困境。然而,作為一個共同體,我們為短期利益而選擇的這個方向幾乎肯定會使人類變得更糟,主要是對那些無能為力的人——我們的孩子、我們的孫子和更多後代。

如果你是一名 AI 研究員,或是像我這樣的數據科學家,當多年來一直朝著這個方向發展職業生涯時,你能如何扭轉局面?你每年的 TC 收入(總收入)可能接近或超過 20 萬美元,並且有一個家庭要養家餬口,無論你對這個領域的發展方向有何看法,都為時已晚。

如果你有一家公司,如何接受競爭對手將他們的 AutoML 解決方案推向市場,而自己原地不動?此外,如果你是像 Jeff Dean 這樣的領域內的帶頭人,你如何向老闆和股東自證團隊在 AI 上投的數十億美元,同時平衡道德問題?

你不能——唯一的答案是越來越大的模型,越來越多的應用程式,越來越多的數據,越來越自動化,然後進一步自動化。

如果你身處美國這樣的國家,當你的競爭對手(例如中國)一心一意地全速前進,無需過多顧慮道德問題,並逐漸取代你在全球權力格局中的許多領域?這時你又如何開發負責任的人工智慧?不參加比賽就意味著認輸,不是嗎?

即使我在這裡描述的事情都沒有發展到這樣的程度,為什麼很多人還是不認真對待並忽視了這種可能性呢?如果我所說的一切都是在散布恐懼氣氛,那麼我很想聽聽你的觀點,20 到 30 年後,人類與 AI 的共存會是怎樣一種場景?

對於人工智慧抹殺人類創造能力的擔憂或許有其道理。不過現代社會,說的太多就意味著沒人願意看,於是熱心網友用 AI 的文本總結功能對這段話進行了摘要。

有趣的是,AI 去掉了原文 81.7% 的篇幅,剩下的兩百多個字仍足以完整表達作者的核心觀點。

這篇回復獲得了人們的最多點讚。

然而 AI 又腦補出了一些不該有的內容,結果把所有人都給整樂了。這樣的 AI,是會抹殺下一代人類創造力的那種嗎?

在評論區,有人回答了正文開頭的問題:「如果圖靈、馮諾依曼、麥卡錫還活著,他們會怎麼看今天的人工智慧發展現狀?」

麥卡錫是一個嚴格的邏輯學家類型(LISP 甚至不應該在真正的計算機上運行),所以他會感到恐懼,或者至少在美學 / 理論層面上感到失望。麥卡錫很幸運,他經歷了自己提出方法的鼎盛時期,並看到了他工作的無數下游應用,即使現在的我們越來越覺得這種範式是人工智慧的死胡同。麥卡錫在 2011 年去世,當時說深度學習還為時過早,但在「機器學習」已經出現很久了,也許人們可以看看他寫的關於機器學習的文章來判斷他的想法。我不知道他是否會像某些人那樣聲稱深度學習會撞牆或實際上未起作用之類的。

圖靈和馮諾依曼肯定會非常熱情:他們倆都對神經網絡、聯結主義和新興方法非常感興趣,贊同人工智慧需要極其強大的硬體,這遠遠超出 1950 年代研究人員的認知,並認為自我學習的方法是必需的。圖靈可能會對他最初預測在 RAM/FLOPS 上相差幾個數量級感到失望,但請注意,在神經科學剛剛起步且計算機實際上什麼也沒做的時代,這是一個合理的猜測。他非常有先見之明,預測硬體的發展將持續實現成倍增長(早在摩爾定律之前);他會指出,我們仍然遠遠落後於進行實驗和探索的自我學習 / 探索系統的目標,代入大量隨機數據代替一定是次優的途徑。

馮諾依曼同樣不會對邏輯方法未能解決許多最重要的問題(如感官知覺)感到驚訝,他很早就主張需要大量的計算能力(這就是他所說的人們只認為邏輯 / 數學很複雜,因為他們沒有意識到現實生活有多麼複雜——這就是邏輯 / 數學失敗的地方,你將需要大量的計算才能完成)並構建數字計算機來解決現實世界的問題,比如棘手的物理設計。

他還在他最後一部未完成的關於計算機和大腦的著作中指出,由於大腦本質上是圖靈完備的,因此它們看起來可以通過輸出數學等符號過程來運行這一事實,但並不意味著它們可以通過符號過程或任何算法等價的東西。最後,馮諾依曼是第一個使用「奇點」一詞描述人類時代即將結束,被技術取代的人。(是的沒錯,如果馮 · 諾依曼能活到今天,他很可能被奉為奇點主義的祖師爺。)

對於這個問題,你怎麼看?

參考內容:https://www.reddit.com/r/MachineLearning/comments/wiqjxv/d_the_current_and_future_state_of_aiml_is/

關鍵字: