Linus終於被勸動:用了30年的Linux內核C語言將升級

linux速推文章 發佈 2022-07-05T14:53:27.429261+00:00

根據 Linux 內核郵件列表的消息,社區近日討論了是否要為內核採用現代 C 語言標準。雖然 Linux 內核在快速發展,但它同時依賴著一些非常古老的工具,其中之一就是內核代碼仍在使用 1989 年版本的 C 語言標準——此標準在 30 多年前內核項目啟動之前就已經編寫完成。

根據 Linux 內核郵件列表的消息,社區近日討論了是否要為內核採用現代 C 語言標準。

雖然 Linux 內核在快速發展,但它同時依賴著一些非常古老的工具,其中之一就是內核代碼仍在使用 1989 年版本的 C 語言標準——此標準在 30 多年前內核項目啟動之前就已經編寫完成。從討論結果來看,這一情況有望在 5.18 版本內核中改變。

Jakob Koschel 在向 Linus Torvalds 遞交的補丁 (https://lkml.org/lkml/2022/2/17/1032) 中修復了內核鍊表相關的預測執行漏洞。

起因是 Jakob 發現了一個問題,Linux 內核廣泛使用由 struct list_head 定義的雙向鍊表:

struct list_head {

  struct list_head *next, *prev;

};

這種結構體通常被嵌入到其他結構體中,通過這種方式,開發者可以使用任何感興趣的結構類型製作鍊表。除此之外,內核還提供了大量可用於遍歷和操作鍊表的函數和宏。其中之一是 list_for_each_entry(),這是一個偽裝成控制結構的宏。要了解如何使用此宏,請假設內核包含如下結構:

struct foo {

    int fooness;

    struct list_head list;

};

list 成員可用於創建 foo 結構體的雙向鍊表,假設我們有一個叫做 foo_list 的結構聲明作為此類鍊表的頭,使用以下代碼可以遍歷此列表:

struct foo *iterator;

list_for_each_entry(iterator, &foo_list, list) {

    do_something_with(iterator);

}

/* Should not use iterator here */

list 參數告訴宏在 foo 結構中 list_head 結構體的名稱。此循環將為列表中的每個元素執行一次,疊代器指向該元素。由此導致了 USB 子系統中的一個 bug:傳遞給該宏的疊代器在退出宏後還能被使用。

Koschel 通過重新編寫有問題的代碼,以在循環後停止使用疊代器來解決問題。

不過 Linus 卻對補丁修復的問題表示不解,也沒有看到它與預測執行漏洞的關係。Koschel 對此進行了進一步解釋,對此 Linus 認為這只是一個普通的 bug。但不久之後 Linus 發現了問題的根源所在:傳遞給列表遍歷宏的疊代器,必須在循環本身之外的範圍內聲明。

隨後,Linus 認為也許可以採用更直接的修復如塊級變量聲明。但 C89 不支持,而 1999 年發布的 C99 標準支持。所以 Linux 內核也許是時候轉向使用 C99 標準了。

Linus 說到,內核代碼一直停留在 C89 的原因之一是編譯器 GCC 的舊版本會出現奇怪的問題,導致初始化程序被破壞。不過現在內核要求的 GCC 最低版本已經提高到了 v5.1,那些 bug 可能不再相關了。

另一位密切關注架構編譯器問題的內核開發者 Arnd Bergmann 提議直接升級到 C11 甚至 C2x,儘管他不確定 C11 是否會帶來任何對內核有用的新內容。不過如果升級到 C17 或 C2x,會破壞對 gcc-5/6/7 的支持,因此升級到 C11 更容易實現,而且跨越太大內核社區未必接受。

Linus 贊成了這個想法,在 Bergmann 確認應該可以這樣做之後,Linus 宣布將在下一個內核版本 v5.18 中嘗試使用 C11 標準。如果一切順利,下一個內核版本使用的 C 語言標準有望升級到 C11。

關鍵字: