想不到吧,統計物理竟然能創造音律

中科院物理所 發佈 2024-04-10T01:28:44.896299+00:00

導語為什麼音樂創作需要基於一系列規則?為什麼以這些方式創作就容易得到悅耳的音樂?物理學家給出的答案是——相變——聲音從嘈雜到和諧的過程,與分子從無序到有序的過程驚人地相似。本文介紹了一項經典研究,用統計力學框架來解釋為音律是怎樣從無序音符中湧現的。

導語

為什麼音樂創作需要基於一系列規則?為什麼以這些方式創作就容易得到悅耳的音樂?物理學家給出的答案是——相變——聲音從嘈雜到和諧的過程,與分子從無序到有序的過程驚人地相似。本文介紹了一項經典研究,用統計力學框架來解釋為音律是怎樣從無序音符中湧現的。原來音律的背後有深刻的物理與數學約束,而不只是人類隨意的發明。

關鍵詞:統計力學、十二平均律、協和音、平均場近似、相變、湧現

羅天麟 | 作者

丁亞飛、Xiangying Shen | 審校

鄧一雪 | 編輯

0. 序

早年間,畢達哥拉斯發現,撥動琴弦所發出的聲音與琴弦的長度有關,音高與弦長成反比。而這裡的音高,指的就是聲音的頻率。同時,人們還發現當頻率之比為1:2的兩個聲音同時發出的時候,這兩個音聽起來是「協和Consonant」的。人們根據這兩個特點,按照音樂演奏需要,研究出了多種「律法」來標註與記錄動聽的音樂,這些律法就被稱為「音律」。音律實際上就是在頻率為1:2的兩個音之間繼續細分,以達到用這些音就可以記錄儘可能多音樂的目的。

雖然中西方音樂種類繁多、各具特色,但中西方音律發展的歷程與結果卻驚人相似。儘管文化交流在其中發揮了很大作用,但這似乎並不是中西方音律相似的全部原因。在2019年一篇題為《The structure of musical harmony as an ordered phase of sound: A statistical mechanics approach to music theory》的文章中,作者Jesse Berezovsky,凝聚態物理學家,亦是一名中提琴手,他認為音律的最終形成似乎具有一定的物理意義,也許與某種相變有關。


1. 樂理基礎 音律發展

我們首先需要花一些篇幅來簡單介紹一些樂理知識以及音律發展的歷程。

聲音的組成

聲音的產生源自於物體的振動。當演奏樂器、拍打一扇門或者敲擊桌面時,他們的振動會引起介質——空氣分子有節奏的振動,使周圍的空氣產生疏密變化,形成疏密相間的縱波,這就產生了聲波,這種現象會一直延續到振動消失為止。

純音 (Pure tone) 與複音 (Complex tone)

純音 (Pure tone) 就是最基本的聲波,即標準的正弦波 (圖1-1),但是可以被人耳聽到的純音在自然界中幾乎不存在,自然界的聲波可以被分解成頻域空間中各種頻率的正弦信號的線性疊加。我們聽到的幾乎所有聲音都是一大群正弦信號的組合 (圖1-2),即複音 (Complex tone)。複音中振幅最大的那個波的頻率被稱為這個音的「基頻」。

圖1-1. 純音時域波形圖

圖1-2.複音時域波形圖

泛音(Harmonics)

古希臘人發現了一個有趣的現象,撥弄一下琴弦,這根琴弦除了發出一個響亮的音調外,還會發出一個比這個音調高八度且振幅更小的協和音。在音樂理論中,若一個音的基頻為F,則它到它頻率兩倍(2F)這個範圍就稱為「八度」。「高八度」的意思便是基頻頻率為原來的兩倍。換句話講,他們在八度音程的較低音調中發現了較高音調。而泛音的英文為什麼會是「Harmonics」,這是因為琴弦振動產生的聲音就是無數簡諧波的疊加,最終形成鋸齒狀的音色。泛音中的基頻就是頻率最低的那個音的頻率,泛音也是一種特殊的複音。


圖1-3. 撥動琴弦產生的「鋸齒」音色

聲與人

振動具有三個很關鍵的特性:頻率、振幅以及相位。一個聲音的頻率(也就是前文所說的基頻)決定了這個聲音有多「高」。聲波的振幅決定了這個聲音有多「響」。相位則代表了聲音開始發出的位置。音律是為記錄音的「位置」而存在的律學,所以音律研究的重點就是聲波的頻率。一般來說,人耳能聽到的聲波頻率範圍是20赫茲到20000赫茲(每秒振動20000次)。聲波的頻率越大(每秒振動的次數越多),聽起來就越「高」。


但是,我們對音高的線性變化並沒有那麼敏感,而對音高的指數變化更敏感。舉個例子,有如下兩個系列的聲音:

系列1:

200Hz、400Hz、600Hz、800Hz、1000Hz、1200Hz、1400Hz、1600Hz

系列2:

200Hz、400Hz、800Hz、1600Hz

對於人耳來說,只有系列2的聲音聽起來像是具有相等距離的,聽起來像是一組「等差」音高。可是實際上系列2的聲音是一組等比音高。

協和(Consonant)與不協和(Dissonant)

協和(Consonant)用來形容人們聽到兩個音時的感受,人們將兩個音之間的音高差稱作音程。所有聽起來悅耳、融合的音程,叫協和音程,也說這兩個音是協和的;而聽起來比較刺耳,彼此不很融合的音程叫做不協和(Dissonant)音程。所以大家可以發現,協和與不協和都是描述人的感受,所以最早得到的哪些音程協和,哪些不協和,都是通過記錄無數人的感覺得來的。

那麼哪些音程是協和的呢,我們首先來看看兩個單音相互作用產生的結果:

圖1-4. 在一個臨界帶寬內兩個音的不協和程度

圖1-4表示兩個單音相互作用的結果。縱坐標為協和、不協和度。橫坐標表示兩個純音之間的音程與較低音的臨界帶寬的比值,這裡要介紹一個新概念:臨界帶寬 (Critical Bandwidth)

臨界帶寬,這個概念首先被Harvey Fletcher在1933年提出,這個概念成功解釋了耳蝸聽覺濾波效應和掩蔽效應。

人耳具有十分複雜的結構,臨界頻帶指的是由於耳蝸構造產生的聽覺濾波器的頻率帶寬。人的聽覺系統中,耳蝸起著頻譜分析的作用,耳蝸基底膜上特定位置點對某一特徵頻率(Characteristic Frequency,CF)響應最大當聲波偏離CF點時,該點的響應減少,因此基底膜上每一點可等效成具有特定頻率(CF)的帶通濾波器整個聽覺系統可等效成一系列具有連續CF的、相互交疊的帶通濾波器,稱為「聽覺濾波器」。臨界頻帶就是聽覺系統帶通濾波功能的反映,聽覺濾波器的帶寬即為臨界帶寬

再回到圖1-4,我們可以知道當兩個音的音程處於臨界帶寬內的某一個值時會存在一個最大的不協和的點。由於低頻區與高頻區臨界頻帶不同,這個位置也不會相同。

但是我們也提到,純音在自然界上是不存在的。一般都是複音,那麼複音之間的協和關係又是怎樣呢,早期學者們將圖1-4中的線條方程寫出來(圖1-4的結果是無數實驗擬合出來的)再將任意兩個複音做傅立葉變換,計算兩個音相同次序項之間的協和度,最後加起來就得到了圖1-5的結果。並且這個結果也經過了大量的人耳檢驗。

圖1-5. 一個八度內的協和音程關係(採用鋸齒音色進行計算得出的結果)

圖1-5中描述了一個八度內兩個複音的協和音程關係,這兩個複音都是前文所提的具有6個諧波疊加的泛音。其中一個的基頻為250Hz,它與任意一個頻率在250Hz到500Hz內的音的協和關係如圖1-5所示。縱坐標表示不協和度,橫坐標表示另一個音的基頻,這裡的單位cps (Cycle per second) 與赫茲意義相同。

從圖中我們可以看到在一個八度內協和度最高的就是我們最開始提到的1:1與1:2的比例關係,也就是兩個250Hz的音,或者一個250Hz和一個500Hz的音。協和度排第二的是當兩個音頻率之比為2:3的時候,也就是250Hz與375Hz,這個比例也很重要,與後文要提到的五度相生律有重要關係。

雖然這些嚴謹數學計算得出的結果在19世紀才出現,但其實在很早的時候,人們就發現了兩個音頻率之比為2:3的時候,這樣的音組十分協和,根據這樣的原則,人們開始制定音律。

從五度相生律到十二平均律

早年間,不僅畢達哥拉斯發現了2:3是一個十分協和的頻率之比,我國先秦時期的《管子·地員篇》也記載了所謂「三分損益律」,具體說來是取一段弦,「三分損一」,即均分弦為三段,舍一留二,便得到 3/2F(F為弦的原頻率)。如果「三分益一」,即弦均分三段後再加一段,便得到 4/3F。「三分損益率」就是最早的音律設計方法。但是如果加上一個4/3F的音,那麼他與前面幾個音的協和程度就遠遠不足了。(其實在這裡我們可以發現,古人最早發現的協和頻率比是2:3和3:4。他們並沒有採用比3:4更協和的比例3:5。)所以古人一想,不如找3/2F的3/2倍,也就是9/4 F,但是這個數已經比2還大了,並不在我們要的第一個八度區間[F,2F]中。我們必須找到這個八度里的9/4F,也就是用9/4F除以離他最近的一個整數,也就是2。這樣它就變成了9/8F。按照這樣的方式,古人在沒有計算計算機的情況下一直算到了243/32 F。通過如上的對應關係,形成了最早音律,最終這些比例的頻率將一個八度音程分成了七份(如表1-1所示)

表1-1:五度相生律演化出來的八度音階(注意:音名其實是與固定音高的聲音一一對應的,比如C4=261Hz,A4=440Hz)

可以看到有兩種比例出現,一種是1.125,另一種是1.0535,前一種音程叫做全音,後一種叫做半音。

這套理論是通過2:3的頻率比制定而成的,在樂理中這樣音程被稱為「純五度」,所以這套音律被稱為「五度相生律」。但是這套音律自誕生之起就飽受詬病,因為在弦樂中彈奏1:5和1:6的位置就已經很麻煩了,而且聲音很不和諧,現在居然還要彈奏81:64、243:128這樣的位置!

對「五度相生律」的修改自其發明的第一天起就沒有斷過,經過對比例簡單的調整後,純律 (Just intonation) 誕生了。但其實「純律」的修正也很簡單,只是把五度相生律的複雜比例變簡單一點。即243/128變為240/128即15/8、27/16變為25/15即5/3、81/64變為80/64即5/4。這樣做的好處很容易理解,就是為了容易演奏,可是壞處同樣也顯而易見,引入了更多不夠協和的頻率之比。事實上這樣的改動是十分失敗的!

那既然修「正」不行,那就繼續細分。隨著數學水平的上升,大家就開始繼續細分音節,看看能不能對細分後的音節進行修「正」。於是這次由(3/2)變成了(3/2)=129.7≈2=128,這次劃分十分細緻,已經去到了第7個八度。具體的比例如表1-2所示。

表1-2. 最早的12聲音階

可以看出隨著計算能力的上升,這一次的音階數更多,更加細化,同時有更多的半音出現。「#」表示「升高」的意思,「b」表示「降」的意思,所以除了原始的CDEFGAB以外又多了5個半音出現,這使得整個音階更加平滑,能夠描述更多更複雜的曲調

可12音階也存在一個問題:在這12個音階當中,存在兩種半音,它們分別為:自然半音 (比例為1.0535)、變化半音 (比例為1.0676)。這會導致一個問題:假如我想唱一首歌,但是我自己的音域達不到這首歌原調的範圍,我只能把這首歌降調來演唱,但是如果每個音階之間的比例不一樣,降一個半音或者一個全音的時候旋律就和以前不一樣了,那怎麼辦?

後來人們又想出了各種修正的辦法,比如構造一些等差數列來修正每個音與理想曲線的誤差等等,但這些方法既複雜又不能從根本上解決問題。這時整個音樂界都在急迫地等待新律制的誕生。直到公元17世紀,明朝人朱載堉提出十二平均律。18世紀的時候,巴赫也創造了十二平均律,但是他的目的不是為了修善音律,只是為了更好的教自己妻子音樂而已。雖然十二平均律看起來很完美,但也不是完全沒有問題。

十二平均律(表1-3)的原理並不複雜,既然是平均,那就是每個音之間的頻率之比是一樣的。因為一個八度為[F,2F],那麼就直接把這個1:2的關係分成十二份,每一份就是(2)=1.059,這樣雖然損失了一部分完美的協和頻率比,但是這套律法能夠為記錄和創作樂曲提供了更多可能。樂器之王鋼琴上的每一個鍵對應的頻率都可以通過十二平均率推算出來(圖4)

表1-3:十二平均律

圖1-5 鋼琴音高對照表

2. 統計物理與音律的發展

這一部分我們將重點講解Jesse Berezovsky的這篇《The structure of musical harmony as an ordered phase of sound: A statistical mechanics approach to music theory》,看看如何從物理的角度來解釋十二平均律的出現。

基本思路

根據上一章的介紹,人們最終選擇十二平均律的原因是,它在保證了一定的協和頻率比的同時具有「平均」的特性,轉調操作十分容易,可以適應更多的演奏。假如用物理或者數學模型來描述某一種「系統」的演化過程最終這種「系統」中出現了今天的「十二平均律」。那麼出現「十二平均律」的這個點應該具有兩個特徵一、協和程度儘可能高(Minimizes dissonant sounds.)二、它能儘可能描繪足夠多的「音樂狀態」(Allows sufficient complexity to allow the desired artistic expression.)


所以,作者想到如果將以上兩個特徵以物理的方式表述出來,並看作某個系統自然演化的方向,那麼「十二平均律」會不會就是這個系統演化的必然結果。之前人們對音樂複雜性的研究就已經提出了音樂的複雜性可以由「熵S」來表示,同時加上前文所提到的兩個音之間的非協和程度D也可以存在很多經驗公式。作者通過將統計力學中著名的亥姆霍茲自由能(F)的表達式(公式1)改寫為(公式2)來描述一個具有很多不同基頻的聲音產生的系統。



對於一個宏觀系統來說,最小化自由能取決於內能U與熵S在不同溫度下的權衡,而對於這個各種聲音組成的系統,要最小化其自由能,就需要降低這些聲音之間的不協和度D,同時增加其複雜程度S。這正與以上提出的兩個方向吻合。

當然,光是寫出這一個方程還不夠,還需要確定聲音之間相互作用的方式。我們已經知道,任何一個聲音都是由一系列頻率的波疊加而成的,而其中振幅最大的那個波的頻率,也就是這個聲音的基頻。在音樂理論中,「基頻」就是「音高」。而由於組成每個聲音的一系列波的振幅,相位等各不相同,所以即使用不同的樂器演奏音高相同的音時,給人的聽感往往也大不相同,這就是我們說的「音色不同」。在本文中Jesse使用的就是鋸齒音色,也就是「泛音」,這類音色一般可以在弦樂器中找到。

為了簡化計算,作者將兩個音不協和程度的計算方式設定為:先將組成每個音的波按振幅由大到小排列,然後計算其中相同次序的波相互作用導致的非協和度d,最後將所有的d相加,得到這兩個音的總非協和度D。

當然,Jesse首先只計算了一個八度內兩個純音之間的非協和程度與純音頻率差距的關係如圖2-1)

圖2-1. 兩個純音的非協和度與純音頻率之差的關係

其中,

表示兩個音之間的頻率差距,f和fb則是兩個純音的頻率,且fb>f,當Δx=1時,兩個音相差一個八度,也就是頻率比為2。而其中不同顏色的線條代表處於不同頻率區域的兩個音的不協和度。Wc為不協和度最高時的音程。當這兩個音的頻率都很低時,處在低頻的一個八度區間內得到的比較大,而高頻的八度區間內比較小。

既然知道了純音相互作用的協和度關係。那麼接下來就可以對這個充滿很多不同音高聲音的體系進行縮小自由能的「實驗」了。

平均場近似

平均場理論(Mean Field Theory, MFT)是將隨機過程模型中一個單體受到的所有影響近似為一個外部場(External field),從而將多體問題(Many-body problem)分解為多個單體問題(One-body problem)進行求解的理論。這個思想已經在物理學中被廣泛使用了。

對於每一個音來說,它受到其它每一個音相互作用。在使用平均場近似後,這個過程變成了一個音與其它所有音組成的「平均場」相互作用,這將大大減少計算量。根據這個原理,定義以下參數:

其中,式(4)代表一個音和其他音產生的平均場之間的頻率差距。式(5)用來計算整個系統的不協和度。為音高為「x」的音的概率,代表所有音與音高「x」的音形成的不協和度的總和,積分區間為(0,1]是因為設定了周期性邊界條件,(0,1]代表一個八度,積分函數都滿足這個周期性的邊界條件。最後式(6)表示的是這個系統的熵。

其中,因為概率是一個周期函數,所以很容易想到使用傅立葉級數作為他的表達式。可以將其寫成:

圖2-2. (A)當時,計算的鋸齒音色不同頻率差的兩個音的非協和度(圖中展示了兩個八度)。(B)通過(A)圖的非協和度計算出來的公式(8)的每一項的參數d。

那麼,既然所有參數都設置好了,我們就要開始最小化自由能了。在這個系統中,溫度T只是一個參數,並不代表真實溫度。我們如果去模擬一個T不斷變小的降溫過程,並且在每一個T下都使得系統的亥姆霍茲自由能最小時,這個系統中的音的頻率分布會是怎樣的呢?

圖2-3. 隨著「溫度」下降,一個八度內聲音概率密度的變化

如圖2-3縱坐標表示音的概率密度,縱坐標越大說明在一個八度內具有某個基頻音的數量越多,令人驚喜的是,在T=20.2、T=16.3時,都能看到12個概率相同的尖峰。這說明:若是某一個音樂系統,要具有最小的非協和度,同時要足夠複雜時,只需要在一個八度內形成一個有十二項的「等差」音高就行!這正好對應著「十二平均律」的出現。而在T小於16.2時,可以看到12個不同概率的峰出現,這也對應著早期具有12聲音階的純律。

圖2-4.約化序參量隨溫度的變化情況

同樣,我們也可以繪製公式(7)中序參量隨溫度變化的規律。根據圖2-4,似乎可以發現整個系統的「冷卻」過程存在一種二階相變。在這兩個臨界溫度之間存在一種十分穩定的狀態——即「十二平均律」階段。

圖2-5. 不同八度內的序參數的變化

因為上一次我們做的平均場近似固定了,但是從圖2-1可知在不同高低的八度區間內是不一樣的。所以,如果使用正確的會得到怎樣的結果呢?如圖2-5所示,橫坐標為溫度,從右到左不斷降低以描繪所述的降溫過程。左邊的彩色矩形顯示了不同顏色對應的k值,左邊的縱坐標為值,對應右邊從C4到C8共4個八度範圍。

可以看到,在高頻八度範圍出現K=12的「相變區間」非常大,而在其他範圍會出現一些其他的音律,比如「七聲音階」、「五聲音階」等。作者認為這樣的現象來自平均場模型的限制。

原文作者提出的平均場模型近似起到一個拋磚引玉的效果,因為平均場近似並不是統計力學中最準確的模型,作者猜想也許其他模型能夠更好解釋音樂或者音律發展的同時,甚至可以從物理出發指導音律和音樂的發展!其實在本文的後半部分,作者還是用了XY模型 (XY model) 構建了一個屬於音樂的晶格網絡,「溫度」降低的過程中可以發現:相鄰的位置的音程符合一定的規律,甚至可以在這個晶格網絡中看到主流音樂所用的三和弦、五和弦。有興趣的讀者可以查看原文,在此就不過多贅述了。

3. 結語

在本文中Jesse Berezovsky使用平均場近似對一個音樂系統進行「緩慢降溫」過程,在每一個時間步上都使得組成該系統的音高儘可能協和,同時不失多樣性。結果表明,在某個溫度下這個系統的音高組成與近代音律的發展相似。似乎在冥冥之中物理和藝術存在著交匯點。這不禁讓筆者驚喜而又後怕,驚喜的是沒想到嚴謹的物理與數學居然能夠與藝術有所糾葛;後怕的是那些藝術家們窮極一生所創造的作品,就像散落在夜空裡的星星。在我們小的時候成為我們夏日幻想,而在長大的某一天我們才意識到那有可能只是一顆冰冷的星球不知道反射了誰的光芒。

不過筆者認為即使是這樣人們也不應該停下追求真理的腳步,因為這個世界是如此複雜,要想走到最後可沒那麼容易;而且無論是音樂、繪畫、甚至是表演。既然他如此美好,那麼我相信即使人類有一天能夠走到最後,結果也應該不會太差。


文參考資料

[1] Berezovsky J. The structure of musical harmony as an ordered phase of sound: A statistical mechanics approach to music theory[J]. Science Advances, 2019, 5(5): eaav8490.

[2] Plomp R, Levelt W J M. Tonal Consonance and Critical Bandwidth[J]. The Journal of the Acoustical Society of America, 1965, 38(4): 548-560.

[3] 霍華德, ) D M, 安格斯, et al. 音樂聲學與心理聲學[M]. 音樂聲學與心理聲學, 2010.

[4] Benson D J. Music : a mathematical offering[M]. Cambridge, UK ;: Cambridge University Press, 2007.

[5] 音樂與數學, Simon Fang


轉載內容僅代表作者觀點

不代表中科院物理所立場

如需轉載請聯繫原公眾號


來源:集智俱樂部

編輯:利有攸往



關鍵字: