讀了這許多年數學,越來越發現思想開通是學數之人的一種必備特質。這裡的「思想開通」是指腦筋靈活,不
宥於一種思維定勢,不墨守陳規,隨時準備接受新概念或意念。雖然學習其他學科往往也需要具備這種特質,
但由於數學是最抽象的學科,學習數學幾乎就等於做「腦力體操」,需要不斷動腦筋,因此便特別需要上述這
種特質。
以前曾聽人說過,學數之人思想呆板,因為他們一切依循既定的公式。上述看法是不懂數學的人的誤解。其實
,在數學中能用公式或既有方法(即「算法」Algorithm)解的題目只佔極少數(註1)。有些人根據他們在中小學
學習數學的經驗,以為學數無非就是學習一些標準的解題公式或方法,但其實這只是片面的看法。初等數學或
非數學專業由於須顧及學生的數學水平和較為著重學生應用數學的能力,因此偏重於數學技巧方面。但是學習
數學的真諦並不在於掌握一些解題技巧,而是在於了解各個概念、定理之間的邏輯關係。因此,對於學數之人
來說,解題結果不是最重要的,邏輯推理過程同樣重要。
現在開始從幾個角度談談為何學數之人需要具備思想開通的特質。首先,學習數學就是不斷接觸新概念的過程
。翻開一本典型的大學數學教科書,你便會見到很多定義、定理。每一個定義都是新概念,而定理則是有關這
些概念的性質或者概念之間關係的陳述。看這些書的過程就是不斷接收新概念,並且根據這些概念的定義進行
推理的過程。有時對一個剛剛接收的新概念還未了解透徹,便又碰到另一個新概念。而且由於數學已發展到高
度專業化的程度,每當你接觸一個以前未曾涉獵的題目,便會碰到一大批陌生的概念和符號,有時連這一領域
的數學家的名字也未聽過。誇張點說,真可以用「驚心動魄」來形容。
數學上有很多新概念是從舊概念推廣(generalize)而來的,這一方面使學數者得以借助舊概念理解新概念,另
一方面亦要求學數者能從不同的角度思考,辨別新舊概念之間的異同,因為新概念往往不是舊概念的簡單推廣
,而是在對舊概念進行重新解釋或突出舊概念某些點後作出的推廣。
例如在點集拓撲學(Point-Set Topology)和分析學(Analysis)有一個「距離空間」(Metric Space)的概念,這
裡的「距離」(Metric)便是從平面幾何學中兩點之間的「距離」(Distance)推廣而來的。可是Metric並不是
Distance的簡單推廣,而是從另一個角度考慮Distance的性質,並且突出了Distance的幾個特性。首先,我們
看到距離其實是平面上任意兩點的一個函數(Function),即任給兩點的坐標,均存在唯一一個實數作為該兩點
間的Distance。由於Distance是一個函數,因此我們可以用一般函數的表示法把它表達為d(x, y)的形式,這
裡x和y是平面上任意兩點,d就是Distance這個函數,而d(x, y)就是x與y之間的Distance。此外,我們還看到
d此一函數具備以下三大特性:(1)兩點間的距離不為負數,而且兩點間的距離為零當且僅當該兩點重合,用數
學符號表示就是
(2)距離關係是對稱(Symmetric)的,即任意兩點x和y之間總滿足
(3)任何三角形其中兩邊的和總不少於第三邊的長度,此即「三角不等式」(Triangle Inequality),用數學符 號表示就是任給x, y, z三點,總有
對Distance有了以上認識後,數學家便把Distance這一概念推廣為Metric概念,即把Metric定義為某一集合中
任意兩個元素的函數,此一函數須具備以上(1)、(2)、(3)三個特性。經此一推廣的Metric概念不再只是幾何
上的概念,而是一個適用於多種數學領域的抽象概念。例如,假設我們考慮所有以[0, 1]閉區間為定義域的有
界連續實值(Bounded Continuous Real-Valued Function)函數,並把所有這些函數看成一個集合,那麼這個
集合的元素不再是平面上的點,而是一些函數(例如sin x、x2等)。為了避免混淆,這裡使用f、g
等代表這個集合的元素。假如我們在這個集合上定義一個距離函數d,把d(f, g)(請注意這裡的f和g不是點而
是函數)定義為|f(x)-g(x)|在x屬於[0, 1]範圍內的最大值(或者更準確一些,是「上確界」Supremum),那麼
可以證明這樣定義的d符合有關距離函數的定義。由此我們見到,平面幾何上的Distance概念可以推廣用於幾
何以外的數學對象。除了距離外,泛函分析(Functional Analysis)中的「範數」(Norm)和拓樸學中的「拓樸
」(Topology)概念也是採用類似方法從幾何學的概念推廣而來的。
有時有些新概念還須改變原有概念的思路,以突破原有概念的某些局限。勒貝格積分(Lebesgue Integral)便
是從黎曼積分(Riemann Integral)的原有框架發展而來的。由於介紹勒貝格積分須涉及很多測度論(Measure
Theory)的專門概念和知識(例如「測度空間」Measure Space、「可測函數」Measurable Function等),這裡
只能很粗略地介紹這兩種積分的基本原理,並且只限於討論有界可測函數(Bounded Measurable Function)的
積分。非常粗略地說,積分(這裡是指「定積分」Definite Integral)是一個求「無限和」(Infinite Sum)的
過程,即求積分範圍(即定積分的上下限所組成的區間)內某連續函數的所有值的總和。由於連續函數在一般的
定義域下有無限個值,而進行無限次相加是不可行的,因此求積分實際是只選取有限個函數值代表某範圍內的
函數值。這實際上是用有限個函數值近似表示無限個函數值的過程,隨著選取的函數值越來越多,近似值的準
確度便越來越高。當選取的值的數目趨向無限大時(此即微積分的求極限方法),上述近似值便趨向於所要求的
積分值。因此積分的本質就是選取函數值、然後求和(Summation)、再後取極限(Limit)的過程,上述兩種積分
的差別在於選取函數值的方法不同。
黎曼積分的基本原理是在積分範圍(假定為區間[a, b])內選取n + 1個點(包括x0 = a、x1
、x2......xn-1和xn = b),從而把積分範圍分為n個子區間(Sub-
interval)(見下圖)。接著在每個子區間([xi, xi+1])內任意選取一點(zi
),並以f(zi)代表整個子區間的函數值。然後把f(zi)乘以該子區間的長度
xi+1 - xi(以下簡記為Δi),f(zi).Δi就是該
子區間內所有函數值總和的近似值。把所有子區間的f(zi).Δi加起來便可得有關函
數在積分範圍內的所有函數值總和的近似值。最後取極限,如果極限存在,該極限值就是所要求的黎曼積分,
寫成數學式子就是
在上式中,lim代表取極限,有關極限是在n趨向無窮大而且子區間的最大長度趨向零時的極限;Σ則代表求和 ,即把括弧中從i=0到i=n的所有值相加的運算(註2)。
黎曼積分的缺點是不能應用於某些不連續的函數,這大大限制了某些數學領域(例如傅立葉分析Fourier Analysis)的應用範圍。為了彌補黎曼積分的不足,數學家們另闢蹊徑,對黎曼積分的定義加以改造,此即勒 貝格積分。勒貝格積分的基本原理與黎曼積分類似,兩者的不同之處在於:黎曼積分是把自變量(Indendent Variable)的取值範圍(即x軸上的範圍)分割為子區間,而勒貝格積分則是把因變量(Dependent Variable)的取 值範圍(即y軸上的範圍)分割為子區間(見下圖)。假設函數f在積分範圍內的值滿足c < f(x) < d,我們首先在 區間[c, d]內選取m + 1個點(包括y0 = c、y1、y2......ym-1 和ym = d),從而把[c, d]分為m個半開半閉的子區間([yi, yi+1) )。接著在每個子區間內任意選取一點(wi)代表整個子區間的值。每個子區間[yi, yi+1)在積分範圍內都有一個對應的逆(Inverse):Ei = f -1 ([yi, yi+1)) = {x | yi <= f(x) < yi+1}。這些 Ei把積分範圍劃分為一個個互斥集(Disjoint Sets)(但請注意Ei不一定是單個區間, 它可能是由幾個區間組成的並集,也可能是由點組成的集,或甚至空集)。由於f是可測函數,因此每個 Ei都有一個「測度」M(Ei)(相當於前述黎曼積分子區間的長度),因而仿照黎曼積分 ,我們可以定義勒貝格積分為
上式中lim和Σ的意義和取值範圍跟黎曼積分相仿(註3)。
數學家已證明所有黎曼可積(Riemann Integrable)的函數(即可計算其黎曼積分的函數)都是勒貝格可積(
Lebegue Integrable)的,反之則不然,而且當兩種積分均存在時,它們的值相等。由此可見,勒貝格積分確
是黎曼積分的推廣,它能解決一些黎曼積分不能解決的問題。
有時對於同一個課題,學數者不僅須學習一種理論或一種方法,還須學習其他理論或方法,因為不同的理論或
方法各有其著重點和特色,參考不同的理論或方法往往可使學數者擴闊視野,獲得新的啟發。例如著名的「代
數學基本定理」(Fundamental Theorem of Algebra)便有多種不同的證明法,分別可以從代數學、分析學和幾
何-拓樸學的角度研究這同一個問題。如能考察這些不同的證明法,除了能從不同角度理解這條定理的意義外
,亦能看到數學各學科的統一性。
從不同角度考察同一個問題往往還可以幫助數學家發掘新的理論,微積分便是一個很好的例子。牛頓(Newton)
最初創立微積分時是使用「無窮小量」(Infinitesimal)的概念的。雖然微積分能非常有效地解決一些實際的
物理學問題,而且在其創立後獲得了廣泛應用和發展,但是由於無窮小量的概念相當模糊和不嚴謹,微積分一
直缺乏堅實的理論基礎,而且還常遭逅病,例如英國哲學家貝克萊(Berkeley)便曾批評無窮小量的定義有任意
性。微積分的此一問題甚至構成數學史上有名的「第二次數學危機」。此一情況直至19世紀柯西(Cachy)建立
嚴格的實函數理論和魏爾施特拉斯(Weierstrass)創立一套用來表述極限的「ε-δ語言」(註4)。自此微積分(
以及以微積分為基礎的整個分析學)便有了嚴格穩固的理論基礎,「極限論」取代「無窮小量」成為微積分的
基礎。今天一般的大學微積分課程均以極限論作為基本的課程內容,此即今天所稱的「標準分析」(Standard
Analysis)。
極限論雖然圓滿地解決了微積分的理論基礎問題,並且化解了第二次數學危機,可是數學界並不以此為滿足。
部分數學家仍然對無窮小量念念不忘,希望能建立無窮小量的嚴格理論。至20世紀60年代,羅賓遜(Robinson)
在引入「超實數」(Surreal Number)的概念後終於建立了嚴格的無窮小量理論,並據此構造了微積分的另一套
理論,稱為「非標準分析」(Non-Standard Analysis),打破了極限論在微積分中一統天下的局面,並且恢復
了無窮小量在微積分中的應有地位。此一事例告訴我們,知識探索(特別是數學的探索)是永無止境的。有時某
些知識領域表面上看已發展成熟,再無發展餘地,但若從另一個角度另闢蹊徑,卻可能創出一個新天地。
保持思想開通有助學數者接受新事物和新概念,相反,抱殘守闕、故步自封則會令一個人難以接受新事物,甚
至阻礙數學的進步。這一點在數學史上也不乏其例,非歐幾里德幾何(Non-Euclidean Geometry)的誕生便由於
人的成見而經歷了一段滄桑史。非歐幾里德幾何是在否定著名的「歐幾里德第五公設」的情況下產生的。眾所
周知,歐幾里德(Euclid)是古希臘的偉大數學家。他的巨著《幾何原本》不僅匯集和整理了當時已知的幾何知
識,而且還把這些知識表達為結構最嚴密的邏輯形式-公理系統。一個公理系統是以一些「不經定義的原始概
念」(Undefined Concept)和「公理」(Axiom,有時又稱「公設」Postulate)為出發點,運用正確的邏輯方法
逐步引入其他「定義」(Definition)和「定理」(Theorem)。在公理系統中,原始概念和公理是原始的、是邏
輯推理的起點,即原始概念是無需(亦無法)定義的,而公理則是無需(亦無法)證明的。相比之下,定義和定理
則是派生的,即須根據正確的邏輯方法由原始概念和公理(或較早出現的定義和定理)推導或證明出來。
歐幾里德建立的邏輯體系雖然被後世奉為用公理方法建構嚴密邏輯系統的典範,但它也並非全無瑕疵。事實上
,在《幾何原本》問世後數百年間,便有不少數學家指出歐幾里德的邏輯系統在某些方面還未夠嚴謹,例如它
的某些證明含有直觀(Intuition)因素,而不是純粹從邏輯出發。不過最受爭議的還是它的「第五公設」(俗稱
「平行公理」Parallel Axiom)(註5)。在《幾何原本》中共有五個公設,前四個公設是關於點、線、圓和直角
的性質,它們的表述方式都很直觀簡單。但是第五公設卻很特殊,它的表述方式很複雜,而且並不直觀(需要
作圖才能理解其含義),令人懷疑它不是公理,而是一條定理(套用邏輯學的術語,這即是說歐幾里德的公理不
是互相獨立的,某些公理可由其他公理推導出來)。在《幾何原本》問世後,有很多數學家嘗試用各種方法證
明平行公理可由歐幾里德的其他公理或定理推導出來,但結果都徒勞無功。後來有一些數學家嘗試用反證法(
Proof by Contradiction),即假設平行公理不成立,希望據此推出一些與已有幾何定理(在邏輯上不依賴於平
行公理的幾何定理)相矛盾的結果,從而證明平行公理。可是事與願違,他們無法推出矛盾,這似乎告訴人們
平行公理的確是一條獨立的公理。如果真是這樣,那麼如果我們把平行公理換為它的其中一個否問題(
Negative Statement)(註6),
到19世紀,俄國數學家羅巴切夫斯基(Lobachevksy)(其實匈牙利數學家鮑耶依Bolyai和德國數學家高斯Gauss
在此時期也發現了新的幾何學,不過羅巴切夫斯基是系統地闡述這種新幾何的數學家,故一般以他作為發現新
幾何的代表人物)索性從平行公理的一個否命題出發,即假設過一直線L外一點有多於一條直線與L不相交,並
據此構造了一個與歐幾里德幾何非常不同但卻無矛盾的幾何系統,宣告了「非歐幾里德幾何」的誕生。在這個
系統中,有一些很奇特的結果,例如上述與L不相交的直線竟有無限多條,任何三角形的內角和均小於180度等
。請注意這種新幾何的發現不是基於對宇宙的觀測,也不是基於對某個實際問題的求解結果,而純粹是邏輯推
理的結果。因此它的誕生標誌著人類抽象思維能力的成長-人類的理性思維(不包括幻想、精神病等)可以與現
實世界的知識毫不相干,純粹從抽象的邏輯概念和公理出發進行推理。沒有這種成長,我們實難以想像其後數
學和物理學的飛躍發展,尤其是那些需要與高度抽象的概念打交道的理論(註7)。
可是,由於這種新幾何的結論跟千百年內人們所學習的幾何知識以及人們在日常生活中的經驗大相徑庭,因此
在當時不為世人所接受。人們難以想像在下圖中除了直線M外,何以還有其他通過P點而與L不相交的直線,因
為所有其他通過P的直線(例如N和O)終將與L相交。他們更無法想像如何可以根據上述這種「錯誤」的前提進行
推理,並推出其他更「荒誕」的結論。這是因為每當人們想到直線和點,只會想像如下圖那樣的直線和點,歐
幾里德幾何是那麼符合人們的日常經驗,要人們想像別的東西實在是非常困難。可是現代數學正就是在這種異
乎尋常的推理和思考中建立起來的。
不過,在非歐幾里德幾何誕生後不足一百年,人們發現這種新幾何其實也並非不可想像和毫無用處。事實上,
數學家克萊因(Klein)和龐加萊(Poincare)找到了可用來解釋非歐幾里德幾何的模型(Model)。同時,另一位數
學家黎曼(Riemann)則從平行公理的另一個否命題出發,即假設過一直線L外一點的所有直線均與L相交,並且
修改了歐幾里德幾何中某些與此假設不相容的前提,由此構造了另一種非歐幾里德幾何(註8)。在20世紀愛恩
斯坦更在非歐幾里德幾何中找到了應用,他的相對論便需要用上非歐幾里德幾何的定理。而更重要的是,當代
的宇宙學(Cosmology)發現,宇宙的幾何結構很可能不是歐幾里德幾何所描述的那種結構,而是其中一種非歐
幾里德幾何的結構。原來我們日常的習慣觀念竟然不是最準確的,真理竟然存在於一些匪夷所思的理論中!
思想開通不僅在於樂於接受新概念,有時還在於了解和承認自身的局限性。從數學學習中,我們知道並非所有
數學問題都有完滿的答案,有些問題甚至連是否存在解答或者解答是否唯一也不知道。因此數學家除了研究如
何解題外,還須研究某些存在性(Existence)和唯一性(Uniqueness)的問題。對於這些問題,有時會得出否定
性的結論,例如五次或以上多項式方程是否存在一般的根式解的問題以及古希臘三大作圖題(註9)等,這些問
題的答案都是否定的。由於這些問題只涉及數學某一學科的某些具體問題,因此這些否定性結論對整體數學的
影響不大。不過有一些否定性的結論卻對數學(以至其他科學)有重大意義,這些結果都是在20世紀才發現的。
在19世紀末和20世紀初,數學在形式化和公理化方面取得巨大進展。在19世紀末,先有布爾(Boole)和弗雷格(
Frege)設計了表達邏輯推理的符號系統,創立了數理邏輯,其後皮亞諾(Peano)又將這套符號系統應用於算術(
Arithmetic),提出了算術的公理系統。當時數學界普遍有一種樂觀的想法,認為可以把整個數學建立在穩固
的邏輯基礎上(包括集合論和數理邏輯)。在20世紀,數學家希爾伯特更提出「形式主義」(Formalism)綱領,
其要旨是先由算術的公理化出發,逐步把數學各學科建構為形式化的公理系統,以嚴格定義的形式語言表達數
學的所有概念和真理,從而使數學達到立論嚴格、無懈可擊的地步。與此相關的還有一個「判定性問題」(
Decision Problem),即設計一個算法,用來判定公理系統內的任何命題是否為真(即是否該公理系統內的定理
),這又是多少年來數學家的夢想,因為如果能夠設計這種算法,判斷和尋找數學真理的工作便變成機械化的
操作,無需再倚賴數學家的個人智慧。在發明電腦後,更可交由電腦執行這種算法,從而實現「數學機械化」
。
可是,在20世紀先後發生了一系列事件,粉碎了數學界一個個樂觀想法和夢想。首先,在20世紀初,數學家兼
哲學家羅素(Russell)提出著名的「羅素悖論」(Russell's Paradox),指出集合論(Set Theory)中含有深刻的
矛盾。由於集合論是數學的邏輯基礎,可以說整個數學都可以用集合論的語言表述,因此羅素的發現震動了數
學界,構成了所謂「第三次數學危機」。
可是羅素悖論的發現還只是事情的開始,在1930年代初,數理邏輯學家哥德爾(Godel)證明了兩個「不完全性
定理」(Incompleteness Theorem),指出了形式主義綱領是不能實現的。前面提到形式主義綱領的目的是把數
學建構為形式化的公理系統,可是問題的關鍵不僅在於構造這樣的系統,而是在於這些公理系統必須具備某些
重要性質,其中兩個關鍵的性質是公理系統的「相容性」(Consistency,亦譯作「無矛盾性」)和「完全性」(
Completeness,亦譯作「完備性」)。前者是指在公理系統中,不能既證明某命題為真,又能證明其為假。後
者則是指對於任一在公理系統中有意義的命題,必能證明該命題為真或為假(請注意「真」和「可證明為真」
是兩回事)。在這兩種性質中,相容性是更為重要的性質,因為一個有矛盾的公理系統是沒有甚麼價值的。因
此除了建構形式化的公理系統外,數學家還須證明他們所建構的系統是相容和完全的,而由於算術是其他數學
學科的基礎,因此須先證明算術的公理系統是相容和完全的。可是哥德爾定理卻指出,任何一個足夠強的相容
的算術形式系統都是不完全的(註10),即存在一些不能夠在此系統內證明但卻是真的定理(註11),而算術系統
的相容性就正是不能在系統內證明的,換句話說,如果某足夠強的算術系統是相容的,則我們無法在該系統內
證明該系統是相容的。
哥德爾定理對數學(以至其他高度倚賴數學和邏輯學的學科)的重大意義在於它揭示了人類理性(特別是形式化
思維)的局限性,它搗破了希爾伯特的美夢。套用數學家馮.諾伊曼(von Neumann,電腦原理的發明者)的話,
哥德爾定理與相對論和量子力學構成了現代人類的三個「觀念危機」(Conceptual Crisis),因為它告訴我們
,數學並非如我們一直所想像的那樣具有高度的確定性和嚴謹性。正如相對論和量子力學的出現粉碎了先前某
些物理學家以為經典物理學(Classical Physics,主要包括牛頓力學和電磁理論)已概括了所有物理現像的樂
觀想法,哥德爾定理也粉碎了先前很多數學家以為他們可以建立一個包含所有數學知識(包括所有已知和未知
但卻是真的數學知識)的公理系統的樂觀想法。
繼哥德爾之後,圖靈(Turing)在1930年代中葉研究了電腦程序的「停機問題」(Halting Problem),證明了停
機問題是不可解的,即不存在一種算法,可以用來判定任何電腦程序會否停止。由於停機問題跟上述的判定性
問題密切相關,圖靈事實上證明了判定性問題是不可解的,即不存在一種算法,可以用來自動判斷任何數學命
題是否為真。至此,前述數學界的各種樂觀想法或夢想可說已不同程度地落了空。
到20世紀後期,柴廷(Chaitin)從信息論(Information Theory)和計算複雜性(Complexity of Computation)的
角度研究與不完全性有關的問題,創立了「算法信息論」(Algorithmic Information Theory)。他指出公理系
統的不完全性其實來源於數學真理的「隨機性」(Randomness),即公理系統只能說明小部分數學事實,而絕大
多數數學事實都是沒有邏輯結構的。雖然柴廷的思想至今未受數學界廣泛重視,但是他的理論無疑是非常驚人
的,因為根據他的理論,一向被認為絕對嚴格和精確的數學,原來竟是那麼不確定的。此一結果真有點像量子
力學的「測不准原理」(Uncertainty Pinciple),其意義將是極其深遠的。
20世紀可說是一個革命的世紀,除了各國政治上的革命外,各個學術思想領域也發生了革命性的變化,就連一
向被認為具有真理確定性的數學竟也不例外。表面上看,羅素、哥德爾、圖靈、柴廷等人的否定性發現似乎是
消極的,但若果我們採取一種實事求是和開通的觀點,那麼我們便會看到,問題並不出在數學本身,而在於我
們固有的定見和一直沿用的方法不能解決一切問題。既然這些固有的定見和方法不能解決某些問題,或許我們
便要另闢蹊徑,嘗試從新的角度和採用新的方法研究問題。
事實上,在20世紀我們除了見到上述各種否定性結論外,也看到各種為了研究不確定的數學現像而興起的新學
科,例如「混沌理論」(Chaos Theory)、「非線性數學」(Non-Linear Mathematics)、「模糊數學」(Fuzzy
Mathematics)等。而前述的數學家柴廷更指出,由於數學事實帶有隨機性,傳統數學的公理方法乃至演繹法是
不夠用的,因此他主張仿照物理學等實驗科學建立一種嶄新的「實驗數學」(Experimental Mathematics),即
根據數學實驗結果歸納出數學事實,而非單純用演繹法。這是一種相當革命性的思想,因為自從歐幾里德以來
數千年的數學傳統均是採用演繹法。而事實上,自從發明電腦後,電腦已成為數學家研究和發現數學新事實以
及進行數學實驗的重要工具。姑勿論柴廷的主張是否會成為事實,但可以肯定的是,數學界只有保持思想開通
,不宥於一種成見,才能保持活力,才能繼續取得進步。