Posted By Mr. Thursday

拓樸 (topology) 在研究一種抽象轉換的關係,不管是函數、實數集合、或是普通離散物品的集合,拓樸的轉換都可以應用在上面。對於不是以數學為專業的讀者來說,要如何了解拓樸呢?就可以試著從上圖一目了然。上面這張圖有三列,每一列有三件物品,雖然這三件物品看起來外觀形狀都不相同,但是在拓樸學家的眼裡,這三件物品是等價的。等價英文用equivalent來表示,就是說三件物品,在壓縮扭曲拉開等各種變化之後,就可以變成另外一件東西的形狀,但是轉換的過程中,沒有「打斷」物品上面任何一個地方,所以是等價的轉換。所以第二列來看,在拓樸學家眼中,一個甜甜圈、有把手的茶杯、和捲筒,是等價的!但是拓樸的轉換,和語意又有甚麼樣子的關係呢?
我們在討論拓樸和語意的關係之前,已經了解拓樸,所以現在來解釋一下語意(semantics)。首先我們可以看看下面這張圖:

所謂語意,可以說是用語言來表達意義,因此在語意網路裡面,文字和意思,會有一些對應的關係。然而意思除了人頭腦自己想出來的意義,有些意義是有所指謂的,也就是說,有些意義是會對應的真實世界裡面的物體、事情、或是事情之間的關係。所以在上面這張圖裡面,我用實心的藍色圓,代表真實世界裡面的物體、事情、或是事情之間的關係。我用空心的藍色圓,代表人腦裡面,對這是事物產生的對應的「意義」。用實心的正方形,代表我們人類使用的語言,對這些「意義」所做的對應。這張圖就表達了我們人類要描述世間萬物的時候,先在大腦裡面產生「意義」來對應世間萬物,在用「語言」輔助我們讓意義更清晰、更細膩地被表示,或是幫助人與人之間可以用「語言」來溝通彼此大腦裡面所想到的「意義」。
世間萬物、意義、和語言之間的對應關係
上面那一張圖,除了從「世間萬物」、到「意義」、到「語言」有三層結構外,中間有三種不同顏色的線條,分別代表著不同層之間,三種不同的對應關係。綠色我用來代表「多對一」的關係,紅色我用來代表「一對多」的關係,咖啡色我用來代表「一對一」的關係。這些關係是甚麼意思呢?舉例來說,先看綠色「多對一」的關係:

這就是說「多個意思」,在語言裡面只用「一個字」來表達,也就是比較模糊,或是可能產生一語雙關的地方。一些「一字多義」的單字,像是 content,當名詞的時候表示「內容」的意思,當形容詞的時候,有「知足、滿足」的意思。紅色線條,則是代表「一對多」的關係,也就是說一個意思,可能用兩個以上的單字來描寫,讓一個概念更細膩的被描述,或是說在不同的場合,對同一個概念有不同的字,或是不同的人身上,同樣的概念用不同的單字。譬如說愛斯基摩人,因為長年接觸冰和雪,因此冰和雪不再是一個簡單的概念,而是可以詳細劃分的概念,譬如說薄冰、厚冰、和刨冰。咖啡色關係則是「一對一」的關係,也就是單字和意思,是一樣多,一樣細膩,每個概念,都有對應的單字來表示來形容。
這是單字層和意義層之間的關係。意義層和世間萬物層的對應關係,也和剛才提到的一樣,綠色的多對一,紅色的一對多,以及咖啡色的一對一關係。意義和單字的多對一代表頭腦裡面有把意思做區分,但是言語上面比較粗略。意義和單字的一對多,代表頭腦裡面某一個特定的意思,在言語上會隨著交談對象或是應用場合,有更細膩的文字區別,或者因為鑽研多年,有更詳細的區分。一對一則可以說整個系統很完備(complete)了。
一對一、多對一、一對多對應關係
愛斯基摩人的例子,則是同樣適用於意義與世間萬物對應的關係,因為同樣都是冰,在大腦裡面會詳細區分是哪一種冰,一種物體對應多種意思 (物體到意義的一對多),此時如果概念在隨著交談場合,用更細膩的文字做區分,就會變成是一種意義對應多個單字了(意義到單字的一對多),譬如說「我」的概念,可能有「我」、「吾」、「在下」、以及「朕」。相反地,多對一 (多個物體用一種意思代表),就是模模糊糊,多個意思用一個單字,也是模模糊湖,或是同意字的關係了,譬如說「行」、「走」、「跑」,都用「移動」來表示,就是多種意思,只用一個單字來表示了。
語意和拓樸的關係
所以拓樸在不打斷物品的情況下扭曲後會等價,和語意的各種對應關係,有甚麼樣子的關聯呢?首先我們看一篇文章,一篇文章有一篇文章要表達的意思,然而同樣一篇文章,我們可以用中文寫,也可以用英文寫,但是對應的意思是一樣的。又或者同樣都是中文,我們可以改寫一篇文章,讓文章長度更長,或是言簡意賅,讓文章長度變短,然而意義上是等價的。這就是我覺得拓樸和語意之間有關聯的部分了。意義可以說是「概念」和「概念」之間的關聯性 (relation),譬如說生物包括動物和植物的這種分類關係,或是行、走、跑,都是移動;移動和轉動,都是動作等抽象關係。然而一旦關係確定後,語言上面可以有不同的變化,可以有同義詞多對一,可以有細膩描述的一對多,也可以用類似數學符號一對一嚴謹的對應,用完備的系統來描述意義。這就和拓樸裡面的物品,只要物品表面上面點和點之間的關係 (relation)不變,也就是沒有「打斷」,物品扭曲擴張壓縮,形狀怎樣子不一樣外觀怎樣子不同,拓樸結構看起來,都是一樣的。
最後,拓樸裡面有一種結構叫做流形,英文叫做 manifolds。這是一種拓樸結構,所以全域 (globally)來看,他和拓樸結構一樣,扭曲擴張壓縮,都可以維持等價。然而流形 (manifolds) 特別的地方在於,區域 (locally) 來看,他可以轉換成歐氏空間(Euclidean Space)。不管歐氏空間是甚麼東西,只要能夠轉換成歐氏空間,就代表現在各種機器演算法都可被處理,因為距離的衡量,就是直接相減就可以得到,不過在這個時候扭曲壓縮擴張,距離就會跟著變,關係就會亂掉了。但是流形 (manifolds) 可以全域上扭曲壓縮擴張,保持原來的關係等價,區域上又可以轉換成歐氏空間用相減來計算距離,因此我才會猜測 (postulate),流形 (manifolds) 這個結構,是適合處理語意相關的問題的。
不過光是猜測,可能不大足夠。如果是數學家,要寫出證明才算數;如果是電腦科學家,要寫出程式可以跑出結果才算數;如果是企業家,要變成成品,有使用者開始使用才算數。無論如何,總是有個起點,接下來就是繼續努力往前跑了!共勉之。
相關資料
- (Wikipedia) Semantics
- (Princeton University) WordNet 可以查同意字反義字相似字的字典免費軟體
- (Wikipedia) Topology
- (Wikipedia) Manifold
- (維基百科) 歐氏空間
相關推薦
![]() |
![]() |







星期四是學數學的吧?:)
這篇文章讓我想起Saussure的binary order…
(真是一場夢魘orz)
「愛斯基摩人的語言裡,冰與雪有許多單字」,按照Steven Pinker所著的《語言本能》一書(中文版商周出版,洪蘭譯)的說法,是一個廣為人知的「謠言」。該書裡說,愛斯基摩人的語言裡,冰雪的單字和英文的數量差不多。所以,這可能不是個好例子。
多謝指正….本人不是語言學家
還請語言學的專家們多多指導
稍微google到一個blog…如果該作者沒有解釋錯誤…應該也是講這一件事
另外本人也不是數學家…(算是學資訊科學, 然後剛接觸神經生物方面)
所以如果有不正確的地方也請數學的專家多多給予指導
非常感激!
http://blog.chinatimes.com/passing/archive/2006/10/28/1436.html
我不是很會數學
不然的話看到這篇文章我會很想學拓墣的
有點不知所云…
[...] 在《探討拓樸和語意之間的關係》這篇文
我大致同意拓樸和語義有關這件事,雖然和你的理由不太一樣。不過在 manifold 那方面, homeomorphism 是不保距的,所以討論 map 到歐氏空間後的距離可能意義不大。更重要的是,幾何中「距離」的概念在語義學中可以發揮什麼作用?我以為這一件事應該才是這個 proposal 需要釐清的論點。
如果你要考慮幾何物件的其他 local 性質,或許也可以從微分幾何裡找點靈感。
我想到manifolds主要是因為距離函數的關係
目前各種電腦的演算法或資料結構
通常都需要資料之間的距離,才能判斷是否相似或是進行排序等動作
然而文字之間的距離,和意思之間的距離,比較像是manifolds的關係
————————————————
也就是說,一件事情的意思,好像整個地球的表面
但是不同的文章和文字,就好像地球在東西南北各個方向不同的投影地圖 (projection)
————————————————
這些文章和文字,不管是用頻率(TF-IDF),文字筆劃,或是直接比對符合的文字個數
都沒辦法比對出,他們是形容同一件事,同一個意思,也就是意義上距離很近
這些文章使用的文字語言可能不同,因此在文字語言的空間上距離很
但是在意義的空間裡面,這些文章應該是距離很接近的點
————————————————
歐式空間的距離,和目前各種演算法使用的距離函數比較接近
而manifolds有local hemeomorphic to 歐式空間的性質
global又可以讓各種投影合而為一的性質
因此我會覺得在語意問題的處理上
manifolds可以當成一種資料結構來使用
剩下的問題…大概就是如何讓電腦自己從閱讀文章的過程裡面
學習出manifolds
————————————————
因為數學家定義了manifolds….卻沒有提到怎樣從data建立一個manifolds…?
另外因為manifolds本身又不大容易理解…我也非數學本科出身
因此是否有從data學出manifolds的方法我還沒有完全清楚…
有錯誤還請多指正…謝謝!
: 歐式空間的距離,和目前各種演算法使用的距離函數比較接近
: 而manifolds有local hemeomorphic to 歐式空間的性質
我再解釋一次:local homeomorphism 並不保距也不唯一,同一個 manifold 上的同一個點的同一個 neighborhood 有無限多個 homeomorphism 映到 R^n。它們 map 過去之後的歐氏距離是沒有意義的,因為你選不同的 homeomorphism 就會有不同的結果。
謝謝補充!有時間的時候我會再仔細研究一下homeomorphism的定義
thanks!