Category Archive for 'Research'

Posted By Mr. Thursday 在康威生命遊戲裡面,棋盤上的每一個格子,都根據四條規則,決定下一秒鐘是否存在。在生命體裡面,尤其是在神經科學裡面,有時候也會有類似的問題。譬如說,如果我們想要知道今天這個神經網路,遇到某種刺激會產生某種反應,是因為網路連結之前可能經驗某些刺激,以及天生基因的影響,因此形成現在觀察到的神經活動。又如同想要預測這個世界每一分每一秒的活動,我們可能需要知道前一秒的世界,甚至更前一秒的世界裡面,每一個原子分子的活動,才能決定性地 (deterministically) 預測出下一秒鐘,世界會是什麼樣子。 然而就一個生命體,或著縮小範圍,一個神經網路,如果要從最初產生的時間點開始,巨細靡遺地紀錄每一秒鐘的過程,進而預測下一秒鐘這個神經網路或產生怎麼樣子的活動,在過去是非常困難的事情。主要原因是因為我們的測量技術還不夠先進。今天我們有新的技術突破,可以解決比較小規模的觀測問題,就是今天想要提到的兩項研究新聞,分別是德國海德堡的DSLM造影技術,以及加州理工學院的新造影技術。他們分別對斑馬魚 (zebrafish) 和 果蠅 (Drosophila) 的胚胎,作出了最初24小時的造影紀錄。 圖1 斑馬魚胚胎造影圖

Read Full Post »

Posted by Mr. Friday 又到了寫論文的季節。下面這篇文章不是我寫的,而是我求學時代看到的文章,算起來也是好幾年前了。這篇文章的作者,是時任台大資管系主任莊裕澤教授,在看過研究所同學的論文proposal之後,有感而發對實驗室同學寫下的信。當年這封信只在實驗室同學、學弟妹、好友間輾轉流傳,而現在這篇文章的刊出,已經過老師的同意,用意是希望與更多朋友分享。〈文章最後改了一點字句,主要是實驗室的相關細節資訊,刪去與本文主旨無礙〉 ◎ ◎ ◎ ◎ ◎ Dear all: 今年的proposal我用較高的標準來衡量,因此大部份的人都得再花一點時間修正。我的用意是與其等到四、五月你們寫論文時再要求你們改進,不如利用這個寒假好好督促你們把論文的前三章寫得完整。我大致翻了所內今年提出的proposals,我們實驗室的成員大部份只在平均附近(或者低些)。我想如果再不嚴格督促你們,我們以後恐怕無法再以LAB成員自豪。 我大概跟你們提過如何寫proposal,但可能不是很有系統。為了讓你們能把proposal及論文寫好。我花了一點時間整理自己的心得,供你們參考。 論文大致上有五、六章。第一章是Introduction,這一章通常只佔論文整體篇幅的十分之一,卻是最關鍵的一章;它就像一個物品的包裝一樣,即使結果再好,但包裝差,也會讓整篇論文頓時失色。在國際會議論文的審稿過程中,很多委員往往僅從Introduction中評斷論文是否值得接受。Introduction要如何寫好是需要一些天份與努力的,基本上它就像在寫作文一樣,要有強而有力的開頭,在前一、二段就能帶領讀者進入你要研究的領域。接下來的幾個段落,你必須替讀者建立足夠的background,讓他們了解你論文的研究背景。Background建立好之後,你必須點出整個研究的動機,這是最關鍵的地方,動機不足,無法顯示你研究的重要性,變成無病呻吟,甚至連呻吟的聲音都聽不到,不曉得你到底要做什麼。動機點出來之後,通常就會說明你的研究成果及主要貢獻,也就是論文的價值之所在。在Proposal階段,這部分會以預期的方式來呈現。最後,你會花一段文字來說明整個論文的架構,並做為第一章的總結。

Read Full Post »

Posted by Mr. Friday 分散式網路中的Power Law現象 前面談到了網路流量的80/20法則,網路上有80%左右的流量都貢獻給了P2P,而事實上,在P2P的世界裡頭,也到處有著Power Law的影子。 大家先別只想到BT跟eMule。其實這個世界上到處充斥著分散式的系統,而其中許多的網路結構都是以Power Law的模樣呈現:從通訊網路、社交網路、到生物網路都有,譬如著名的AT&T的電話網路紀錄。在這篇2000年研究文獻裡面提到,他們統計過AT&T的電話通聯紀錄,結果發現群眾的通聯模式也符合Power Law的關係。如果說每個人都是平面上的一個點,而每播一通電話就是一條線、連接著播/接電話的兩個人,那麼將可觀察到大多數的點只有幾條連線,但有極少數的點,可連線通往大多數的點──換言之,大多數人可能一天當中只會打給固定幾個人,但有少數人士可能一次打個幾十通上百通。〈當然啦,這些人也有可能是出於電話行銷、業務員、或是電話詐騙才會打那麼多電話,但有這些樣本才算是反映了真實世界。〉 電話網路如此,電腦網路也是如此。大家現在在用的WWW超連結也有著這樣的關係。先前Mr。Saturday寫過Web上的人際網路 – 網路長什麼樣子?描述的就是這個現象。前面不是把打電話類比成圖案嗎?現在請你想像一個網站是一個點,點跟點之間的連線代表超連結,那麼這張圖會長什麼樣呢?

Read Full Post »

Posted By Mr. Thursday 在量子力學 (Quantum Mechanics) 裡面,有個定理叫做「測不準定理」,又稱為「不確定性原理」,英文是 Uncertainty Principle。這個定理是在講些什麼呢?是否是說,我們如果要測量一個東西的長度,拿一把尺,測量的時候因為刻度不夠細會有誤差呢?No No No。那麼是否因為物體會動,尺不會動,所以測不準呢?這樣子只有一部分正確。如果要用很簡單的白話文來說明測不準原理,應該就是:(下面有更正修改過) 物體有兩個性質,分別是「位置」和「動量」。 把物體位置的不確定性變小,動量的不確定性就會變大。 物體位置的不確定性變大,動量的不確定性就會變小。 不確定性越大,測量者就無法準確測量。 譬如說我要測量一本書的長度,如果我把書本固定在桌面上,我就知道測量的尺要往哪邊擺,但是書本在桌面這個小範圍就會移動的非常快速或非常緩慢(動量變化的範圍,也就是動量變化的不確定性增加),導致我雖然知道書本就在桌面這個範圍裡面,測量的尺卻無法捕捉書本移動的速度。 相反地,如果不限制書本的範圍在一個桌面上面,可以在任何地方,那麼書本的「動量不確定性」(動量可能分部的範圍) 就會變小,動量變化就是質量 (mass) 乘以速度變化 (velocity change) ,這個時候測量的尺如果要追上書移動的速度比較容易,但是卻茫茫然不知道書的「位置」在哪邊了,因為這個時候我們沒有限制書本位置變化範圍在桌面的小範圍內。 因此,「測不準原理」就是敘述物體「位置」和「動量」之間的互補效果 (trade-off) :位置越確定,動量就越不確定;位置範圍越不確定,動量就越確定。MMDays之前曾經介紹過MIT一位物理教授 Walter Lewin 教學如同表演。MIT開放式課程裡面有這位教授的上課內容錄影,其中量子力學介紹這一堂課就有介紹到測不準原理。各位不妨參考一下裡面介紹的內容。

Read Full Post »

Posted By Mr. Thursday 在之前有寫了一些神經科學相關的文章,有些是偏向認知心理的,有些是偏向細胞分子的,或是偏向視覺處理的。神經科學的研究,我本身的是以人工智慧作為出發點,往神經科學研究方向進行。至於為什麼要在人工智慧以外加上神經科學呢?這兩者似乎有一點距離?原來資訊工程的技術是否已經足夠了呢? 這邊我提出幾點研究的動機。首先,目前的機器學習的方式,和人類學習的方式比較起來,有個最大的不同,就是我們人類可能從上課或是閱讀當中自我學習,或是由外在環境給予的經驗來學習。機器同樣也是接收外界的刺激,調整自己的反應來學習,然而機器學習過程當中,有時候會需要滿多人類的介入,譬如說調整參數、調整模型或演算法等等。如果用類比的方式來說,目前機器學習的方式如果用到人上面,就像是把人的腦蓋打開,調整裡面的神經連結,關起來以後再讓人腦跑跑看有沒有學習到。其實這種方式學習也沒有什麼不好,因為機器的目標,其實是服務人類,學習的東西有學到,怎樣子學習到就不那麼重要了。 那麼機器目前學習的情況如何呢?其實目前的電腦和機器算是滿先進的,加上運算速度快,純粹數字計算的能力就比人類心算能力還快,許多應用服務也讓人類生活改善不少。然而有些比較難處理的問題,像是需要人類智能才能完成的問題,譬如說翻譯、圖形辨識、影像辨識、語音辨識、語意了解等等,這些都算是人工智慧 (Artifitial Intelligence 人工智能) 所需要解決的問題,這些問題的解決,沒有隨著硬體速度的增加而解決,因此軟體上面的進步,就是關鍵了!目前對於這些難以解決的方式,有兩種解法:(1) 運用大量的訓練資料,譬如說Google翻譯,使用大量的訓練資料,或是PDA的手寫辨識,大量的訓練資料都讓正確率大大提升。(2) 運用人工運算 (Human Computing) 結合Web2.0的方式,提供人性化的介面,讓每個人在趣味中貢獻微小的人類智力,解決一些大量資料也無法解決的東西,譬如說reCAPTCHA、語意辨識、圖形的ROI (region of interest) 等等。

Read Full Post »

Posted by Mr. Thursday 之前曾經介紹過〈海扁學習與神經網路的同步化〉,今天則是要和各位介紹和長期記憶相關的一個腦部結構,叫做「海馬迴」。「海馬迴」英文稱為 hippocampus,是從希臘文字根 hippos (馬) + kampos (海怪)而來的。 圖1 海馬迴在人腦裡面的位置  海馬迴重要在哪裡呢?主要是因為海馬迴和我們形成長期記憶的過程有關。怎樣子曉得和長期記憶有關呢?最重要的是因為在1953年,有一為病人,名字縮寫為H.M. (Henry M.) ,因為一直為癲癇 (epilepsy) 所苦,因此醫生決定為他開刀,把癲癇的來源,也就是腦部顳葉 (temporal lobe) 的地方,摘除掉。這個部分剛好也就是海馬迴的地方,因此他的左右的海馬迴、以及杏仁核 (amygdala, 負責情緒功能的區域),也被摘除掉了。 手術之後,病人H.M.好像恢復正常,不再癲癇。但是,他開始產生嚴重的失憶症,手術往前一部分時間的記憶消失,手術後無法形成新的長期記憶。人沒有長期記憶的功能,是非常不容易生活下去的!醫師發現這個情況以後,也就在沒有其他醫生會使用這種切除海馬迴的方式來治療癲癇了。對於科學研究來說,我們則是順便從這個病例,了解到海馬迴具有形成長期記憶的功能,詳細迴路可能還不知道,但是至少知道如果整個海馬迴摘掉,就無法形成長期記憶,因此非常重要! 下面是另外一張海馬迴的立體位置圖:(尋找hippocampus的地方) 圖2 海馬迴位置圖

Read Full Post »

Posted By Mr. Thursday MIT News前陣子有一篇報導,敘述有一些和認知語言有關的研究。他們主要是研究南美洲一些原住民部落的語言,主要是巴西的西北部一個叫做Piraha的部落。在那邊除了研究語言之外,也研究該部落的語言,對於數字的概念是如何?他們發現到一個有趣的現象,就是在Piraha這個部落的語言裡面,對於數字的觀念非常模糊,幾乎沒有精確的數字描述。譬如說研究者請他們從1數到10,或是從10數到1,結果用他們的語言,1和2兩個字都有,但是數到3以上,都是同一個單字。也就是說,他們對於數字的觀念,只有「1」、「2」、和「很多」這三種區別。(圖: Edward Gibson教授) 就我們的工作記憶(working memory) 來講,的確也是有類似的現象,譬如說我們印象深刻的數字,第一個大概是「3」,大於「3」的數字,我們比較不容易捕捉其概念。舉個例子來說,中文字的1是「一」,2是「二」,3是「三」,但是4呢?就不是四條橫線了!又另外一個數字比較印象深刻的,大概是7。不是因為7乘以4等於28天,也不是一個禮拜剛好七天,而是因為工作記憶的容量,通常就在7到8位數字左右,觀察一下我們的電話號碼,你說手機有10位數字,但是開頭兩位可能都是固定的,所以其實只要記住8位數字就好,室內電話最多也是8位數,第一位數有時候也是固定的。如果要再科學一點,我們也可以用實驗的方式,來證實工作記憶的儲存容量,對一般人來說就是7到8位數。譬如說亂數唸出一堆數字,然後請受試者寫下記得的數字,一般人大概最多回憶到7組數字 (如果兩個數字一組,7組數字就是14個數字,也就是7個二位數的數字)。 而這則新聞和認知科學上面對工作記憶的發現,也讓我產生了一個大膽的假設,或許有興趣的話,可以實驗來證明一下。我的假設是說:人類數字功能,是一種類似「繞道」而行的方式產生,也就是說數字功能可能不是天生的,但是後天可以勤能補拙,產生數字的功能。為什麼會這樣子假設呢?

Read Full Post »

頁次 3 of 1512345678910...最後一頁 »