Posted by Mr. Thursday 恭喜新年好!今天要和各位介紹的,是有關我們天天都會使用的視覺。視覺是非常重要的,有視覺是非常幸福的一件事。在資訊科學裡面,如何讓電腦也可以看到圖片、看懂圖片,目前也仍舊是一個困難的問題,但也是可以有許多應用的問題。之前在MMDays上面的文章就曾經介紹過電腦視覺的相關應用,譬如說以圖找圖、超影像連結(hyper video link)、AdSense for video、CAPTCHA、以及無人車比賽等等。 有這麼多應用急待電腦視覺來解決,但是有些解答,或許可以從生物模型上面得到靈感。因此,這篇文章就把過去曾經介紹過的視覺路徑整理起來,從一開始的視網膜、到中繼站的LGN、到大腦皮質的第一站V1、以及之後兩條路徑裡面處理物體移動資訊的MT、和今天會新介紹的和辨識物體形狀有關的IT。最後,也會就目前未知的部分,提供一些假說作為參考。
Tag Archive '大腦'
呼吸的花朵與人機運算的比較
Posted in Mr. Thursday, Research, 大腦, 專欄, 影片, 神經生物, 網路新聞, 認知心理 on Aug 23rd, 2008
Posted By Mr. Thursday 下面的FLASH是由 Arthur Shapiro 所製作的視覺錯覺。原本固定形狀的花朵,加上邊緣的線條,就會開始規律地扭轉,好像在呼吸一樣呢! FLASH1 呼吸的花 Arthur Shapiro會在他的blog每天製作一個視覺的錯覺 (Visual Illusion)。也許會納悶,怎麼人的視覺系統會產生錯覺呢?這樣子不就不大好?其實我們也可以說,因為人類視覺系統如此特別,所以可以輕鬆地辨識物體,尤其在切割兩個重疊的影像的時候,我們可以很輕鬆地把同一盤菜裡面的菜和湯分開來,如果要用電腦來處理,目前仍然無法很容易地進行。 其中部分原因,是因為我們的視覺系統是用對比的訊號 (contrast),而不是像電腦的編碼,儲存的時候是用點陣圖的方式儲存,對比的資訊需要另外計算。電腦似乎就是用「絕對」的方式來處理視覺資訊,而人腦就是用一種「相對」的方式來處理視覺資訊,因此對電腦來說不容易的視覺工作,人腦是非常容易辦到,不過也因此會有副產品的產生,就是視覺上的錯覺了。之前曾經介紹的Ebbinghaus Illusion,就是可以說明我們使用相對資訊來處理視覺,因而產生錯覺的例子,您看!中間兩個圓圈是一樣大的,但是因為週遭圓圈大小不同,我們相對的視覺系統,就產生大小不同的錯覺了。 圖1 ebbinghaus illusion 除了「相對」的處理方式是人腦和電腦有所不同的地方,「平行計算」是另一個可以比較的地方。不過無論是電腦或是人腦,都會有平行計算,因此今天想探討的是另外一個問題,請各位先觀察一下下面這張圖片: 圖2 人腦XOR 這個圖片是由 Mark Changizi 所製作的,主要的想法是希望能夠利用人腦平行計算的能力,來解決一些邏輯上的運算。譬如說上面這張圖,是希望在圖的最上方可以放0或1,0的盒子會遠離觀賞者,1的盒子看起來會朝向觀賞者。接著觀賞著沿著這張設計好的圖,運用人腦的平行計算能力,看到圖片最下方的地方,如果感覺是朝向觀賞者,就說是1,如果最下面看起來是遠離觀賞者,就說是0。而這張圖的設計,可以讓觀賞者自然地從上面看到下面的時候,做了一個XOR (exclusive OR) 的運算。 不過我想探討的問題就是:平行計算應該是發生在運算初期的部分,無論是人腦還是電腦的平行計算。
猴子使用意念移動機械手臂
Posted in Mr. Thursday, Research, 大腦, 專欄, 影片, 神經生物, 網路新聞, 電腦科學 on Jul 23rd, 2008
Posted By Mr. Thursday 由匹茲堡大學 (University of Pittsburgh) 和卡內基美隆大學 (Carnegie Mellon University) 的研究團隊所做的研究,把電極插到猴子的頭腦裡面,接著用電腦分析讀取電極傳出來的大腦訊號,轉換成機械手臂移動的指令,猴子便能夠用「想」的,移動機械手臂來自行拿取食物來吃。讓我們先看一下 DEMO 的影片。 這個研究如果將來技術成熟之後,可以應用在一些癱瘓病人身上。他們大腦裡面負責運動的區域可能還是好的,但是運動的肢體像是手臂等等,可能已經無法使用,這個時候就可以用機械手臂來取代,並且透過電及和電腦分析,讓使用者可以用意念,來指揮機械手臂。 目前比較困難的是,研究人員發現插進大腦的電極 (electrode) 在幾個月之後就會無法使用,因此這部分還有待突破。然而大腦運動區域訊號的分析,則是已經有顯著進展,只要先有一小段訓練時間,電腦就可以慢慢了解猴子移動手臂往上、往下、往前、往後、往左、往右、開始、停等訊號。 此外,我個人的觀察是,首先,因為運動神經在腦幹 (brain stem) 的區域會左右交換,因此影片中猴子右手一邊在動,但是我猜他們放置電極的地方可能是左腦的運動區。其次,運動訊號主要就是從大腦的主要運動皮質 (primary motor cortex) 區域裡面,負責手臂運動的地方的訊號來分析。不過不知道如果加上小腦 (cerebellum) 的訊號,會不會讓效果更好?因為小腦主要就是對運動進行微調,負責無意識的運動調節學習 (adapt)。 大腦的運動區域對身體的分佈,可以參考大腦一日遊裡面的這一張圖的說明: 左邊是主要感覺區的分佈,右邊是主要運動區 (primary motor cortex) 的分佈,臉部無論是感覺或是運動,都佔了很大的比例,代表對臉部的感覺和運動很細膩,需要比較大的區域來處理或產生訊號。另外,皮質區 (cortex) 是有意識的資訊的處理,訊號離開大腦後,會延著腦幹,往脊隨 (spinal cord) 的方向傳遞,中間會經過小腦,也會隨著訊息的目的地在不同的地方左右互換,這部分滿複雜,可能要重新複習一下課本才會記得,有興趣的讀者在繼續深究這一部分吧!