Category Archive for '專欄'

Posted By Mr. Thursday 今天上網尋找東西或資訊,無論是用Google還是Yahoo,我們用的都是關鍵字 (keyword) 搜尋。關鍵字搜尋對一些專有名詞的資訊搜尋效果不錯,然而有時候我們只知道比較廣泛的概念,想要找比較詳細的資訊卻不知道該下什麼關鍵字,或著是同義字很多,像是 Apple是指水果的蘋果,還是蘋果電腦?或是我們想用自然語言的問句,來界定我們關鍵字的上下文意義,避免找到有這個關鍵字,應用情境 (context) 卻不是想要尋找的情況。「語意搜尋引擎」想要達成的目標就是如此,當少數關鍵字的意思並不明確,無法清楚定義出情境 (context) 或是排除同義字,或是想從廣泛的概念搜尋比較詳細特定的概念,就可以運用語意搜尋引擎來找找。 目前有哪些搜尋引擎呢?針對 Wikipedia 內容來做語意搜尋的搜尋引擎有 Powerset 和 Cognition,Cognition除了包含Wikipedia的內容外,也針對法律 (legal) 內容和醫學 (medicine) 內容做搜尋。Hakia 則是針對整個網路的內容做語意搜尋。除此之外,最近也有 Evri 這個語意搜尋引擎,使用類似資料庫裡面 entity-relationship (ER) 的瀏覽方式,讓使用者可以根據事情之間意義上的關係,從一個網頁連到另外一個網頁,讓超連結 (hyperlink) 不是只有關鍵字的連結,而是經由事物的屬性意義的連結。下面就讓我們先看一下這些搜尋引擎的 DEMO 吧! 影片1 Powerset demo

Read Full Post »

Posted by Mr. Friday 今天是9月20號,距離辛樂克颱風襲台已經過了四天。然而縱使風雨已遠,這場颱風所揭露的諸多弊端,現在才正要開始發酵…。 廬山暴洪沖塌七層飯店 新聞來源:壹蘋果網路〈節錄〉 2008-09-16【陳方瑩、蔡惠光、路暢平╱南投報導】辛樂克颱挾帶狂風大雨,昨重創南投縣!觀光勝地廬山溫泉遭洪水肆虐,2家飯店地基遭淘空,17家飯店淹水,其中7樓高的綺麗溫泉飯店先傾斜,最終倒塌在滾滾洪水中,溫泉區1人活埋失蹤,106人受困,下廬山溫泉區一片水鄉澤國…〈略〉 「根本來不及逃命」 消防救難隊員據報趕到,動用13輛挖土機搶救,約晚上8時30分,從4輛扭曲變形的汽車、1輛機車救出7人,4人自行返家,其中張念華(38歲、信義鄉人、胸腔內出血、左手骨折)和父親張金水(65歲、輕傷),以及一名駕駛陳順貴(52歲、輕傷)3人被送往竹山秀傳醫院,無生命危險。但當地守望相助隊隊員董振彬(48歲)救出時死亡。逃過一劫的陳順貴說,「我的車排在最後,當時土石從山上沖下來,車子就被推落到下方葡萄園內,根本來不及逃命,真恐怖!」

Read Full Post »

Posted By Mr. Thursday 在之前有寫了一些神經科學相關的文章,有些是偏向認知心理的,有些是偏向細胞分子的,或是偏向視覺處理的。神經科學的研究,我本身的是以人工智慧作為出發點,往神經科學研究方向進行。至於為什麼要在人工智慧以外加上神經科學呢?這兩者似乎有一點距離?原來資訊工程的技術是否已經足夠了呢? 這邊我提出幾點研究的動機。首先,目前的機器學習的方式,和人類學習的方式比較起來,有個最大的不同,就是我們人類可能從上課或是閱讀當中自我學習,或是由外在環境給予的經驗來學習。機器同樣也是接收外界的刺激,調整自己的反應來學習,然而機器學習過程當中,有時候會需要滿多人類的介入,譬如說調整參數、調整模型或演算法等等。如果用類比的方式來說,目前機器學習的方式如果用到人上面,就像是把人的腦蓋打開,調整裡面的神經連結,關起來以後再讓人腦跑跑看有沒有學習到。其實這種方式學習也沒有什麼不好,因為機器的目標,其實是服務人類,學習的東西有學到,怎樣子學習到就不那麼重要了。 那麼機器目前學習的情況如何呢?其實目前的電腦和機器算是滿先進的,加上運算速度快,純粹數字計算的能力就比人類心算能力還快,許多應用服務也讓人類生活改善不少。然而有些比較難處理的問題,像是需要人類智能才能完成的問題,譬如說翻譯、圖形辨識、影像辨識、語音辨識、語意了解等等,這些都算是人工智慧 (Artifitial Intelligence 人工智能) 所需要解決的問題,這些問題的解決,沒有隨著硬體速度的增加而解決,因此軟體上面的進步,就是關鍵了!目前對於這些難以解決的方式,有兩種解法:(1) 運用大量的訓練資料,譬如說Google翻譯,使用大量的訓練資料,或是PDA的手寫辨識,大量的訓練資料都讓正確率大大提升。(2) 運用人工運算 (Human Computing) 結合Web2.0的方式,提供人性化的介面,讓每個人在趣味中貢獻微小的人類智力,解決一些大量資料也無法解決的東西,譬如說reCAPTCHA、語意辨識、圖形的ROI (region of interest) 等等。

Read Full Post »

Posted by Mr.Friday 時間真的很快,一轉眼,今天竟是PTT創站十三週年慶!這裡特別慶祝一下這個台灣網路奇蹟的生日,附上47張PTT歷年進站畫面!〈我怎麼這麼認真…XD〉 以下大概是PTT最早的一批進站畫面…

Read Full Post »

Google 讓我們變笨 ?

我們有了網路,但是讓網路更加強大的是搜尋引擎。因為搜尋引擎的關係,人們只要在那小小的欄位內鍵入關字之後,就可以很快地找到相關的資料,從此我們大量地縮短了我們尋找資料的時間。而在這方面,做的最出色的就是 Google,因此 Google 難免成了眾矢之的。

像是根據英國《泰晤士報》14日報導,有18年大學教學經驗的布拉芭蓉認為,資訊取得容易使學生的好奇心鈍化,同時抑制了辯論風氣。然而更令人擔心的是這些正在學習的學生無法辨別網路上面資訊的正確性,但是為了圖一己之便,常常就相信從網路上面所查到的資料。

Read Full Post »

Posted by Mr. Thursday 之前曾經介紹過〈海扁學習與神經網路的同步化〉,今天則是要和各位介紹和長期記憶相關的一個腦部結構,叫做「海馬迴」。「海馬迴」英文稱為 hippocampus,是從希臘文字根 hippos (馬) + kampos (海怪)而來的。 圖1 海馬迴在人腦裡面的位置  海馬迴重要在哪裡呢?主要是因為海馬迴和我們形成長期記憶的過程有關。怎樣子曉得和長期記憶有關呢?最重要的是因為在1953年,有一為病人,名字縮寫為H.M. (Henry M.) ,因為一直為癲癇 (epilepsy) 所苦,因此醫生決定為他開刀,把癲癇的來源,也就是腦部顳葉 (temporal lobe) 的地方,摘除掉。這個部分剛好也就是海馬迴的地方,因此他的左右的海馬迴、以及杏仁核 (amygdala, 負責情緒功能的區域),也被摘除掉了。 手術之後,病人H.M.好像恢復正常,不再癲癇。但是,他開始產生嚴重的失憶症,手術往前一部分時間的記憶消失,手術後無法形成新的長期記憶。人沒有長期記憶的功能,是非常不容易生活下去的!醫師發現這個情況以後,也就在沒有其他醫生會使用這種切除海馬迴的方式來治療癲癇了。對於科學研究來說,我們則是順便從這個病例,了解到海馬迴具有形成長期記憶的功能,詳細迴路可能還不知道,但是至少知道如果整個海馬迴摘掉,就無法形成長期記憶,因此非常重要! 下面是另外一張海馬迴的立體位置圖:(尋找hippocampus的地方) 圖2 海馬迴位置圖

Read Full Post »

Posted By Mr. Thursday MIT News前陣子有一篇報導,敘述有一些和認知語言有關的研究。他們主要是研究南美洲一些原住民部落的語言,主要是巴西的西北部一個叫做Piraha的部落。在那邊除了研究語言之外,也研究該部落的語言,對於數字的概念是如何?他們發現到一個有趣的現象,就是在Piraha這個部落的語言裡面,對於數字的觀念非常模糊,幾乎沒有精確的數字描述。譬如說研究者請他們從1數到10,或是從10數到1,結果用他們的語言,1和2兩個字都有,但是數到3以上,都是同一個單字。也就是說,他們對於數字的觀念,只有「1」、「2」、和「很多」這三種區別。(圖: Edward Gibson教授) 就我們的工作記憶(working memory) 來講,的確也是有類似的現象,譬如說我們印象深刻的數字,第一個大概是「3」,大於「3」的數字,我們比較不容易捕捉其概念。舉個例子來說,中文字的1是「一」,2是「二」,3是「三」,但是4呢?就不是四條橫線了!又另外一個數字比較印象深刻的,大概是7。不是因為7乘以4等於28天,也不是一個禮拜剛好七天,而是因為工作記憶的容量,通常就在7到8位數字左右,觀察一下我們的電話號碼,你說手機有10位數字,但是開頭兩位可能都是固定的,所以其實只要記住8位數字就好,室內電話最多也是8位數,第一位數有時候也是固定的。如果要再科學一點,我們也可以用實驗的方式,來證實工作記憶的儲存容量,對一般人來說就是7到8位數。譬如說亂數唸出一堆數字,然後請受試者寫下記得的數字,一般人大概最多回憶到7組數字 (如果兩個數字一組,7組數字就是14個數字,也就是7個二位數的數字)。 而這則新聞和認知科學上面對工作記憶的發現,也讓我產生了一個大膽的假設,或許有興趣的話,可以實驗來證明一下。我的假設是說:人類數字功能,是一種類似「繞道」而行的方式產生,也就是說數字功能可能不是天生的,但是後天可以勤能補拙,產生數字的功能。為什麼會這樣子假設呢?

Read Full Post »