Category Archive for 'Mr. Thursday'

Posted By Mr. Thursday 在今年9月6日,GeoEye-1衛星發射,這部衛星除了美國地理資訊局 (National Geospatial-Intelligence Agency) 要使用以外,Google是另一位商用客戶,在這個需要美金五億元的衛星裡面也付出不少金錢。這個衛星主要能夠讓Google可以在地圖或地球服務上,有更清晰的影像。不過為了國防安全,商業使用者Google得到的影像解析度還是會稍微低一些,詳細報導請參考這一則新聞。下面則是10月初傳回來的第一張影像,是美國賓州 (Pennsylvania) 一所大學的校園。 GeoEye-1  回傳的第一張影像 下面也在網路上搜尋了一些影片讓各位瞧瞧,分別是GeoEye-1發射的影片,以及GeoEye公司參觀的影片。

Read Full Post »

Posted By Mr. Thursday 之前在語意搜尋引擎文章裡面提到了幾個目前具有語意搜尋功能的搜尋引擎,其中Powerset、Hakia、和Cognition都可以正式使用。然而剛開始嚐試使用這些語意搜尋引擎的時候,可能要開很多視窗,切換視窗,有些麻煩,因此我就想自己寫一個網站包,把這三個搜尋引擎介面包成一個視窗,可以同時比較搜尋結果,查詢字串也只需要輸入一次,三個結果頁面就會跑出來。原本想用Google Widget Toolkit開發,後來想想如果只是單純要把三個查詢畫面包在同一個視窗,HTML + Javascript 就應該足夠達成這個功能。因此我就寫好了這個可以在 local 端執行的網頁。使用者只要有安裝瀏覽器 (目前測過IE和FireFox沒問題),網路有接通,可以解開ZIP檔案,打開以後用瀏覽器打開資料夾裡面的 index.html 就可以開始用了! 下載請按這邊:semanticwrapper.zip 下面貼上一些執行過程的畫面,順便簡單介紹使用流程,應該是一看就懂,沒有太複雜的地方。

Read Full Post »

Posted By Mr. Thursday 在量子力學 (Quantum Mechanics) 裡面,有個定理叫做「測不準定理」,又稱為「不確定性原理」,英文是 Uncertainty Principle。這個定理是在講些什麼呢?是否是說,我們如果要測量一個東西的長度,拿一把尺,測量的時候因為刻度不夠細會有誤差呢?No No No。那麼是否因為物體會動,尺不會動,所以測不準呢?這樣子只有一部分正確。如果要用很簡單的白話文來說明測不準原理,應該就是:(下面有更正修改過) 物體有兩個性質,分別是「位置」和「動量」。 把物體位置的不確定性變小,動量的不確定性就會變大。 物體位置的不確定性變大,動量的不確定性就會變小。 不確定性越大,測量者就無法準確測量。 譬如說我要測量一本書的長度,如果我把書本固定在桌面上,我就知道測量的尺要往哪邊擺,但是書本在桌面這個小範圍就會移動的非常快速或非常緩慢(動量變化的範圍,也就是動量變化的不確定性增加),導致我雖然知道書本就在桌面這個範圍裡面,測量的尺卻無法捕捉書本移動的速度。 相反地,如果不限制書本的範圍在一個桌面上面,可以在任何地方,那麼書本的「動量不確定性」(動量可能分部的範圍) 就會變小,動量變化就是質量 (mass) 乘以速度變化 (velocity change) ,這個時候測量的尺如果要追上書移動的速度比較容易,但是卻茫茫然不知道書的「位置」在哪邊了,因為這個時候我們沒有限制書本位置變化範圍在桌面的小範圍內。 因此,「測不準原理」就是敘述物體「位置」和「動量」之間的互補效果 (trade-off) :位置越確定,動量就越不確定;位置範圍越不確定,動量就越確定。MMDays之前曾經介紹過MIT一位物理教授 Walter Lewin 教學如同表演。MIT開放式課程裡面有這位教授的上課內容錄影,其中量子力學介紹這一堂課就有介紹到測不準原理。各位不妨參考一下裡面介紹的內容。

Read Full Post »

Posted By Mr. Thursday MIT Technology Review報導了Plastic Logic推出的可彎曲電子閱讀器,裡面也稍微介紹了多分子的面板和E-Ink的技術組合成這種可以彎曲的電子閱讀器。也許有一天,材料技術可以進步到發明一種電子閱讀器,像紙做的報紙一樣揉成一團都沒問題呢! 報導裡面也提到了目前市面上已經有的電子閱讀器,有些也是可以延展的,就先在 Youtube 上面找一些 DEMO 影片給各為先睹為快! 首先是 Plastic Logic 在 DEMO 上面發表的可彎曲電子閱讀器:   影片1 Plastic Logic閱讀器

Read Full Post »

Posted By Mr. Thursday 人類是會說話的動物,如果人類不會說話,恐怕得用肢體語言 (body language) 作為日常溝通的方式,每天上演動作片了。在各種話語裡面,有時候是「睜眼說瞎話」,有時候是「空口說白話」,有時候是「癡人說夢話」。不管是哪一種,共同的地方就是「說」和「話」。只是這三種話裡面,「夢話」似乎是一個比較特殊的話,牽涉到人潛意識的層面,而且只要有睡覺,通常就可以有夢產生。另外日有所思,夜有所夢,也是夢話的另外一個特點。因此有一個夢話網站的構想,也就是一個網站,讓大家提供自己的夢境,在網站上面說「夢話」,這樣子的網站要如何和一般討論區不同,又有哪些可能的商業模式,甚至是否對於社交網站有所幫助呢?下面就慢慢列出這個夢話網站的構想供大家參考。 使用者的角色 平常我們可能日有所思,夜有所夢,夢境可能反映出我們擔心的事情、關心的事情、或是期待的事情。分享夢境的好處是,只要有睡覺,有作夢,內容就源源不斷地產生,因此對使用者來說,生產夢境的內容並不是很大的負擔。此外,夢境千變萬化,也不用合乎邏輯,因此各式各樣的夢都可以被分享。分享夢境也可以幫助我們在網路社交活動上,有一個分享的活動,甚至相同類似的夢境,可以經過網站比對,讓我們經由夢境來找到網路上新的朋友。如果覺得有些夢境是有關個人的隱私,沒關係,網站也可以提供匿名分享的方式,讓使用者在匿名狀況下透過夢境交友,但是夢話的作者可以有匿名的功能,和作者本身的歷史資料脫離,免去隱私權的負擔。

Read Full Post »

Posted By Mr. Thursday Amazon等書籍網站,會把使用者購買書本的資料,或是使用者的意見,經由機器分析之後,歸納出一些規則,推薦其他使用者新的書本。然而除了使用者直接提供意見的方法,用機器直接分析書本的內容,尤其是書本的寫作風格,把相同風格的書籍找出來推薦給使用者,也是另外一種內容分析的推薦方法。BookLamp就是使用這種推薦方式的系統。 影片1 BookLamp簡介

Read Full Post »

Posted By Mr. Thursday 今天上網尋找東西或資訊,無論是用Google還是Yahoo,我們用的都是關鍵字 (keyword) 搜尋。關鍵字搜尋對一些專有名詞的資訊搜尋效果不錯,然而有時候我們只知道比較廣泛的概念,想要找比較詳細的資訊卻不知道該下什麼關鍵字,或著是同義字很多,像是 Apple是指水果的蘋果,還是蘋果電腦?或是我們想用自然語言的問句,來界定我們關鍵字的上下文意義,避免找到有這個關鍵字,應用情境 (context) 卻不是想要尋找的情況。「語意搜尋引擎」想要達成的目標就是如此,當少數關鍵字的意思並不明確,無法清楚定義出情境 (context) 或是排除同義字,或是想從廣泛的概念搜尋比較詳細特定的概念,就可以運用語意搜尋引擎來找找。 目前有哪些搜尋引擎呢?針對 Wikipedia 內容來做語意搜尋的搜尋引擎有 Powerset 和 Cognition,Cognition除了包含Wikipedia的內容外,也針對法律 (legal) 內容和醫學 (medicine) 內容做搜尋。Hakia 則是針對整個網路的內容做語意搜尋。除此之外,最近也有 Evri 這個語意搜尋引擎,使用類似資料庫裡面 entity-relationship (ER) 的瀏覽方式,讓使用者可以根據事情之間意義上的關係,從一個網頁連到另外一個網頁,讓超連結 (hyperlink) 不是只有關鍵字的連結,而是經由事物的屬性意義的連結。下面就讓我們先看一下這些搜尋引擎的 DEMO 吧! 影片1 Powerset demo

Read Full Post »

Posted By Mr. Thursday 在之前有寫了一些神經科學相關的文章,有些是偏向認知心理的,有些是偏向細胞分子的,或是偏向視覺處理的。神經科學的研究,我本身的是以人工智慧作為出發點,往神經科學研究方向進行。至於為什麼要在人工智慧以外加上神經科學呢?這兩者似乎有一點距離?原來資訊工程的技術是否已經足夠了呢? 這邊我提出幾點研究的動機。首先,目前的機器學習的方式,和人類學習的方式比較起來,有個最大的不同,就是我們人類可能從上課或是閱讀當中自我學習,或是由外在環境給予的經驗來學習。機器同樣也是接收外界的刺激,調整自己的反應來學習,然而機器學習過程當中,有時候會需要滿多人類的介入,譬如說調整參數、調整模型或演算法等等。如果用類比的方式來說,目前機器學習的方式如果用到人上面,就像是把人的腦蓋打開,調整裡面的神經連結,關起來以後再讓人腦跑跑看有沒有學習到。其實這種方式學習也沒有什麼不好,因為機器的目標,其實是服務人類,學習的東西有學到,怎樣子學習到就不那麼重要了。 那麼機器目前學習的情況如何呢?其實目前的電腦和機器算是滿先進的,加上運算速度快,純粹數字計算的能力就比人類心算能力還快,許多應用服務也讓人類生活改善不少。然而有些比較難處理的問題,像是需要人類智能才能完成的問題,譬如說翻譯、圖形辨識、影像辨識、語音辨識、語意了解等等,這些都算是人工智慧 (Artifitial Intelligence 人工智能) 所需要解決的問題,這些問題的解決,沒有隨著硬體速度的增加而解決,因此軟體上面的進步,就是關鍵了!目前對於這些難以解決的方式,有兩種解法:(1) 運用大量的訓練資料,譬如說Google翻譯,使用大量的訓練資料,或是PDA的手寫辨識,大量的訓練資料都讓正確率大大提升。(2) 運用人工運算 (Human Computing) 結合Web2.0的方式,提供人性化的介面,讓每個人在趣味中貢獻微小的人類智力,解決一些大量資料也無法解決的東西,譬如說reCAPTCHA、語意辨識、圖形的ROI (region of interest) 等等。

Read Full Post »

Posted by Mr. Thursday 之前曾經介紹過〈海扁學習與神經網路的同步化〉,今天則是要和各位介紹和長期記憶相關的一個腦部結構,叫做「海馬迴」。「海馬迴」英文稱為 hippocampus,是從希臘文字根 hippos (馬) + kampos (海怪)而來的。 圖1 海馬迴在人腦裡面的位置  海馬迴重要在哪裡呢?主要是因為海馬迴和我們形成長期記憶的過程有關。怎樣子曉得和長期記憶有關呢?最重要的是因為在1953年,有一為病人,名字縮寫為H.M. (Henry M.) ,因為一直為癲癇 (epilepsy) 所苦,因此醫生決定為他開刀,把癲癇的來源,也就是腦部顳葉 (temporal lobe) 的地方,摘除掉。這個部分剛好也就是海馬迴的地方,因此他的左右的海馬迴、以及杏仁核 (amygdala, 負責情緒功能的區域),也被摘除掉了。 手術之後,病人H.M.好像恢復正常,不再癲癇。但是,他開始產生嚴重的失憶症,手術往前一部分時間的記憶消失,手術後無法形成新的長期記憶。人沒有長期記憶的功能,是非常不容易生活下去的!醫師發現這個情況以後,也就在沒有其他醫生會使用這種切除海馬迴的方式來治療癲癇了。對於科學研究來說,我們則是順便從這個病例,了解到海馬迴具有形成長期記憶的功能,詳細迴路可能還不知道,但是至少知道如果整個海馬迴摘掉,就無法形成長期記憶,因此非常重要! 下面是另外一張海馬迴的立體位置圖:(尋找hippocampus的地方) 圖2 海馬迴位置圖

Read Full Post »

Posted By Mr. Thursday MIT News前陣子有一篇報導,敘述有一些和認知語言有關的研究。他們主要是研究南美洲一些原住民部落的語言,主要是巴西的西北部一個叫做Piraha的部落。在那邊除了研究語言之外,也研究該部落的語言,對於數字的概念是如何?他們發現到一個有趣的現象,就是在Piraha這個部落的語言裡面,對於數字的觀念非常模糊,幾乎沒有精確的數字描述。譬如說研究者請他們從1數到10,或是從10數到1,結果用他們的語言,1和2兩個字都有,但是數到3以上,都是同一個單字。也就是說,他們對於數字的觀念,只有「1」、「2」、和「很多」這三種區別。(圖: Edward Gibson教授) 就我們的工作記憶(working memory) 來講,的確也是有類似的現象,譬如說我們印象深刻的數字,第一個大概是「3」,大於「3」的數字,我們比較不容易捕捉其概念。舉個例子來說,中文字的1是「一」,2是「二」,3是「三」,但是4呢?就不是四條橫線了!又另外一個數字比較印象深刻的,大概是7。不是因為7乘以4等於28天,也不是一個禮拜剛好七天,而是因為工作記憶的容量,通常就在7到8位數字左右,觀察一下我們的電話號碼,你說手機有10位數字,但是開頭兩位可能都是固定的,所以其實只要記住8位數字就好,室內電話最多也是8位數,第一位數有時候也是固定的。如果要再科學一點,我們也可以用實驗的方式,來證實工作記憶的儲存容量,對一般人來說就是7到8位數。譬如說亂數唸出一堆數字,然後請受試者寫下記得的數字,一般人大概最多回憶到7組數字 (如果兩個數字一組,7組數字就是14個數字,也就是7個二位數的數字)。 而這則新聞和認知科學上面對工作記憶的發現,也讓我產生了一個大膽的假設,或許有興趣的話,可以實驗來證明一下。我的假設是說:人類數字功能,是一種類似「繞道」而行的方式產生,也就是說數字功能可能不是天生的,但是後天可以勤能補拙,產生數字的功能。為什麼會這樣子假設呢?

Read Full Post »

頁次 3 of 1112345678910...最後一頁 »