Category Archive for '電腦科學'

Posted By Mr. Thursday Infovell 是一個專業的資訊搜尋引擎。一般免費的搜尋引擎通常會找到不是專家所提供的資訊,搜尋結果也不會非常地和想要解決的問題相關,因此 Infovell 雖然不是免費的,但是可以搜尋到專業的內容,並且對結果做適度的整理。影片裡面提到一個例子,是一個朋友因為感覺手腳有麻痺的感覺,檢查之後發現得到了 Vasculitis (血管炎: vascular血管的, -tis 炎),是一種自體免疫的疾病,醫生建議作切片檢查。如果使用一般免費搜尋引擎,可能找到不是很信任的專家提供的資訊內容,並且無法以文找文,也沒有和切片檢查很相關的資訊。影片中提到 Infovell 則是可以提供審查過的論文內容,並且整理出切片檢查的各種可能的風險,讓使用者比較能夠參考資訊作出最適當的決定,也可以在和醫生見面之前先做功課,或是提供更多資訊給醫生參考。下面就是 DEMO 的影片。   我個人的想法如下: (1) 專業資訊固然好,不過如果剛好是一個使用者不懂的領域,譬如說數學、物理、或是醫學論文,即使是專業論文內容,一般使用者可能會看不懂,這時候即使有找到資訊可能也沒有幫助到。 (2) 急症病患也許來不及用這種系統,或許慢性需要長期抗戰的疾病,其家屬可能會使用這個系統來研究各種可能的治療方法。 (3) 即使系統有收費,不過資訊化之後,除非使用者自己不分享給其他人,不然資訊複製在今日仍就是非常容易。因此就獲益模式來講,這個系統有可能還是會碰到資訊內容免費複製的問題了!   參考資料 (Read Write Web) Sometimes Google Isn’t Enough: New Research Engine Searches “Deep Web” (Wikipedia) Vasculitis

Read Full Post »

Posted By Mr. Thursday Google 最近推出新的搜尋介面,稱為 SearchWiki,使用者可以對自己搜尋的結果作修改,譬如說修改搜尋結果網頁的先後次序,或是直接移除某一項搜尋結果 (刪錯可以救回來) ,以及為某一項搜尋結果加上一些文字註解。下面這段影片可以讓各位比較清楚地看到整個介面和操作的流程: 這項功能目前要使用者在登入Google帳號的狀態下才會出現,並且要選英文介面才可以,中文介面暫時還沒有這項功能出現。 這個功能可以讓使用者自己排序搜尋結果,不過只會影響自己的搜尋結果,會和別人分享的只有文字註解。因此,針對個人化排序結果的分享,我想到了有三種方式,或許可以對應到各種不同的資訊來源或是使情境:個人使用、完全公開、以及朋友傳遞鏈。

Read Full Post »

Posted by Mr. Friday (本文已同步刊登在密技偷偷報十月號) 好萊塢電影裡,總是對於電腦駭客有一些誇大不實的描述,譬如Die Hard 4〈終極警探4〉裡面,就把駭客講得實在有夠神,總是隨隨便便在幾秒內就能夠破解別人的密碼、穿越防火牆,取得機密資料,最後抱得美人歸〈誤〉…。不過誇張歸誇張,在現實生活裡,有能耐的駭客的確能夠在短短數分鐘之內,竊聽網路上的一舉一動,當然也包括了你剛才輸入過的帳號密碼!今天本文要解析的內容,就在於如何進行網路竊聽,而且神不知、鬼不絕,完全不在被竊聽的電腦上留下任何蛛絲馬跡! 聽起來可真神。不過講到網路竊聽,許多人可能還是不太清楚實際上是怎麼運作的。聽到這個名詞的瞬間,腦中所聯想到的畫面,可能還是動作片裡偵探在房間裡偷裝竊聽器的模樣。事實上,的確有一些網路竊聽的概念是源自這種模式:駭客在你電腦裡面裝木馬軟體,再把你打過的每一個字透過網路偷偷傳送出來。不過這種模式有個缺點,就是容易留下證據,畢竟竊聽器〈木馬程式〉還留在對方電腦裡。但是,今天要介紹的這種攻擊卻完全不同;這種攻擊不需要在你電腦上裝病毒或木馬,也不會在你電腦上留下任何紀錄,卻能紀錄到你在網路上的任何一舉一動,的是來無影去無蹤。它的名字叫做:Man-in-the-middle attack,簡稱MITM〈中間人攻擊〉。

Read Full Post »

Posted By Mr. Thursday 之前在語意搜尋引擎文章裡面提到了幾個目前具有語意搜尋功能的搜尋引擎,其中Powerset、Hakia、和Cognition都可以正式使用。然而剛開始嚐試使用這些語意搜尋引擎的時候,可能要開很多視窗,切換視窗,有些麻煩,因此我就想自己寫一個網站包,把這三個搜尋引擎介面包成一個視窗,可以同時比較搜尋結果,查詢字串也只需要輸入一次,三個結果頁面就會跑出來。原本想用Google Widget Toolkit開發,後來想想如果只是單純要把三個查詢畫面包在同一個視窗,HTML + Javascript 就應該足夠達成這個功能。因此我就寫好了這個可以在 local 端執行的網頁。使用者只要有安裝瀏覽器 (目前測過IE和FireFox沒問題),網路有接通,可以解開ZIP檔案,打開以後用瀏覽器打開資料夾裡面的 index.html 就可以開始用了! 下載請按這邊:semanticwrapper.zip 下面貼上一些執行過程的畫面,順便簡單介紹使用流程,應該是一看就懂,沒有太複雜的地方。

Read Full Post »

Posted By Mr. Thursday Amazon等書籍網站,會把使用者購買書本的資料,或是使用者的意見,經由機器分析之後,歸納出一些規則,推薦其他使用者新的書本。然而除了使用者直接提供意見的方法,用機器直接分析書本的內容,尤其是書本的寫作風格,把相同風格的書籍找出來推薦給使用者,也是另外一種內容分析的推薦方法。BookLamp就是使用這種推薦方式的系統。 影片1 BookLamp簡介

Read Full Post »

Posted By Mr. Thursday 今天上網尋找東西或資訊,無論是用Google還是Yahoo,我們用的都是關鍵字 (keyword) 搜尋。關鍵字搜尋對一些專有名詞的資訊搜尋效果不錯,然而有時候我們只知道比較廣泛的概念,想要找比較詳細的資訊卻不知道該下什麼關鍵字,或著是同義字很多,像是 Apple是指水果的蘋果,還是蘋果電腦?或是我們想用自然語言的問句,來界定我們關鍵字的上下文意義,避免找到有這個關鍵字,應用情境 (context) 卻不是想要尋找的情況。「語意搜尋引擎」想要達成的目標就是如此,當少數關鍵字的意思並不明確,無法清楚定義出情境 (context) 或是排除同義字,或是想從廣泛的概念搜尋比較詳細特定的概念,就可以運用語意搜尋引擎來找找。 目前有哪些搜尋引擎呢?針對 Wikipedia 內容來做語意搜尋的搜尋引擎有 Powerset 和 Cognition,Cognition除了包含Wikipedia的內容外,也針對法律 (legal) 內容和醫學 (medicine) 內容做搜尋。Hakia 則是針對整個網路的內容做語意搜尋。除此之外,最近也有 Evri 這個語意搜尋引擎,使用類似資料庫裡面 entity-relationship (ER) 的瀏覽方式,讓使用者可以根據事情之間意義上的關係,從一個網頁連到另外一個網頁,讓超連結 (hyperlink) 不是只有關鍵字的連結,而是經由事物的屬性意義的連結。下面就讓我們先看一下這些搜尋引擎的 DEMO 吧! 影片1 Powerset demo

Read Full Post »

Posted By Mr. Thursday 在之前有寫了一些神經科學相關的文章,有些是偏向認知心理的,有些是偏向細胞分子的,或是偏向視覺處理的。神經科學的研究,我本身的是以人工智慧作為出發點,往神經科學研究方向進行。至於為什麼要在人工智慧以外加上神經科學呢?這兩者似乎有一點距離?原來資訊工程的技術是否已經足夠了呢? 這邊我提出幾點研究的動機。首先,目前的機器學習的方式,和人類學習的方式比較起來,有個最大的不同,就是我們人類可能從上課或是閱讀當中自我學習,或是由外在環境給予的經驗來學習。機器同樣也是接收外界的刺激,調整自己的反應來學習,然而機器學習過程當中,有時候會需要滿多人類的介入,譬如說調整參數、調整模型或演算法等等。如果用類比的方式來說,目前機器學習的方式如果用到人上面,就像是把人的腦蓋打開,調整裡面的神經連結,關起來以後再讓人腦跑跑看有沒有學習到。其實這種方式學習也沒有什麼不好,因為機器的目標,其實是服務人類,學習的東西有學到,怎樣子學習到就不那麼重要了。 那麼機器目前學習的情況如何呢?其實目前的電腦和機器算是滿先進的,加上運算速度快,純粹數字計算的能力就比人類心算能力還快,許多應用服務也讓人類生活改善不少。然而有些比較難處理的問題,像是需要人類智能才能完成的問題,譬如說翻譯、圖形辨識、影像辨識、語音辨識、語意了解等等,這些都算是人工智慧 (Artifitial Intelligence 人工智能) 所需要解決的問題,這些問題的解決,沒有隨著硬體速度的增加而解決,因此軟體上面的進步,就是關鍵了!目前對於這些難以解決的方式,有兩種解法:(1) 運用大量的訓練資料,譬如說Google翻譯,使用大量的訓練資料,或是PDA的手寫辨識,大量的訓練資料都讓正確率大大提升。(2) 運用人工運算 (Human Computing) 結合Web2.0的方式,提供人性化的介面,讓每個人在趣味中貢獻微小的人類智力,解決一些大量資料也無法解決的東西,譬如說reCAPTCHA、語意辨識、圖形的ROI (region of interest) 等等。

Read Full Post »