Posted By Mr. Thursday 今天上網尋找東西或資訊,無論是用Google還是Yahoo,我們用的都是關鍵字 (keyword) 搜尋。關鍵字搜尋對一些專有名詞的資訊搜尋效果不錯,然而有時候我們只知道比較廣泛的概念,想要找比較詳細的資訊卻不知道該下什麼關鍵字,或著是同義字很多,像是 Apple是指水果的蘋果,還是蘋果電腦?或是我們想用自然語言的問句,來界定我們關鍵字的上下文意義,避免找到有這個關鍵字,應用情境 (context) 卻不是想要尋找的情況。「語意搜尋引擎」想要達成的目標就是如此,當少數關鍵字的意思並不明確,無法清楚定義出情境 (context) 或是排除同義字,或是想從廣泛的概念搜尋比較詳細特定的概念,就可以運用語意搜尋引擎來找找。 目前有哪些搜尋引擎呢?針對 Wikipedia 內容來做語意搜尋的搜尋引擎有 Powerset 和 Cognition,Cognition除了包含Wikipedia的內容外,也針對法律 (legal) 內容和醫學 (medicine) 內容做搜尋。Hakia 則是針對整個網路的內容做語意搜尋。除此之外,最近也有 Evri 這個語意搜尋引擎,使用類似資料庫裡面 entity-relationship (ER) 的瀏覽方式,讓使用者可以根據事情之間意義上的關係,從一個網頁連到另外一個網頁,讓超連結 (hyperlink) 不是只有關鍵字的連結,而是經由事物的屬性意義的連結。下面就讓我們先看一下這些搜尋引擎的 DEMO 吧! 影片1 Powerset demo
Tag Archive '搜尋'
Posted by Mr. March Searchme 這個搜尋引擎提供了一些新的搜尋特色: Searchme 所強調的點,包括將搜尋結果 cover flow 化,如果僅僅只是這樣子的話。那實在沒什麼大不了。不過在 demo 裡面我們可以看到,使用者在輸入關鍵字的時候,在 bar 上面的 icon 會隨著關鍵字而變化,也就是說,它會根據關鍵字 pop out 出相關的領域的 category,這一點導是非常有趣。將搜尋結果分類這件事情,Mr. Wednesday 已經有從事相關的研究,但是是在搜尋結果上面分類,而不是在關鍵字處就開始分類。
化繁為簡:資訊時代的唯一生存之道
Posted in Apple, Google, Mr. Saturday, 專欄, 生活, 觀點, 設計, 關於網路產業, 關於設計, 電腦科學 on Jun 22nd, 2008
Posted by Mr. Saturday 我相信很多人都跟我有一樣的感覺,這個世界被搞得太複雜了,以致於我們是被科技和無限量的資訊推著走,人們的時間隨著科技的進步居然是越來越少,越來越沒有辦法享受有品質的人生,我們每天 焦慮地吸收資訊,閱讀書報以及網路新聞,深怕自己成為資訊時代的局外人,可是到頭來卻發現:在我們自己真正把這些資訊組織起來之前,我們又得趕快去吸收剛剛湧進來的新聞和知識了,雖說書到用 時方恨少,書讀得多了,毫無疑問知識會有所增長,但是在這一個書永遠讀不完的時代,化繁為簡的功夫,卻是很多人忽略的地方。有的時候,簡化和過濾你手邊的資訊,會讓你更能掌握重點,也能讓這些資訊發揮更大的效益,不僅讀書如此,世界上其他許多領域也是有相同的概念。正好最近我又受到了幾本好書的啟發,因此寫下了這篇文章,除了簡單談談一些四處可見的化繁為簡的案例,也同時作為自己的一個反思。
二元樹排序對搜尋的影響
Posted in Mr. Thursday, 專欄, 電腦科學 on Mar 29th, 2008
Posted By Mr. Thursday 在〈二元樹在排序的應用〉裡面,我們提到了演算法就是完成一件事情的步驟,資料結構則是和演算法搭配,讓步驟有運作的東西,像是刮鬍刀的步驟,會運作在刮鬍刀或是插頭上面。「樹」(tree) 是一種資料結構,有樹根樹枝,看起來像是倒立的一棵樹。二元數則是每個節點只有兩個分支的樹。此外,我們可以用二元樹這個資料結構,完成「排序」(sorting) 的演算法。下面是一段各種排序演算法的影片: 除了排序以外,今天要和各位介紹,當我們把資料用一棵樹排序之後,要如何進行搜尋?排序或是沒有排序,對搜尋的效率有甚麼樣子的影響?我們先看看下面這兩張圖,左邊是排序過程,右邊是搜尋過程的動畫:
Posted by Mr. March 繼之前Songza:線上免費聽音樂!這篇文章後,今天我們我們要來介紹的是 Gimado 這個網站: 這網站所提供的功能跟我們之前介紹過的 Songza 很相似,一樣是使用者搜尋歌曲,然後它讓你可以免費的聽音樂,但是這兩個網站還是有些差異,這個網站並不像 Songza 可以排歌單,而且也不能使用中文字來搜尋,但是他有一個比較厲害的地方,那就是你不但可以在線上聽,而且還可以把整首歌下載回來!而且實際測試過後,他的速度也並沒有很慢,算是一個不錯的網站。
Web 2.0@Taiwan : funP
Posted in Case Study, Mr. Monday, Web 2.0, 在地Taiwan, 專欄, 觀點, 關於網路產業 on Aug 26th, 2007
funP 由於團隊年輕,因此在產品的設計上面有許多不當的地方。除了介面設計的不良之處外,funP 始終堅守著他的蓋台策略也是頗不尊重部落客。技術可以做到的事,不代表就一定符合人性,我希望 funP 在這個服務上面還能再三思一下。
funP 的團隊非常注重宣傳,我想這個 funP 的團隊以及背景有關。當然 funP 的技術團隊是優異的,這也使的他們可以在今年秋季的 DEMO 大會上面向全世界的創投以及熱愛科技的人士介紹他們的服務。這是一個很難得的機會,因為到時候 video 也會被放到網站上面供大家觀賞。我相信 funP 自己也非常了解這個機會,這是 funP 可以推向國際的一個好時點,Mr. Saturday 和 Mr. Monday 在之前的文章中已經討論過類似的觀點了,台灣的市場是有點太小了,如果可以的話,是應當朝向國際發展,就算是不能朝向國際發展,那好歹也朝向大中華區發展吧。不過在介面上面,我並沒有看到英文版的介面,我也沒有看到簡體版的介面。在能夠推向國際的時刻,卻不能充分把握是有點可惜了。說到簡體版的話,在 Satrt Page 這領域的話,在中國有一個網站叫做”是我的”,所提供的服務還蠻出色的,當然它的 Start Page 遠勝過 funP 現在的陽春版。
除了搜尋, BBS還可以加什麼?
Posted in Mr. Friday, 專欄, 關於網路產業 on Jul 30th, 2007
兩個禮拜前, Yousee轟轟烈烈的上線, 宣布要提供完整的BBS全文搜尋功能; 一個禮拜後, 在一片撻伐聲中, Yousee不得不狼狽退場, 暫緩搜尋功能. Yousee引起的BBS隱私權爭議本身就已經多到可以再另外寫一篇很長的文章來吵, 但是在這個事件當中, 我更好奇想問的是, 要加強BBS的可用度, 除了做搜尋引擎以外, 還可以怎麼做?
以圖找圖 (Search by Image) 與印象派,下一代的搜尋應用何在?
Posted in Mr. Saturday, Research, 專欄, 數學, 電腦科學 on Jun 27th, 2007
一般網路對於搜尋引擎的使用,不外乎就是輸入關鍵字 (input),然後搜尋引擎吐出搜尋結果 (output) 給你。因此我們不難發現現在搜尋引擎的 input 主要是以文字為主,使用者輸入查詢關鍵字,搜尋引擎根據這些文字來搜尋,較為複雜的「以文找文」應用在業界雖然已經出現許久,但是並沒有被大家使用得很廣泛,主要還是因為應用的方式有限,實用性不高。
一式解讀 PageRank
Posted in Google, Mr. Saturday, 專欄, 數學, 電腦科學 on Jun 5th, 2007
上面這個公式翻譯成白話文的話,就是假設有 n 個網頁連結到你的網站,那麼你的 PageRank 就是這些網頁個別的 PageRank 值除以他們個別的對外連結數目,再白話一點,在你的立場來看,別人的 PageRank 值就是他們手上握有的投票數目,他們對外連結的數目就代表了他們把自己手中的票均分成幾份投了出去。也就是說,別人連結到你的網站,就表示他投了票給你,但是這票的效力有多少,就取決於他把票投給了幾個人,如果他手中的 PageRank 值是 5 (也就是五票),而他把票投給 10 個人的話 (也就是有十個對外連結),那麼你從他手中拿到的票就只有 0.5 票。




