Tag Archive 'search'

Posted by Mr. March 在資訊量越來越多,數據處理越來越繁忙的現代,對於海量數據的收集和觀察與搜索就成了一個很大的問題 Elasticssearch就是在這樣子的背景之下誕生,為了解決上述問題而提出的一套開放源碼的套件,而且它還不只單純可以用在搜尋上;合併Logstash和Kibana這兩個套件一起使用還能夠用在收集log data上,而這三種套件縮寫合稱ELK

Read Full Post »

有時候本文後面的討論反而還比本文更精彩勒。然而拜社會化媒體(例如Twitter與Plurk)快速發展之賜,大家越來越習慣在其中討論日常生活點滴,當然,也包括了閱讀到的文章。因此,為了更快速找到文章相關的評論,PlurkTop提供了一個新的Widget,幫助聚合文章在Plurk上的相關討論。這個想法最方便的地方在於使用者無須再去任何網站申請新帳號,直接利用現有的噗浪Plurk,只要發個噗就好。

Read Full Post »

Posted by Mr. Friday 剛剛在mashable上面看到的消息,Twitter的搜尋功能在昨晚正式上線了。 網址…非常的好猜,看過xdite這篇文章的人應該沒幾秒就猜得出來。沒錯,就叫做http://search.twitter.com 。

Read Full Post »

Posted by Mr. Friday 分散式網路中的Power Law現象 前面談到了網路流量的80/20法則,網路上有80%左右的流量都貢獻給了P2P,而事實上,在P2P的世界裡頭,也到處有著Power Law的影子。 大家先別只想到BT跟eMule。其實這個世界上到處充斥著分散式的系統,而其中許多的網路結構都是以Power Law的模樣呈現:從通訊網路、社交網路、到生物網路都有,譬如著名的AT&T的電話網路紀錄。在這篇2000年研究文獻裡面提到,他們統計過AT&T的電話通聯紀錄,結果發現群眾的通聯模式也符合Power Law的關係。如果說每個人都是平面上的一個點,而每播一通電話就是一條線、連接著播/接電話的兩個人,那麼將可觀察到大多數的點只有幾條連線,但有極少數的點,可連線通往大多數的點──換言之,大多數人可能一天當中只會打給固定幾個人,但有少數人士可能一次打個幾十通上百通。〈當然啦,這些人也有可能是出於電話行銷、業務員、或是電話詐騙才會打那麼多電話,但有這些樣本才算是反映了真實世界。〉 電話網路如此,電腦網路也是如此。大家現在在用的WWW超連結也有著這樣的關係。先前Mr。Saturday寫過Web上的人際網路 – 網路長什麼樣子?描述的就是這個現象。前面不是把打電話類比成圖案嗎?現在請你想像一個網站是一個點,點跟點之間的連線代表超連結,那麼這張圖會長什麼樣呢?

Read Full Post »

Posted By Mr. Thursday 今天上網尋找東西或資訊,無論是用Google還是Yahoo,我們用的都是關鍵字 (keyword) 搜尋。關鍵字搜尋對一些專有名詞的資訊搜尋效果不錯,然而有時候我們只知道比較廣泛的概念,想要找比較詳細的資訊卻不知道該下什麼關鍵字,或著是同義字很多,像是 Apple是指水果的蘋果,還是蘋果電腦?或是我們想用自然語言的問句,來界定我們關鍵字的上下文意義,避免找到有這個關鍵字,應用情境 (context) 卻不是想要尋找的情況。「語意搜尋引擎」想要達成的目標就是如此,當少數關鍵字的意思並不明確,無法清楚定義出情境 (context) 或是排除同義字,或是想從廣泛的概念搜尋比較詳細特定的概念,就可以運用語意搜尋引擎來找找。 目前有哪些搜尋引擎呢?針對 Wikipedia 內容來做語意搜尋的搜尋引擎有 Powerset 和 Cognition,Cognition除了包含Wikipedia的內容外,也針對法律 (legal) 內容和醫學 (medicine) 內容做搜尋。Hakia 則是針對整個網路的內容做語意搜尋。除此之外,最近也有 Evri 這個語意搜尋引擎,使用類似資料庫裡面 entity-relationship (ER) 的瀏覽方式,讓使用者可以根據事情之間意義上的關係,從一個網頁連到另外一個網頁,讓超連結 (hyperlink) 不是只有關鍵字的連結,而是經由事物的屬性意義的連結。下面就讓我們先看一下這些搜尋引擎的 DEMO 吧! 影片1 Powerset demo

Read Full Post »

Posted by Mr. March Searchme 這個搜尋引擎提供了一些新的搜尋特色: Searchme 所強調的點,包括將搜尋結果 cover flow 化,如果僅僅只是這樣子的話。那實在沒什麼大不了。不過在 demo 裡面我們可以看到,使用者在輸入關鍵字的時候,在 bar 上面的 icon 會隨著關鍵字而變化,也就是說,它會根據關鍵字 pop out 出相關的領域的 category,這一點導是非常有趣。將搜尋結果分類這件事情,Mr. Wednesday 已經有從事相關的研究,但是是在搜尋結果上面分類,而不是在關鍵字處就開始分類。

Read Full Post »

Posted By Mr. Thursday 在〈二元樹在排序的應用〉裡面,我們提到了演算法就是完成一件事情的步驟,資料結構則是和演算法搭配,讓步驟有運作的東西,像是刮鬍刀的步驟,會運作在刮鬍刀或是插頭上面。「樹」(tree) 是一種資料結構,有樹根樹枝,看起來像是倒立的一棵樹。二元數則是每個節點只有兩個分支的樹。此外,我們可以用二元樹這個資料結構,完成「排序」(sorting) 的演算法。下面是一段各種排序演算法的影片:   除了排序以外,今天要和各位介紹,當我們把資料用一棵樹排序之後,要如何進行搜尋?排序或是沒有排序,對搜尋的效率有甚麼樣子的影響?我們先看看下面這兩張圖,左邊是排序過程,右邊是搜尋過程的動畫:

Read Full Post »

頁次 1 of 212