Digg Explorer不是一個全新的工具,它最近推出了新的版本,v1.1。它以視覺化的方式提供了許多Digg相關得統計資訊,像是最熱門的Digg主區塊,次區塊,常用字,最常被提交的領域與喜好。這個工具提供了許多有用的資訊,想知道有哪些關鍵字是熱門文章最常用的嗎?沒問題,這裡統統找的到。
資料來源:Mashable
Read Full Post »
Posted in 新聞, 網路產業, 電玩, 電腦科學 on Nov 27th, 2007
微軟即將把Social Networking帶入Xbox Live的服務之中。XBox Live是微軟的線上遊戲服務,讓使用者可以與朋友一同進行線上遊戲。過去XBox Live提供有聯絡清單的功能,而這次新的改變,將可以讓使用者看到朋友的朋友,提供更多的對戰機會。
Ars Technica認為這項特徵是”very MySpace”,但是XBox Live上的Social Networking將不會以相同的型式出現。過去的XBox線上遊戲就包含了語音交談,所以社交面向的特徵將不會類似個人資訊頁面或是一般社交網站的作法,而會是一個以傳統文字型態存在更為社交的服務。
資料來源:TechCrunch
Read Full Post »
Posted in Google, 新聞, 程式設計, 網路產業, 電腦科學 on Nov 25th, 2007
Google搜尋力量的強大相信許多讀者已經親身體驗過,甚至用Google找出私人的電話住址也不是太奇怪的事了。但是您能想像用Google找出您在網路上使用的密碼嗎?
目前許多網站的使用帳號都會利用密碼保護,而存在資料庫中的密碼如果不是直接用明文儲存(通常不會這樣做,萬一被駭客入侵那後果不堪設想),就是會經由雜湊後(例如MD5或是SHA-1等hash function)再儲存。不久之前Cambridge University security team發生被駭客入侵的事件,駭客翻出了資料庫中的帳號密碼紀錄,但是密碼已經被MD5雜湊處理過所以無法直接使用。經過幾次字典法的嘗試失敗後,駭客把腦筋動到了Google身上,。駭客將本身創建的帳號調整到管理者的權限。駭客入侵的動作很快就被管理者發現,也將新建的帳號關閉,但是管理者進行了一些有趣的實驗希望找出駭客建立的帳號的密碼。在嘗試使用字典法失敗後,轉向從Google上尋找解答。直接把得到的密碼雜湊,20f1aeb7819d7858684c898d1e98c1bb,丟到Google上查詢,結果得到的搜尋結果都含有Anthony這樣的特徵,最後駭客使用這組密碼成功破解最後管理者終於找出了駭客使用的密碼。
原來是因為網頁URL透漏了這樣的訊息!許多程式或系統會用雜湊後的碼來當作網頁的索引,而進行雜湊時所使用的字串也經常與該網頁內容有關。簡單來說,Google成了一個超大的雜湊碼字典了。
資料來源:BLORGE.com
Read Full Post »
Posted in Mr. Thursday, Research, 大腦, 專欄, 神經生物, 電腦科學 on Nov 16th, 2007
Posted By Mr. Thursday
之前幾篇文章稍微提到了計算神經科學想要以數學的方法,計算出神經生物上詳細的模型,好的模型還可以在拿回電腦科學領域,尤其是人工智慧的問題上面,作為解決的方法。至於現在的機器學習方法,為甚麼我覺得不夠用呢?我主要是覺得困難在兩個地方:特徵 (feature) 的擷取,參數 (parameter) 調整過程中需要人的參與,以及文字意義 (meaning)學習上可能會有困難。以下就這三個部分來做個討論,順便討論計算神經目前能夠解決的部分,和未來有可能達成的目標 (人機介面: Brain-Computer Interface)。
首先先和各位談談二項式係數。不知道各位是否有學過多項式呢?如果不知道二項式係數,可以先看看下面這個巴斯卡三角形:
Read Full Post »
Posted in Mr. Saturday, Research, 專欄, 科技, 電腦科學 on Nov 5th, 2007
Posted by Mr. Saturday
顯然電腦科技改變的,不僅僅是我們的上網生活而已,在這一次 DARPA Urban Challenge 的比賽之後,相信許多人會真正感覺到,電腦科技真的已經準備好要深入我們的日常生活之中了.有些讀者可能不知道 DARPA Urban Challenge 是什麼東西,我在之前的一篇文章 無人車橫越沙漠! – 初探 Computer Vision (電腦視覺) 有介紹過,有興趣的讀者可以回去翻閱,這邊我就簡單地再說明一次.DARPA機構隸屬於美國國防部,該機構旨在促進美國國防部科技及工程上的研究發展,DARPA 之前為了促進自動車無人駕駛的科技,在 2004 年曾經在 Las Vegas 沙漠舉辦無人車自動駕駛挑戰 (DARPA Grand Challenge 2004),也是在為美國國防部尋找千里馬的一個計畫。但是 2004 年的這個比賽全部參賽的隊伍通通槓龜,沒有任何隊伍的自動車跑完全程.因此在 2005 年又辦了同樣自動車橫越沙漠的競賽,該競賽最後由史丹佛大學 (Stanford University) 奪得最後的冠軍,順利跑完全程,抱走獎金兩百萬美金.
Read Full Post »
Posted in Mr. Saturday, Web 2.0, 專欄, 網路產業, 觀點, 電腦科學 on Oct 23rd, 2007
Posted by Mr. Saturday
剛剛看了這篇很棒的文章 Forget Platforms And Applications, Data Is The Real Asset On the Web,心有所感所以趕緊寫下了這篇文章,如果各位讀者懶得看該篇文章,那我在這邊就稍微提一下該篇文章的內容,之後再說說我自己的看法.這篇文章講的東西呢,用四個字來總結,就是資料為王.什麼意思呢?是這樣的,這篇文章的作者觀察到現今網路上的新興網站,大多著重在平台 (platform) 和應用 (application) 本身,卻忽略了在 Web 2.0 的網路時代,最重要的是資料,而不是花俏或是功能強大的平台.也就是說,Web 2.0 本來的重點就在於使用者回饋,使用者產出以及使用者得到回報,真正有價值的東西在於使用者幫你累積的資料,而不在於你的平台本身,平台本身,一但缺了使用者和資料,在現在的網站時代是毫無價值的.
Read Full Post »
Posted in Mr. Thursday, 專欄, 電腦科學 on Oct 19th, 2007
Posted By Mr. Thursday
在今日我們可以從網路上吸收大量資訊,有時候一堆文章看不完。如果我們想要吸收資訊,時間卻又不夠的時候,使用電腦幫我們過濾資訊,或是用電腦幫我們做個總整理,是個方法。如果今天手中有一篇文章,我們想要用電腦幫我們找出這篇文章最重要的關鍵字,要怎麼做呢?在資訊檢索 (IR: Information Retrieval)領域裡面,有個基礎的方法,入門必學的方法,就是使用 TF 和 IDF (TF: Term Frequency, IDF: Inverse Document Frequency)。使用這兩個估計值,可以讓電腦具有計算重要關鍵字的能力,進而節省我們的時間。
接下來讓我們看看,TF 和 IDF 個是甚麼東西呢?TF 全名是Term Frequency,也就是某個關鍵字出現的次數,譬如說某篇文章裡面,「電腦」這個詞出現很多次,或是「使用者需求」這個詞出現很多次,那麼這些詞句的出現頻率,就會很高。一篇文章中出現很多次的詞句,必定有其重要性。譬如說一篇論述「人工智慧」的文章,「人工智慧」這個詞句再文章中出現的頻率也一定很高。然而為甚麼除了 TF (Term Frequency) 以外,還要有 IDF (Inverse Document Frequency) 呢?
Read Full Post »
Posted by Mr. Saturday
在 Google 和其他搜尋引擎公司的大軍壓境之下,在搜尋引擎的技術這方面,應該是沒什麼人想要正面跟這些大公司衝突才對.不過 Eurekster 這一家在 2004 年成立的公司對於搜尋引擎的玩法倒是巧妙地結合了社群和個人化的垂直搜尋引擎 (vertical search engine).推出類似 Wiki 的有趣應用.這是目前各大搜尋引擎公司都尚未推出或成熟的服務和應用方式.其運作模式不僅值得我們一探究竟,其實也代表了搜尋本身的演進.(事實上,Eurekster 算是一家成立於紐西蘭公司,不過重心現在已經放在舊金山)
Read Full Post »
Posted in Mr. Thursday, 專欄, 電腦科學 on Oct 5th, 2007
Posted By Mr. Thursday
在《從尋找質數談談搜尋演算法》一篇文章裡面提到質數搜尋演算法,約略提到了一點演算法 (Algorithm) 以及 搜尋(search) 演算法。簡單地說,搜尋演算法就是要在一堆可能是答案的輸入資料 (input data) 當中,找出符合條件的答案。之前在《排程問題與CPU Scheduling》裡面提到了Job-Shop Problem是一個很難的排程問題 (Scheduling Problem),是NP-complete。本篇就簡單介紹一下搜尋演算法、「旅行中的商人」這個問題如何使用搜尋演算法、NP-complete的定義、以及最後提一下對偶問題(Dual Problem)。
Read Full Post »
Posted in Mr. Thursday, 專欄, 電腦科學 on Sep 28th, 2007
Posted By Mr. Thursday
如果今天有一台機器,N個人要用,每個人使用的時間分別是t1, t2, …, tn,那麼怎樣子才能讓等待的時間最少呢?如果是以每個人的角度來說的話,當然是先搶先贏啦!不過如果是以這N個人所屬機構的角度來看,要讓全部人的等待時間最少,要如何安排使用機器的順序呢?這個時候作業系統 (OS: Operating System) 裡面的CPU Scheduling方法,就可以參考了!
首先我們先看看N個人不同的先後順序有幾種組合呢?答案是N!(N階層)種組合,譬如說5個人先後順序的組合方法就有5! = 120種組合,裡面包括第一個人先、然後第二個人、第三個人、第四個人、第五個人執行,也包括第一個人先、然後第三個人、第四個人、第五個人、最後才是第二個人執行,以及更多種組合的方法。因此我們排程的解答,就是在這麼多種組合(N!種)裡面,找到一個執行的順序,大家等待的時間加總起來是最小的。然而要怎麼找到這個解答呢?
Read Full Post »