Luis von Ahn: 人腦運算

本文同步刊載在 <UIUI>

Posted by Mr. Monday

這一篇文章是根據之前的一篇文章 <玩遊戲,做研究> 所改寫而成。本文並可在 <密技偷偷報【密】字第肆拾號> 雜誌中看到。

2005年,一個帶著眼鏡、身材略微發福的年輕小伙子接過了卡內基梅隆大學(Carnegie Mellon University)所頒發的博士畢業證書,領取這個畢業證書是必然的,因為他的博士研究使得電腦界開拓出了一個全新的研究領域人腦運算 (Human Computation)。這個年輕人的名字是 Luis von Ahn,人機介面(HCI)跟人工智慧(AI)領域的新星。

dog.jpg

Luis von Ahn 暸解到了電腦智慧的極限,也暸解到電腦如果要模仿人類的思考的話,需要大量的資料來做訓練。比如說,如果我們要讓電腦知道什麼是狗的話,我們就必須拿出一張有狗的照片,然後把狗所在的位置給標示出來;同樣的道理,如果我們需要讓電腦理解什麼是貓的話,我們就必須給電腦貓的圖片;依此類推。然而,我們不可能聘請這麼多人來標記所有的東西,因為這樣子所牽涉到人力跟範圍將是非常地大的,而且聘用的金額將是非常昂貴。試想想,如果付錢給一個工讀生,每小時 100 塊,請工讀生來幫忙標記圖片,一個小時標記 100 張圖片,一天 8 小時,如果需要標記的圖片是數千萬張的範圍,我要請多少工讀生來做這些事情呢? 而且,我又怎麼知道他們有沒有標記錯誤呢? 我又該要花多少錢來做驗證?

對於上述的問題,Luis von Ahn 想到了解決的方法。他認為根本不需要付錢,大家就會自動來幫忙做這件事情,只要他們覺得這件事情是好玩的。這讓我想到馬克吐溫的名作 <湯姆歷險記> 裡的橋段,故事的主人翁湯姆由於被交代要將所有的籬笆上油漆,因此不能跟其他的小朋友一起去玩耍,不過聰明的湯姆想到了好方法,他讓其他的小朋友認為刷油漆是很有趣的一件事情。因此,其他的小朋友不但爭先恐後地來幫湯姆刷油漆之外,還會給湯姆玩具或是糖果,就只是為了能夠刷到油漆。


(圖片來源: ESP Game網站)

Luis von Ahn 借著觀察,發現許多人會在網路上面玩一些小遊戲來打發零星瑣碎的時間,因此他決定著手設計一款遊戲,這款遊戲叫做 EPS Game。遊戲規則很簡單,玩家一進入遊戲畫面,會看到一張圖,針對這張圖,玩家必須給一個關鍵字,而在網路的彼端,會有一個玩家跟你配對起來,一但你所輸入的關鍵字跟你配對的玩家一樣,那麼你們兩個就獲得分數,雙方進入下一關。當然,如果沒有沒有人跟你玩的話,就會有機器人跟你配對起來。藉由這個遊戲,Luis von Ahn 就可以讓大家在玩樂的同時取得大量有意義的配對資料,而這些跟圖片配對的關鍵字,將可以用來訓練電腦來認識圖片的內容物。

因為這一款遊戲,也讓 Google 發覺了這位超級新星,因此在 200412 月邀請他到 Google 演講;其後在他畢業之後,又邀請他到 Google 給了另外一個演講 。在文字搜尋的戰場上面,Google 算是贏家了,然而面對科技的劇烈變動,任何一個公司如果不能持續往下一個科技邁進,都將會被時代所淹沒。因此,對於搜尋而言,下一個最大的戰場,當然就是多媒體,包括了音樂、影片、照片。Google 會邀請 Luis von Ahn 不是沒有道理,因為他們也想要利用這樣子的遊戲來建立他們的資料庫。就在 2006 91號,Google 發表了一款大作,Google Image Labeler 而這一款遊戲正是 EPS Game 的模仿之作。

不過,Luis von Ahn 的創意還未竭盡,在推出如此成功的遊戲之後,Luis von Ahn又馬不停蹄地推出了一個更好玩的曠世鉅作Peekaboom。這款遊戲的趣味性比EPS高出數倍,保證一玩馬上上癮。遊戲規則則是將 EPS game 的規則做個修改。現在玩家分成Peek方,以及 Boom 方。兩個被配對起來的玩家,必須共同合作。在一開始的遊戲畫面,Peek 方會是一片全黑的 畫面,而Boom方或是一張圖片以及一個單字。Boom方利用滑鼠將圖片點開,每點擊一下,被點擊的圖片部位在 Peek 方就會暈開。於是Peek方就可以 利用得到的圖片部分資訊來猜測這張圖片所配對到的單字。一但Peek方猜中,兩方就會共同得分,然後換下一張圖,然後兩個人腳色互換,原本是Peek方的 腳色,變成 Boom 方,而 Boom 方的腳色變成 Peek 方。這個遊戲就有點像是我猜。因為有時間限制,因此 Boom方會儘量點擊跟單字相關的部位。此遊戲 不但遊戲趣味度高,研究員也可從遊戲的資料當中來做研究。因為有成千上萬的人,會因為玩這個遊戲來幫他們標記圖片中相關物件的位置。藉由這些標記的位置和大量的資料,就可以做非常有用的分析了。而這個遊戲也非基於之前所設計的遊戲 ESP 所取得的資料不可,之前說到的遊戲規則,Boom 方會的到一張圖片,以及一個單字。電腦怎麼知道要圖片該用什麼單字來表達?就是拿ESP的資料庫的遊戲資料得來的。因此,也可以說,這種遊戲也只有 Luis von Ahn 也才能設計出來。普通人誰有數千萬張已經標記過後的圖片?

透過網路以及簡單的人工智慧設計,Luis von Ahn 創造出了一個全新的領域: 人腦運算 (Human Computing),讓在網際網路上面的千千萬萬個使用者都能夠貢獻他們的腦力在研究之上,而這個貢獻是基於自願的。終於,Luis von Ahn 為線上遊戲找到了一個最好的出路,玩遊戲的人不再是花費時間,而是藉由遊戲學習單字;而所標記的圖片,將可以讓科學家獲得寶貴的研究資料,得以教導電腦如何來認識這些圖片。

gwap.jpg

Luis von Ahn 似乎也有意要將網路遊戲結合研究的目標繼續發揚光大,在他任職於他所畢業的母校之後,他在今年5月推出了gwap,一個整合型的遊戲網站。這個網站整合了許多的小遊戲,這些小遊戲都是用來設計來取得人對於某項資料的認知,像是標示圖片或是標示音樂等等。

photo.jpg

因為 Luis von Ahn 的開創,這樣子取得資料的方式也開始在各個領域中被採納。台灣大學的資訊網路與多媒體研究也連續在 2006 年以及 2007 年推出了兩款遊戲,其中一款叫做PhotoShoot 的遊戲是用來蒐集圖片當中大家所感興趣的地方;而另外一款叫做 PhotoSlap 的遊戲則是用來標示人臉的遊戲。

re.jpg

結合網路的人腦運算,將會開始以不同的形式出現,遊戲只是其中一種方式。其他的方式還包括了利用 RECAPCHA來進行認證的系統。RECAPCHA也是由Luis von Ahn所發明,上圖中的波浪字串,其中有一個是從電腦掃描書中的字串而來,當使用者輸入圖中的文字時,就順便幫忙辨識了電腦掃描下來的文字。這些大量蒐集的資料同樣地也可以幫助電腦辨識文字(OCR),除此之外,也可以順便驗證電腦所辨認的字串是否正確。藉由每天成千上萬的登錄數據,RECAPCHA系統又成功的利用了人腦來做運算。

人腦運算 (Human Computation) 雖然是由 Luis von Ahn 所開創,但是他的想法以及研究的精隨將會在全世界遍地開花,但是無論下一個應用是什麼,都將脫離不暸網路,因為正是因為網路的發達才孕育出了這一個全新的領域。我想,這也是網路發明人當初所想不道的其中一件事吧。

圖片來源: http://www.cs.cmu.edu/~biglou/

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!