Luis von Ahn: 人腦運算

本文同步刊載在 <UIUI>

Posted by Mr. Monday

這一篇文章是根據之前的一篇文章 <玩遊戲,做研究> 所改寫而成。本文並可在 <密技偷偷報【密】字第肆拾號> 雜誌中看到。

2005年,一個帶著眼鏡、身材略微發福的年輕小伙子接過了卡內基梅隆大學(Carnegie Mellon University)所頒發的博士畢業證書,領取這個畢業證書是必然的,因為他的博士研究使得電腦界開拓出了一個全新的研究領域人腦運算 (Human Computation)。這個年輕人的名字是 Luis von Ahn,人機介面(HCI)跟人工智慧(AI)領域的新星。

dog.jpg

Luis von Ahn 暸解到了電腦智慧的極限,也暸解到電腦如果要模仿人類的思考的話,需要大量的資料來做訓練。比如說,如果我們要讓電腦知道什麼是狗的話,我們就必須拿出一張有狗的照片,然後把狗所在的位置給標示出來;同樣的道理,如果我們需要讓電腦理解什麼是貓的話,我們就必須給電腦貓的圖片;依此類推。然而,我們不可能聘請這麼多人來標記所有的東西,因為這樣子所牽涉到人力跟範圍將是非常地大的,而且聘用的金額將是非常昂貴。試想想,如果付錢給一個工讀生,每小時 100 塊,請工讀生來幫忙標記圖片,一個小時標記 100 張圖片,一天 8 小時,如果需要標記的圖片是數千萬張的範圍,我要請多少工讀生來做這些事情呢? 而且,我又怎麼知道他們有沒有標記錯誤呢? 我又該要花多少錢來做驗證?

對於上述的問題,Luis von Ahn 想到了解決的方法。他認為根本不需要付錢,大家就會自動來幫忙做這件事情,只要他們覺得這件事情是好玩的。這讓我想到馬克吐溫的名作 <湯姆歷險記> 裡的橋段,故事的主人翁湯姆由於被交代要將所有的籬笆上油漆,因此不能跟其他的小朋友一起去玩耍,不過聰明的湯姆想到了好方法,他讓其他的小朋友認為刷油漆是很有趣的一件事情。因此,其他的小朋友不但爭先恐後地來幫湯姆刷油漆之外,還會給湯姆玩具或是糖果,就只是為了能夠刷到油漆。


(圖片來源: ESP Game網站)

Luis von Ahn 借著觀察,發現許多人會在網路上面玩一些小遊戲來打發零星瑣碎的時間,因此他決定著手設計一款遊戲,這款遊戲叫做 EPS Game。遊戲規則很簡單,玩家一進入遊戲畫面,會看到一張圖,針對這張圖,玩家必須給一個關鍵字,而在網路的彼端,會有一個玩家跟你配對起來,一但你所輸入的關鍵字跟你配對的玩家一樣,那麼你們兩個就獲得分數,雙方進入下一關。當然,如果沒有沒有人跟你玩的話,就會有機器人跟你配對起來。藉由這個遊戲,Luis von Ahn 就可以讓大家在玩樂的同時取得大量有意義的配對資料,而這些跟圖片配對的關鍵字,將可以用來訓練電腦來認識圖片的內容物。

因為這一款遊戲,也讓 Google 發覺了這位超級新星,因此在 200412 月邀請他到 Google 演講;其後在他畢業之後,又邀請他到 Google 給了另外一個演講 。在文字搜尋的戰場上面,Google 算是贏家了,然而面對科技的劇烈變動,任何一個公司如果不能持續往下一個科技邁進,都將會被時代所淹沒。因此,對於搜尋而言,下一個最大的戰場,當然就是多媒體,包括了音樂、影片、照片。Google 會邀請 Luis von Ahn 不是沒有道理,因為他們也想要利用這樣子的遊戲來建立他們的資料庫。就在 2006 91號,Google 發表了一款大作,Google Image Labeler 而這一款遊戲正是 EPS Game 的模仿之作。

不過,Luis von Ahn 的創意還未竭盡,在推出如此成功的遊戲之後,Luis von Ahn又馬不停蹄地推出了一個更好玩的曠世鉅作Peekaboom。這款遊戲的趣味性比EPS高出數倍,保證一玩馬上上癮。遊戲規則則是將 EPS game 的規則做個修改。現在玩家分成Peek方,以及 Boom 方。兩個被配對起來的玩家,必須共同合作。在一開始的遊戲畫面,Peek 方會是一片全黑的 畫面,而Boom方或是一張圖片以及一個單字。Boom方利用滑鼠將圖片點開,每點擊一下,被點擊的圖片部位在 Peek 方就會暈開。於是Peek方就可以 利用得到的圖片部分資訊來猜測這張圖片所配對到的單字。一但Peek方猜中,兩方就會共同得分,然後換下一張圖,然後兩個人腳色互換,原本是Peek方的 腳色,變成 Boom 方,而 Boom 方的腳色變成 Peek 方。這個遊戲就有點像是我猜。因為有時間限制,因此 Boom方會儘量點擊跟單字相關的部位。此遊戲 不但遊戲趣味度高,研究員也可從遊戲的資料當中來做研究。因為有成千上萬的人,會因為玩這個遊戲來幫他們標記圖片中相關物件的位置。藉由這些標記的位置和大量的資料,就可以做非常有用的分析了。而這個遊戲也非基於之前所設計的遊戲 ESP 所取得的資料不可,之前說到的遊戲規則,Boom 方會的到一張圖片,以及一個單字。電腦怎麼知道要圖片該用什麼單字來表達?就是拿ESP的資料庫的遊戲資料得來的。因此,也可以說,這種遊戲也只有 Luis von Ahn 也才能設計出來。普通人誰有數千萬張已經標記過後的圖片?

透過網路以及簡單的人工智慧設計,Luis von Ahn 創造出了一個全新的領域: 人腦運算 (Human Computing),讓在網際網路上面的千千萬萬個使用者都能夠貢獻他們的腦力在研究之上,而這個貢獻是基於自願的。終於,Luis von Ahn 為線上遊戲找到了一個最好的出路,玩遊戲的人不再是花費時間,而是藉由遊戲學習單字;而所標記的圖片,將可以讓科學家獲得寶貴的研究資料,得以教導電腦如何來認識這些圖片。

gwap.jpg

Luis von Ahn 似乎也有意要將網路遊戲結合研究的目標繼續發揚光大,在他任職於他所畢業的母校之後,他在今年5月推出了gwap,一個整合型的遊戲網站。這個網站整合了許多的小遊戲,這些小遊戲都是用來設計來取得人對於某項資料的認知,像是標示圖片或是標示音樂等等。

photo.jpg

因為 Luis von Ahn 的開創,這樣子取得資料的方式也開始在各個領域中被採納。台灣大學的資訊網路與多媒體研究也連續在 2006 年以及 2007 年推出了兩款遊戲,其中一款叫做PhotoShoot 的遊戲是用來蒐集圖片當中大家所感興趣的地方;而另外一款叫做 PhotoSlap 的遊戲則是用來標示人臉的遊戲。

re.jpg

結合網路的人腦運算,將會開始以不同的形式出現,遊戲只是其中一種方式。其他的方式還包括了利用 RECAPCHA來進行認證的系統。RECAPCHA也是由Luis von Ahn所發明,上圖中的波浪字串,其中有一個是從電腦掃描書中的字串而來,當使用者輸入圖中的文字時,就順便幫忙辨識了電腦掃描下來的文字。這些大量蒐集的資料同樣地也可以幫助電腦辨識文字(OCR),除此之外,也可以順便驗證電腦所辨認的字串是否正確。藉由每天成千上萬的登錄數據,RECAPCHA系統又成功的利用了人腦來做運算。

人腦運算 (Human Computation) 雖然是由 Luis von Ahn 所開創,但是他的想法以及研究的精隨將會在全世界遍地開花,但是無論下一個應用是什麼,都將脫離不暸網路,因為正是因為網路的發達才孕育出了這一個全新的領域。我想,這也是網路發明人當初所想不道的其中一件事吧。

圖片來源: http://www.cs.cmu.edu/~biglou/

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!
  • 這感覺有點像在教小孩子唸書
    然而,我想這小孩也總有一天會長大成人

    但是希望它不會變成壞人
    XD 有人懂我在講什麼嗎?
    其實我自己也不太懂………

  • 這感覺有點像在教小孩子唸書
    然而,我想這小孩也總有一天會長大成人

    但是希望它不會變成壞人
    XD 有人懂我在講什麼嗎?
    其實我自己也不太懂………

  • Kit

    又要費心去開法下一代RECAPCHA
    http://research.microsoft.com/asirra/?0sr=a

  • Kit

    又要費心去開法下一代RECAPCHA
    http://research.microsoft.com/asirra/?0sr=a

  • Hi, Kit,

    Thanks for your sharing. 🙂
    I will share it to others on UIUI.

  • Hi, Kit,

    Thanks for your sharing. 🙂
    I will share it to others on UIUI.

  • Pingback: » Microsoft: 圖片認證 Asirra()

  • Pingback: (依主題重組):電腦技術領域 « eweibookmark()

  • 你說”RECAPCHA幫忙辨識了電腦掃描下來的文字”如果我輸入錯了,他怎麼知道我輸入錯了,我猜是不是他原本資料庫內就有答案了,如果是的話,那你輸入的那一次就也沒有辦法做出什麼幫忙。而”順便驗證電腦所辨認的字串是否正確”如過我輸入錯誤不就是在請你輸入一遍,那我對系統還有做到驗證的行為嗎?RECAPCHA有一個 Get an audio challenge聽到了一堆吵雜的聲音,但是那一個聲音和驗證的圖片是一樣的嗎?其他還有很多線上空間如:Bodongo,Rapidshare,Easyshare的圖片驗證也跟這個有關嗎?我去註冊某網站時就有RECAPCHA。很多時候看這種圖片驗證圖片的文字太藝術了,所以有事後連人都判斷不清楚,真的有需要做成這樣嗎?有些網站的圖片驗證要打好幾次才成功,又要換好幾張圖。

  • 你說”RECAPCHA幫忙辨識了電腦掃描下來的文字”如果我輸入錯了,他怎麼知道我輸入錯了,我猜是不是他原本資料庫內就有答案了,如果是的話,那你輸入的那一次就也沒有辦法做出什麼幫忙。而”順便驗證電腦所辨認的字串是否正確”如過我輸入錯誤不就是在請你輸入一遍,那我對系統還有做到驗證的行為嗎?RECAPCHA有一個 Get an audio challenge聽到了一堆吵雜的聲音,但是那一個聲音和驗證的圖片是一樣的嗎?其他還有很多線上空間如:Bodongo,Rapidshare,Easyshare的圖片驗證也跟這個有關嗎?我去註冊某網站時就有RECAPCHA。很多時候看這種圖片驗證圖片的文字太藝術了,所以有事後連人都判斷不清楚,真的有需要做成這樣嗎?有些網站的圖片驗證要打好幾次才成功,又要換好幾張圖。

  • Hi, Frondget,

    很高興你對 RECAPCHA 有興趣
    在文章當中, 我沒有很詳細的介紹 RECAPCHA 是怎麼運作
    我也沒有介紹什麼是 CAPCHA
    因此, 有所誤解是難免的

    裝有 RECAPCHA 的網站其實並不多
    致少你提到的那三個分享網站, 都僅僅是 CAPCHA 而不是 RECAPCHA
    太藝術的文字, (也就是扭曲的太厲害, 或是雜訊太多)
    的確是很難辨識
    這也是為什麼 CAPCHA 的系統一直在改進
    不過沒有 CAPCHA 的系統的話
    就很容易被 SPAM, 就跟敝 Blog 一樣

    而 RECAPCHA 的機制, 你的確有猜到一點
    這邊我簡略解釋一下, 詳細的運作你可以觀看 Louis 的網頁
    RECAPCHA 需要你輸入兩個單字
    而這兩個單字, 其中一個是電腦已經知道的答案
    另外一個是電腦不知道的或是不確定的答案 (也就是從書本上面掃描下來的文字)
    因此, 當你輸入驗證字串的時候
    電腦會檢查他已經知道的答案那ㄧ個部份
    看你是否輸入正確
    對於他不知道的那個答案的部份. 它則是存起來
    而對於這個不知道為何的字串
    在經過多人的輸入之後, 就可以依照大數法則, 來斷定這個字究竟是什麼字
    大多數的情況來說, 如果大家認為某個長相的字串是 Dog 的話
    那它是 Dog 的機會就越高
    因此, 借由 RECAPCHA 的確可以利用人眼達到辨認字串的效果 🙂

  • Hi, Frondget,

    很高興你對 RECAPCHA 有興趣
    在文章當中, 我沒有很詳細的介紹 RECAPCHA 是怎麼運作
    我也沒有介紹什麼是 CAPCHA
    因此, 有所誤解是難免的

    裝有 RECAPCHA 的網站其實並不多
    致少你提到的那三個分享網站, 都僅僅是 CAPCHA 而不是 RECAPCHA
    太藝術的文字, (也就是扭曲的太厲害, 或是雜訊太多)
    的確是很難辨識
    這也是為什麼 CAPCHA 的系統一直在改進
    不過沒有 CAPCHA 的系統的話
    就很容易被 SPAM, 就跟敝 Blog 一樣

    而 RECAPCHA 的機制, 你的確有猜到一點
    這邊我簡略解釋一下, 詳細的運作你可以觀看 Louis 的網頁
    RECAPCHA 需要你輸入兩個單字
    而這兩個單字, 其中一個是電腦已經知道的答案
    另外一個是電腦不知道的或是不確定的答案 (也就是從書本上面掃描下來的文字)
    因此, 當你輸入驗證字串的時候
    電腦會檢查他已經知道的答案那ㄧ個部份
    看你是否輸入正確
    對於他不知道的那個答案的部份. 它則是存起來
    而對於這個不知道為何的字串
    在經過多人的輸入之後, 就可以依照大數法則, 來斷定這個字究竟是什麼字
    大多數的情況來說, 如果大家認為某個長相的字串是 Dog 的話
    那它是 Dog 的機會就越高
    因此, 借由 RECAPCHA 的確可以利用人眼達到辨認字串的效果 🙂

  • Pingback: Mars Opinion()

  • Jeff

    歡迎六樓的新同學。

    為啥是新同學呢?有關驗證碼的運轉原哩,在本站先前的點點點大賽中,有介紹過喔。

  • Jeff

    歡迎六樓的新同學。

    為啥是新同學呢?有關驗證碼的運轉原哩,在本站先前的點點點大賽中,有介紹過喔。

  • 去看了Luis在Google演講的影片,很佩服他的才智。
    不過可以想見它有某些限制。
    因為有許多task是需要有domain knowledge才能完成的。
    標示一般圖片可能每個人都可以做,
    不過如果要標示人體X光圖片中的陰影,
    這就不是大部份的人可以做到的事。

  • 去看了Luis在Google演講的影片,很佩服他的才智。
    不過可以想見它有某些限制。
    因為有許多task是需要有domain knowledge才能完成的。
    標示一般圖片可能每個人都可以做,
    不過如果要標示人體X光圖片中的陰影,
    這就不是大部份的人可以做到的事。

  • Hi, Grady,

    的確如此

  • Hi, Grady,

    的確如此

  • Victor

    這方法我有想過,我當初是想如果能將一些需要人力才能完成的資訊相關工作,如果以網路分散出去做的話,應該會很方便,且有效率,例如翻譯文章等等工作,或許可以成立一個平台讓人可以有機會在家接並且完成這種工作,但是需求量似乎沒這麼大,而且工作想來想去也只有這類較瑣碎的工作,所以就沒有實作出來的打算,沒想到有人真的做出來,而且還是用遊戲的形式,不過我個人覺得這只是將工作分散給很多人做的網路平台而已,覺得這市場有一定的潛力在,但還有待開發。

  • Victor

    這方法我有想過,我當初是想如果能將一些需要人力才能完成的資訊相關工作,如果以網路分散出去做的話,應該會很方便,且有效率,例如翻譯文章等等工作,或許可以成立一個平台讓人可以有機會在家接並且完成這種工作,但是需求量似乎沒這麼大,而且工作想來想去也只有這類較瑣碎的工作,所以就沒有實作出來的打算,沒想到有人真的做出來,而且還是用遊戲的形式,不過我個人覺得這只是將工作分散給很多人做的網路平台而已,覺得這市場有一定的潛力在,但還有待開發。

  • 你這叫有想過?你根本找不到文章的重點,Luis von Ahn 的做法獨到之處在於,把工作變做遊戲,把原本要錢請人才會有人做的工作變做人們自願爭相無償完成的遊戲,甚至可以向「玩家」收費(當然會影響參與人數)。你想過甚麼?網路協作一早就有,還用你想?

  • 你這叫有想過?你根本找不到文章的重點,Luis von Ahn 的做法獨到之處在於,把工作變做遊戲,把原本要錢請人才會有人做的工作變做人們自願爭相無償完成的遊戲,甚至可以向「玩家」收費(當然會影響參與人數)。你想過甚麼?網路協作一早就有,還用你想?

  • Pingback: Luis von Ahn MMDays « Ispey Images()