Category Archive for 'Mr. Saturday'

Posted by Mr. Monday, Mr. Saturday Stanford大學在三月七號舉辦了一場有趣的演講:就是邀請最近在美國相當火紅的線上遊戲Second Life,其副總裁Ginsu Yoon現身說法。另外現場也請到了James Currier,現在是OOGA LABS的CEO。另外值得一提的是,Google的Mountain View總部也曾經於去年三月一號請到Linden Lab的CEO Philip Rosedale以及CTO Cory Ondrejka到現場為大家做Second Life中一些相當有趣的demo,這可能是Mr. Saturday看過最有趣的Second Life Demo之一(如果你已經等不及看這些demo的話,請下拉至文章的末端)。

Read Full Post »

如何解題

Posted by Mr. Saturday 人一生都在解決問題,尤其身為一個台灣的學生,從小到大就是面對一堆怎麼樣也寫不完的考卷和作業,想辦法解出一個又一個問題。問題解決得好或是解決的快,你的成績就名列前茅。Mr. Monday之前談到了大學生一定要學會的三件事情,其中一項談到了解決問題的能力。對於這一點我深有所感,所以來跟大家分享一下我的解題心得。當然以下的討論可能偏重於談論一些總是有標準答案的問題,但是我相信把一些概念推而廣之,類似的法則應用於真實世界中那些常常沒有標準答案的問題時同樣有效。

Read Full Post »

Posted by Mr. Saturday Web 2.0 喊出來其實也沒多久,現在連學術界和科學界都來個 Science 2.0。相信大家都於 [email protected] 這個 project 一點都不陌生,這個意在尋找外星智慧的 project 從 1999 年開始,至今已經被列為金氏世界紀錄上最龐大的分散式運算計畫,累計已經有超過 520 萬人加入這個計畫。雖然到現在為止還沒找到什麼外星人,但 SETI 可以說是在科學界開放平台、邀請大家一起來做科學研究的鼻祖之一。而 Web 2.0 這個名詞出現之後,開放共享的概念更是在學術界迅速蔓延開來。

Read Full Post »

Posted by Mr. Saturday 紐約時報這兩天報導了有關Google以及YouTube與content providers交涉取得合法影音內容的新聞,Google不愧坐擁雄厚的資金,一但有人來告YouTube上面的內容侵權,Google二話不說馬上就開始談合夥,花錢買你內容的版權,並且為這些夥伴的內容開一個專屬的新頻道。感覺起來跟微軟打不過人家就把人家買下來有異曲同工之妙,不過這種策略還是雙贏就對了。隨著YouTube上面的頻道越來越多,恐怕以後上YouTube就跟上網看電視是一模一樣了!昨天YouTube又有了新頻道:那就是NBA!大家趕快上去欣賞吧!   其他一些YouTube專屬頻道: (轉載自紐約時報)

Read Full Post »

Posted by Mr. Saturday 成天看台灣電視新聞的人,一定常常氣得跳腳痛罵,現在的媒體記者該報的不報,不該報的拼命報。重要的事情被邊緣成不重要,不重要的事情被放大鏡放大無限倍來報導。特別是電視新聞記者,他們最愛做的事情,就是當整個社會的判官,像是跑到採訪現場叫嫌犯下跪道歉,或是採訪一些民眾之後就自己對於社會事件亂下結論。記者的專業素養和水準實在是令人畫上一個大問號。台灣的主流媒體也因此讓人感覺已經病很久了,而且病入膏肓。有的時候Mr. Saturday不禁會想問:台灣真的需要這些記者嗎?

Read Full Post »

Posted by Mr. Saturday 瀑布中的一滴水滴,你知道它最終會流過河川、匯入大海,但是此時此刻,你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置。這個觀察告訴了我們,我們可以看得見長期的趨勢,但是微觀的下一秒鐘,我們卻怎麼樣也難以窺見其變化,因為需要考慮的因素太多:水的流量、地形的細微變化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。當因素太多太多,以至於我們無法掌握時,水滴在某一個瞬間的走向對我們來說就是隨機的。我們只知道:不管這個水滴現在怎麼走,最終它會進入大海。這就是Mr. Saturday這邊想要淺談的隨機現象。隨機現象在我們生活中處處可見,而且深深影響我們的生活,很多不同科學領域的尖端研究,現在都是在對付隨機現象。研究物理的人研究到量子的層次,會發現這個穩固的世界居然是由一些隨機亂跑的粒子所堆砌而成。研究電腦科學的人,會發現隨機方法竟然可以用來設計出簡潔易懂的演算法,研究數學的人,會發現機率模型竟然可以相當程度上幫助我們做出生活中的決策。那麼隨機現象對於我們現實生活中的啟示又什麼呢?以下Mr. Saturday先舉出一個電腦科學界的例子來闡述。 機器學習(Machine Learning)這一個有關人工智慧的學門是電腦科學界最近相當熱門的一個研究領域,主要研究的方向和重點是結合演算法和統計資料,擷取出這些資料之內所隱含的一些資訊,然後用這些擷取出來的資訊讓電腦去對一些事情做預測,以此模擬出類似學習的行為。Machine Learning在近年來取得了巨大的成功,讓曾經一度委靡不振的人工智慧研究又開創了許多新的契機。市面上的各種搜尋引擎就有應用相當多機器學習的技巧在裡面,讓這些搜尋引擎好像真的有智慧,去猜測你要搜尋甚麼東西,然後回傳精準的搜尋結果給你。在這個研究領域中,有一個很重要的現象是每個剛剛學習機器學習的人都會接觸到的:這個現象叫做Overfitting。要講解這個現象之前,我們先舉一個最簡單的例子來介紹機器學習。 如果你要教電腦去找出一個公式,用來計算出身高與體重的關係,那麼你的第一件事情就是收集很多人身高與體重的資料(data),然後跑一個線性迴歸分析(Linear Regression),在身高與體重的平面上找出一條直線去match這些data,這條直線電腦就拿來當作是計算身高體重的公式:你給了電腦身高,電腦就算出體重給你,反之亦然。這是機器學習最簡單的一個例子。電腦所做的事情不過就是從資料看出身高與體重之間的大略關係。之所以說是大略關係,是因為我們讓電腦假設身高與體重的關係完全是線性的,所以我們找了一條直線去當作身高和體重的model:身高越高,體重就越高。但是大家都知道身高和體重不可能剛好是線性的關係,有些人很高但是體重卻很輕,有些人很矮但是體重卻很重。所以當我們用一條直線來解釋這些資料的時候,實際上我們會有一些誤差存在。但是我們知道,以統計上來講,這個趨勢是對的,身高越高的人通常體重會比較重,所以當我們知道了某個人的身高,然後用這條直線去預測那個人的體重時,大部分的時候我們預測出來的結果不會差太遠。 現在有人覺得直線不是一種預測身高體重很好的model,所以想要用比較複雜的曲線來fit這些data,結果他找出了一條完美的曲線來解釋這些data,這條曲線毫無誤差,可以在平面上完全穿過所有資料點。但是這個曲線會出現一個大問題:這條曲線完全沒有辦法拿來預測一個人的體重:你有一個人的身高,然後拿這條曲線去預測這個人的體重,你會發現大部分的時候算出的體重都是相當離譜。而且這條曲線看起來會彎彎曲曲,完全沒有辦法看出身高與體重大致上是呈現線性的關係。這種現象就稱為Overfitting,從字面上的意思來看就是:我們對於資料做了過多的解釋。Overfitting這個現象,在統計學習理論上已經可以用數學來量化,在這邊我們就略過不談。Overfitting給我們最大的啟示就是,不要對你的資料和你看到的現象做過多的解釋。 研究哲學的人都知道Occam’s Razor這個原則:當你對一個現象有許多種解釋時,記得選擇最簡單的那一個。這個指導原則在機器學習領域是相當重要的一個概念,很多統計學家和經濟學家會建構相當複雜的模型來詮釋他們的資料,試著去預測以後很多事物的走向。舉例來說LTCM想要做的就是這種事情,兩個諾貝爾獎得主搞出了一套模型,可以保證長期下來,他們的投資絕對穩賺不賠,這群經濟學家以為自己掌握了世界每一秒的趨勢,世界的金錢已經操弄在他們的經濟模型之中,結果最後他們突然倒掉了。為什麼?原因很簡單:因為他們沒有料到蘇聯會忽然解體解體後對於國債的意外處理方式。就這麼一個他們沒有料到的因素(其實當時誰又料得到呢?),就讓他們的模型整個崩潰了。同樣地,搞出越複雜的模型,你就會發現常常這個模型對於解釋新的現象時是不管用的。 反應在我們的生活之中,炒股票的人和那些老師,整天都在跟你講明天股票是會漲還是會跌,他們在做的事情,就是在跟你講瀑布中的水滴下一秒鐘會流到什麼地方。你覺得他們猜得準嗎?你還會相信他們嗎?一群自稱是趨勢專家的人在電視上講得口沫橫飛,說出千萬個理由分析給你聽,要你去買什麼什麼股票。在我看來,他們只是用極有限的知識在跟隨機現象對抗。像預測趨勢這種連那些科學家和統計學家都還做不好的事情,你覺得這些老師做得好嗎?一家公司的股價圖對於人類現在有限的認知而言,完全就是隨機的,你不可能準確預測下一秒鐘準確的走向。股市甚至於連長期的趨勢都難以預測,還記得我們的水滴例子嗎?如果你連長期的趨勢都看不清楚,想要微觀地分析更是難上加難。即使這個世界上沒有真正隨機的事情,一切都是命中注定的,以人類現在有限的知識和電腦的運算能力來說,也還是無法完全掌握的。 同樣的,在股票市場上你會常常看到一些靠股市成為百萬或是千萬富翁的人出書大談自己的投資經,說明自己如何致富,講得真是天花亂墜。我現在舉一個簡單的運算給大家看:假設以你現在的資本,在股市連續賭一支股票十次漲跌,十次都成功,你就可以成為百萬富翁,這樣的機率是多少?既然你每次都是閉上眼睛瞎猜,所以每次的成功率都是一半,連續十次成功就大約是千分之一。看起來連續十次成功真的很難,不過換個角度想,如果台灣有兩百萬人同時做這樣的事情呢?你會發現平均來說,會有兩千人在這十次賭博之中成為百萬富翁,如果這兩千人之中有一些人跑來出書或是上節目大談自己的投資經驗呢?沒錯,他們就變成老師了。隨機現象讓這些人成為百萬富翁,然後這些人以及週遭的人開始用過度解釋和吹捧的方式來大談他們賺錢的成功,最後的結果就是:大家都被隨機現象給唬了。連這些老師自己都相信自己真有一套本領能在股市呼風喚雨。 曾經有一些學者找來一群猩猩做實驗,這些學者把華爾街日報的股票版釘在牆上,讓這些猩猩對那些股票名稱射飛鏢,當作是猩猩建議他們買的股票。結果矇著眼睛的猩猩,朝報紙股票版擲飛鏢所射中的股票,並不比投資專家們的選股遜色。看到這個實驗結果,你作何感想呢? 講了以上這麼多例子,並不是要告訴大家這個世界是隨機的,所以我們做出再多努力也是枉然。人類真正可貴的地方,就在於對這些不確定性所做出的努力,能夠讓人類的智識更推進一步,讓我們更加了解這個世界。談隨機現象只是要提醒大家,很多我們想盡辦法解釋的現象,其實往往都是隨機的結果,這是這個世界運作的機率,確確實實存在,支撐著量子力學,也支撐著我們的現實生活。我們應該做的,是去看整體的趨勢,而不是對於一個短期的現象,鑽牛角尖地想盡辦法去解剖它。解剖的結果就會讓你像量子物理學家一樣,困惑地發現井然有序的世界,竟然是由一些到處亂跑的粒子組成。長期的趨勢是可以透過努力研究在一定程度上達到預測的效果,短期趨勢是誰也說不準。 隨機現象本身是一個相當深奧的議題,談到最後往往都會淪為「上帝究竟丟不丟骰子?」的哲學議題, 人類也許永遠都無法了解這個世界是不是一切都命中注定,抑或是人總是可以隨時透過外在力量改變一些事物的隨機世界。無論是怎麼樣,努力之後得來的果實永遠都是甜美的。只是要記住,別被一些人解釋隨機現象的嘴砲所唬了,好像這些隨機現象真的像他們講的那樣完全可以預測。 別把隨機當必然。

Read Full Post »

Posted by Mr. Saturday Digg是一家在矽谷新興的一個分享平台,由Kevin Rose於2004年12月創辦,主要讓網友在上面分享科技以及科技相關的文章,這種網站又被稱作social content website。Digg在矽谷是相當成功的網站,吸引了大量的使用者,最近台灣火紅的Hemidemi也是一個類似的Social content website,不過功能上尚不及Digg完整。 網路上有這麼一個有趣的報導 Digg Effect(Digg效應),這個效應講的就是,一些網站突然的流量爆增,是因為有人把該網站的內容分享到Digg上面去了,大家可以看看下面某個網站一段時間的流量圖,可以注意到流量的走向中有兩個突然出現的不自然的尖峰。這兩個高峰就是Digg Effect發生作用的時間點,也就是在那個時間,有人把該網站的內容或是文章分享到Digg上面去了,而且有不少的人透過Digg閱覽該內容,或是造訪該網站。於是就造成了突然之間流量的爆增。 這個情境在台灣的網路環境上實在是太熟悉不過了,PTT的表特(Beauty)板不就恰恰有著同樣的效應嗎?無名小站上面的正妹相簿靠著表特板的分享讓人氣一飛衝天,一天往往可達上萬人次觀賞。無名小站同時也因為這個版把PTT上面的部分流量導到自己這邊來。所謂的Digg效應,在台灣早就有相對應的PTT效應了!而且這個效應還造就了今日的無名小站。BBS和Web交織出來的這種奇特效應,除了PTT盛行的台灣之外,世界上難有第二個類似的案例。當然PTT與Digg最大的不同點是顯而易見的,在PTT上面的分享方式不過就是post個連結到板上讓大家去連。在Hemidemi和Digg上面就有著比較Fancy的介面和對於一篇文章或是一個書簽的評價機制。 PTT現在對於文章的評價機制就如同先前提到的,還是用簡單的推文來達成。由於先天上是一個電子佈告欄系統,PTT一篇文章相關的評價和後續討論並不會匯集在同一個點或是頁面上,讓使用者可以像在網路上那樣,對於同樣一篇文章的相關訊息可以在同一個頁面一次瀏覽,也可以看到有誰訂閱了哪篇文章或是分享了哪個書籤,或是留下較為完整的評論,更進一步地,可以看到與該文章或是書籤相關的連結,讓使用者作延伸閱讀。PTT的文章還是長江後浪推前浪,前浪死在沙灘上,反正新的文章多了,你的文章就被淹沒了。所以洗板很容易,只要版主一下子沒發現,鬧板的人可以在上面興風作浪。 於是就有版主和鄉民很生氣地在很多地方噓那些不爬文的人,譴責某些人同樣的問題一問再問,Mr. Saturday到是認為這些人實在沒有甚麼好罵的,問問題的人很多是沒有時間仔細爬文的人,爬了文爬不仔細也是無可厚非,在同一個板上搜尋文章,有時搜尋字用得不對,想找的文章就找不到了,PTT在資訊擷取上的搜尋功能連最原始的Boolean model都不是,搜尋時也不過就是看看哪些標題有搜尋字在裡面罷了。問問題的人有時候要的只是即時的答案,PTT之所以成功,不就是在於資訊分享的快速? 一個圖書館的藏書越來越多的時候,就有必要引進圖書管理和書籍搜尋的功能來方便使用者找到他想要的書,在網路上也是一樣,網路上的資訊太多了,搜尋引擎就出現了。如此使用者才不用在毫無組織的資訊中進行毫無組織的翻找。Mr. Saturday認為PTT的資訊和文章已經多到有必要出現一個完整的搜尋功能了。不過對於BBS這種介面而言,顯然難度是太高了點。 前面提到的流量暴增現象,雖然看來像是對於blogger或是網站經營者的一種鼓勵,其實這種爆增的流量就像是突然來的海浪一樣,來得快去得也快,可以突然吸引一堆人到你的網站上來看特定的內容,但是卻不會真正吸引到相當多的忠實顧客或是blog reader。 那些突然造訪的人也只對於你網站上特定的內容有興趣,就像是去看正妹圖一樣,除了圖片,恐怕不會有很多人再去看看那些正妹寫的文章,進而成為忠實讀者。在對於流量的詮釋上,網站經營者一定要考慮到這樣的特殊效應。

Read Full Post »