douban與google book search
Posted in Google, Mr. Tuesday, 圖書, 專欄, 關於網路產業 on Feb 27th, 2007
Posted by Mr. Tuesday douban與book search如果結合的好的話,說不定可以讓人類文明有重大突破喔。
網路, 產業, 資訊, 觀察, 生活, 電影, 技術, 新知, 科技, 媒體, 趨勢, Web 2.0
Posted in Google, Mr. Tuesday, 圖書, 專欄, 關於網路產業 on Feb 27th, 2007
Posted by Mr. Tuesday douban與book search如果結合的好的話,說不定可以讓人類文明有重大突破喔。
Posted in Business, Mr. Friday, 專欄, 關於網路產業 on Feb 27th, 2007
Posted by Mr. Friday 最近web 2.0的議題炒得沸沸揚揚, 許多報章雜誌甚至blogger本身都很愛提起這個字眼. 這一波網路熱潮到底”又”還能持續多久, 很多人都抱著看好戲的心態. 不過姑且不論這一波網路熱潮到底會不會再破滅, 其中一句話倒是引起我的興趣. 什麼話呢? 就是這些新興服務都打著”讓使用者自己創造有價值的內容”云云. 這句話倒是點出很多新興服務的共通點(倒不見得舊有服務沒有, 而是說最近興起的服務都有這種趨勢) : 鼓勵使用者分享. 以吸引更多的使用者參與. 如果再更深入一點的想的話, 其實這句話描述的是資訊流創造與使用的過程. 以往大家印象深刻Amazon, Yahoo!等網站, 使用者在上面獲得的資訊往往來自於特定的來源:要嘛是網站本身, 要嘛是廣告商或其他特定網站的資訊, 使用者只能處於被動接收的狀態; 不過最近開始流行的網站, 例如digg(或是國內的HemiDemi)和Youtube, 你所看到大部分的資訊, 都來自地球某個角落的另外一個人, 而你自己本身在觀看之餘, 也能夠參與分享, 形成一個正向的迴圈. 就是這段話, 激起了Mr. Friday我偶然的一個念頭:既然這些網站在資訊流(information stream)的創造與使用上有如此的差異, 那麼從這個差異的型態出發, 是不是能夠規劃出一種分類模式, 把大部分的網站都納入其中呢? 話說我一直覺得舊型的B2B, B2C, C2C分類得頗粗糙, 因為這完全是以”如何賺錢”為出發點的分類方式, 但不是所有網站都以營利為目的, 因此也不適合分類非營利網站. 好, 廢話說完了, 我試著從上述的角度出發規劃, 結果我得到下面這個圖: 這個圖表有幾個要解釋的地方. x軸代表使用者上站後, 所得到的有價值的資訊, 大部分是由誰所提供? 左邊是單一的content provider, […]
Posted in Microsoft, Mr. Monday, 關於設計 on Feb 26th, 2007
Posted by Mr. Monday 瞧,這什麼年代了,連Microsoft都注重設計了。Microsoft跟IDSA(Industrial Designers of American)辦了一個比賽,設計下一代的PC。獲勝者可以獲得1萬美金,得獎作品將在五月公佈。不過不管有沒有得獎,設計得都蠻酷的。原網站有更多的圖組,這邊針對每一個入選的product都轉一張圖過來,沒辦法,我對設計好的東西特別有好感啊^_____^
Posted in Mr. Saturday, 專欄, 觀點 on Feb 25th, 2007
Posted by Mr. Saturday 瀑布中的一滴水滴,你知道它最終會流過河川、匯入大海,但是此時此刻,你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置。這個觀察告訴了我們,我們可以看得見長期的趨勢,但是微觀的下一秒鐘,我們卻怎麼樣也難以窺見其變化,因為需要考慮的因素太多:水的流量、地形的細微變化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。當因素太多太多,以至於我們無法掌握時,水滴在某一個瞬間的走向對我們來說就是隨機的。我們只知道:不管這個水滴現在怎麼走,最終它會進入大海。這就是Mr. Saturday這邊想要淺談的隨機現象。隨機現象在我們生活中處處可見,而且深深影響我們的生活,很多不同科學領域的尖端研究,現在都是在對付隨機現象。研究物理的人研究到量子的層次,會發現這個穩固的世界居然是由一些隨機亂跑的粒子所堆砌而成。研究電腦科學的人,會發現隨機方法竟然可以用來設計出簡潔易懂的演算法,研究數學的人,會發現機率模型竟然可以相當程度上幫助我們做出生活中的決策。那麼隨機現象對於我們現實生活中的啟示又什麼呢?以下Mr. Saturday先舉出一個電腦科學界的例子來闡述。 機器學習(Machine Learning)這一個有關人工智慧的學門是電腦科學界最近相當熱門的一個研究領域,主要研究的方向和重點是結合演算法和統計資料,擷取出這些資料之內所隱含的一些資訊,然後用這些擷取出來的資訊讓電腦去對一些事情做預測,以此模擬出類似學習的行為。Machine Learning在近年來取得了巨大的成功,讓曾經一度委靡不振的人工智慧研究又開創了許多新的契機。市面上的各種搜尋引擎就有應用相當多機器學習的技巧在裡面,讓這些搜尋引擎好像真的有智慧,去猜測你要搜尋甚麼東西,然後回傳精準的搜尋結果給你。在這個研究領域中,有一個很重要的現象是每個剛剛學習機器學習的人都會接觸到的:這個現象叫做Overfitting。要講解這個現象之前,我們先舉一個最簡單的例子來介紹機器學習。 如果你要教電腦去找出一個公式,用來計算出身高與體重的關係,那麼你的第一件事情就是收集很多人身高與體重的資料(data),然後跑一個線性迴歸分析(Linear Regression),在身高與體重的平面上找出一條直線去match這些data,這條直線電腦就拿來當作是計算身高體重的公式:你給了電腦身高,電腦就算出體重給你,反之亦然。這是機器學習最簡單的一個例子。電腦所做的事情不過就是從資料看出身高與體重之間的大略關係。之所以說是大略關係,是因為我們讓電腦假設身高與體重的關係完全是線性的,所以我們找了一條直線去當作身高和體重的model:身高越高,體重就越高。但是大家都知道身高和體重不可能剛好是線性的關係,有些人很高但是體重卻很輕,有些人很矮但是體重卻很重。所以當我們用一條直線來解釋這些資料的時候,實際上我們會有一些誤差存在。但是我們知道,以統計上來講,這個趨勢是對的,身高越高的人通常體重會比較重,所以當我們知道了某個人的身高,然後用這條直線去預測那個人的體重時,大部分的時候我們預測出來的結果不會差太遠。 現在有人覺得直線不是一種預測身高體重很好的model,所以想要用比較複雜的曲線來fit這些data,結果他找出了一條完美的曲線來解釋這些data,這條曲線毫無誤差,可以在平面上完全穿過所有資料點。但是這個曲線會出現一個大問題:這條曲線完全沒有辦法拿來預測一個人的體重:你有一個人的身高,然後拿這條曲線去預測這個人的體重,你會發現大部分的時候算出的體重都是相當離譜。而且這條曲線看起來會彎彎曲曲,完全沒有辦法看出身高與體重大致上是呈現線性的關係。這種現象就稱為Overfitting,從字面上的意思來看就是:我們對於資料做了過多的解釋。Overfitting這個現象,在統計學習理論上已經可以用數學來量化,在這邊我們就略過不談。Overfitting給我們最大的啟示就是,不要對你的資料和你看到的現象做過多的解釋。 研究哲學的人都知道Occam’s Razor這個原則:當你對一個現象有許多種解釋時,記得選擇最簡單的那一個。這個指導原則在機器學習領域是相當重要的一個概念,很多統計學家和經濟學家會建構相當複雜的模型來詮釋他們的資料,試著去預測以後很多事物的走向。舉例來說LTCM想要做的就是這種事情,兩個諾貝爾獎得主搞出了一套模型,可以保證長期下來,他們的投資絕對穩賺不賠,這群經濟學家以為自己掌握了世界每一秒的趨勢,世界的金錢已經操弄在他們的經濟模型之中,結果最後他們突然倒掉了。為什麼?原因很簡單:因為他們沒有料到蘇聯會忽然解體解體後對於國債的意外處理方式。就這麼一個他們沒有料到的因素(其實當時誰又料得到呢?),就讓他們的模型整個崩潰了。同樣地,搞出越複雜的模型,你就會發現常常這個模型對於解釋新的現象時是不管用的。 反應在我們的生活之中,炒股票的人和那些老師,整天都在跟你講明天股票是會漲還是會跌,他們在做的事情,就是在跟你講瀑布中的水滴下一秒鐘會流到什麼地方。你覺得他們猜得準嗎?你還會相信他們嗎?一群自稱是趨勢專家的人在電視上講得口沫橫飛,說出千萬個理由分析給你聽,要你去買什麼什麼股票。在我看來,他們只是用極有限的知識在跟隨機現象對抗。像預測趨勢這種連那些科學家和統計學家都還做不好的事情,你覺得這些老師做得好嗎?一家公司的股價圖對於人類現在有限的認知而言,完全就是隨機的,你不可能準確預測下一秒鐘準確的走向。股市甚至於連長期的趨勢都難以預測,還記得我們的水滴例子嗎?如果你連長期的趨勢都看不清楚,想要微觀地分析更是難上加難。即使這個世界上沒有真正隨機的事情,一切都是命中注定的,以人類現在有限的知識和電腦的運算能力來說,也還是無法完全掌握的。 同樣的,在股票市場上你會常常看到一些靠股市成為百萬或是千萬富翁的人出書大談自己的投資經,說明自己如何致富,講得真是天花亂墜。我現在舉一個簡單的運算給大家看:假設以你現在的資本,在股市連續賭一支股票十次漲跌,十次都成功,你就可以成為百萬富翁,這樣的機率是多少?既然你每次都是閉上眼睛瞎猜,所以每次的成功率都是一半,連續十次成功就大約是千分之一。看起來連續十次成功真的很難,不過換個角度想,如果台灣有兩百萬人同時做這樣的事情呢?你會發現平均來說,會有兩千人在這十次賭博之中成為百萬富翁,如果這兩千人之中有一些人跑來出書或是上節目大談自己的投資經驗呢?沒錯,他們就變成老師了。隨機現象讓這些人成為百萬富翁,然後這些人以及週遭的人開始用過度解釋和吹捧的方式來大談他們賺錢的成功,最後的結果就是:大家都被隨機現象給唬了。連這些老師自己都相信自己真有一套本領能在股市呼風喚雨。 曾經有一些學者找來一群猩猩做實驗,這些學者把華爾街日報的股票版釘在牆上,讓這些猩猩對那些股票名稱射飛鏢,當作是猩猩建議他們買的股票。結果矇著眼睛的猩猩,朝報紙股票版擲飛鏢所射中的股票,並不比投資專家們的選股遜色。看到這個實驗結果,你作何感想呢? 講了以上這麼多例子,並不是要告訴大家這個世界是隨機的,所以我們做出再多努力也是枉然。人類真正可貴的地方,就在於對這些不確定性所做出的努力,能夠讓人類的智識更推進一步,讓我們更加了解這個世界。談隨機現象只是要提醒大家,很多我們想盡辦法解釋的現象,其實往往都是隨機的結果,這是這個世界運作的機率,確確實實存在,支撐著量子力學,也支撐著我們的現實生活。我們應該做的,是去看整體的趨勢,而不是對於一個短期的現象,鑽牛角尖地想盡辦法去解剖它。解剖的結果就會讓你像量子物理學家一樣,困惑地發現井然有序的世界,竟然是由一些到處亂跑的粒子組成。長期的趨勢是可以透過努力研究在一定程度上達到預測的效果,短期趨勢是誰也說不準。 隨機現象本身是一個相當深奧的議題,談到最後往往都會淪為「上帝究竟丟不丟骰子?」的哲學議題, 人類也許永遠都無法了解這個世界是不是一切都命中注定,抑或是人總是可以隨時透過外在力量改變一些事物的隨機世界。無論是怎麼樣,努力之後得來的果實永遠都是甜美的。只是要記住,別被一些人解釋隨機現象的嘴砲所唬了,好像這些隨機現象真的像他們講的那樣完全可以預測。 別把隨機當必然。
Posted in Mr. Friday, 圖書, 專欄, 關於媒體, 關於網路產業 on Feb 24th, 2007
Posted by Mr. Friday 大家好,在這裡跟大家拜個晚年,不知道各位在春節時都做了哪些事情?有沒有去哪些地方玩呢? Mr. Friday春節時候逛誠品(天,他們可真夠敬業的,這個時候還繼續上班),逛到了一本書,內容很有趣,探討當下的流行文化對一般民眾的影響,書名叫做開機:START。 (圖:作者Steven Johnson,譯者蔡孟璇,早安財經文化出版) 探討流行文化的書不是已經有很多了嗎?探討電視、電影電玩對大家的影響,通常這些書要碼不痛不癢的單純敘述文化演進史,要碼就是找出其中關於性、暴力、同性戀、種族歧視之類的橋段,進行所謂後現代式再現的探討。不過這本書相當地特別,它提出了一個相當罕見的觀點:這些流行文化媒體,有益我們的智力發展,就像閱讀小說一樣。等等,你是說…打電動有助智力發展?是低你沒聽錯,本書宣稱,打電玩、看電視影集、看電影有助於我們大眾的智力發展。WOW,這下所有愛打電動的小孩們都急著要跟父母邀功,要求再多打幾小時了XD。
Posted in Mr. Saturday, 專欄, 關於網路產業 on Feb 24th, 2007
Posted by Mr. Saturday Digg是一家在矽谷新興的一個分享平台,由Kevin Rose於2004年12月創辦,主要讓網友在上面分享科技以及科技相關的文章,這種網站又被稱作social content website。Digg在矽谷是相當成功的網站,吸引了大量的使用者,最近台灣火紅的Hemidemi也是一個類似的Social content website,不過功能上尚不及Digg完整。 網路上有這麼一個有趣的報導 Digg Effect(Digg效應),這個效應講的就是,一些網站突然的流量爆增,是因為有人把該網站的內容分享到Digg上面去了,大家可以看看下面某個網站一段時間的流量圖,可以注意到流量的走向中有兩個突然出現的不自然的尖峰。這兩個高峰就是Digg Effect發生作用的時間點,也就是在那個時間,有人把該網站的內容或是文章分享到Digg上面去了,而且有不少的人透過Digg閱覽該內容,或是造訪該網站。於是就造成了突然之間流量的爆增。 這個情境在台灣的網路環境上實在是太熟悉不過了,PTT的表特(Beauty)板不就恰恰有著同樣的效應嗎?無名小站上面的正妹相簿靠著表特板的分享讓人氣一飛衝天,一天往往可達上萬人次觀賞。無名小站同時也因為這個版把PTT上面的部分流量導到自己這邊來。所謂的Digg效應,在台灣早就有相對應的PTT效應了!而且這個效應還造就了今日的無名小站。BBS和Web交織出來的這種奇特效應,除了PTT盛行的台灣之外,世界上難有第二個類似的案例。當然PTT與Digg最大的不同點是顯而易見的,在PTT上面的分享方式不過就是post個連結到板上讓大家去連。在Hemidemi和Digg上面就有著比較Fancy的介面和對於一篇文章或是一個書簽的評價機制。 PTT現在對於文章的評價機制就如同先前提到的,還是用簡單的推文來達成。由於先天上是一個電子佈告欄系統,PTT一篇文章相關的評價和後續討論並不會匯集在同一個點或是頁面上,讓使用者可以像在網路上那樣,對於同樣一篇文章的相關訊息可以在同一個頁面一次瀏覽,也可以看到有誰訂閱了哪篇文章或是分享了哪個書籤,或是留下較為完整的評論,更進一步地,可以看到與該文章或是書籤相關的連結,讓使用者作延伸閱讀。PTT的文章還是長江後浪推前浪,前浪死在沙灘上,反正新的文章多了,你的文章就被淹沒了。所以洗板很容易,只要版主一下子沒發現,鬧板的人可以在上面興風作浪。 於是就有版主和鄉民很生氣地在很多地方噓那些不爬文的人,譴責某些人同樣的問題一問再問,Mr. Saturday到是認為這些人實在沒有甚麼好罵的,問問題的人很多是沒有時間仔細爬文的人,爬了文爬不仔細也是無可厚非,在同一個板上搜尋文章,有時搜尋字用得不對,想找的文章就找不到了,PTT在資訊擷取上的搜尋功能連最原始的Boolean model都不是,搜尋時也不過就是看看哪些標題有搜尋字在裡面罷了。問問題的人有時候要的只是即時的答案,PTT之所以成功,不就是在於資訊分享的快速? 一個圖書館的藏書越來越多的時候,就有必要引進圖書管理和書籍搜尋的功能來方便使用者找到他想要的書,在網路上也是一樣,網路上的資訊太多了,搜尋引擎就出現了。如此使用者才不用在毫無組織的資訊中進行毫無組織的翻找。Mr. Saturday認為PTT的資訊和文章已經多到有必要出現一個完整的搜尋功能了。不過對於BBS這種介面而言,顯然難度是太高了點。 前面提到的流量暴增現象,雖然看來像是對於blogger或是網站經營者的一種鼓勵,其實這種爆增的流量就像是突然來的海浪一樣,來得快去得也快,可以突然吸引一堆人到你的網站上來看特定的內容,但是卻不會真正吸引到相當多的忠實顧客或是blog reader。 那些突然造訪的人也只對於你網站上特定的內容有興趣,就像是去看正妹圖一樣,除了圖片,恐怕不會有很多人再去看看那些正妹寫的文章,進而成為忠實讀者。在對於流量的詮釋上,網站經營者一定要考慮到這樣的特殊效應。
Posted in Google, Microsoft, Mr. Saturday, 專欄, 關於網路產業 on Feb 23rd, 2007
Posted by Mr. Saturday Google在美國時間今天的凌晨正式推出了Google Apps,不過這個package裡面所包含的東西其實是大家早已經在用的東西,一個部分是Gmail加上Google Talk,另一部分則是推出沒有很久的Docs and Spreadsheets。Google這次做的事情主要就是把這兩部分的服務整合在一起,提供給企業使用。而這些都是免費的!當然如果企業使用者需要額外的儲存空間,那就要每人每年另外收費50塊美金。 有關於Google這次發布Google Apps,大家都把這件事情視為是跟微軟正面交鋒的一件大事情。微軟最賺錢的兩個東西:一是Windows,二是Office,現在Google把Docs and Spreadsheets又推了一次,這一次還跟其他服務整合在一起,對微軟的Office採取正面攻擊的意味濃厚,微軟一年靠Office授權費的營收高達110億美金,這一塊超大的市場,現在Google要用不同的方式來搶食。 企業現在最常用的Office和Exchange,根據紐約時報的報導,一年平均要花上每個企業內員工225美金,這還不包括額外的系統管理成本 。現在Google Apps頂多每個人每年收個50塊美金,而且Google還幫你管理這些系統,保證99%的時間都不會中斷服務。看到Google這個99%的說法我心中會心一笑,即使是Google也不能保證自己的系統百分之百不會出問題,畢竟世事難料,寫了百分之百不會出問題,恐怕只是在系統真的出問題時招致更多謾罵。 當然啦,最與微軟不同的地方就是Google把這些應用程式通通放到網路上了,個人認為,這種作法長期來講會對微軟造成相當大的傷害,雖然現在還有一些問題需要克服,像是有人質疑Google現在幫我們代管這些資料和系統,那麼我們的企業資料有沒有外洩的可能?Google內部會不會自己偷偷把這些資料拿去自己應用?當然Google的答案是絕對不會。Gmail之前就已經飽受同樣的批評,因為大家發現自己的Gmail介面上方總是會根據自己的喜好出現不同的廣告,讓有些人覺得自己的Email是否被監看且拿去分析了? 不過根據Mr. Saturday自己的經驗,Google是一個對於保密相當計較的企業,裡面的員工按照職別來分,對於系統都有不同的存取權限。Google核心的PageRank演算法的程式碼,即使在Google總部,看過動過的人也沒多少。也許這可以讓一些企業感到安心吧,不過有關資訊安全的議題是沒有一天會停歇的,大家總是覺得自己的資料每天都在外洩。Google對於Gmail裡面的郵件,做的事情也不過就是用軟體去自動掃描你的郵件內容,分析你個人的喜好,然後從Google自己的廣告Pool自動推銷相關的廣告給你。過程中沒有人為的監看和分析。 Google照這樣發展下去,提供越來越多的免費應用程式服務到網路上,接下來威脅到的就是微軟的Windows,因為一但作業系統裡面重要的功能都上了網,使用者勢必會減少在本機作業系統上的花費,大家猜測Google會做出自己的網路作業系統(Web Operating System),謠言已經傳了很久,也許Google以Google Apps這樣的方式延續下去,不斷推出服務,不斷bundle在一起,整個服務一步一步越做越大,到了最後不就自然而然地變成一個網路作業系統了嗎?對於此種蠺食鯨吞的方式,微軟實在不得不慎。 Bill Gates最大的失誤,就是沒有及早預料到網路的崛起,導至於跨入網路市場的腳步過慢,讓Google和Yahoo!在網路市場上坐大, 現在Live Search的使用者比起Google和Yahoo!少得可憐,在中國大陸幾乎已經沒有Live Search的市場,而Google又要透過網路服務殺進微軟賴以為生的Windows和Office市場,微軟在網路上的表現,只能說是節節敗退。不只在網路上已經難以和Google抗衡,恐怕連自己的「傳統產業」都要給一併吞了。接下來的發展,就讓我們拭目以待吧。