douban與google book search

Posted by Mr. Tuesday

douban與book search如果結合的好的話,說不定可以讓人類文明有重大突破喔。

集眾人之力來讀書

douban是一個分享閱讀經驗的網站,網友在站內分享閱讀心得,每個人寫下自己看過的書籍,整個社群就可以共享全部人的閱讀經驗。雖然douban還包括諸如電影、音樂等其他內容的經驗分享,但網友的書籍閱讀分享仍然是最特殊的一個資料。因為書籍的消化與再分析,產生的心得與想法本身就是知識的再造,這些演繹出來的心得的價值,比電影、音樂更高,不但提供他人參考,也能提供他人再消化吸收,使的原來書內的知識可以不斷被討論、過濾、純化,使書裡的知識可不斷精練。越多的心得使書籍的效用延伸。就像古書名典都有注釋一樣,douban的讀者社群就是現代書籍的注釋與考究。

書與知識、文明的關係

因為書籍除了娛樂功能外,還有知識傳播的作用,每本書的內容都是多個知識的組織與呈現,是由文字堆砌起來的,是最原始的資料,是由人類溝通與文明累積的基本元件 – 文字所組成。因此,被評鑑為再爛的書,都有存在的必要,因為文字是最原始的思想呈現。電影、音樂是已經被精緻化的藝術,作品完成時就已經生命終結,大部分的發展空間已不存在,只剩最好的作品有存在的意義。也因此,書籍可以不斷累積,從有文字以來,所有文字都對現代有用。

書怎麼被利用

書的儲存本來是耗費成本的,但電子化使的書的儲存成本幾乎為零,不過想充分利用大量的書又需要耗費大量人力閱讀與分析,使的人望”書”興嘆。終於,透過搜尋技術,我們可以有蹊徑探索所有的書籍,人類因此有機會去駕馭累積千年的文明。電子化書籍在多年多家公司的嘗試下未能成功,如今google挾充沛資金與搜尋技術,想再次嘗試這個夢想,推動book search產業。姑且不論這個計畫對出版業的商業利益與產業衝擊,至少從人類文明發展的角度看,此類計畫讓現代人有機會在有生之年用一己之力,利用完全部的書籍,對知識發展的效益,非常令人期待。

技術的障礙阻礙發展

儘管google已經靠搜尋賺錢,搜尋仍是一個初發展的技術,我們仍然有很多辦不到的事情。google的演算法再強,也很難自動將眾多的書籍組織成知識,讓完全不懂的人能利用。以現有的模式 – 使用者下關鍵字電腦把有關的資料找出來,想讓所有人都能利用所有的書籍,可說是不可能,光是查詢的關鍵字就下不出來,怎麼開始整個人類的智慧寶庫?怎麼用共產主義找到馬克思的資本論呢?怎麼用儒家思想找到論語呢?

douban的商業利益

如果每一本書,都有人歸納與分析過,做過討論,分享心得,那我們時時可以得到每本書在被討論時的觀點、解釋甚至是摘要。有這些相關的”補充文件”,搜尋技術可以獲得突破,不會侷限在關鍵字的範疇,也能跟的上時代的詮釋與反應。把群眾的心得拿來供電子商務消費的幫助,是舊的應用了,已可以見於amazon的書評機制裡了。但把這些心得餵給電腦分析,將對book search增進更多的準確性與實用性。douban應該開始著手利用網友的群力產物,提供搜尋優化的服務,找一些懂自然語言工程的人,好好利用網友提供的資料。或是更加把勁,找出刺激網友貢獻新得的方法,擴大書籍種類,不要陷於暢銷書,把資料類型衝大,等著百度或Yahoo!等願意使用”人工”智慧的公司收購。懂資訊檢索與自然語言的專家們,也可以試著著手分析douban上的資料,自行結合book search結果,做出增進搜尋結果的演算法,也可以成為google的併購目標。

結論

這或許是社群產生的資料比社群本身重要的另一個有趣的例子吧!

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!
  • Pingback: Mr./Ms. Days成立一月 « Mr./Ms. Days()

  • CD Wu

    自動將眾多書籍組織成知識==>I think one candidate is MACHINE LEARNING!

  • CD Wu

    自動將眾多書籍組織成知識==>I think one candidate is MACHINE LEARNING!