Posted By Mr. Thursday
Amazon等書籍網站,會把使用者購買書本的資料,或是使用者的意見,經由機器分析之後,歸納出一些規則,推薦其他使用者新的書本。然而除了使用者直接提供意見的方法,用機器直接分析書本的內容,尤其是書本的寫作風格,把相同風格的書籍找出來推薦給使用者,也是另外一種內容分析的推薦方法。BookLamp就是使用這種推薦方式的系統。
影片1 BookLamp簡介
BookLamp作者認為,一位讀者喜歡一本書,會因為書本裡面的主角、劇情、和寫作風格三個要素而定。主角和劇情每一本書可能都不大一樣,然而寫作風格和劇情讀起來的張力和感覺,卻是不同書本之間可以共同有的特點,也成為以書找書的推薦基礎。
因此BookLamp把一本書籍的風格分成五大要素:疏密度、節奏感、動作感、對話度、以及描述度。英文分別是Density Level, Pacing Level, Action Level, Dialog Level, and Description Level。對每一種書籍,都先用機器為每一個評分項目來打分數,影片中以節奏感為例,使用一些自然語言處理的演算法,抓取書本中句子的模式 (pattern),如果動詞多、句子短促,節奏感的分數就會變高,反之如果字句很長,又很多逗點,就是節奏感比較低的分數。一本書先分成很多個情節 (scene),在為每一段情節打上這五個分數 (剛才提到的DPADD五個項目分數)。接著每一本書的任何一個要素,都可以根據以情節當成不同時間點,呈現一個曲線的變化,譬如說一本書的節奏感,一開始可能是0.5,到了第10幕以後,節奏感開始增強,曲線往上,一直到故事快結束的時候才恢復0.5。
每一本書經由這樣子的模式分析,就會有5條曲線,分別代表這5個組成要素在這本書裡面的程度變化模式,形成這本書的指紋。藉著這個指紋,就可以以書找書,推薦新的書籍給使用者。影片中就示範了怎樣子先用句子第一人稱或第三人稱出現的次數打分數,逐步挑出模式類似的書籍,最後再以使用者給的喜好評分平均來排序挑選的結果。
除此之外,這5項評分方式依照篩選的先後順序不同,篩選出來的書籍也會有所差異。如何讓這5種評分方式有最好的順序呢?除了讓使用者自行決定順序之外,平常使用者在替書籍評分的時候,也可以讓機器一邊學習使用者最注重那一項評分標準,讓機器自動學會使用者對評分標準的權重,而這種每位使用者都會有所差異的個人化評分先後順序,在將來或許可以有社交上的撮合作用。
最後,將來BookLamp可能會在加強的兩項功能,也就是另外兩個評分標準,分別是模式轉變 (Pattern Shifting) 和興趣程度 (Interest Levels),就是針對寫作模式在一本書籍內轉變的偵測,以及對某些關鍵字有個人化的加權平均等功能。如果讀者們對這個推薦系統有興趣,不妨就先去註冊來試用看看吧!
圖1 BookLamp
相關連結
- BookLamp
- (Slashdot) Boiling Down Books, Algorithmically
過去的今天:
- 《海角七號》:那天晚上的海很藍,星光燦爛 - 2008
- 奇異動物 - 2007
- 創意廣告II - 2007
- 讓你網站比關鍵字廣告還顯眼 - SEM/SEO行銷 - 2007
相關推薦
![]() |
![]() |








個人很不看好這樣的model, 我常閱讀小說, machine learning 的模式對於”深層含義”的幫助不是很大, 搞NLP抓語句模式然後搭配一大堆方法還不如我看到某位我習慣追的評論人寫一篇文章:p
這東西搞半天可能比在aNobli上直接追蹤某些人還不準
–
不過就科學研究來說或許不錯啦
或是機器推薦先評分
之後再加上書評作者的推薦
兩者都使用…只是書評作者還來不及評論之前
機器可以先代勞囉?
或是習慣只看比對分數的使用者 來不及把書評一篇一篇看完的使用
這個系統也許會有用就是了?
类似Pandora的思路,都是从音乐或书的本身来寻找相似之处。
但根据作者自己的描述,感觉Booklamp似乎更适合用来分析小说,而且因为读一本书的时间耗费较长,所以决定读什么书需要考虑的因素挺复杂的,很难象听一首歌一样随意。
嗯…適合以書找書的場合應該就可以用這個系統了!
可以當成使用者推薦和評論家推薦以外
另外一個推薦分數的來源