BookLamp: 分析寫作風格的書籍推薦系統

Posted By Mr. Thursday

Amazon等書籍網站,會把使用者購買書本的資料,或是使用者的意見,經由機器分析之後,歸納出一些規則,推薦其他使用者新的書本。然而除了使用者直接提供意見的方法,用機器直接分析書本的內容,尤其是書本的寫作風格,把相同風格的書籍找出來推薦給使用者,也是另外一種內容分析的推薦方法BookLamp就是使用這種推薦方式的系統。

影片1 BookLamp簡介

BookLamp作者認為,一位讀者喜歡一本書,會因為書本裡面的主角劇情、和寫作風格三個要素而定。主角和劇情每一本書可能都不大一樣,然而寫作風格和劇情讀起來的張力和感覺,卻是不同書本之間可以共同有的特點,也成為以書找書的推薦基礎。

因此BookLamp把一本書籍的風格分成五大要素:疏密度節奏感動作感對話度、以及描述度。英文分別是Density Level, Pacing Level, Action Level, Dialog Level, and Description Level。對每一種書籍,都先用機器為每一個評分項目來打分數,影片中以節奏感為例,使用一些自然語言處理的演算法,抓取書本中句子的模式 (pattern),如果動詞多、句子短促,節奏感的分數就會變高,反之如果字句很長,又很多逗點,就是節奏感比較低的分數。一本書先分成很多個情節 (scene),在為每一段情節打上這五個分數 (剛才提到的DPADD五個項目分數)。接著每一本書的任何一個要素,都可以根據以情節當成不同時間點,呈現一個曲線的變化,譬如說一本書的節奏感,一開始可能是0.5,到了第10幕以後,節奏感開始增強,曲線往上,一直到故事快結束的時候才恢復0.5。

每一本書經由這樣子的模式分析,就會有5條曲線,分別代表這5個組成要素在這本書裡面的程度變化模式,形成這本書的指紋。藉著這個指紋,就可以以書找書推薦新的書籍給使用者。影片中就示範了怎樣子先用句子第一人稱或第三人稱出現的次數打分數,逐步挑出模式類似的書籍,最後再以使用者給的喜好評分平均來排序挑選的結果。

除此之外,這5項評分方式依照篩選的先後順序不同,篩選出來的書籍也會有所差異。如何讓這5種評分方式有最好的順序呢?除了讓使用者自行決定順序之外,平常使用者在替書籍評分的時候,也可以讓機器一邊學習使用者最注重那一項評分標準,讓機器自動學會使用者對評分標準的權重,而這種每位使用者都會有所差異的個人化評分先後順序,在將來或許可以有社交上的撮合作用

最後,將來BookLamp可能會在加強的兩項功能,也就是另外兩個評分標準,分別是模式轉變 (Pattern Shifting) 和興趣程度 (Interest Levels),就是針對寫作模式在一本書籍內轉變的偵測,以及對某些關鍵字有個人化的加權平均等功能。如果讀者們對這個推薦系統有興趣,不妨就先去註冊來試用看看吧!

 

圖1 BookLamp

相關連結

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!