追求消費者口碑的真實性、及時性、客觀性一直是研發部門的重要任務,這是我們成立社群所創造的重要價值之一。一開始,我們曾經研究過一般議題式討論(BBS)所帶來的口碑價值,研究過程中發現議題式討論有許多「先天不完整」以及難以利用的部分,為了改良這些不適用的部分我們開發了「人對商品」的七階段量化評價機制與口語評價來輔助,此機制到現在都還能成功的提供消費者在購物決策上的口碑資訊與廠商衡量市場趨勢的參考基準。不過,隨著資料庫日益龐大,與持續不斷分析、檢證,我們也發現了一些可能潛在的問題,雖然這些問題表面上造成的影響有限,但我們還是想克服它以追求更高的口碑資訊準確度。
只要有評分,就會有標準不一的問題
相信大家小時候都有上過作文課,也都有交過作文,其中最讓我印象深刻的是有的老師給分很嚴格,有的老師給分很輕鬆。我曾經把同一篇文章給補習班老師跟學校老師批改過(對,我作弊偷懶),結果補習班老師給我60分,學校老師給了我80分。難道這篇文章在補習班老師眼中是不好的文章,而在學校老師眼中卻是好的嗎?其實不是,在該次的評分中,補習班全班最高分的同學是65分,最低分是20分,而在學校班上最高分是90分,最低分是60分,我的分數在這兩個班上都算是不錯的,但表面上看起來卻有很大的差異。
消費者對商品的評價也跟老師對作文的評分會遇到同樣的問題。當然大多數的消費者心裡會有一個不約而同的準則,例如在我們社群中消費者盛傳著「指數五分(滿分是七分)就可以買了」的規則,但是還是會有很多新進的消費者會以這個標準以外的方式評分,有一些消費者從他們所留下口語式的口碑可以看出他們很推薦這個商品,但卻只給了中庸的3分或4分,雖然不會影響主流的商品,但這對一些較冷門的商品形成了一種不必要的口碑殺傷力。
評分跟評分之間是否真可以拿來比較
當然,消費者留下評鑑口碑最大的目的就是形成比較的準則,大家都希望為一個商品標上一個分數之後可以跟其他商品做比較,甚至是排行。這個想法也是我們的初衷,但是我們越來越發現一樣商品的好用與否,似乎很難用一個分數來代替,應該有各個角度的評分來幫助消費者做出準確的判斷,這樣的方式也對一些具有獨特功能的商品較公平。
改進的策略
發現這些問題之後,我們首先將原本的七階段評分加上對應的口語式評價敘述,讓消費者在選擇分數時有一個可以參考的情境,這讓這些評分更符合實際一點,但是這不會是最佳解。之後,我們可能會再設計更深層的評價機制,務求以多元的標準來評價商品。當然,這些策略都會面臨到消費者使用便利性的問題,一昧的加重消費者評價商品的負擔,絕對不會是一個好的方法,而這方面我們打算朝「自然語言邏輯」加上越來越流行的「人工智能」來判斷來發展出新的口碑評價工具,並試著在消費者自然的口語當中萃取出量化的準則,脫離老式的給分機制。這個想法還在嘗試當中,是否可行也未可知,在這個階段中,若諸位讀者對此有興趣者可以跟我聯繫,而之後有進一步的實驗結果,我也會撰文跟大家報告。
Post By Buzz Lab
過去的今天:
- UMapper:用地圖玩遊戲 - 2009
- 好讀推薦︰Devil take the hindmost : a history of financial speculation - 2008
- 好讀推薦: 時間簡史 - 2008
- 自然觀測2.0 - 2007
- 嵌入3D物件式廣告 - 2007
隨機推薦
![]() |
![]() |
分享 |
推到 Plurk!
|











半夜中看到這個有趣的問題。 就我所學的,會將解決這問題的機制放在抽樣上。 簡單來說,樣本選取好的話,兩個同類標的物之間的比較,可以說是能夠信賴的,這是看平均數的部份。 接下來,可以看極端值的分佈,應該也能發現一些有趣的訊息。
引言>>發現這些問題之後,我們首先將原本的七階段評分加上對應的口語式評價敘述,讓消費者在選擇分數時有一個可以參考的情境,這讓這些評分更符合實際一點,但是這不會是最佳解。
這段話應該講的是效度。
>>之後,我們可能會再設計更深層的評價機制,務求以多元的標準來評價商品
一個產品只看單一面向,本來就會有偏差,不過在這個資訊爆炸的時代,只看排行是方便的作法,也最能夠吸引目光。要抽取哪些元素來讓人評價,是個有趣的問題,也跟前面提到的效度有關系。
看到這篇文,回想起以前所學的,才發現已經忘的差不多了。 XD
之前拜讀過部落格,沒想到在這裡注意到你的文
人類語意評價量化一直以來都存在幾個不同面向的問題
評分基準、尺度不同,彼此對語意認知的不一致之類…
最近受到指點,正在追有關這方面的論文
目前看到比較可行的是procrustes analysis,一個利用數學矩陣變換的方式處理上述問題的手段
原先應該(其實沒有很肯定)是用來作圖形比對相關的分析
已經能找到將其概念代入統計領域的相關文獻,但是資源不多,是否可以運用在其他領域還很難說
相關資料建議可以從食品工業相關的期刊論文著手,這個領域對消費者資料的處理方式相當多元
有好的抽樣,不同的評分就可以亙相比較,但這個「好的抽樣」是很難做到的。首先我們要有大量的評價,平均數或極端值分佈才有意義。在鼎鼎大名的Amazon.com ,很多商品都只有寥寥數個評價,這樣我們很難依靠平均值去彌補評分標準的偏差。另一個問題是如果一開首的人們評價不好,也許會影響了後來的人對某商品的觀感,這樣我們便更難得到「好的抽樣」了。(一百個凡事都只懂和議的「意見」,是及不上十個獨立思考的意見的)
在消費者的自然口語中萃取資料,一些經濟學家也有在用差不多的方法,他們以一些報紙的用詞來計算這份報紙的政治取向是較民主黨還是共和黨(是美國的研究啦)。在那位教授的一個seminar 中,他說「這種方法暫時未被廣泛採用,但一旦很多人都用這種方式,可以預見報紙會盡量避開這些影響評分的用詞來顯示自己是中立的」 我覺得是蠻合理的,而且同樣的問題也可能會出現在商品評價上。
謝謝大家給我的寶貴意見,我會好好想想以上大家所提的現象及觀念。