關於噗熱浪事件的澄清

關於上一篇的狀況,事件發展比想像中快速。我們收到了來自癮科技的澄清信。

以下是癮科技信的全文:

Dear MMDays,
看到貴站指控噗熱浪新文章涉嫌竊取貴站(plurktop)資料
這自然是需要出來說明一下的,不勞貴站聲聲呼喚我們面對
首先還是得先澄清一下,關於貴站的判斷有其邏輯性,但這個事件是個誤會
噗熱浪網站並沒有直接將plurktop站上的資料抓取進來之後,再以相同形式展示於網站上關於噗熱浪,它是這麼運作的:
1.我們先整理出噗浪上轉貼數量較多的網址

2.對這些網址進行計數、加以排序

3.同時為了在頁面上呈現這些網址的簡要內容,對這些網址進行內容摘要

4.由部落格觀察對摘要的內容作分析,整理出每個網址的相關關鍵字

5.在噗熱浪站上顯示時,會顯示這個網址的頁面標題、簡要內容、最先貼出的噗友、最近貼的噗友,及其噗文內容

6.每個網址有其更詳細的頁面,包括所有貼過這個網址的噗友發文,由Plurk API取得

以上是噗熱浪運作的程序,其實引起貴站誤會的即是第3、4、5個步驟
由於貴站資訊傳播速度快,有不少噗友會轉貼plurktop站上的連結,
因此在我們的統計中,plurktop經常榜上有名,是噗友喜愛轉貼的站點
於是乎,當我們的程式進行內容摘要時,便留下造訪的ip記錄
由於熱門連結數量多,造成摘要程式訪問plurktop之次數也增多,此為誤會之一
其次,關於貴站手機版頁面每個連結列出兩位噗友的貼文
我們處理的方式是列出最早噗及最近噗的兩筆,不知是否也與貴站為相同的資料處理方式
若同為如此,則實屬巧合。

第三點補充說明,door.urs.tw之造訪記錄,即是在進行資料分析時所留下
最後我們必須再聲明一次,噗熱浪並未如貴站所稱
一天存取plurktop數百次,很明顯後台是接plurktop的水管做的。
我們並沒有竊取貴站的噗浪熱門連結資料作為我們站上的熱門資料
我們所使用的統計資料,都是自行統計及分析
這可以從我們自己開發的程式及資料庫記錄證明
我們能了解貴站保護開發成果的殷切
但竊取資料這件事並不實際存在
也希望貴站能仔細思考 這個指控的嚴重性以及它是否成立
若貴站不願意因為被轉貼多次、成為熱門連結而被噗熱浪進行網頁摘要
我們也會依照貴站要求,避開貴站網址,或是由貴站直接封鎖噗熱浪ip
這或許能直接證明 噗熱浪並沒有竊取貴站資料
再請貴站回覆意見,謝謝

在我看來,癮科技這篇回文的確在技術上也有其合理的地方。看起來,癮科技這個網站的運作原理跟plurktop幾乎一模一樣,那麼由於(3)的緣故來撈plurktop是可以相信的。

如果真是這樣,接水管的指控我道歉。不過,問題是我無法證明。我無法真的證明癮科技撈完plurktop的統計資料頁面之後,真的沒有去parse裡面的統計資料,還是只是抓標題。

說實在,網路上出現一個功能、介面十分近似,而且會定期過來撈你頁面的網站,要不懷疑對方接水管還真有點難。但我盡量在文章中只是提出我認為合理的懷疑,要求對方給個說明。既然澄清信來了,我們也就我們的懷疑做出說明。
不過癮科技後來又寄了一封措詞比較強硬的信,一字未改,內容如下:

敬啟者您好,

由於貴站所作出之不實指控訊息散播
已經造成對敝公司莫大的商譽損失
我們已經將不實言論相關證據全數留存,包含更改前的文章內容

希望貴站能儘速處理,提出公開澄清並致歉
否則我們必須作出自保動作
若貴站遲不處理,我們將寄出存證信函採取法律行動

請再次明察相關不實言論,並另行發表澄清聲明
若有任何意見,煩請回覆

Thanks,
Lawrence

事情就是這樣,Plurktop有被他們來爬過是事實,我們才會有我們的懷疑,癮科技的澄清我們覺得也有一些合理性。若是癮科技還是要寄存證信函什麼的,我們也不能控制,就交由網友公評吧。

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!