網路高相似度文件搜尋系統 – Parrot

Posted By Mr. Wednesday

由於前一陣子MMDAYS發生了文章被抄襲的事件,因此Mr. Wednesday開發了一個工具來幫助了解這類情況,取名為《Parrot》,用於尋找網路上高相似度的文件。


按此進入Parrot服務首頁

經過初步的實驗,效果還不錯。今天特別邀請各位讀者多加利用,希望在各位讀者碰到類似被抄襲的情況時,能提供一點幫助。使用方法很簡單,進到首頁的畫面後會看到兩個輸入欄位,第一個欄位為文章所在網頁超連結,請輸入文章所在的網頁超連結。第二個欄位是文章內容(必填),請輸入要比對相似度的文章內容,可只輸入文章某的單一段落,也可輸入整篇文章。接著按下submit按鈕即可,運算過程約需30秒鐘左右,請耐心等候。接下來系統會依據相似度由高到低列出相似的網頁連結與其對應的重複字元數重複字元比例(0到1之間),重複字元比例為一個0以上的正數,越高代表內容越相似,根據實驗,重複字元比例在0.5以上的網頁為高度相似

Parrot目前仍在實驗中,不保證結果完全正確。如有任何問題,請與我們聯繫,謝謝。

ps. 目前Parrot的服務是跑在port 8180上,如果有伺服器長時間沒有回應的情況,請確認一下是否被您的防火牆給檔掉了。

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!