Category Archive for 'Research'

Posted by Mr. Friday 首先要感謝一下各位讀者…前兩篇刊出後, 瀏覽人數直線上升, 兩天下來瀏覽人次直接衝過3000人…小弟還是第一次看到這麼多閱讀量, 著實高興了一下, 希望之後大家還會對我的其他文章捧場一下囉(偷打廣告XD), 在此先謝過大家囉. 不過有些讀者看完第二篇之後覺得太深奧了, 還有人說好像在看排隊理論的論文, 不太想看下去, 這這…好吧, 這第三篇我直接下猛藥. 本篇的重點在於 1. 數據顯示, (瞬間平均)下載速度最快是出現在BT檔發佈後的第50小時!!! 2. 數據顯示, 在BT中, 上傳的量越多, 下載速度反而比較慢!!! 3. 數據顯示, 同時開多個BT下載, 下載速度不會變慢!!! 有沒有比較想往下看了呢? XD

Read Full Post »

Posted By Mr. Wednesday 相信大家一定知道,digg是網路上非常有名的一個新聞網站,許許多多有趣的新聞都可以在這裡看到,藉由大眾的投票機制可以篩選出許多大家感興趣的新聞。單純的從digg的排行榜列表來看,可以看到在digg網站上某個瞬間大家感興趣新聞的排名,但是如果想要連續觀察一段特定的時間內所有的新聞動態呢?

Read Full Post »

Posted by Mr. Friday 前一篇文章介紹了BT的基本運作原理,這一篇文章就來看看學術界對這個機制的探討吧。 關於BT機制本身的實驗文章其實不少。2004年一群法國人發表了一篇Dissecting BitTorrent:Five Months in a Torrent’s Life。內容是他們把Red Hat 9的原始檔(約1.77G)放在網路上供人下載,透過Tracker的紀錄機制,觀察BT的下載特性。相較於這群法國人觀察的是單一BT檔的下載過程,紐西蘭Delft大學的研究生則觀察了國外比較有名的BT分享論壇(Supernova.org、Youceff.com等)幾個月來的人潮(大約有六萬人)。從這些鄉野實驗,可以得到幾個基本的結論: (1) BT檔案往往會有flash crowd情形:分享開始的前幾天會湧入大量人潮,然而高潮退去後人也散得快。 (2) 下載的速度呈現「多數人下載慢,極少數人下載速度超快」的情形;不過即使「多數人下載慢」,下載的平均速度仍然比ftp快上不少。根據實驗,平均下載速度是240K,90%的人速度不會超過520K。有極少數的人下載速度會達到每秒3000K以上。 (3) 檔案的存活天數難以從檔案分享十天後的狀況來預測:紐西蘭學生嘗試著去預測檔案存活天數,不過失敗了。後面我們會看到另外一篇paper是如何成功預測的。 就這樣而已嗎?這兩篇實驗雖然做了一段蠻長的時間,可是得出的結論好像跟沒做差不多;我們這些下載者不用做實驗也知道。不過學術界就是這樣:會有人先去做最基本的實驗,弄出一大堆看似無用的數據,接著就會出現根據這些數據做出的漂亮推論。2004年,著名期刊SIGCOMM石破天驚地刊出了一篇論文:「Modeling and Performance Analysis of BitTorrent-Like Peer-to-Peer Networks」,作者是UIUC的Dongyu Qiu與R. Sirkant。該篇文章用廣泛而嚴謹的數學模型推導BitTorrent在穩定態效能、檔案分享效度、Free Rider(不提供上傳頻寬但享受下載速度的懶蟲)等問題,做了一番精闢的解析,讓所有網路學教授驚覺BT中的價值:不只是因為根據BT的數學隨機模型極有研究價值(經數學驗證,BT擁有「無人數上限」、「下載速度不受人潮影響」的特性),更讓他們驚奇的是,這些教授竟然都沒發現身邊有這麼傑出的軟體,而且還是一個無名小卒寫的XD。從該篇文章之後,有更多的學術資源投入與BT相關的研究,BT技術的影響也深入到其他應用,例如隨選視訊(VOD)、CDN等等。

Read Full Post »

Posted by Mr. Friday 談到 BT,相信大家都不陌生。沒錯,今天要來談的就是這幾年在網路上非常重要,已經快要變成全民運動的──BT 程式。筆者有鑒於 BT 已經變成非常火紅的應用程式,但是了解這個程式的基本運作原理與影響的人卻寥寥無幾,於是決定撰寫這個主題;本篇會先介紹BT的源起與運作原理,接下來的幾篇則會根據這一兩年學術上對BT的觀察,介紹BT在各種使用情境下對網路行為的影響(當中包含一些相當出人意表的發現)。 BitTorrent,簡稱BT,由Bram Cohen於2002年獨立完成其核心程式碼的撰寫。從Bram Cohen簡陋而陽春的個人網頁上看來,他於1993年進入紐約州立大學就讀,輟學之後陸續做過研究員、網路程式設計師,就履歷上看來並不是非常特出,2002年間他發表的BT一開始也沒有獲得很大的關注。隔年五月他把BT的理論基礎寫成一篇簡短五頁的學術文章發表在「Workshop on Economics of Peer-to-Peer Systems, 2003」上,文章本身沒有知名教授的背書、用字遣辭顯然也不夠精練,然而這篇文章至今卻已累積了474篇的reference數。2004年六月時,據CNN報導,BT已經佔據了網路上所有P2P流量的53%。至今,BT程式檔的下載量已經超過一億三千五百萬人次,而這些數字還不包含網路上經其他使用者修改過的版本,如BitComet、BitSpirit…等等。

Read Full Post »

Posted By Mr. Wednesday 綜觀各新聞網站,呈現新聞最簡單的方式就是將一則則新聞標題依序排列好,供讀者瀏覽。Mr. Wednesday向各位各介紹一個有趣的網站,10×10,它是以10×10總共100張的圖片呈現特定時間所發生的新聞事件,根據網站上的說明,圖片來源包括Reuters World News,BBC World Edition與New York Times Internation News。所謂一張圖片勝過千言萬語在這裡有了一個有趣的應用。 圖片來源: 10×10 / 100 Words and Pictures that Define the Time

Read Full Post »

Posted by Mr. Friday 今天我們要談的主題是網路的信任機制。信任,英文稱之為Trust。三國演義有云:「人無信不立。」自古以來,信任即為……。(扯遠XD) 拉回正題,今天並不是要寫作文,今天的主題是「如何在網路上相信他人?」―或者說,該不該相信誰?的問題。談到網路交易,大家往往第一個念頭都是:「網路交易可以相信嗎?」有很多從事網路業的人,以為大家害怕的是網路駭客竊聽這類的問題,於是紛紛投入技術面的防範。這當然是個重要的課題,然而事實上,網路交易的安全性並不只在於防範「網路訊號會不會被竊聽」、「帳號會不會被盜」之類比較偏技術性的危險,還有一個比較容易被人忽略、但其實更為重要的的問題是:「我怎麼知道網路那頭的人會不會騙我?」 「我怎麼知道網路那頭的人會不會騙我」有多重要?看看新聞就知道了。打開電視與報紙統計一下,其實網路信用卡密碼被盜的駭客新聞出現的比例遠比「少女被網友詐騙失蹤」、「女恐龍網路詐騙,捲款宅男幾百萬」來得少多了。技術性帳號的盜取也許比較容易防範,但是人與人之間的信任似乎來得更重要,卻也更難以防範。數學上有一個很有名的問題,叫做「拜占庭將軍問題」,就是在討論人與人之間的信任危機。拜占庭位在今日土耳其的伊斯坦堡,是東羅馬帝國的首都,所以東羅馬帝國也稱為拜占庭帝國。既然稱為帝國,當然幅員遼闊不在話下,因此每個將軍的軍隊都分隔的很遠,彼此只能靠信差傳消息。在戰爭的時候,將軍們必須要達成一致的共識:進攻或是撤退。然而很不幸的,在這些將軍之中有叛徒(人數不明),他們的目的是擾亂整體軍隊的秩序。這個時候就衍生出一個問題:在已知有將軍謀反的情況下,其餘忠誠的將軍該如何達成一致的協議,不受叛徒的影響?這就是拜占庭問題。

Read Full Post »

搜尋視覺化(IV)

Posted by Mr. Monday 今天的搜尋視覺化進入第四集。 今天要介紹的是Grokker,結果上網一查,發現科技政策研究與資訊中心已經有人詳細撰文。那可真是太好了,這邊做個節錄。

Read Full Post »