Category Archive for 'Research'

Posted by Mr. Friday

前一篇文章介紹了BT的基本運作原理,這一篇文章就來看看學術界對這個機制的探討吧。

關於BT機制本身的實驗文章其實不少。2004年一群法國人發表了一篇Dissecting BitTorrent:Five Months in a Torrent’s Life。內容是他們把Red Hat 9的原始檔(約1.77G)放在網路上供人下載,透過Tracker的紀錄機制,觀察BT的下載特性。相較於這群法國人觀察的是單一BT檔的下載過程,紐西蘭Delft大學的研究生則觀察了國外比較有名的BT分享論壇(Supernova.org、Youceff.com等)幾個月來的人潮(大約有六萬人)。從這些鄉野實驗,可以得到幾個基本的結論:

(1) BT檔案往往會有flash crowd情形:分享開始的前幾天會湧入大量人潮,然而高潮退去後人也散得快。
(2) 下載的速度呈現「多數人下載慢,極少數人下載速度超快」的情形;不過即使「多數人下載慢」,下載的平均速度仍然比ftp快上不少。根據實驗,平均下載速度是240K,90%的人速度不會超過520K。有極少數的人下載速度會達到每秒3000K以上。
(3) 檔案的存活天數難以從檔案分享十天後的狀況來預測:紐西蘭學生嘗試著去預測檔案存活天數,不過失敗了。後面我們會看到另外一篇paper是如何成功預測的。

就這樣而已嗎?這兩篇實驗雖然做了一段蠻長的時間,可是得出的結論好像跟沒做差不多;我們這些下載者不用做實驗也知道。不過學術界就是這樣:會有人先去做最基本的實驗,弄出一大堆看似無用的數據,接著就會出現根據這些數據做出的漂亮推論。2004年,著名期刊SIGCOMM石破天驚地刊出了一篇論文:「Modeling and Performance Analysis of BitTorrent-Like Peer-to-Peer Networks」,作者是UIUC的Dongyu Qiu與R. Sirkant。該篇文章用廣泛而嚴謹的數學模型推導BitTorrent在穩定態效能、檔案分享效度、Free Rider(不提供上傳頻寬但享受下載速度的懶蟲)等問題,做了一番精闢的解析,讓所有網路學教授驚覺BT中的價值:不只是因為根據BT的數學隨機模型極有研究價值(經數學驗證,BT擁有「無人數上限」、「下載速度不受人潮影響」的特性),更讓他們驚奇的是,這些教授竟然都沒發現身邊有這麼傑出的軟體,而且還是一個無名小卒寫的XD。從該篇文章之後,有更多的學術資源投入與BT相關的研究,BT技術的影響也深入到其他應用,例如隨選視訊(VOD)、CDN等等。

Read Full Post »

Posted by Mr. Friday

談到 BT,相信大家都不陌生。沒錯,今天要來談的就是這幾年在網路上非常重要,已經快要變成全民運動的──BT 程式。筆者有鑒於 BT 已經變成非常火紅的應用程式,但是了解這個程式的基本運作原理與影響的人卻寥寥無幾,於是決定撰寫這個主題;本篇會先介紹BT的源起與運作原理,接下來的幾篇則會根據這一兩年學術上對BT的觀察,介紹BT在各種使用情境下對網路行為的影響(當中包含一些相當出人意表的發現)。

BitTorrent,簡稱BT,由Bram Cohen於2002年獨立完成其核心程式碼的撰寫。從Bram Cohen簡陋而陽春的個人網頁上看來,他於1993年進入紐約州立大學就讀,輟學之後陸續做過研究員、網路程式設計師,就履歷上看來並不是非常特出,2002年間他發表的BT一開始也沒有獲得很大的關注。隔年五月他把BT的理論基礎寫成一篇簡短五頁的學術文章發表在「Workshop on Economics of Peer-to-Peer Systems, 2003」上,文章本身沒有知名教授的背書、用字遣辭顯然也不夠精練,然而這篇文章至今卻已累積了474篇的reference數。2004年六月時,據CNN報導,BT已經佔據了網路上所有P2P流量的53%。至今,BT程式檔的下載量已經超過一億三千五百萬人次,而這些數字還不包含網路上經其他使用者修改過的版本,如BitComet、BitSpirit…等等。

Read Full Post »

Posted By Mr. Wednesday
綜觀各新聞網站,呈現新聞最簡單的方式就是將一則則新聞標題依序排列好,供讀者瀏覽。Mr. Wednesday向各位各介紹一個有趣的網站,10×10,它是以10×10總共100張的圖片呈現特定時間所發生的新聞事件,根據網站上的說明,圖片來源包括Reuters World News,BBC World Edition與New York Times Internation News。所謂一張圖片勝過千言萬語在這裡有了一個有趣的應用。

圖片來源: 10×10 / 100 Words and Pictures that Define the Time

Read Full Post »

Posted by Mr. Friday
今天我們要談的主題是網路的信任機制。信任,英文稱之為Trust。三國演義有云:「人無信不立。」自古以來,信任即為……。(扯遠XD)

拉回正題,今天並不是要寫作文,今天的主題是「如何在網路上相信他人?」―或者說,該不該相信誰?的問題。談到網路交易,大家往往第一個念頭都是:「網路交易可以相信嗎?」有很多從事網路業的人,以為大家害怕的是網路駭客竊聽這類的問題,於是紛紛投入技術面的防範。這當然是個重要的課題,然而事實上,網路交易的安全性並不只在於防範「網路訊號會不會被竊聽」、「帳號會不會被盜」之類比較偏技術性的危險,還有一個比較容易被人忽略、但其實更為重要的的問題是:「我怎麼知道網路那頭的人會不會騙我?」

「我怎麼知道網路那頭的人會不會騙我」有多重要?看看新聞就知道了。打開電視與報紙統計一下,其實網路信用卡密碼被盜的駭客新聞出現的比例遠比「少女被網友詐騙失蹤」、「女恐龍網路詐騙,捲款宅男幾百萬」來得少多了。技術性帳號的盜取也許比較容易防範,但是人與人之間的信任似乎來得更重要,卻也更難以防範。數學上有一個很有名的問題,叫做「拜占庭將軍問題」,就是在討論人與人之間的信任危機。拜占庭位在今日土耳其的伊斯坦堡,是東羅馬帝國的首都,所以東羅馬帝國也稱為拜占庭帝國。既然稱為帝國,當然幅員遼闊不在話下,因此每個將軍的軍隊都分隔的很遠,彼此只能靠信差傳消息。在戰爭的時候,將軍們必須要達成一致的共識:進攻或是撤退。然而很不幸的,在這些將軍之中有叛徒(人數不明),他們的目的是擾亂整體軍隊的秩序。這個時候就衍生出一個問題:在已知有將軍謀反的情況下,其餘忠誠的將軍該如何達成一致的協議,不受叛徒的影響?這就是拜占庭問題。

Read Full Post »

搜尋視覺化(IV)

Posted by Mr. Monday
今天的搜尋視覺化進入第四集。 今天要介紹的是Grokker,結果上網一查,發現科技政策研究與資訊中心已經有人詳細撰文。那可真是太好了,這邊做個節錄。

Read Full Post »

搜尋視覺化(III)

Posted by Mr. Monday

親身體驗
MusicIP算是音樂搜尋引擎中的怪咖。搜尋出來的結果,會有每首音樂專輯的縮圖,滑鼠放在上面會自動展開,然後會有更豐富的資料,當然試聽是一定要的。點選某一首歌之後,它還會呈螺旋狀排列出相關的歌曲,只能說,太炫麗了。
除了上述的線上版Discover Music 之外,他們也提供了桌面版類似iTune的軟體Mixer,使用者可以方便地用這款軟體找尋自己電腦上的音樂,長期使用後,電腦還會根據你聽音樂的喜好來幫你整理播放列表。

資料圖片來源: CNET

Read Full Post »

搜尋視覺化(II)

Posted by Mr. Monday
Quintura這家公司可有趣了,在你輸入搜尋的字串之後,會有一堆相關的名詞包圍著輸入的字串,遠近和其相關性成正比。使用者可以非常方便地點選相關同義字或是相似詞。

觀看界面
除了這個介面之外,Quintura還很好心的做了專門給小孩子用的搜尋介面。四周有分類好的類別,都用非常童話的圖示來表示,整個介面也很鮮活。當然最讓父母放心的是,它會擋掉一些成人才能看到的結果。

觀看介面
圖片資料來源: WebWare

Read Full Post »

搜尋視覺化(I)

Posted by Mr. Monday

天下事情無奇不有,尤其是Nerd…更會做出你想不到的事情。藝術家Jonathan Harris將搜尋出來的資料用宇宙行星天文的方式來呈現,真是有夠酷。大家可以上去玩玩看: http://universe.daylife.com/。不過還是Google好用就是了。
資料圖片來源: CNET

Read Full Post »

小孩名字視覺化

Posted by Mr. Monday
IBM的研究員Martin Wattenberg針對1880年到2005年小孩子的名字做研究,並將之視覺化。
在圖上每一個線段(Strip)代表的是一個名字,沿著時間軸移動,就會發現這個名字在不同年代的排名,還蠻有趣的:)
觀看DEMO

圖片來源: Bogle’s Blog
 

Read Full Post »

部落格視覺化

Posted by Mr. Monday
Twingly screensaver這款軟體以視覺化呈現現在世界各地Blog的動態。非常有趣:)

圖片以及資料來源: Go2web

Read Full Post »

頁次 8 of 9«123456789»