從超文字連結(Hypertext)到超影像連結(Hypervideo)

Posted by Mr. Saturday

在現在的全球資訊網上,網站與網站之間的連結主要來自於文字的超連結,就是大家所熟知的超文字連結hypertext,那麼有沒有文字之外的連結呢?可能不好想像,不過現在網路上最流行的連結方式,實際上早已經跳脫一般文字的連結了:那就是透過標籤(tag)來連結,現在YouTube或是很多social network或是social content的網站都讓使用者可以為自己的內容加入tag,作為內容的metadata,網站就根據該內容的標籤,來決定相關以及類似的其他內容提供給 使用者。這已經是一種跳脫於hypertext靜態連結的方式了,網路越來越聰明,越來越能透過這些metadata來提供有價值的動態連結給網民。 Google的AdWords和AdSense的人工智慧也是一個超脫於一般純文字連結的動態方式。不過這些技術呢,本質上還是透過文字來連結。

這邊要介紹一個嶄新的以影像為基礎的連結方式,現在一般來說被稱為hypervideo (或是hyperlinked video)的技術,這個技術跟人工智慧的關係又更加密切了,簡單來說, hypervideo的運作概念是這樣:網站上如果放了一支video,那麼我們就用軟體去掃瞄這個video,用object tracking的技術,去找出這一支video裡面有什麼關鍵物品或是人臉,然後根據在影片播放的時候把人臉或是物品圈起來,畫成一塊連結到其他地方的 區域,只要使用者點選那一塊區域,就可以連結到與該物品或是人臉相關的網站。點選之後,該影片就會暫停播放,然後先show出你點選的相關連結,等你看完相關連結後,影片再繼續。舉例來說,如果我們正在看張忠謀的演講影片,我們的軟體認出這個傢伙是張忠謀,於是就把他的臉給圈起來,然後提供外部連結,連結到他個人的網站或是有關於他的wikipedia page。這裡馬上就牽涉到兩項人工智慧技術了,face recognitionobject tracking (或是廣義來說,人臉就當成是一種object),object tracking技術有多難做到讓人滿意的結果,其實念computer science的學生一定略知一二 (Mr. Saturday就曾經被相關的project荼毒過…),所以這個概念距離真正廣泛應用到網路上的content,其實還有一段相當長的路要走。這些技術現在都歸類在Computer Vision(電腦視覺)這個學門之下(有關電腦視覺的資訊可以參閱Carnegie Mellon University的Vision Group),電腦視覺目前還是一個相當活躍的研究領域,有許多困難但是卻有趣的open problem尚未解決,以後Mr. Saturday再另撰文介紹這個領域。

一旦這些相關技術成熟了,我們甚至也不需要用人力來tag網路上的內容了,因為軟體就直接幫你決定一支video該用怎麼樣的tag來描述(或許再加上一些人為的post-editing)。另外這個技術的成熟,也會帶動整個網路世界相當大的改變,簡單舉例來說,Google的PageRank就一定要來一個大翻修了,因為hypervideo的概念會造成網路上更複雜的連結關係,很多網站在搜尋引擎的ranking也一定會隨之改變,所以這個時候、根據連結來決定網站排名的PageRank演算法勢必要做一番改變了。

另外Etiquette也是個大問題,不同於超文字連結的簡單性和明確性,現在還沒有很明確的規範來告訴大家一般hypervideo的方式應該要怎麼樣來implement,網路上的video content已經有很多很多了,但是流傳的方式很不一,有的人為了分享,會把對方的video直接放在自己的網頁上播放,這叫做hotlink, hotlink是否構成侵權,還是一個很爭議的問題,有的video owner很歡迎大家把他們的video隨便流傳、隨便公佈或是下載,前提是不可以靠這個video來賺錢,但是誰知道呢?「靠這個video賺錢」的明確定義又是什麼?比如說,之後要是google的adSense技術能夠進步到去掃瞄網站的video,根據video內容去push廣告,那麼到底誰要 負責,又是一個複雜的問題了。很多類似的爭議其實很容易想像,可以說真的是有一大堆的問題要解決。但是一個問題就是一個機會。

講了這一堆,Google到底為什麼要砸大錢買YouTube,目的應該已經相當清楚了吧。這項技術一旦成熟,加上網路上成千上萬的video, Google可以根據video的內容準確地push相關的廣告給使用者,這是現在幾乎還未被開發,相當可怕的一個商機啊!所以雖然很多人覺得 Google買貴了,我倒是一點也不覺得。Google的這個卡位實在太厲害了,現在網路上看似散亂的video,之後一個一個都會是被當作拿來賺錢的工具。 這個願景我相信幾年後會為Google帶來另一波的榮景。當然Google以外,也有太多太多的機會等我們去發掘。

另外Microsoft的adCenter Labs在最近就釋出了hypervideo的demo:大家可以看下圖:當我們把滑鼠移動到Video之中滑雪的人身上時,會出現一個括號框起來的區域,這個區域會有一些簡單的廣告文字出現,使用者進一步點擊之後,就會連結到廣告的網站或是其他媒體。hypervideo-ms

其實由這些準備成為明日之星的應用來看,我們不難看出網路已經明顯走向智慧型網路的發展方向,也就是說網路對於使用者來說呈現出越來越高的智慧。已經有很多人在討論把更高的人工智慧引進網路世界了。Web 3.0的定義,我個人是一廂情願地認為應該往這個方向來定義才對。但是網路的發展一直都是一種漸進式的過程,即使是突然的學術研究上的突破,要真正應用在實際層面上也是需要時間來加以促成。很多人拼命在搶Web 3.0的定義,但是實際上,一但更多嶄新的技術在網路上站穩了腳步,融入人們的生活,有一天,當我們不經意地回想起Web 2.0剛剛喊出來的網路生活時,也許會突然發現,人們在網路上累積的智慧結晶,已經足以讓現在的網路又稱為一個新的時代,Web 3.0這個口號也就自然而然地產生了。

(寫到這邊,赫然發現這篇文章以陳述居多,待Mr. Saturday整理好更多相關的資訊和Demo,再來繼續跟大家分享 :D)

延伸閱讀:

有相當多的網站和公司已經開始實驗hypervideo技術,比較具代表性的有

一些相關的Demo和Hypervideo的資訊

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!