Tag Archive 'Data Portability'

Posted by Mr. Saturday
(本文同時刊載於 2008 年 2 月的 Download 網路密技王)
你提供到各大網站的資料究竟是歸誰所有,這個問題早就已經存在已久,也引起了不少的爭論.之前我就寫過一篇「網路時代,你的個人資料到底歸誰所有?一瞥使用者在 Facebook 上的新營利模式」來從 Facebook 探討這個頗受爭議的問題,在那些認為資料當然是歸自己所有的使用者之中,有些人就採取了相當積極的手段去把自己的資料給搶回來,最常見的就是用 web scraping 的方式去把各大網站的資料給刮下來.web scraping 廣義來說是讓電腦自動去擷取網路上資料的一種通稱,比如說 web crawler 也算是一種 web scraping 的方式.各大搜尋引擎公司都有自己的 web crawler 隨時在網路上爬來爬去,抓取世界上所有網頁的內容,讓自己的搜尋引擎可以針對這些網頁做索引以及排序,讓使用者可以搜尋.而使用者如果想讓電腦程式幫自己把資料給搶回來,也是透過類似的工具來從各大網站把自己的資料給下載回來.你常常會在一些網站看到從 gmail 或是 hotmail 匯入好友名單等功能,也都是 web scraping 的工具所提供的功能.
問題是通常這些取得資料的方式和工具,都不是這些來源網站可以接受的,像 Facebook 就有一些複雜的機制來阻擋這類 web scraping 工具,不讓使用者隨意把資料取走.但這種工具隨時在更新、隨時在進化,結果就變成了雙方類似資訊安全的攻防戰.而最近 Robert Scoble 這個全世界知名的部落客帳號被 Facebook 停權的事件,可能是導致網路界突然正視這個議題、使得各大公司採取行動的導火線.

Read Full Post »