從 Facebook 看起,你的個人資料究竟算誰的?

Posted by Mr. Saturday
(
本文同時刊載於 2008 年 2 月的 Download 網路密技王)

你提供到各大網站的資料究竟是歸誰所有,這個問題早就已經存在已久,也引起了不少的爭論.之前我就寫過一篇「網路時代,你的個人資料到底歸誰所有?一瞥使用者在 Facebook 上的新營利模式」來從 Facebook 探討這個頗受爭議的問題,在那些認為資料當然是歸自己所有的使用者之中,有些人就採取了相當積極的手段去把自己的資料給搶回來,最常見的就是用 web scraping 的方式去把各大網站的資料給刮下來.web scraping 廣義來說是讓電腦自動去擷取網路上資料的一種通稱,比如說 web crawler 也算是一種 web scraping 的方式.各大搜尋引擎公司都有自己的 web crawler 隨時在網路上爬來爬去,抓取世界上所有網頁的內容,讓自己的搜尋引擎可以針對這些網頁做索引以及排序,讓使用者可以搜尋.而使用者如果想讓電腦程式幫自己把資料給搶回來,也是透過類似的工具來從各大網站把自己的資料給下載回來.你常常會在一些網站看到從 gmail 或是 hotmail 匯入好友名單等功能,也都是 web scraping 的工具所提供的功能.

問題是通常這些取得資料的方式和工具,都不是這些來源網站可以接受的,像 Facebook 就有一些複雜的機制來阻擋這類 web scraping 工具,不讓使用者隨意把資料取走.但這種工具隨時在更新、隨時在進化,結果就變成了雙方類似資訊安全的攻防戰.而最近 Robert Scoble 這個全世界知名的部落客帳號被 Facebook 停權的事件,可能是導致網路界突然正視這個議題、使得各大公司採取行動的導火線.

Robert Scoble 這個傢伙是在部落界最為有名的 blogger 之一,他也為部落格寫了一本書叫做「裸體商業革命」,相信有一些讀者應該有看過,這位老兄在 Facebook 上可活躍了,他在上面有五千個朋友,達到了 Facebook 好友數目的上限.結果最近他使用一些 web scraping 的工具去把自己在上面的資料給下載回來,被 Facebook 的自動偵測機制給抓包了,帳號突然之間被停掉.Robert Scoble 發現此事,立刻在自己的 blog 上頭發了一篇文章 Facebook disabled my account,說自己的帳號被停權了.文章中沒有謾罵或是不滿,只說自己想把資料移到別的地方去,不過 Facebook 的使用者條款顯然不允許他這樣做.

有趣的是,短短幾個小時,這件事情在美國的部落界馬上傳開,大家都好奇這件事情會怎麼樣發展下去,我相信同樣的事情在一般 Facebook 的使用者身上一定有發生過,但是現在事情是發生在一個網路名人身上,自然激起的漣漪大不相同.好吧,結果怎麼了?結果 Facebook 在經過 7 個小時之後,就把 Robert Scoble 的帳號重新開啟了.Facebook 回應 Robert Scoble 說:在這種狀況之下,我們接受使用者的陳情,竟然你已經提出陳情,所以我們決定恢復你的帳號,不過請你以後不要再用類似的工具來抓資料了.

在我看來,重點不是陳情,重點是 Facebook 不能再因為這個事情節外生枝了,Beacon 廣告系統已經讓 Facebook 的名聲蒙上陰影,現在要是因為一個部落客又把名聲弄得更臭,實在是不划算,不如趕快把帳號還人,對大眾釋出善意比較重要.Robert Scoble 也針對這個事件,錄製了一段影片,直接點出了 Facebook 在個人資料處理上面的雙重標準.在影片之中,Robert 提到,當你加入了 Facebook 的時候,系統會問你要不要把 Gmail 或是其他地方的聯絡人一起匯入到 Facebook 上面,看看你有哪些朋友已經在使用 Facebook 了.Facebook 同樣也是採用 web scraping 去你的 Gmail 通訊錄裡面把資料給刮出來.除此之外,Facebook 還用很多其他的方法去網路上蒐集你的個人相關資料,把你的資料盡其所能地都吸到 Facebook.

但是一但 Facebook 用這種方式把你的個人資料給吸進去之後,他們就拒絕再把資料用任何方式吐出來,這就是 Robert Scoble 覺得不合理的地方,為什麼 Facebook 可以從別人那邊搜括你的個人資料,但是使用者卻不能把自己的資料再拿出來,這根本就是一個單方面的雙重標準.所以他之所以要開始去把資料搶回來,為的就是打破 Facebook 的這面高牆,讓他們知道使用者的資料不應該被他們這樣子封鎖起來.他要逼 Facebook 主動提供介面,讓使用者可以把自己的資料帶走.

順便一提,Facebook 為了防止這些 web scraping 的程式去他們網站上抓取使用者的 emai,所以在顯示使用者的 email 時,是用圖片檔來顯示,而不是文字,這樣可以讓這些電腦程式沒法直接當作文字來處理.不過 Robert Scoble 從 Plaxo 那邊拿了一個更高竿的程式,這個程式把圖片檔抓回來之後,可以把圖片拿來做 OCR (Optical Character Recognition),分析圖片中是什麼樣的文字,結果 email 還是被順利地抓了下來.

不知道是時機剛剛好還是事件本身的影響,反正 Robert Scoble 的行為也算是收到了成效.五天之後,Google 和 Facebook 以及 Plaxo 三家公司都加入了 DataPortability 這個團體.DataPortability 這個組織的目的在於透過整合和推廣開放的標準,設計出和推行讓使用者資料可以在網路上各個地方暢行無阻的機制.等於就是把使用者的資料整個開放出來,當然具體的細節還在研擬之中,各家公司的配合也是不可或缺的成功要素.值得注意的是,使用者的資料流通性更大之後,安全性又是一個重要的考量.

這樣一股資料開放的風氣吹到了 Facebook 之後,看起來真像是「世界是平的:social network 版」,競爭的平台好像突然之間被剷平了,當沒有一家公司真正擁有個人資料的時候,也為許多小的新進的競爭者提供了一些希望,似乎這些寶貴的資料即將唾手可得,但實際上真的是這樣嗎?

我覺得不是,使用者可以把自己的資料帶走,並不意味著使用者願意把他的資料再放到另一個平台上面去,我相信無論是何種形式的資料開放,要讓資料在平台之間流動與互通,一個最基本的原則就是:必須經過使用者本身的同意.Facebook 和 Google 已經有大量的資料和完整的平台,就算今天使用者可以方便地把自己的資料帶著走,你也得給使用者一個好的理由,說服他把資料再放到你的平台上.很多人用某個平台用成了習慣之後,你就很難叫他搬家.

所以「可流動」和「流動與否」基本上是兩回事.你做出了跟 Google 一模一樣的搜尋引擎;或是做出跟 Facebook 一模一樣的 social network,你依舊很難威脅到他們,更何況模仿這兩家公司談何容易.所以 Google 早就有了 Google Data API 讓你去使用他們的服務和聚合他們的資料,一句話:他們不怕你用.Facebook 倒也不必擔心把自己的資料開放出來,畢竟將近六千萬的使用者已經是相當可怕的規模,看看無名小站不過數百萬個使用者,雖然不斷得罪使用者,大家都還是懶得搬家了,Facebook 自然也不會因為資料開放被擊倒.

資料開放真正的意義在於,把掌握資料的權利還到使用者的手中,而不是被任何一家公司壟斷或是掌握.如此我們可以直接預見一個資訊流通更為發達的網際網路.我也期待使用者以後不用再受制於一些惡質經營的公司,能夠確實掌握自己的資料,能夠輕易地用自己寶貴的資料去投好的公司一票.

圖片來源: bbc.co.uk, stepheno.net

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!