<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Mr./Ms. Days (MMDays) - 網路, 資訊, 觀察, 生活MMDays &#8211; Robert Scoble</title>
	<atom:link href="http://mmdays.com/tag/robert-scoble/feed/" rel="self" type="application/rss+xml" />
	<link>http://mmdays.com</link>
	<description>網路, 產業, 資訊, 觀察, 生活, 電影, 技術, 新知, 科技, 媒體, 趨勢, Web 2.0</description>
	<lastBuildDate>Thu, 24 May 2012 16:59:21 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>從 Facebook 看起，你的個人資料究竟算誰的？</title>
		<link>http://mmdays.com/2008/02/03/social_network_and_your_data/</link>
		<comments>http://mmdays.com/2008/02/03/social_network_and_your_data/#comments</comments>
		<pubDate>Sun, 03 Feb 2008 00:01:38 +0000</pubDate>
		<dc:creator>Mr. Saturday</dc:creator>
				<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Mr. Saturday]]></category>
		<category><![CDATA[Web 2.0]]></category>
		<category><![CDATA[專欄]]></category>
		<category><![CDATA[關於網路產業]]></category>
		<category><![CDATA[Data Portability]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Robert Scoble]]></category>
		<category><![CDATA[Web Scraping]]></category>

		<guid isPermaLink="false">http://mmdays.com/2008/02/03/social_network_and_your_data/</guid>
		<description><![CDATA[Posted by Mr. Saturday (本文同時刊載於 2008 年 2 月的 Download 網路密技王) 你提供到各大網站的資料究竟是歸誰所有，這個問題早就已經存在已久，也引起了不少的爭論．之前我就寫過一篇「網路時代，你的個人資料到底歸誰所有？一瞥使用者在 Facebook 上的新營利模式」來從 Facebook 探討這個頗受爭議的問題，在那些認為資料當然是歸自己所有的使用者之中，有些人就採取了相當積極的手段去把自己的資料給搶回來，最常見的就是用 web scraping 的方式去把各大網站的資料給刮下來．web scraping 廣義來說是讓電腦自動去擷取網路上資料的一種通稱，比如說 web crawler 也算是一種 web scraping 的方式．各大搜尋引擎公司都有自己的 web crawler 隨時在網路上爬來爬去，抓取世界上所有網頁的內容，讓自己的搜尋引擎可以針對這些網頁做索引以及排序，讓使用者可以搜尋．而使用者如果想讓電腦程式幫自己把資料給搶回來，也是透過類似的工具來從各大網站把自己的資料給下載回來．你常常會在一些網站看到從 gmail 或是 hotmail 匯入好友名單等功能，也都是 web scraping 的工具所提供的功能． 問題是通常這些取得資料的方式和工具，都不是這些來源網站可以接受的，像 Facebook 就有一些複雜的機制來阻擋這類 web scraping 工具，不讓使用者隨意把資料取走．但這種工具隨時在更新、隨時在進化，結果就變成了雙方類似資訊安全的攻防戰．而最近 Robert Scoble 這個全世界知名的部落客帳號被 Facebook 停權的事件，可能是導致網路界突然正視這個議題、使得各大公司採取行動的導火線． Robert Scoble 這個傢伙是在部落界最為有名的 blogger 之一，他也為部落格寫了一本書叫做「裸體商業革命」，相信有一些讀者應該有看過，這位老兄在 Facebook 上可活躍了，他在上面有五千個朋友，達到了 [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Posted by </strong><strong><font color="#964b00">Mr. Saturday<br />
(</font></strong><font color="#000000">本文同時刊載於<span> 2008 年 2 月的 <a href="http://www.pcuser.com.tw/bookdetail.aspx?Number=2AS502" target="_blank">Download 網路密技王</a></span></font><strong><font color="#964b00">) </font></strong></p>
<p><img src="http://www.bbc.co.uk/schools/gcsebitesize/img/ict06datasecurity.gif" align="left" border="0" height="362" width="350" />你提供到各大網站的資料究竟是歸誰所有，這個問題早就已經存在已久，也引起了不少的爭論．之前我就寫過一篇「<a href="http://mmdays.com/2007/12/09/facebook_weblo/" rel="bookmark" title="Permanent Link to [MMDays 專欄] 網路時代，你的個人資料到底歸誰所有？一瞥使用者在 Facebook 上的新營利模式">網路時代，你的個人資料到底歸誰所有？一瞥使用者在 Facebook 上的新營利模式</a>」來從 Facebook 探討這個頗受爭議的問題，在那些認為資料當然是歸自己所有的使用者之中，有些人就採取了相當積極的手段去把自己的資料給搶回來，最常見的就是用 web scraping 的方式去把各大網站的資料給刮下來．web scraping 廣義來說是讓電腦自動去擷取網路上資料的一種通稱，比如說 web crawler 也算是一種 web scraping 的方式．各大搜尋引擎公司都有自己的 web crawler 隨時在網路上爬來爬去，抓取世界上所有網頁的內容，讓自己的搜尋引擎可以針對這些網頁做索引以及排序，讓使用者可以搜尋．而使用者如果想讓電腦程式幫自己把資料給搶回來，也是透過類似的工具來從各大網站把自己的資料給下載回來．你常常會在一些網站看到從 gmail 或是 hotmail 匯入好友名單等功能，也都是 web scraping 的工具所提供的功能．</p>
<p><img src="http://stepheno.net/wpso/wp-content/2006/12/nancy19.jpg" align="right" border="0" height="250" width="300" />問題是通常這些取得資料的方式和工具，都不是這些來源網站可以接受的，像 Facebook 就有一些複雜的機制來阻擋這類 web scraping 工具，不讓使用者隨意把資料取走．但這種工具隨時在更新、隨時在進化，結果就變成了雙方類似資訊安全的攻防戰．而最近 Robert Scoble 這個全世界知名的部落客帳號被 Facebook 停權的事件，可能是導致網路界突然正視這個議題、使得各大公司採取行動的導火線．</p>
<p><span id="more-5371"></span></p>
<p>Robert Scoble 這個傢伙是在部落界最為有名的 blogger 之一，他也為部落格寫了一本書叫做「裸體商業革命」，相信有一些讀者應該有看過，這位老兄在 Facebook 上可活躍了，他在上面有五千個朋友，達到了 Facebook 好友數目的上限．結果最近他使用一些 web scraping 的工具去把自己在上面的資料給下載回來，被 Facebook 的自動偵測機制給抓包了，帳號突然之間被停掉．Robert Scoble 發現此事，立刻在自己的 blog 上頭發了一篇文章 <a href="http://scobleizer.com/2008/01/03/ive-been-kicked-off-of-facebook/" target="_blank">Facebook disabled my account</a>，說自己的帳號被停權了．文章中沒有謾罵或是不滿，只說自己想把資料移到別的地方去，不過 Facebook 的使用者條款顯然不允許他這樣做．</p>
<p>有趣的是，短短幾個小時，這件事情在美國的部落界馬上傳開，大家都好奇這件事情會怎麼樣發展下去，我相信同樣的事情在一般 Facebook 的使用者身上一定有發生過，但是現在事情是發生在一個網路名人身上，自然激起的漣漪大不相同．好吧，結果怎麼了？結果 Facebook 在經過 7 個小時之後，就把 Robert Scoble 的帳號重新開啟了．Facebook 回應 Robert Scoble 說：在這種狀況之下，我們接受使用者的陳情，竟然你已經提出陳情，所以我們決定恢復你的帳號，不過請你以後不要再用類似的工具來抓資料了．</p>
<p>在我看來，重點不是陳情，重點是 Facebook 不能再因為這個事情節外生枝了，Beacon 廣告系統已經讓 Facebook 的名聲蒙上陰影，現在要是因為一個部落客又把名聲弄得更臭，實在是不划算，不如趕快把帳號還人，對大眾釋出善意比較重要．Robert Scoble 也針對這個事件，<a href="http://www.seesmic.com/Standalone.html?video=4fBjAGYLW5" target="_blank">錄製了一段影片</a>，直接點出了 Facebook 在個人資料處理上面的雙重標準．在影片之中，Robert 提到，當你加入了 Facebook 的時候，系統會問你要不要把 Gmail 或是其他地方的聯絡人一起匯入到 Facebook 上面，看看你有哪些朋友已經在使用 Facebook 了．Facebook 同樣也是採用 web scraping 去你的 Gmail 通訊錄裡面把資料給刮出來．除此之外，Facebook 還用很多其他的方法去網路上蒐集你的個人相關資料，把你的資料盡其所能地都吸到 Facebook．</p>
<p>但是一但 Facebook 用這種方式把你的個人資料給吸進去之後，他們就拒絕再把資料用任何方式吐出來，這就是 Robert Scoble 覺得不合理的地方，為什麼 Facebook 可以從別人那邊搜括你的個人資料，但是使用者卻不能把自己的資料再拿出來，這根本就是一個單方面的雙重標準．所以他之所以要開始去把資料搶回來，為的就是打破 Facebook 的這面高牆，讓他們知道使用者的資料不應該被他們這樣子封鎖起來．他要逼 Facebook 主動提供介面，讓使用者可以把自己的資料帶走．</p>
<p>順便一提，Facebook 為了防止這些 web scraping 的程式去他們網站上抓取使用者的 emai，所以在顯示使用者的 email 時，是用圖片檔來顯示，而不是文字，這樣可以讓這些電腦程式沒法直接當作文字來處理．不過 Robert Scoble 從 Plaxo 那邊拿了一個更高竿的程式，這個程式把圖片檔抓回來之後，可以把圖片拿來做 OCR (Optical Character Recognition)，分析圖片中是什麼樣的文字，結果 email 還是被順利地抓了下來．</p>
<p>不知道是時機剛剛好還是事件本身的影響，反正 Robert Scoble 的行為也算是收到了成效．五天之後，Google 和 Facebook 以及 Plaxo 三家公司都加入了 <a href="http://dataportability.org" target="_blank">DataPortability</a> 這個團體．DataPortability 這個組織的目的在於透過整合和推廣開放的標準，設計出和推行讓使用者資料可以在網路上各個地方暢行無阻的機制．等於就是把使用者的資料整個開放出來，當然具體的細節還在研擬之中，各家公司的配合也是不可或缺的成功要素．值得注意的是，使用者的資料流通性更大之後，安全性又是一個重要的考量．</p>
<p>這樣一股資料開放的風氣吹到了 Facebook 之後，看起來真像是「世界是平的：social network 版」，競爭的平台好像突然之間被剷平了，當沒有一家公司真正擁有個人資料的時候，也為許多小的新進的競爭者提供了一些希望，似乎這些寶貴的資料即將唾手可得，但實際上真的是這樣嗎？</p>
<p>我覺得不是，使用者可以把自己的資料帶走，並不意味著使用者願意把他的資料再放到另一個平台上面去，我相信無論是何種形式的資料開放，要讓資料在平台之間流動與互通，一個最基本的原則就是：<strong>必須經過使用者本身的同意</strong>．Facebook 和 Google 已經有大量的資料和完整的平台，就算今天使用者可以方便地把自己的資料帶著走，你也得給使用者一個好的理由，說服他把資料再放到你的平台上．很多人用某個平台用成了習慣之後，你就很難叫他搬家．</p>
<p>所以「可流動」和「流動與否」基本上是兩回事．你做出了跟 Google 一模一樣的搜尋引擎；或是做出跟 Facebook 一模一樣的 social network，你依舊很難威脅到他們，更何況模仿這兩家公司談何容易．所以 Google 早就有了 Google Data API 讓你去使用他們的服務和聚合他們的資料，一句話：他們不怕你用．Facebook 倒也不必擔心把自己的資料開放出來，畢竟將近六千萬的使用者已經是相當可怕的規模，看看無名小站不過數百萬個使用者，雖然不斷得罪使用者，大家都還是懶得搬家了，Facebook 自然也不會因為資料開放被擊倒．</p>
<p>資料開放真正的意義在於，把掌握資料的權利還到使用者的手中，而不是被任何一家公司壟斷或是掌握．如此我們可以直接預見一個資訊流通更為發達的網際網路．我也期待使用者以後不用再受制於一些惡質經營的公司，能夠確實掌握自己的資料，能夠輕易地用自己寶貴的資料去投好的公司一票．</p>
<p>圖片來源: <a href="http://www.bbc.co.uk/schools/gcsebitesize/ict/legal/0dataprotectionactrev1.shtml" target="_blank">bbc.co.uk</a>, <a href="http://stepheno.net/category/business/" target="_blank">stepheno.net</a><br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=2ae71a695354c5cefda83b0aed2b2d0c" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2008%2F02%2F03%2Fsocial_network_and_your_data%2F+%28%E5%BE%9E+Facebook+%E7%9C%8B%E8%B5%B7%EF%BC%8C%E4%BD%A0%E7%9A%84%E5%80%8B%E4%BA%BA%E8%B3%87%E6%96%99%E7%A9%B6%E7%AB%9F%E7%AE%97%E8%AA%B0%E7%9A%84%EF%BC%9F%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2008/02/03/social_network_and_your_data/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
	</channel>
</rss>

