<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Mr./Ms. Days (MMDays) - 網路, 資訊, 觀察, 生活MMDays &#8211; 人工智慧</title>
	<atom:link href="http://mmdays.com/tag/%e4%ba%ba%e5%b7%a5%e6%99%ba%e6%85%a7/feed/" rel="self" type="application/rss+xml" />
	<link>http://mmdays.com</link>
	<description>網路, 產業, 資訊, 觀察, 生活, 電影, 技術, 新知, 科技, 媒體, 趨勢, Web 2.0</description>
	<lastBuildDate>Wed, 08 Feb 2012 17:35:46 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Wolfram Alpha 即將問世：電腦科學界聖杯的追尋之路</title>
		<link>http://mmdays.com/2009/05/11/wolfram-alpha-and-turing-test/</link>
		<comments>http://mmdays.com/2009/05/11/wolfram-alpha-and-turing-test/#comments</comments>
		<pubDate>Sun, 10 May 2009 22:30:21 +0000</pubDate>
		<dc:creator>Mr. Saturday</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[Mr. Saturday]]></category>
		<category><![CDATA[Web 2.0]]></category>
		<category><![CDATA[專欄]]></category>
		<category><![CDATA[網路新聞]]></category>
		<category><![CDATA[觀點]]></category>
		<category><![CDATA[關於網路產業]]></category>
		<category><![CDATA[電腦科學]]></category>
		<category><![CDATA[Artificial Intelligence]]></category>
		<category><![CDATA[Knowledge Search]]></category>
		<category><![CDATA[Mathematica]]></category>
		<category><![CDATA[natural language processing]]></category>
		<category><![CDATA[Stephen Wolfram]]></category>
		<category><![CDATA[Turing Test]]></category>
		<category><![CDATA[Wolfram Alpha]]></category>
		<category><![CDATA[人工智慧]]></category>

		<guid isPermaLink="false">http://mmdays.com/?p=7149</guid>
		<description><![CDATA[Posted by Mr. Saturday 最近有一個新的搜尋引擎相當受到網路界的矚目，許多網路觀察家都期待這個產品會成為挑戰 Google 的明日之星，媒體也利用大篇幅來報導這個即將上市的搜尋引擎，大家期待的程度真可說是未上市先轟動，這個東西就是 Mathematica 創辦人 Stephen Wolfram 的最新作品 Wolfram Alpha computational knowledge engine。然而大家可以注意到，Wolfram 實際上不把他最新的作品稱作是一個「搜尋引擎」，而是用「computational knowledge engine」(計算知識引擎) 來當作名稱，主要的原因很簡單，因為這個搜尋引擎的特點在於使用者不是真的到上面去作搜尋的動作，而是到這個地方「直接問問題」。 這有什麼特別呢？我們都知道怎麼去使用 Google 在網路上作搜尋：使用者去輸入了一些關鍵字，然後 Google 在一瞬間把搜尋結果一筆一筆列出來，使用者就點進去網頁尋找自己的資訊。Wolfram 的使用方式有別 Google 和現在所有搜尋引擎的使用方法，Wolfram 可以讓使用者直接輸入一個完整的問句，比如說：「世界上最高的山是哪一座山？」然後 Wolfram 就會分析你問的問題，理解你的問題；接著從網路已經有的、公開的資料和自己內部經過授權取得的資料，粹取出問題的答案直接回答你，如此完成一個問與答的動作。Wolfram 不會像 Google 一樣，給你一堆網路上的搜尋結果，要你自己去找你要的東西，Wolfram 只會給你一個明確的答案，沒有其他東西。也就是說，你跟他的互動，就像是跟人的互動一樣，你問他答。 在電腦科學界，像「問與答」這種人與電腦的互動一直是許多人追求的聖杯，從事人工智慧的電腦科學家最為渴求的，就是有朝一日電腦能夠跟真人一樣與外界互動，且外界分辨不出電腦到底是不是一個真人，這也就是鼎鼎大名的 Turing Test (涂林測驗)：如果躲在幕後與人互動的電腦能夠騙過受試者，讓受試者分辨不出到底互動的對象是真人還是電腦，我們就說這一台電腦通過了 Turing Test。 現在為止，沒有任何電腦可以騙過人類。電腦還是電腦，人類還是人類，一經過互動，大家都可以分辨出牆壁的另一邊是真人還是電腦。 Wolfram Alpha 的推出，在我看來也是以另一種形式在挑戰 Turing Test，讓電腦回答問題一直是一個非常困難的問題，看過霹靂遊俠李麥克的人應該都會對裡面智慧型的跑車「夥計」印象深刻，每次只要李麥克一個指令，夥計就會精確地執行任務，甚至於最後還會跟李麥克聊上幾句。不過這樣的未來情境，在現今的電腦界尚未實現，甚至於可以說還有很長的一段路要走。因為仔細思考一下，我們就可以發現第一個難題是「讓電腦去理解人類的自然語言」。 理解人類的語言有多難？請各位讀者想一個簡單的問題就好了：「學習一種新的語言你需要多久的時間才能學好？」，我們都知道把語言學好是一種藝術，但是對於人類來說，掌握一種新語言的基本元素都已經是一件不簡單的事情了。現在我們想要讓電腦去理解一種自然語言、甚至於能夠明白我們的問題，難度自然是不在話下了。 即使這個問題我們可以完美地克服之後，第二個難題馬上來了：「理解了問題之後，電腦要怎麼產生出答案？」這個問題到今天，也還是沒有很好的解法，通常我們只能預先給電腦準備一個很大的、經過組織後的資料庫，讓電腦從事某種程度上挖掘答案的行為，廣義來說，這也就是 Semantic Web 想要解決的問題：讓網路上的所有資料經過標準，組織成為一個世界上最龐大的資料庫，使得「整個網路可以被任何一台電腦理解並分析」這樣的一個概念可以落實。 所以 Turing [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Posted by </strong><a href="../category/mr-saturday/" target="_blank"><strong><span style="color: #993300;">Mr. Saturday</span></strong></a></p>
<p>最近有一個新的搜尋引擎相當受到網路界的矚目，許多網路觀察家都期待這個產品會成為挑戰 Google 的明日之星，媒體也利用大篇幅來報導這個即將上市的搜尋引擎，大家期待的程度真可說是未上市先轟動，這個東西就是 Mathematica 創辦人 Stephen Wolfram 的最新作品 <a href="http://www.wolframalpha.com" target="_blank">Wolfram Alpha computational knowledge engine</a>。然而大家可以注意到，Wolfram 實際上不把他最新的作品稱作是一個「搜尋引擎」，而是用「computational knowledge engine」(計算知識引擎) 來當作名稱，主要的原因很簡單，因為這個搜尋引擎的特點在於使用者不是真的到上面去作搜尋的動作，而是到這個地方「直接問問題」。</p>
<p><img class="size-full wp-image-7183" title="wolframalpha-logo" src="http://mmdays.com/wp-content/uploads/2009/05/wolframalpha-logo.jpg" alt="Wolfram Alpha Computational Knowledge Engine" width="577" height="101" /></p>
<p><span id="more-7149"></span></p>
<p>這有什麼特別呢？我們都知道怎麼去使用 Google 在網路上作搜尋：使用者去輸入了一些關鍵字，然後 Google 在一瞬間把搜尋結果一筆一筆列出來，使用者就點進去網頁尋找自己的資訊。Wolfram 的使用方式有別 Google 和現在所有搜尋引擎的使用方法，Wolfram 可以讓使用者直接輸入一個完整的問句，比如說：「世界上最高的山是哪一座山？」然後 Wolfram 就會分析你問的問題，理解你的問題；接著從網路已經有的、公開的資料和自己內部經過授權取得的資料，粹取出問題的答案直接回答你，如此完成一個問與答的動作。Wolfram 不會像 Google 一樣，給你一堆網路上的搜尋結果，要你自己去找你要的東西，Wolfram 只會給你一個明確的答案，沒有其他東西。也就是說，你跟他的互動，就像是跟人的互動一樣，你問他答。</p>
<div class="mceTemp">
<dl class="wp-caption alignleft" style="width: 260px;">
<dt class="wp-caption-dt"><a href="http://upload.wikimedia.org/wikipedia/commons/e/e4/Turing_Test_version_3.png"><img title="Turing Test" src="http://upload.wikimedia.org/wikipedia/commons/e/e4/Turing_Test_version_3.png" alt="http://upload.wikimedia.org/wikipedia/commons/e/e4/Turing_Test_version_3.png" width="250" height="320" /></a></dt>
</dl>
</div>
<p>在電腦科學界，像「問與答」這種人與電腦的互動一直是許多人追求的聖杯，從事人工智慧的電腦科學家最為渴求的，就是有朝一日電腦能夠跟真人一樣與外界互動，且外界分辨不出電腦到底是不是一個真人，這也就是鼎鼎大名的 Turing Test (涂林測驗)：如果躲在幕後與人互動的電腦能夠騙過受試者，讓受試者分辨不出到底互動的對象是真人還是電腦，我們就說這一台電腦通過了 Turing Test。</p>
<p>現在為止，沒有任何電腦可以騙過人類。電腦還是電腦，人類還是人類，一經過互動，大家都可以分辨出牆壁的另一邊是真人還是電腦。</p>
<p>Wolfram Alpha 的推出，在我看來也是以另一種形式在挑戰 Turing Test，讓電腦回答問題一直是一個非常困難的問題，看過霹靂遊俠李麥克的人應該都會對裡面智慧型的跑車「夥計」印象深刻，每次只要李麥克一個指令，夥計就會精確地執行任務，甚至於最後還會跟李麥克聊上幾句。不過這樣的未來情境，在現今的電腦界尚未實現，甚至於可以說還有很長的一段路要走。因為仔細思考一下，我們就可以發現<strong>第一個難題是「讓電腦去理解人類的自然語言」</strong>。</p>
<p>理解人類的語言有多難？請各位讀者想一個簡單的問題就好了：「學習一種新的語言你需要多久的時間才能學好？」，我們都知道把語言學好是一種藝術，但是對於人類來說，掌握一種新語言的基本元素都已經是一件不簡單的事情了。現在我們想要讓電腦去理解一種自然語言、甚至於能夠明白我們的問題，難度自然是不在話下了。</p>
<p>即使這個問題我們可以完美地克服之後，第二個難題馬上來了：「<strong>理解了問題之後，電腦要怎麼產生出答案？</strong>」這個問題到今天，也還是沒有很好的解法，通常我們只能預先給電腦準備一個很大的、經過組織後的資料庫，讓電腦從事某種程度上挖掘答案的行為，廣義來說，這也就是 Semantic Web 想要解決的問題：讓網路上的所有資料經過標準，組織成為一個世界上最龐大的資料庫，使得「<strong>整個網路可以被任何一台電腦理解並分析</strong>」這樣的一個概念可以落實。</p>
<p>所以 Turing Test 現在普遍被認為跟處理自然語言是同樣的一個問題，這其實很容易理解：唯有在一台電腦的人工智慧可以將人類的自然語言模擬地很好的時候，才有可能騙過與它互動的人類，進而通過 Turing Test。</p>
<p style="text-align: left;">以上這些懸而未解的難題，也是為什麼 Wolfram 讓人如此受期待的原因。而究竟 Wolfram 可以把這些問題解決到什麼樣的程度呢？其實我也相當期待。從以下 Stephen Wolfram 本人親自的 demo 影片來看，在一些特定領域的搜尋上面，這個新的搜尋引擎表現真的相當搶眼。就讓我們期待 5/18 Wolfram 正式上線吧！</p>
<p><!-- start insertion by YouTube Brackets, robertbuzink.nl --><span class="youtube"><object width="425" height="350" type="application/x-shockwave-flash" data="http://www.youtube.com/v/hYhLsQPHNas"> <param name="movie" value="http://www.youtube.com/v/hYhLsQPHNas" /><param name="wmode" value="transparent" /></object></span><!-- end Youtube Brackets insertion --><br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=1653da0218c40361b2255665f10b9216" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2009%2F05%2F11%2Fwolfram-alpha-and-turing-test%2F+%28Wolfram+Alpha+%E5%8D%B3%E5%B0%87%E5%95%8F%E4%B8%96%EF%BC%9A%E9%9B%BB%E8%85%A6%E7%A7%91%E5%AD%B8%E7%95%8C%E8%81%96%E6%9D%AF%E7%9A%84%E8%BF%BD%E5%B0%8B%E4%B9%8B%E8%B7%AF%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2009/05/11/wolfram-alpha-and-turing-test/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>神經網路的直觀印象</title>
		<link>http://mmdays.com/2009/01/24/neural_network/</link>
		<comments>http://mmdays.com/2009/01/24/neural_network/#comments</comments>
		<pubDate>Fri, 23 Jan 2009 20:30:31 +0000</pubDate>
		<dc:creator>Mr. Thursday</dc:creator>
				<category><![CDATA[Mr. Thursday]]></category>
		<category><![CDATA[Research]]></category>
		<category><![CDATA[大腦]]></category>
		<category><![CDATA[專欄]]></category>
		<category><![CDATA[數學]]></category>
		<category><![CDATA[神經生物]]></category>
		<category><![CDATA[電腦科學]]></category>
		<category><![CDATA[Artificial Intelligence]]></category>
		<category><![CDATA[人工智慧]]></category>
		<category><![CDATA[神經]]></category>
		<category><![CDATA[神經網路]]></category>
		<category><![CDATA[自由]]></category>

		<guid isPermaLink="false">http://mmdays.com/?p=6631</guid>
		<description><![CDATA[Posted By Mr. Thursday 從簡單的生物到人類，無論是只有幾個神經細胞的海星，或是有數億個神經細胞的大腦的人類，神經系統都讓我們不是只有活著，而是能夠產生有智慧的行為，和這個真實的外在世界互動。也因此，神經科學的一些發現，有可能對資訊科學裡面的人工智慧的問題，作出一些貢獻。之前也寫了一些神經科學一些基本的介紹，不過本篇希望可以把這些基本的觀念，用更直觀的方式和例子，再敘述一次，讓各位讀者無論背景是研究哪一方面，當看到「神經網路」的時候，可以當下在腦中浮現一些印象，即使不是專家對於神經網路的印象，卻也能夠比一般常識範圍的印象，稍微增長一些。每年多增加一些印象和了解，日積月累下來或許還是可以有可觀的知識累積，讓自己在知識的領域裡面，也多長一歲喔！ 接下來就讓我們分別了解一下神經網路是什麼 (what)，以及為什麼研究神經網路(why)，並且有一段比較數學角度來分析神經網路，給數理背景的讀者參考，也有一段比較人文哲學角度來分析神經網路，給人文背景的讀者參考，最後有一個總結。 神經網路，我們就可以用一堆「點」和「線」來理解，每個點就代表著一個個神經細胞，點和點之間的連線，就代表著神經細胞之間的連結。 神經細胞有什麼特點呢？一個神經細胞可以從對外的連結，得到電流的刺激，當電流的刺激大於某一個關鍵值的時候，這個神經細胞就會從原來沒有活動的狀態，改變成有活動的狀態。 如果要做個比喻，我們可以想像整個神經網路，就像是在玩大地遊戲一樣，每個人就像是一個神經細胞，人和人之間用繩子綁起來，像是神經細胞之間的連結，每個人可以稍微移動位置，但是移動的同時，會藉著連結的繩子，影響到附近的人。另一方面，對於每一個人/每一個神經細胞來說，如果對外連結的繩子，拉扯的力量超過某一個關鍵值，自己的位置也會移動。自己移動的時候，又可以影響別人了！ 因此一個神經網路，就是類似這樣子的方式，把外在世界給的刺激，轉化成內在的活動訊號，透過神經細胞之間的連結，讓訊號傳遞下去，甚至是不斷循環等等。 為什麼神經細胞的活動與否，可以當成是一種訊號表示的方式呢？假設現在我們把神經細胞比做電燈泡，神經細胞沒有活動就像是燈泡沒有亮，神經細胞有活動/大地遊戲裡面的人移動了，就像是燈泡亮了。 接著我們想像一下，有一個大的看板，上面有無數的燈泡，每個燈泡在這一秒鐘，可能亮也可能不亮，而這多種組合的方式，就可以和外在世界的各項事物作對應，就如同我們的語言系統，用不同的單字和詞彙，對應外在世界的某件物體或某件事情。看板上面某一種燈泡亮暗的組合，就如同語言系統裡面的單字，可以對映外在世界的某一件物體或事情。 而神經網路更勝於燈泡組成的看板，在於神經網路可以自己產生這種對應，並且「學習」這種對應，因為除了神經細胞，還有神經細胞之間的「連結」，稱為神經鍵結 (synapse)，神經鍵結不僅剛出生的時候會迅速改變連結強度，到了發展完成之後仍然可以學習和改變，而這些連結強度的改變，可以影響神經細胞活動/燈泡亮暗的活動模式，行為上看起來，就如同在接受外在「刺激」(stimulus)之後，「學習」(learn)了一種「反應」(response)的方式。 也因此有一個名詞稱為連結主義 (connectionist)，因為神經網路不在神經細胞本身的活動，而是神經細胞之間連結的強弱改變，可以造成具有學習效果的神經活動模式，讓生物可以適應外在世界的生活。就如同大地遊戲裡面的繩子，連結強度的改變，就如同繩子可以變細或變粗，粗繩子一拉移動的效果很大，細繩子一拉移動效果很小，因此外在世界給予同樣的刺激，但是大地遊戲裡面的人/神經細胞，之間的連結強度如果不同，神經細胞活動的模式 (pattern)，也就會跟著不同，行為上的表現就是不同的「反應」了！ 神經網路研究對人工智慧可能的貢獻 因此我們現在有比較直觀的印象，來想像一個神經網路，包括神經元的活動，以及影響活動模式的源頭，也就是可以改變強弱的神經連結 (synapse)。 然而研究生物上的神經網路，可以對人工智慧的問題作出哪些貢獻呢？最早有類神經網路 (artificial neural network)，就是把生物上對神經系統的發現，拿來解決人工智慧的問題。一個類神經網路，可以是有正確答案的監督式學習 (supervised learning)，或是沒有正確答案的非監督式學習 (unsupervised learning)，經過訓練之後的網路連結，就會拿來使用。網路的架構和訓練過程的不同，就是後來各種不同的模型 (model)，譬如說用梯度遞減的學習法 (gradient descent)，或是後來的自我組織圖 (SOM: Self-Organized Map)，以及 ART (Artificial Resonence Theory)等等。 近年來除了類神經網路已經有的各項研究，還有計算神經學 (Computational Neuroscience)以及神經計算學 (Neural Computing)。就我目前的理解，如果是在神經科學領域裡面為出發點，稱為計算神經學，如果是從資訊科學領域為出發點，稱為神經計算學。也因此，雖然兩者大致上來說，都是比類神經網路多出更多細節的模擬和描述，譬如說近年來有基因體的發現和研究，蛋白質的各種反應路徑，以及電生理訊號的資料分析等等，都比最初發現神經網路的研究，有更多的細節，因此會比傳統的類神經網路模型，有更多生物細節的發現被加入。 舉例來說，類神經網路通常注重在連結強弱的學習，然而近年來的發現，讓連結除了連結強弱 (synaptic weight) 之外，還有連結傳遞快慢的性質 (latency)。因此神經細胞的活動，不是瞬間傳給其他細胞，而是有傳遞快慢的次序。此外，神經細胞之間的連結，有刺激性(excitatory)和抑制性(inhibitory)的分別，當然啦，類神經網路裡面其實有模擬到這點，只要加一個「負號」就可以達到抑制連結的效果。 不過還有更細節的部分，在於神經連結(synapse)到其他神經細胞，不是直接訊號的傳遞，而是在另一個神經元的樹狀突出部分會有一個匯整，拿剛才大地遊戲的比方，繩子不是每個人每根繩子都綁在腰上，而是一根繩子連到另一個人身上的時候，可能是綁在腳踝上，可能是綁在脖子上，可能是綁在手腕上，神經元的樹狀突出，就是有許多不同的形狀多樣性，每個人體型也是如此具有差別，彙整繩子傳進來的力道，也會有不同的表現。巨觀來說可能沒有立即的差別，微觀的時候或許有重要的影響，甚至在課本裡面，初步的分析也把這部分對應成一種邏輯迴路的機制，彷彿是神經網路裡面的另一個網路，在樹突 (dendrite)上面的一個微網路。 除此之外，還有一個地方想要強調的，是人工參數的影響。譬如說類神經網路，可能需要一個參數，來代表電流超過某個關鍵值，這個神經細胞才會從沒有活動，變成活動的狀態。然而這個關鍵值是多少，類神經網路裡面大部分是用人工給定的參數，好一些的模型，可能會根據訓練的資料，在 cross-validation的時候改變。然而這些方法，可能都會因為人工給定，或是訓練資料的代表性來決定人工參數，造成新的問題無法從舊的模型舉一反三等問題。 譬如說有些模型，會根據外在刺激調整連結強弱，但是每次要改變多少，結果就多出一個人工參數叫做「學習率」。但是學習率要給多少才對？似乎就是任意給，或是人工看看學習效果調整，或是自動化讓機器自己cross-validation來調整。其中cross-validation似乎就可以自動化找出人工參數的值，而且訓練資料越多，模型會越準，如統統計裡面的中央極限定理一般。然而訓練好的模型，無法直接用在新的問題上面，遇到新的問題，又需要新的訓練資料，新的正確答案，才能重覆上面的「自動化」過程。至少人類對於大部分問題，有一定程度的「舉一反三」能力，因此這部分，是我希望神經網路研究可以貢獻人工智慧的地方。 為什麼可能有貢獻呢？因為就生物系統本身來說，經過多年的演變，生物系統具有一定程度的自我調節能力。譬如說運動的時候，體溫上升，此時心跳增加，血管擴張，分泌汗液來散熱。生物系統巧妙地連結這一切調節機制，無須另外一個人剖開身體來調節。神經系統也是如此，神經細胞產生活動的關鍵值，不需要給定一個變數來代表，而是從生物結構本身，適應刺激之後自動產生的反應，自動調節。 [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Posted By <span style="color: #008000;">Mr. Thursday</span></strong></p>
<p>從簡單的生物到人類，無論是只有幾個神經細胞的海星，或是有數億個神經細胞的大腦的人類，神經系統都讓我們不是只有活著，而是能夠產生有智慧的行為，和這個真實的外在世界互動。也因此，神經科學的一些發現，有可能對資訊科學裡面的<strong>人工智慧</strong>的問題，作出一些貢獻。之前也寫了一些神經科學一些基本的介紹，不過本篇希望可以把這些基本的觀念，用<strong>更直觀的方式和例子</strong>，再敘述一次，讓各位讀者無論背景是研究哪一方面，當看到「<strong>神經網路</strong>」的時候，可以當下在腦中浮現一些印象，即使不是專家對於神經網路的印象，卻也能夠比一般常識範圍的印象，稍微增長一些。每年多增加一些印象和了解，<strong>日積月累</strong>下來或許還是可以有可觀的<strong>知識累積</strong>，讓自己在知識的領域裡面，也多長一歲喔！</p>
<p>接下來就讓我們分別了解一下<strong>神經網路</strong>是什麼 (what)，以及為什麼研究神經網路(why)，並且有一段比較<strong>數學角度</strong>來分析神經網路，給數理背景的讀者參考，也有一段比較<strong>人文哲學角度</strong>來分析神經網路，給人文背景的讀者參考，最後有一個總結。</p>
<p><span id="more-6631"></span>神經網路，我們就可以用一堆「點」和「線」來理解，每個<strong>點</strong>就代表著一個個<strong>神經細胞</strong>，點和點之間的<strong>連線</strong>，就代表著神經細胞之間的<strong>連結</strong>。</p>
<p>神經細胞有什麼特點呢？一個神經細胞可以從對外的連結，得到電流的刺激，當電流的刺激大於某一個<strong>關鍵值</strong>的時候，這個神經細胞就會從原來<strong>沒有活動</strong>的狀態，改變成<strong>有活動</strong>的狀態。</p>
<p>如果要做個比喻，我們可以想像整個神經網路，就像是在玩<strong>大地遊戲</strong>一樣，每個人就像是一個神經細胞，人和人之間用<strong>繩子</strong>綁起來，像是神經細胞之間的連結，每個人可以稍微<strong>移動位置</strong>，但是移動的同時，會藉著連結的繩子，<strong>影響</strong>到附近的人。另一方面，對於每一個人/每一個神經細胞來說，如果對外連結的繩子，拉扯的力量超過某一個<strong>關鍵值</strong>，自己的位置也會<strong>移動</strong>。自己移動的時候，又可以影響別人了！</p>
<p>因此一個神經網路，就是類似這樣子的方式，把外在世界給的刺激，轉化成內在的活動<strong>訊號</strong>，透過神經細胞之間的連結，讓<strong>訊號</strong>傳遞下去，甚至是不斷循環等等。</p>
<p>為什麼神經細胞的活動與否，可以當成是一種<strong>訊號表示</strong>的方式呢？假設現在我們把神經細胞比做<strong>電燈泡</strong>，神經細胞沒有活動就像是燈泡沒有亮，神經細胞有活動/大地遊戲裡面的人移動了，就像是燈泡<strong>亮</strong>了。</p>
<p>接著我們想像一下，有一個大的看板，上面有無數的燈泡，每個燈泡在這一秒鐘，可能<strong>亮</strong>也可能<strong>不亮</strong>，而這多種組合的方式，就可以和外在世界的各項事物作對應，就如同我們的語言系統，用不同的<strong>單字</strong>和詞彙，<strong>對應外在世界</strong>的某件物體或某件事情。看板上面某一種<strong>燈泡亮暗的組合</strong>，就如同語言系統裡面的單字，可以<strong>對映外在世界</strong>的某一件物體或事情。</p>
<p>而神經網路更勝於燈泡組成的看板，在於神經網路可以<strong>自己產生這種對應</strong>，並且「<strong>學習</strong>」這種對應，因為除了神經細胞，還有神經細胞之間的「<strong>連結</strong>」，稱為神經鍵結 (synapse)，神經鍵結不僅剛出生的時候會迅速改變連結強度，到了發展完成之後仍然可以學習和改變，而這些連結<strong>強度的改變</strong>，可以影響神經細胞活動/燈泡亮暗的活動模式，行為上看起來，就如同在接受外在「<strong>刺激</strong>」(stimulus)之後，「學習」(learn)了一種「<strong>反應</strong>」(response)的方式。</p>
<p>也因此有一個名詞稱為<strong>連結主義</strong> (connectionist)，因為神經網路不在神經細胞本身的活動，而是神經細胞之間<strong>連結的強弱改變</strong>，可以造成具有<strong>學習效果</strong>的神經活動模式，讓生物可以適應外在世界的生活。就如同大地遊戲裡面的<strong>繩子</strong>，連結強度的改變，就如同繩子可以變細或變粗，<strong>粗繩子</strong>一拉移動的效果很大，<strong>細繩子</strong>一拉移動效果很小，因此外在世界給予同樣的刺激，但是大地遊戲裡面的人/神經細胞，之間的連結強度如果不同，神經細胞<strong>活動</strong>的模式 (pattern)，也就會跟著不同，行為上的表現就是不同的「<strong>反應</strong>」了！</p>
<p style="text-align: center;"><strong>神經網路研究對人工智慧可能的貢獻</strong></p>
<p>因此我們現在有比較直觀的印象，來想像一個神經網路，包括神經元的活動，以及影響活動模式的源頭，也就是<strong>可以改變強弱</strong>的<strong>神經連結</strong> (synapse)。</p>
<p>然而研究生物上的神經網路，可以對人工智慧的問題作出哪些貢獻呢？最早有<strong>類神經網路</strong> (artificial neural network)，就是把生物上對神經系統的發現，拿來解決人工智慧的問題。一個類神經網路，可以是有正確答案的監督式學習 (supervised learning)，或是沒有正確答案的非監督式學習 (unsupervised learning)，經過訓練之後的網路連結，就會拿來使用。網路的架構和訓練過程的不同，就是後來各種不同的模型 (model)，譬如說用梯度遞減的學習法 (gradient descent)，或是後來的自我組織圖 (SOM: Self-Organized Map)，以及 ART (Artificial Resonence Theory)等等。</p>
<p>近年來除了類神經網路已經有的各項研究，還有<strong>計算神經學</strong> (Computational Neuroscience)以及<strong>神經計算學</strong> (Neural Computing)。就我目前的理解，如果是在神經科學領域裡面為出發點，稱為計算神經學，如果是從資訊科學領域為出發點，稱為神經計算學。也因此，雖然兩者大致上來說，都是比類神經網路多出更多細節的模擬和描述，譬如說近年來有基因體的發現和研究，蛋白質的各種反應路徑，以及電生理訊號的資料分析等等，都比最初發現神經網路的研究，有更多的細節，因此會比傳統的類神經網路模型，有更多<strong>生物細節</strong>的發現被加入。</p>
<p>舉例來說，類神經網路通常注重在連結強弱的學習，然而近年來的發現，讓連結除了連結強弱 (synaptic weight) 之外，還有<strong>連結傳遞快慢</strong>的性質 (latency)。因此神經細胞的活動，不是瞬間傳給其他細胞，而是有<strong>傳遞快慢的次序</strong>。此外，神經細胞之間的連結，有刺激性(excitatory)和抑制性(inhibitory)的分別，當然啦，類神經網路裡面其實有模擬到這點，只要加一個「負號」就可以達到抑制連結的效果。</p>
<p>不過還有更細節的部分，在於神經連結(synapse)到其他神經細胞，不是直接訊號的傳遞，而是在另一個神經元的<strong>樹狀突出</strong>部分會有一個<strong>匯整</strong>，拿剛才大地遊戲的比方，繩子不是每個人每根繩子都綁在腰上，而是一根繩子連到另一個人身上的時候，可能是綁在腳踝上，可能是綁在脖子上，可能是綁在手腕上，神經元的<strong>樹狀突出</strong>，就是有許多不同的形狀多樣性，每個人體型也是如此具有差別，彙整繩子傳進來的力道，也會有不同的表現。巨觀來說可能沒有立即的差別，微觀的時候或許有重要的影響，甚至在課本裡面，初步的分析也把這部分對應成一種邏輯迴路的機制，彷彿是<strong>神經網路裡面的另一個網路</strong>，在<strong>樹突</strong> (dendrite)上面的一個微網路。</p>
<p>除此之外，還有一個地方想要強調的，是<strong>人工參數</strong>的影響。譬如說類神經網路，可能需要一個參數，來代表電流超過某個關鍵值，這個神經細胞才會從沒有活動，變成活動的狀態。然而這個關鍵值是多少，類神經網路裡面大部分是用人工給定的參數，好一些的模型，可能會根據訓練的資料，在 cross-validation的時候改變。然而這些方法，可能都會因為人工給定，或是訓練資料的代表性來決定人工參數，造成新的問題無法從舊的模型舉一反三等問題。</p>
<p>譬如說有些模型，會根據外在刺激調整連結強弱，但是每次要改變多少，結果就多出一個人工參數叫做「學習率」。但是學習率要給多少才對？似乎就是任意給，或是人工看看學習效果調整，或是自動化讓機器自己cross-validation來調整。其中cross-validation似乎就可以<strong>自動化</strong>找出人工參數的值，而且<strong>訓練資料越多</strong>，模型會越準，如統統計裡面的<strong>中央極限定理</strong>一般。然而訓練好的模型，無法直接用在新的問題上面，遇到新的問題，又需要新的訓練資料，<strong>新的正確答案</strong>，才能重覆上面的「<strong>自動化</strong>」過程。至少人類對於大部分問題，有一定程度的「<strong>舉一反三</strong>」能力，因此這部分，是我希望神經網路研究可以貢獻人工智慧的地方。</p>
<p>為什麼可能有貢獻呢？因為就<strong>生物系統</strong>本身來說，經過多年的演變，生物系統具有一定程度的<strong>自我調節能力</strong>。譬如說運動的時候，體溫上升，此時心跳增加，血管擴張，分泌汗液來散熱。生物系統巧妙地連結這一切調節機制，無須另外一個人剖開身體來調節。神經系統也是如此，神經細胞產生活動的關鍵值，不需要給定一個變數來代表，而是從<strong>生物結構本身</strong>，適應刺激之後自動產生的反應，<strong>自動調節</strong>。</p>
<p>譬如說神經細胞上面，其實是佈滿各種<strong>離子通道</strong>。這些通道的開關，可以讓離子進入神經細胞、或是離開神經細胞，而<strong>離子帶有電荷</strong>，因此離子的進出，就會改變<strong>神經細胞的電位</strong>，進而影響神經細胞的<strong>活動</strong>。</p>
<p>接下來就要問，這些通道開關如何被控制呢？答案是通道上面的<strong>接受器</strong>(receptor)，人是肉做的，而每個細胞組織，其實就是<strong>蛋白質</strong>組成的，蛋白質又是許多<strong>胺基酸</strong>組成的，<strong>胺基酸</strong>的分子又分為<strong>帶正電</strong>、<strong>帶負電</strong>、或<strong>不帶電</strong>三種。因此這些通道，除了<strong>接受器</strong>，可以接受其他神經細胞傳來的<strong>化學物質</strong> (稍微提一下有興奮性的Glutamate、抑制性的GABA、以及對肌肉是興奮但是對心臟是抑制的乙烯膽鹼Acetylcholine、和更多種，容我日後整理好之後另外撰寫介紹)，這些化學物質巨觀來看，如同<strong>鑰匙</strong>打開接受器這道<strong>鎖</strong>，讓<strong>離子通道</strong>這扇門被打開。</p>
<p>然而一個神經細胞上面，是具有<strong>許許多多的離子通道</strong>的，(可以粗分為快的AMPA通道，以及比較慢的NMDA通道，也容我日後整理好在撰寫介紹)。因此其他神經細胞活動之後，散發出化學<strong>神經傳導物質</strong> (neurotransmitters)，可能只有打開這個神經細胞上面一小部分的離子通道。</p>
<p>接下來就是重點了！神經細胞產生活動要超過的電位關鍵值，是如何自我調節而不是人工給定的呢？這邊我用「<strong>投票</strong>」的過程來比喻。因為每個離子通道，也是胺基酸做的，某一段胺基酸帶有電荷，會受到細胞本身電位改變而改變外觀，也因此這個離子通道就稱為<strong>電位驅動開關的通道</strong> (voltage-gated)，細胞電位如果開始變高，這個通道就有比較大的機會打開。</p>
<p>這和「<strong>選舉投票</strong>」有什麼相似之處呢？在選舉裡面，我們想要投誰一票，或許都會先<strong>參考其他人的意見</strong>。然而一開始大多數的人或許都沒什麼意見，又或可能都心有定見。無論如何，選舉前幾個月，選舉人本身會不斷拜票，推出競選廣告，有如一個神經細胞接受其他細胞傳過來的化學物質，可以打開自己細胞上面的某些離子通道。然而工作上的同事，家裡親戚的意見，同學之間的意見，也會開始影響自己的決定，並且傳遞下去，<strong>互相影響</strong>。當這個影響開始產生<strong>正向循環</strong>的時候，就會導致最後想要投票給誰。</p>
<p>也因此神經細胞上的離子通道，<strong>一開始</strong>只被神經傳導物質<strong>打開幾個</strong>。但是如果這幾個打開的通道<strong>足夠多</strong>，可以讓細胞電位改變，並且這個改變讓voltage-gated的通道跟著打開，形成<strong>正向循環</strong>，最後就會造成<strong>整個細胞所有的離子通道打開</strong>，大量離子進出，才能讓細胞<strong>電位</strong>一下子往上衝，形成<strong>動作電位</strong> (action potential)，這個時候才是我們所看到的神經細胞<strong>活動</strong>，如同燈泡點<strong>亮</strong>的活動。</p>
<p>至於一開始關鍵值要設定多少，就是神經細胞本身的生物組成結構，決定了這個關鍵值，而不是細胞裡面設定了一個變數，代表這個關鍵值，先讀出來，然後作一個大於的運算，才決定是否要活動了，這是出現在模擬程式的寫法，然而生物體內，是用上述的方法自我調節決定這個關鍵值(threshold)，生物體的自我調節功能，也在這邊顯現了出來。</p>
<p style="text-align: center;"><strong>神經網路的一些複雜度推算</strong></p>
<p>這一段是給數理背景的人參考，其他讀者可以先移駕到下一段繼續閱讀！:)</p>
<p>假設有 n 個神經元，那麼如果完全連結 (full-connected)，會有 n^2個神經連結。n個神經元如果只有活動/不活動兩種狀態，那麼神經網路所有可能的狀態個數就是2^n。假設神經連結強度也只有兩種，那麼神經鍵結可能的狀態組合個數，就是2^(n^2)種了。</p>
<p>接下來要探討什麼呢？是要探討<strong>鍵結</strong>改變<strong>神經活動</strong>，以及<strong>神經活動</strong>改變<strong>鍵結</strong>的一些<strong>複雜度估算</strong>。首先看看神經活動，總共有2^n種神經活動模式 (pattern)，那麼從這一秒鐘到下一秒鐘 (或是以毫秒為單位)，活動模式的轉移 (transition)個數，就是(2^n)^2。而每一秒鐘神經連結所在的狀態，有2^(n^2)種，大於(2^n)^2種神經活動模式轉移的個數，因此是個多對一的函數，沒問題！</p>
<p>然而接下來要討論神經活動，對於神經連結的影響。假設神經連結強度，也是透過神經活動來自我調節。剛又假設神經強度只有2種狀態，如果神經強度有k種狀態也可以，那麼神經連結模式總個數就是k^(n^2)個，神經聯結模式的轉移(transition)個數就是(k^(n^2))^2。然而在每一秒鐘下，神經活動模式只有2^n，即使k=2，2^n是小於(2^(n^2))^2的，變成一對多，不是一個函數了，因為每一種神經活動模式，有可能對映多種神經連結強度的轉移(transition)。</p>
<p>不過，如果是過去t個時間裡面，神經活動的組合，一起影響在現在這一秒，神經連結的改變轉移(transition)，那麼就可能變成一「多對一」，或是至少「一對一」的函數了。數學寫起來就是需要一個t，讓(2^n)^t大於等於(2^(n^2))^2，或是神經連結有k種狀態的話，要大於等於(k^(n^2))^2。這邊或許可以估算出STDP (spike-timing dependent plasticity)，需要多少時間t以前的影響，來決定現在這一秒鐘，神經連結的改變。</p>
<p>以上是一些對於神經網路，<strong>活動</strong>影響<strong>連結變化</strong>，以及<strong>連結</strong>影響<strong>活動變化</strong>，的一些<strong>複雜度估算</strong>，供數理背景的讀者參考。</p>
<p style="text-align: center;"><strong>神經網路的人文哲思: 自由的產生與意義</strong></p>
<p>在人文哲學的部分，我想要探討的是「自由」如何產生？以及「自由」的意義這兩個重點。</p>
<p>首先「自由」如何<strong>產生</strong>的這一部分，主要是從閱讀文獻的過程中產生的想法。在神經科學的研究文獻裡面，常常看到一些研究成果，是把某個神經細胞，給予某種刺激，或是某種化學物質，會有哪些反應，而且實驗是可以<strong>重現</strong> (reproducable)，無論是世界上的哪一個地方，只要在同樣的<strong>環境條件</strong>下面，<strong>同樣的刺激</strong>，就有<strong>同樣的反應</strong>。</p>
<p>然而令我好奇的是，這種看起來沒有<strong>自由</strong>的神經細胞，組合起來之後，居然出現了自由的行為。所謂自由在這邊就是指<strong>無法被確定的行為模式</strong>。譬如說在電影《墨攻》有一幕是在找出奸細，城內居民事先約定好，聚集在一起，眼睛閉起來，鐘聲一敲，全部蹲下來。但是如果後來才混進人群的奸細，不知道這個約定，就會站著馬上被認出來。然而這種約定，只要奸細有聽說，或是使用過一次，下次就無法在使用了。因為人就是有這種學習能力和自由度。</p>
<p>一個神經細胞，我們不用擔心其他細胞會因為這次實驗，互相通報，學起來，下次碰到這個化學物質或電刺激，故意選擇另一種反應。首先神經細胞的反應雖然有機率成份，但是似乎還沒有到自由選擇的地步，其次，神經細胞彼此之間，沒有類似這種情報的溝通，頂多只有生物訊息的傳遞，仍舊在必然性的範圍內。</p>
<p>因此，<strong>自由</strong>如何從這種可以在實驗中被控制的，<strong>沒有自由的物質</strong>，在變成一個<strong>複雜系統</strong>之後，成為一個<strong>有自由的系統</strong>，必須要用<strong>機率</strong>才能描述行為的因果關係？而這一項特點，我想也是<strong>社會科學</strong>和其他科學不同的地方。譬如說某項研究顯示某某情況人會做某件事情。但是研究結果一出來，人可以開始改變自己，或是偏偏選擇另一種事情。人有這個自由選擇，也可以在得到某項消息後作出改變，也就是說，即使<strong>環境條件</strong>都一樣，人卻可以做<strong>不同選擇</strong>，彷彿有自由做選擇，而不是必然作出某件事情。</p>
<p>但是每一個細胞，卻又是可以在被控制的環境裡面，必然地產生某種反應。<strong>從無自由中生出自由的生命系統</strong>，是我感到神奇的一個地方。</p>
<p>第二個想要探討的重點，是<strong>自由</strong>與<strong>責任</strong>的關聯。延伸前面的討論，人到底是否真的具有自由，還是只是因為<strong>不確定性變大</strong>，彷彿有自由，實際上還是受到環境產生必然的反應，而不是彷彿有個我可以自由選擇？這關聯到一個問題，就是「<strong>責任歸屬</strong>」的問題。</p>
<p>因為有了自由，有了選擇，人們才需要為自己的行為負責，因為這麼多選擇，你選了其中一項，讓世界運轉的方向，從<strong>眾多可能</strong>中<strong>走向</strong><strong>其中一種世界</strong>。這個後果，必須要讓<strong>做決定</strong>的人來承擔，無論是功是過，也就是<strong>責任</strong>有所歸屬。</p>
<p>但是如果今天人並沒有自由，一切都是<strong>必然</strong>發生的，從小到大，到這一秒鐘，我就是注定要做出這件事情，必然發生而沒有選擇的自由，那麼我似乎就不用負起責任，因為有選擇自由，才需要負責任。</p>
<p>因此未來可能發生的問題就是：如果有一天，一個<strong>決定性</strong> (deterministic) 的模型被找出來，可以決定性地，<strong>解釋</strong>人每一秒鐘的行為，<strong>預測</strong>每一秒鐘的行為，那麼人是否還需要<strong>負責</strong>？因為看起來的自由選擇，其實都在細胞的層次，<strong>必然地</strong>被解釋和預測出來了。</p>
<p style="text-align: center;"><strong>結語</strong></p>
<p>在〈<a href="http://mmdays.com/2007/11/16/ml_bci/" target="_blank">機器學習與腦機介面的願景</a>〉裡面，提到了研究神經科學的願景目標，在〈<a href="http://mmdays.com/2008/09/16/neuroscience_research/" target="_blank">神經科學研究的各個層次</a>〉也稍微蜻蜓點水式地簡介神經科學，從<strong>細胞</strong>到<strong>系統</strong>到<strong>認知</strong>層次的各項研究主題。今天這一篇<strong>直觀介紹</strong>，希望各位看的懂，也希望沒有錯誤才好。總之，希望各位看完這篇以後，看到「<strong>神經網路</strong>」四個字，可以有比較<strong>豐富的印象</strong>，讓自己不但歲數增長，知識也增長一些。後面的<strong>數學</strong>和<strong>哲學</strong>討論，也希望對有興趣的讀者有所幫助！祝福大家新年快樂！萬事如意！新年新希望！<br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=1c53c607a5d706a98c19ece8315010b5" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2009%2F01%2F24%2Fneural_network%2F+%28%E7%A5%9E%E7%B6%93%E7%B6%B2%E8%B7%AF%E7%9A%84%E7%9B%B4%E8%A7%80%E5%8D%B0%E8%B1%A1%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2009/01/24/neural_network/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>Luis von Ahn: 人腦運算</title>
		<link>http://mmdays.com/2008/07/07/human-computation/</link>
		<comments>http://mmdays.com/2008/07/07/human-computation/#comments</comments>
		<pubDate>Mon, 07 Jul 2008 05:30:05 +0000</pubDate>
		<dc:creator>Mr. Monday</dc:creator>
				<category><![CDATA[Mr. Monday]]></category>
		<category><![CDATA[Web 2.0]]></category>
		<category><![CDATA[電玩]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[Artificial Intelligence]]></category>
		<category><![CDATA[game]]></category>
		<category><![CDATA[HCI]]></category>
		<category><![CDATA[photo]]></category>
		<category><![CDATA[web]]></category>
		<category><![CDATA[web2.0]]></category>
		<category><![CDATA[人工智慧]]></category>
		<category><![CDATA[標記]]></category>
		<category><![CDATA[研究]]></category>
		<category><![CDATA[網路]]></category>
		<category><![CDATA[遊戲]]></category>

		<guid isPermaLink="false">http://mmdays.com/?p=6011</guid>
		<description><![CDATA[本文同步刊載在 &#60;UIUI&#62; Posted by Mr. Monday 這一篇文章是根據之前的一篇文章 &#60;玩遊戲，做研究&#62; 所改寫而成。本文並可在 &#60;密技偷偷報【密】字第肆拾號&#62; 雜誌中看到。 2005年，一個帶著眼鏡、身材略微發福的年輕小伙子接過了卡內基梅隆大學（Carnegie Mellon University）所頒發的博士畢業證書，領取這個畢業證書是必然的，因為他的博士研究使得電腦界開拓出了一個全新的研究領域 &#8212; 人腦運算 (Human Computation)。這個年輕人的名字是 Luis von Ahn，人機介面(HCI)跟人工智慧(AI)領域的新星。 Luis von Ahn 暸解到了電腦智慧的極限，也暸解到電腦如果要模仿人類的思考的話，需要大量的資料來做訓練。比如說，如果我們要讓電腦知道什麼是狗的話，我們就必須拿出一張有狗的照片，然後把狗所在的位置給標示出來；同樣的道理，如果我們需要讓電腦理解什麼是貓的話，我們就必須給電腦貓的圖片；依此類推。然而，我們不可能聘請這麼多人來標記所有的東西，因為這樣子所牽涉到人力跟範圍將是非常地大的，而且聘用的金額將是非常昂貴。試想想，如果付錢給一個工讀生，每小時 100 塊，請工讀生來幫忙標記圖片，一個小時標記 100 張圖片，一天 8 小時，如果需要標記的圖片是數千萬張的範圍，我要請多少工讀生來做這些事情呢? 而且，我又怎麼知道他們有沒有標記錯誤呢? 我又該要花多少錢來做驗證? 對於上述的問題，Luis von Ahn 想到了解決的方法。他認為根本不需要付錢，大家就會自動來幫忙做這件事情，只要他們覺得這件事情是好玩的。這讓我想到馬克吐溫的名作 &#60;湯姆歷險記&#62; 裡的橋段，故事的主人翁湯姆由於被交代要將所有的籬笆上油漆，因此不能跟其他的小朋友一起去玩耍，不過聰明的湯姆想到了好方法，他讓其他的小朋友認為刷油漆是很有趣的一件事情。因此，其他的小朋友不但爭先恐後地來幫湯姆刷油漆之外，還會給湯姆玩具或是糖果，就只是為了能夠刷到油漆。 (圖片來源: ESP Game網站) 而 Luis von Ahn 借著觀察，發現許多人會在網路上面玩一些小遊戲來打發零星瑣碎的時間，因此他決定著手設計一款遊戲，這款遊戲叫做 EPS Game。遊戲規則很簡單，玩家一進入遊戲畫面，會看到一張圖，針對這張圖，玩家必須給一個關鍵字，而在網路的彼端，會有一個玩家跟你配對起來，一但你所輸入的關鍵字跟你配對的玩家一樣，那麼你們兩個就獲得分數，雙方進入下一關。當然，如果沒有沒有人跟你玩的話，就會有機器人跟你配對起來。藉由這個遊戲，Luis von Ahn 就可以讓大家在玩樂的同時取得大量有意義的配對資料，而這些跟圖片配對的關鍵字，將可以用來訓練電腦來認識圖片的內容物。 因為這一款遊戲，也讓 Google 發覺了這位超級新星，因此在 [...]]]></description>
			<content:encoded><![CDATA[<p><strong>本文同步刊載在 &lt;<a href="http://uiui.mmdays.com/2008/07/07/human-computation/">UIUI</a>&gt;</strong></p>
<p><strong>Posted by </strong><strong><a onclick="javascript:urchinTracker ('/outbound/article/mmdays.wordpress.com');" href="../tag/mr-monday/" target="_blank"><span style="color: #ff0000;">Mr. Monday</span></a></strong></p>
<p style="text-align: center"><img src="http://www.books.com.tw/exep/lib/image.php?image=http://addons.books.com.tw/G/001/1/0010407091.jpg&amp;width=200&amp;height=280&amp;quality=80" alt="" width="200" height="280" /></p>
<p>這一篇文章是根據之前的一篇文章 &lt;<a href="http://mmdays.com/2007/02/05/game-research/">玩遊戲，做研究</a>&gt; 所改寫而成。本文並可在 &lt;<a href="http://www.books.com.tw/exep/prod/booksfile.php?item=0010407091">密技偷偷報【密】字第肆拾號</a>&gt; 雜誌中看到。</p>
<p><span id="more-6011"></span></p>
<p><img src="http://www.cs.cmu.edu/~biglou/luisvonahn.jpg" alt="" width="126" height="149" align="left" /></p>
<p><span lang="EN-US">2005</span>年，一個帶著眼鏡、身材略微發福的年輕小伙子接過了卡內基梅隆大學（<span lang="EN-US">Carnegie Mellon University</span>）所頒發的博士畢業證書，領取這個畢業證書是必然的，因為他的博士研究使得電腦界開拓出了一個全新的研究領域<span lang="EN-US"> &#8212; </span>人腦運算<span lang="EN-US"> (Human Computation)</span>。這個年輕人的名字是 <span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a></span>，人機介面<span lang="EN-US">(HCI)</span>跟人工智慧<span lang="EN-US">(AI)</span>領域的新星。</p>
<p><a title="dog.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/dog.jpg"></a></p>
<p style="text-align: center"><a title="dog.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/dog.jpg"><img src="http://uiui.mmdays.com/wp-content/uploads/2008/07/dog.jpg" alt="dog.jpg" /></a></p>
<p><span lang="EN-US"><!--[if gte vml 1]><v :shape id="_x0000_i1026" type="#_x0000_t75"  style='width:293.25pt;height:101.25pt'> <v :imagedata src="file:///F:\DOCUME~1\DORORO\LOCALS~1\Temp\msohtml1\01\clip_image003.png" mce_src="file:///F:\DOCUME~1\DORORO\LOCALS~1\Temp\msohtml1\01\clip_image003.png"   o:title="" /> </v>< ![endif]--><!--[if !vml]--><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a> </span>暸解到了電腦智慧的極限，也暸解到電腦如果要模仿人類的思考的話，需要大量的資料來做訓練。比如說，如果我們要讓電腦知道什麼是狗的話，我們就必須拿出一張有狗的照片，然後把狗所在的位置給標示出來；同樣的道理，如果我們需要讓電腦理解什麼是貓的話，我們就必須給電腦貓的圖片；依此類推。然而，我們不可能聘請這麼多人來標記所有的東西，因為這樣子所牽涉到人力跟範圍將是非常地大的，而且聘用的金額將是非常昂貴。試想想，如果付錢給一個工讀生，每小時 <span lang="EN-US">100</span> 塊，請工讀生來幫忙標記圖片，一個小時標記 <span lang="EN-US">100</span> 張圖片，一天 <span lang="EN-US">8</span> 小時，如果需要標記的圖片是數千萬張的範圍，我要請多少工讀生來做這些事情呢<span lang="EN-US">? </span>而且，我又怎麼知道他們有沒有標記錯誤呢<span lang="EN-US">? </span>我又該要花多少錢來做驗證<span lang="EN-US">? </span></p>
<p>對於上述的問題，<span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a> </span>想到了解決的方法。他認為根本不需要付錢，大家就會自動來幫忙做這件事情，只要他們覺得這件事情是好玩的。這讓我想到馬克吐溫的名作<span lang="EN-US"> &lt;</span>湯姆歷險記<span lang="EN-US">&gt; </span>裡的橋段，故事的主人翁湯姆由於被交代要將所有的籬笆上油漆，因此不能跟其他的小朋友一起去玩耍，不過聰明的湯姆想到了好方法，他讓其他的小朋友認為刷油漆是很有趣的一件事情。因此，其他的小朋友不但爭先恐後地來幫湯姆刷油漆之外，還會給湯姆玩具或是糖果，就只是為了能夠刷到油漆。</p>
<p style="text-align: center" align="center"><img src="http://www.espgame.org/instructions.jpg" alt="" width="400" height="450" /><br />
<span lang="EN-US"> (</span>圖片來源<span lang="EN-US">: ESP Game</span>網站<span lang="EN-US">)</span></p>
<p>而 <span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a> </span>借著觀察，發現許多人會在網路上面玩一些小遊戲來打發零星瑣碎的時間，因此他決定著手設計一款遊戲，這款遊戲叫做<span lang="EN-US"> <a href="http://www.gwap.com/gwap/">EPS Game</a><a href="http://www.gwap.com/gwap/"></a></span>。遊戲規則很簡單，玩家一進入遊戲畫面，會看到一張圖，針對這張圖，玩家必須給一個<strong><span style="font-family: 新細明體;">關鍵字</span></strong>，而在網路的彼端，會有一個玩家跟你配對起來，一但你所輸入的關鍵字跟你配對的玩家一樣，那麼你們兩個就獲得分數，雙方進入下一關。當然，如果沒有沒有人跟你玩的話，就會有機器人跟你配對起來。藉由這個遊戲，<span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a> </span>就可以讓大家在玩樂的同時取得大量有意義的配對資料，而這些跟圖片配對的關鍵字，將可以用來訓練電腦來認識圖片的內容物。</p>
<p><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="100" height="100" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="id" value="VideoPlayback" /><param name="src" value="http://video.google.com/googleplayer.swf?docid=-8246463980976635143&amp;hl=zh-TW&amp;fs=true" /><embed id="VideoPlayback" type="application/x-shockwave-flash" width="100" height="100" src="http://video.google.com/googleplayer.swf?docid=-8246463980976635143&amp;hl=zh-TW&amp;fs=true"></embed></object></p>
<p>因為這一款遊戲，也讓<span lang="EN-US"> Google</span> 發覺了這位超級新星，因此在 <span lang="EN-US">2004</span> 年 <span lang="EN-US">12</span> 月邀請他到 <span lang="EN-US">Google </span>演講；其後在他畢業之後，又邀請他到 <span lang="EN-US">Google</span> 給了<a href="http://video.google.com/videoplay?docid=-8246463980976635143&amp;q=luis+von+ahn&amp;pr=goog-sl">另外一個演講</a><span lang="EN-US"> </span>。在文字搜尋的戰場上面，<span lang="EN-US">Google</span> 算是贏家了，然而面對科技的劇烈變動，<strong><span style="font-family: 新細明體;">任何一個公司如果不能持續往下一個科技邁進，都將會被時代所淹沒</span></strong>。因此，對於搜尋而言，下一個最大的戰場，當然就是多媒體，包括了音樂、影片、照片。<span lang="EN-US">Google</span> 會邀請<span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/"> Luis von Ahn</a></span> 不是沒有道理，因為他們也想要利用這樣子的遊戲來建立他們的資料庫。就在 <span lang="EN-US">2006 </span>年 <span lang="EN-US">9</span> 月 <span lang="EN-US">1</span>號，<span lang="EN-US">Google</span> 發表了一款大作，<span lang="EN-US"><a href="http://images.google.com/imagelabeler/">Google Image Labeler</a> </span>而這一款遊戲正是<span lang="EN-US"> EPS Game </span>的模仿之作。</p>
<p style="text-align: center" align="center"><img src="http://www.csiro.au/helix/sciencemail/activities/images/PeekaboomStepTwo.jpg" alt="" width="250" height="194" align="left" /></p>
<p>不過，<a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a><span lang="EN-US"> </span>的創意還未竭盡，在推出如此成功的遊戲之後，<a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a>又馬不停蹄地推出了一個更好玩的曠世鉅作<span lang="EN-US">–<a href="http://www.peekaboom.org/">Peekaboom</a></span>。這款遊戲的趣味性比<span lang="EN-US">EPS</span>高出數倍，保證一玩馬上上癮。遊戲規則則是將 <span lang="EN-US">EPS game </span>的規則做個修改。現在玩家分成<span lang="EN-US">Peek</span>方，以及<span lang="EN-US"> Boom </span>方。兩個被配對起來的玩家，必須共同合作。在一開始的遊戲畫面，<span lang="EN-US">Peek</span> 方會是一片全黑的 畫面，而<span lang="EN-US">Boom</span>方或是一張圖片以及一個單字。<span lang="EN-US">Boom</span>方利用滑鼠將圖片點開，每點擊一下，被點擊的圖片部位在 <span lang="EN-US">Peek </span>方就會暈開。於是<span lang="EN-US">Peek</span>方就可以 利用得到的圖片部分資訊來猜測這張圖片所配對到的單字。一但<span lang="EN-US">Peek</span>方猜中，兩方就會共同得分，然後換下一張圖，然後兩個人腳色互換，原本是<span lang="EN-US">Peek</span>方的 腳色，變成<span lang="EN-US"> Boom</span> 方，而<span lang="EN-US"> Boom</span> 方的腳色變成 <span lang="EN-US">Peek </span>方。這個遊戲就有點像是我猜。因為有時間限制，因此 <span lang="EN-US">Boom</span>方會儘量點擊跟單字相關的部位。此遊戲 不但遊戲趣味度高，研究員也可從遊戲的資料當中來做研究。<strong><span style="font-family: 新細明體;">因為有成千上萬的人，會因為玩這個遊戲來幫他們標記圖片中相關物件的位置</span></strong>。藉由這些標記的位置和大量的資料，就可以做非常有用的分析了。而<strong><span style="font-family: 新細明體;">這個遊戲也非基於之前所設計的遊戲 <span lang="EN-US">ESP 所取得的資料</span>不可</span></strong>，之前說到的遊戲規則，<span lang="EN-US">Boom </span>方會的到一張圖片，以及一個單字。電腦怎麼知道要圖片該用什麼單字來表達<span lang="EN-US">?</span>就是拿<span lang="EN-US">ESP</span>的資料庫的遊戲資料得來的。因此，也可以說，<strong><span style="font-weight: normal; font-family: 新細明體;">這種遊戲也只有 </span></strong><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a><strong><span style="font-weight: normal; font-family: 新細明體;"> 也才能設計出來</span></strong>。普通人誰有數千萬張已經標記過後的圖片<span lang="EN-US">?</span></p>
<p>透過網路以及簡單的人工智慧設計，<a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a><span lang="EN-US"> </span>創造出了一個全新的領域<span lang="EN-US">: </span><strong>人腦運算<span lang="EN-US"> (Human Computing)</span></strong>，讓在網際網路上面的千千萬萬個使用者都能夠貢獻他們的腦力在<span lang="EN-US">”</span>研究<span lang="EN-US">”</span>之上，而這個貢獻是基於自願的。終於，<span lang="EN-US">Luis von Ahn </span>為線上遊戲找到了一個最好的出路，玩遊戲的人不再是花費時間，而是藉由遊戲學習單字；而所標記的圖片，將可以讓科學家獲得寶貴的研究資料，得以教導電腦如何來認識這些圖片。</p>
<p><a title="gwap.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/gwap.jpg"></a></p>
<p style="text-align: center"><a title="gwap.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/gwap.jpg"><img src="http://uiui.mmdays.com/wp-content/uploads/2008/07/gwap.jpg" alt="gwap.jpg" /></a></p>
<p><span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/"><span lang="FR">Luis von Ahn </span></a></span>似乎也有意要將網路遊戲結合研究的目標繼續發揚光大，在他任職於他所畢業的母校之後，他在今年<span lang="EN-US">5</span>月推出了<span lang="EN-US"><a href="http://www.gwap.com/gwap">gwap</a>，一個</span>整合型的遊戲網站。這個網站整合了許多的小遊戲，這些小遊戲都是用來設計來取得人對於某項資料的認知，像是標示圖片或是標示音樂等等。</p>
<p><span lang="EN-US"><!--[if gte vml 1]><v :shape id="_x0000_i1030" type="#_x0000_t75"  alt="" style='width:198pt;height:135pt'> <v :imagedata src="file:///F:\DOCUME~1\DORORO\LOCALS~1\Temp\msohtml1\01\clip_image009.jpg" mce_src="file:///F:\DOCUME~1\DORORO\LOCALS~1\Temp\msohtml1\01\clip_image009.jpg"   o:href="http://photoshoot.csie.org/help/shoot_.jpg" /> </v>< ![endif]--><!--[if !vml]--><!--[endif]--><span> </span></span><a title="photo.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/photo.jpg"></a></p>
<p style="text-align: center"><a title="photo.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/photo.jpg"><img src="http://uiui.mmdays.com/wp-content/uploads/2008/07/photo.jpg" alt="photo.jpg" /></a></p>
<p>因為 <span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/"><span lang="FR">Luis von Ahn </span></a></span>的開創，這樣子取得資料的方式也開始在各個領域中被採納。<a onclick="javascript:urchinTracker ('/outbound/article/www.csie.ntu.edu.tw');" href="http://www.csie.ntu.edu.tw/%7Einm/cindex.html">台灣大學的資訊網路與多媒體研究</a>也連續在 <span lang="EN-US">2006 </span>年以及 <span lang="EN-US">2007</span> 年推出了兩款遊戲，其中一款叫做<span lang="EN-US"><a href="http://photoshoot.csie.org/">PhotoShoot</a> </span>的遊戲是用來蒐集圖片當中大家所感興趣的地方；而另外一款叫做<span lang="EN-US"><a href="http://photoslap.csie.org/"> PhotoSlap</a> </span>的遊戲則是用來標示人臉的遊戲。</p>
<p style="text-align: center" align="center"><a title="re.jpg" href="http://uiui.mmdays.com/wp-content/uploads/2008/07/re.jpg"><img src="http://uiui.mmdays.com/wp-content/uploads/2008/07/re.jpg" alt="re.jpg" /></a></p>
<p>結合網路的人腦運算，將會開始以不同的形式出現，遊戲只是其中一種方式。其他的方式還包括了利用<span lang="EN-US"> RECAPCHA</span>來進行認證的系統。<span lang="EN-US">RECAPCHA</span>也是由<span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn</a></span>所發明，上圖中的波浪字串，其中有一個是從電腦掃描書中的字串而來，當使用者輸入圖中的文字時，就順便幫忙辨識了電腦掃描下來的文字。這些大量蒐集的資料同樣地也可以幫助電腦辨識文字<span lang="EN-US">(OCR)</span>，除此之外，也可以順便驗證電腦所辨認的字串是否正確。藉由每天成千上萬的登錄數據，<span lang="EN-US">RECAPCHA</span>系統又成功的利用了人腦來做運算。</p>
<p>人腦運算<span lang="EN-US"> (Human Computation)</span> 雖然是由 <span lang="EN-US"><a href="http://www.cs.cmu.edu/%7Ebiglou/">Luis von Ahn </a></span>所開創，但是他的想法以及研究的精隨將會在全世界遍地開花，但是無論下一個應用是什麼，都將脫離不暸網路，因為正是因為網路的發達才孕育出了這一個全新的領域。我想，這也是網路發明人當初所想不道的其中一件事吧。</p>
<p>圖片來源<span lang="EN-US">: <a href="http://www.cs.cmu.edu/%7Ebiglou/">http://www.cs.cmu.edu/~biglou/</a></span><br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=09bdfb9d8a356f87c35551f68e7f71e4" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2008%2F07%2F07%2Fhuman-computation%2F+%28Luis+von+Ahn%3A+%E4%BA%BA%E8%85%A6%E9%81%8B%E7%AE%97%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2008/07/07/human-computation/feed/</wfw:commentRss>
		<slash:comments>24</slash:comments>
		</item>
		<item>
		<title>海扁學習與神經網路的同步化</title>
		<link>http://mmdays.com/2008/06/06/hebbian_learning/</link>
		<comments>http://mmdays.com/2008/06/06/hebbian_learning/#comments</comments>
		<pubDate>Thu, 05 Jun 2008 17:48:57 +0000</pubDate>
		<dc:creator>Mr. Thursday</dc:creator>
				<category><![CDATA[Mr. Thursday]]></category>
		<category><![CDATA[Research]]></category>
		<category><![CDATA[大腦]]></category>
		<category><![CDATA[專欄]]></category>
		<category><![CDATA[數學]]></category>
		<category><![CDATA[神經生物]]></category>
		<category><![CDATA[電腦科學]]></category>
		<category><![CDATA[hebb]]></category>
		<category><![CDATA[hebbian learning]]></category>
		<category><![CDATA[Izhikevich]]></category>
		<category><![CDATA[polychronous]]></category>
		<category><![CDATA[STDP]]></category>
		<category><![CDATA[synchronous]]></category>
		<category><![CDATA[Thanos Siapas]]></category>
		<category><![CDATA[人工智慧]]></category>
		<category><![CDATA[神經網路]]></category>

		<guid isPermaLink="false">http://mmdays.com/?p=5947</guid>
		<description><![CDATA[Posted By Mr. Thursday 我們的大腦複雜無比，裡面的神經網路錯綜複雜，也因此讓我們能夠表現智慧的行為。現今一些人工智慧 (AI: Artificial Intelligence) 的問題，或許可以透過參考人腦的神經網路，來設計一個可以處理視覺、聽覺、文字等資訊的人工智慧系統。除此之外，如果還能夠像人類一樣，能夠自我調整、自我學習，儘量減少人類對系統直接的調整，是最好的了。然而人腦的神經網路，又是如何自我學習、自我調整呢？今天就先和各位分享神經網路調整的兩種方法：海扁學習和STDP，並且另外介紹神經網路同步化 (synchronized)和同多步 (polychrnous)的模型，進一步探討可能的神經網路模式，或許對人工智慧自我學習的方法上，也能提供一些參考！ Hebbian Learning Donald O. Hebb (1904 &#8211; 1985) 是一位神經心理學家 (圖1 Donald O. Hebb)，他對神經網路最重要的一個貢獻，就是 Hebbian Learning ，在這邊我就暫且先翻譯成 海扁學習法。甚麼是海扁學習法呢？海扁學習是在學習甚麼東西呢？首先，讓我們先回憶一下，我們的大腦裡面，是由許許多多的神經元 (neuron) 所組成，神經元和神經元之間，有著連結，叫做神經鍵結 (synapse)。神經元和神經鍵結整個形成一個網路，可以讓神經訊號到處傳遞，就稱為一個神經網路 (neural network)。 我們外在的行為，就是因為神經網路接受了刺激，處理之後產生了反應。然而從刺激到反應之間訊號如何被處理、被轉換，讓我們的行為表現出有智慧的樣子呢？這就牽涉到神經元之間的連結了，因為某些神經元之間連結弱一點，某些神經元之間的連結強一點，我們就可以針對不同的刺激，產生不同的反應，進而表現出智慧的行為。如果我們再縮小範圍來看整個網路裡面的某兩個神經元，接著我們就要問，這兩個神經元之間的連結強度，要怎樣子變強變弱呢？Hebb就針對這個部分提出他的假設，後來也經由許多實驗資料證實，成為海扁學習法了。 所謂的海扁學習法，就是說如果兩個神經元常常同時產生動作電位，或是說同時激動 (fire)，這兩個神經元之間的連結就會變強，反之則變弱。原文引述如下： Let us assume that the persistence or repetition of a reverberatory activity (or &#8220;trace&#8221;) tends to induce lasting cellular [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Posted By <span style="color: green;">Mr. Thursday</span></strong></p>
<p>我們的大腦複雜無比，裡面的神經網路錯綜複雜，也因此讓我們能夠表現智慧的行為。現今一些人工智慧 (AI: Artificial Intelligence) 的問題，或許可以透過參考人腦的神經網路，來設計一個可以處理視覺、聽覺、文字等資訊的人工智慧系統。除此之外，如果還能夠像人類一樣，能夠<strong>自我調整</strong>、<strong>自我學習</strong>，儘量減少人類對系統直接的調整，是最好的了。然而人腦的神經網路，又是如何自我學習、自我調整呢？今天就先和各位分享神經網路調整的兩種方法：<strong>海扁學習</strong>和<strong>STDP</strong>，並且另外介紹神經網路<strong>同步化</strong> (synchronized)和<strong>同多步</strong> (polychrnous)的模型，進一步探討可能的神經網路模式，或許對人工智慧自我學習的方法上，也能提供一些參考！</p>
<p style="text-align: center;"><strong>Hebbian Learning</strong></p>
<p>Donald O. Hebb (1904 &#8211; 1985) 是一位神經心理學家 (圖1 <a href="http://www.apa.org/science/psa/0906dsca3.jpg" target="_blank">Donald O. Hebb</a>)，他對<img class="alignright" src="http://www.apa.org/science/psa/0906dsca3.jpg" alt="" width="141" height="180" />神經網路最重要的一個貢獻，就是 <strong>Hebbian Learning</strong> ，在這邊我就暫且先翻譯成 <strong>海扁學習法</strong>。甚麼是海扁學習法呢？海扁學習是在學習甚麼東西呢？首先，讓我們先回憶一下，我們的大腦裡面，是由許許多多的<strong>神經元</strong> (neuron) 所組成，神經元和神經元之間，有著連結，叫做<strong>神經鍵結</strong> (synapse)。神經元和神經鍵結整個形成一個<strong>網路</strong>，可以讓神經訊號到處傳遞，就稱為一個<strong>神經網路</strong> (neural network)。</p>
<p>我們外在的行為，就是因為神經網路接受了<strong>刺激</strong>，處理之後產生了<strong>反應</strong>。然而從刺激到反應之間訊號如何被處理、被轉換，讓我們的行為表現出有智慧的樣子呢？這就牽涉到神經元之間的連結了，因為某些神經元之間連結<strong>弱</strong>一點，某些神經元之間的連結<strong>強</strong>一點，我們就可以針對不同的刺激，產生不同的反應，進而表現出智慧的行為。如果我們再縮小範圍來看整個網路裡面的某兩個神經元，接著我們就要問，這兩個神經元之間的連結強度，要怎樣子變強變弱呢？Hebb就針對這個部分提出他的假設，後來也經由許多實驗資料證實，成為海扁學習法了。</p>
<p><span id="more-5947"></span></p>
<p>所謂的海扁學習法，就是說如果兩個神經元常常同時產生動作電位，或是說同時激動 (fire)，這兩個神經元之間的連結就會變強，反之則變弱。原文引述如下：</p>
<blockquote><dd>Let us assume that the persistence or repetition of a reverberatory activity (or &#8220;trace&#8221;) tends to induce lasting cellular changes that add to its stability.… When an axon of cell <em>A</em> is near enough to excite a cell <em>B</em> and repeatedly or persistently takes part in firing it, some growth process or metabolic change takes place in one or both cells such that <em>A&#8217;</em>s efficiency, as one of the cells firing <em>B</em>, is increased. </dd>
</blockquote>
<p>根據這個學習法，神經元之間的連結，就根據神經元本身的活動 (firing activities)，自行調整連結的強弱，連結的強弱，又回來影響往後神經元接收刺激之後產生的反應，表現在行為上，就產生一種學習的效果。如果舉個例子來說，譬如說「臥冰求鯉」是神經元A，「打雷」是神經元B。臥冰求鯉，和打雷如果常常發生，我們就會把這兩件事情歸類成有某種關聯，即使我們還不知道兩者是甚麼樣子的關聯。</p>
<p style="text-align: center;"><strong>STDP: Spike Timing Dependent Plasticity<img class="alignright" src="http://bmi.epfl.ch/webdav/site/bmi/shared/Images/Faculty/markram1.jpg" alt="" width="120" height="160" /></strong></p>
<p>在Hebb提出海扁學習法之後，1983年之後由 Henry Markram (圖2 <a href="http://bmi.epfl.ch/webdav/site/bmi/shared/Images/Faculty/markram1.jpg" target="_blank">Henry Markram</a>) 從實驗資料中提出一項理論，就是<strong>STDP</strong>了。STDP英文全名是 Spike Timing Dependent Plasticity，也就是根據神經元活動的「<strong>先後順序</strong>」，調整神經元之間連結的強弱。STDP 可以說是海扁學習法的一種延伸，海扁學習法提出如果兩個神經元常常一起活動，之間的連結會變強。STDP進一步提出，兩個神經元之間的活動，如果<strong>其他神經傳遞的訊息在本身產生活動之前</strong>，會<strong>加強</strong>之間的連結強度。如果神經元<strong>本身產生活動之後</strong>，才接受到另外一個神經元來的訊號，則會<strong>減弱</strong>和該神經元連結的強度。</p>
<p>如果延續剛才的例子，如果神經元B本身，用「打雷」來代表。另外一個神經元A用「臥冰求鯉」代表。如果臥冰求鯉之後，突然打雷，我們會說孝心感動天，也就是臥冰求鯉和打雷的連結變強了。如果先打雷，之後才臥冰求鯉，那麼我們可能就不會覺得是孝心感動天了，也就是臥冰求鯉和打雷的連結變弱了。</p>
<p style="text-align: center;"><strong>STDP 影響神經網路的同步性</strong></p>
<p>在 2008年4月的Neuron期刊有一篇paper，是在討論有關<strong>STDP對神經網路同步性的影響</strong>。首先介紹一下神經網路的同步。所謂<strong>同步</strong> (synchronized)，就是指神經網路裡面每個神經元，都同時激動 (fire)，同時安靜，同時激動，同時安靜。所有的神經元就好像是<strong>合為一體</strong>一樣，大家一起激動，大家一起安靜。<strong>同步化</strong> (synchronized)有哪些特點呢？首先，因為全部的神經元，像是只有一個神經元的活動，因此表現的<strong>資訊量變少</strong>了。但是另一方面，因為大家的活動都同步了，因此<strong>活動的強度變強</strong>，在行為上，可以解釋一部分「<strong>注意力</strong>」(attention)的產生來源。<img class="alignright" src="http://biology.caltech.edu/facimages/Siapas" alt="" width="175" height="175" /></p>
<p>STDP對神經網路的同步又有哪些影響呢？在Thanos Siapas (圖3 <a href="http://biology.caltech.edu/facimages/Siapas" target="_blank">Thanos Siapas</a>)的paper裡面，先提出他們在老鼠睡覺的時候，測量了<strong>海馬迴</strong> (hippocampus)區域的神經活動，發現<strong>海馬迴</strong>會產生同步化的神經活動 (burst)。在同個時候，如果神經元之間又有 STDP 的規則來調整連結的強弱，會發生一個調節的現象。這個現象就是說，一個網路如果非常同步，STDP會產生一個擾亂的力量，讓神經網路往非同步變化。相反地，如果神經網路原來沒有同步，STDP會讓神經網路同步化。paper裡面用一些模擬，來確認這件事情。因此STDP讓神經網路<strong>在沒有外界刺激，像是睡覺的時候</strong>，<strong>維持在同步與非同步的臨界點附近</strong>。這個預測也和他們在海馬迴 (hippocampus) 的實驗資料吻合，他們也推測這個機制可能是長期記憶從海馬迴，慢慢移動到大腦皮質 (cortex) 的一個過程。</p>
<p style="text-align: center;"><strong>Polychronous 同多步</strong></p>
<p>在上面那篇paper裡面，模擬simulation的神經網路，用了Izhikevich (圖4 <a href="http://vesicle.nsi.edu/users/izhikevich/Eugene_and_Kate.jpg" target="_blank">Eugene M. Izhikevich</a>)的神經網路模型。一查他的paper，發現<img class="alignright" src="http://vesicle.nsi.edu/users/izhikevich/Eugene_and_Kate.jpg" alt="" width="140" height="100" />2004年Izhikevich提出了同步以外另外一個概念，稱為 <strong>Polychronous</strong>。Polychronous和同步 (synchronous)類似，唯一的差別在於，polychrnous不是全部的神經元一起激動、一起安靜，而是有一個<strong>固定的節奏</strong>，第一秒神經元A激動，第3秒神經元B激動，第8秒神經元C激動，以此類推。也就是說，<strong>神經元依照一個固定的順序活動，形成一個活動模式 (pattern)</strong>。Polychronous怎樣子可以產生呢？Izhikevich在他的神經網路裡面，除了有<strong>神經元</strong>，神經<strong>鍵結的強度</strong>，還加上神經<strong>鍵結的傳遞時間 (delay)</strong>。由於神經元之間訊息傳遞的延遲 (delay)，可以造成polychrnous的效果，感覺也有點把神經網路的問題，變成<strong>圖論</strong>問題的感覺。</p>
<p style="center"><strong>結語</strong></p>
<p><img style="middle" src="http://www.piaggio.ccii.unipi.it/~ferro/Stdp.PNG" alt="" width="266" height="292" /><img style="middle" src="http://www.scholarpedia.org/wiki/images/b/b4/SethModelsOfConsciousness1.gif" alt="" width="250" height="215" /></p>
<p>圖5 <a href="http://www.piaggio.ccii.unipi.it/~ferro/Stdp.PNG" target="_blank">STDP示意圖</a> 圖6 <a href="http://www.piaggio.ccii.unipi.it/~ferro/Stdp.PNG" target="_blank">Polychronous示意圖</a></p>
<p>所以從剛才到現在，我們一一走訪了各種自我學習的理論，包括最早提出的<strong>海扁學習</strong> (Hebbian Learning)，延伸改良版的<strong>STDP</strong> (Spike Timing Dependent Plasticity)，把神經活動的時間點對鍵結學習的影響考慮進去。之後繼續探討了STDP對於神經網路的<strong>同步</strong>的影響，也介紹了另一項新的想法，<strong>polychronous</strong>。這麼多種模型和學習方法，有的是比前一個更加精細的模型，有個則是提供更多學習方式，讓計算神經的研究者可以有更多選擇來模擬人類的神經網路。其實最重要的，是希望能夠粹取神經網路裡面的精髓，可能是一種自我學習的演算法，或是一種會自我調適的網路，希望有一天，可以建造出和人類智力相當的計算機，不管是哪一種應用，對人類的文明進步必定有所幫助！</p>
<p>參考資料</p>
<ul>
<li>(Wikipedia) <a href="http://en.wikipedia.org/wiki/Hebbian_learning" target="_blank">Hebbian Learning</a></li>
<li>(Wikipedia) <a href="http://en.wikipedia.org/wiki/STDP" target="_blank">STDP</a></li>
<li>(Izhikevich) <a href="http://vesicle.nsi.edu/users/izhikevich/publications/spnet.htm" target="_blank">Polychronization: Computation With Spikes</a></li>
<li>(Neuron) <a href="http://www.neuron.org/content/article/abstract?uid=PIIS0896627308001281" target="_blank">Decoupling through Synchrony in Neuronal Circuits with Propagation Delays</a></li>
</ul>
<p><br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=e20ca23d09b7a14f16c322c70e178f9f" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2008%2F06%2F06%2Fhebbian_learning%2F+%28%E6%B5%B7%E6%89%81%E5%AD%B8%E7%BF%92%E8%88%87%E7%A5%9E%E7%B6%93%E7%B6%B2%E8%B7%AF%E7%9A%84%E5%90%8C%E6%AD%A5%E5%8C%96%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2008/06/06/hebbian_learning/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>別把隨機當必然 2</title>
		<link>http://mmdays.com/2008/02/21/randomness-2/</link>
		<comments>http://mmdays.com/2008/02/21/randomness-2/#comments</comments>
		<pubDate>Wed, 20 Feb 2008 23:30:34 +0000</pubDate>
		<dc:creator>Mr. Saturday</dc:creator>
				<category><![CDATA[Mr. Saturday]]></category>
		<category><![CDATA[專欄]]></category>
		<category><![CDATA[觀點]]></category>
		<category><![CDATA[Artificial Intelligence]]></category>
		<category><![CDATA[Chaos]]></category>
		<category><![CDATA[Linear Regression]]></category>
		<category><![CDATA[LTCM]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Occam's Razor]]></category>
		<category><![CDATA[Overfitting]]></category>
		<category><![CDATA[prediction]]></category>
		<category><![CDATA[Quantum Mechanics]]></category>
		<category><![CDATA[Randomness]]></category>
		<category><![CDATA[人工智慧]]></category>
		<category><![CDATA[投資]]></category>
		<category><![CDATA[機器學習]]></category>
		<category><![CDATA[混沌]]></category>
		<category><![CDATA[社會現象]]></category>
		<category><![CDATA[群眾行為]]></category>
		<category><![CDATA[股市]]></category>
		<category><![CDATA[量子力學]]></category>
		<category><![CDATA[隨機]]></category>
		<category><![CDATA[隨機現象]]></category>
		<category><![CDATA[預測]]></category>

		<guid isPermaLink="false">http://mmdays.com/2008/02/21/randomness-2/</guid>
		<description><![CDATA[Posted by Mr. Saturday 前言 MMDays 成立至今也過了一年多的時間，回頭審視自己曾經寫過的文章，如果要我從當中選一篇自己最喜愛的出來，我想「別把隨機當必然」這篇文章毫無疑問會是我的第一名。當時寫完其實有點意猶未盡的感覺，所以我總是一直在找機會想要來個續集，或是把文章再寫得更完整一點，不過懶散加上拖延，不知不覺一年就這樣過去了。今天我終於找到一些時間整理自己過往的文章，所以在下面我把一些新的想法和例子又加入了原本的文章裡面，其實這不應該算是續集，應該說是更新版吧！ 瀑布中的一滴水滴，你知道它最終會流過河川、匯入大海，但是此時此刻，你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置。 這個觀察告訴了我們，我們可以看得見長期的趨勢，但是微觀的下一秒鐘，我們卻怎麼樣也難以窺見其變化，因為需要考慮的因素太多：水的流量、地形的細微變 化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。當因素太多太多，以至於我們無法掌握時，水滴在某一個瞬間的走向對我們來說就是隨機的。我們只知道：不管這個水滴現在怎麼走，最終它會進入大海。這就是我這邊想要淺談的隨機現象。 隨機現象在我們生活中處處可見，而且深深影響我們的生活，很多不同科學領域的尖端研究，現在都是在對付隨機現象。研究物理的人研究到量子的層次，會發現這 個穩固的世界居然是由一些隨機亂跑的粒子所堆砌而成。研究電腦科學的人，會發現隨機方法竟然可以用來設計出簡潔易懂的演算法，研究數學的人，會發現機率模 型竟然可以相當程度上幫助我們做出生活中的決策。那麼隨機現象對於我們現實生活中的啟示又什麼呢？以下我先舉出一個電腦科學界的例子來闡述。 機器學習 (Machine Learning) 這一個有關人工智慧的學門是電腦科學界最近相當熱門的一個研究領域，主要研究的方向和重點是結合演算法和統計資料，擷取出這些資料之內 所隱含的一些資訊，然後用這些擷取出來的資訊讓電腦去對一些事情做預測，以此模擬出類似學習的行為。Machine Learning 在近年來取得了巨大的成功，讓曾經一度委靡不振的人工智慧研究又開創了許多新的契機。市面上的各種搜尋引擎就有應用相當多機器學習的技巧 在裡面，讓這些搜尋引擎好像真的有智慧，去猜測你要搜尋甚麼東西，然後回傳精準的搜尋結果給你。在這個研究領域中，有一個很重要的現象是每個剛剛學習機器 學習的人都會接觸到的：這個現象叫做 Overfitting。要講解這個現象之前，我們先舉一個最簡單的例子來介紹機器學習。 如果你要教電腦去找出一個公式，用來計算出身高與體重的關係，那麼你的第一件事情就是收集很多人身高與體重的資料(data)，然後跑一個線性迴歸分析 (Linear Regression)，在身高與體重的平面上找出一條直線去 match 這些 data，這條直線電腦就拿來當作是計算身高體重的公式：你給了電腦身高，電腦就算出體重給你，反之亦然。這是機器學習最簡單的一個例子。電腦所做的事情不過就是從資料看出身高與體重之間的大略關係。之所以說是大略關係，是因為我 們讓電腦假設身高與體重的關係完全是線性的，所以我們找了一條直線去當作身高和體重的 model：身高越高，體重就越高。但是大家都知道身高和體重不可能 剛好是線性的關係，有些人很高但是體重卻很輕，有些人很矮但是體重卻很重。所以當我們用一條直線來解釋這些資料的時候，實際上我們會有一些誤差存在。但是我們知道，以統計上來講，這個趨勢是對的，身高越高的人通常體重會比較重，所以當我們知道了某個人的身高，然後用這條直線去預測那個人的體重時，大部分的時候我們預測出來的結果不會差太遠。 現在有人覺得直線不是一種預測身高體重很好的 model，所以想要用比較複雜的曲線來 fit 這些 data，結果他找出了一條完美的曲線來解釋這些 data，這條曲線毫無誤差，可以在平面上完全穿過所有資料點。但是這個曲線會出現一個大問題：這條曲線完全沒有辦法拿來預測一個人的體重：你有一個人的 身高，然後拿這條曲線去預測這個人的體重，你會發現大部分的時候算出的體重都是相當離譜。而且這條曲線看起來會彎彎曲曲，完全沒有辦法看出身高與體重大致 上是呈現線性的關係。這種現象就稱為Overfitting，從字面上的意思來看就是：我們對於資料做了過多的解釋。Overfitting 這個現象，在統計學習理論上已經可以用數學來量化，在這邊我們就略過不談。Overfitting 給我們最大的啟示就是，不要對你的資料和你看到的現象做過多的解釋。 研究哲學的人都知道 Occam’s Razor 這個原則：當你對一個現象有許多種解釋時，記得選擇最簡單的那一個。 這個指導原則在機器學習領域是相當重要的一個概念，很多統計學家和經濟學家會建構相當複雜的模型來詮釋他們的資料，試著去預測以後很多事物的走向。舉例來 說 LTCM 想要做的就是這種事情，兩個諾貝爾獎得主搞出了一套模型，可以保證長期下來，他們的投資絕對穩賺不賠，這群經濟學家以為自己掌握了世界每一秒的 趨勢，世界的金錢已經操弄在他們的經濟模型之中，結果最後他們突然倒掉了。為什麼？原因很簡單：因為他們沒有料到蘇聯解體後對於國債的意外處理方式。就這麼一個他們沒有料到的因素(其實當時誰又料得到呢？)，就讓他們的模型整個崩潰了。同樣地，搞出越複雜的模型，你就會發現常常這個模型對於解釋新的現象時是不管用的。 反應在我們的生活之中，炒股票的人和那些老師，整天都在跟你講明天股票是會漲還是會跌，他們在做的事情，就是在跟你講瀑布中的水滴下一秒鐘會流到什 麼地方。你覺得他們猜得準嗎？你還會相信他們嗎？一群自稱是趨勢專家的人在電視上講得口沫橫飛，說出千萬個理由分析給你聽，要你去買什麼什麼股票。在我看來，他們只是用極有限的知識在跟隨機現象對抗。像預測趨勢這種連那些科學家和統計學家都還做不好的事情，你覺得這些老師做得好嗎？一家公司的股價圖對於人類現在有限的認知而言，完全就是隨機的，你不可能準確預測下一秒鐘準確的走向。股市甚至於連長期的趨勢都難以預測，還記得我們的水滴例子嗎？如果你連長期的趨勢都看不清楚，想要微觀地分析更是難上加難。即使這個世界上沒有真正隨機的事情，一切都是命中注定的，以人類現在有限的知識和電腦的運算能力來說，也還是無法完全掌握的。 同樣的，在股票市場上你會常常看到一些靠股市成為百萬或是千萬富翁的人出書大談自己的投資經，說明自己如何致富，講得真是天花亂墜。我現在舉一個簡單的運算給大家看：假設以你現在的資本，在股市連續賭一支股票十次漲跌，十次都成功，你就可以成為百萬富翁，這樣的機率是多少？既然你每次都是閉上眼睛瞎猜，所以每次的成功率都是一半，連續十次成功就大約是千分之一。看起來連續十次成功真的很難，不過換個角度想，如果台灣有兩百萬人同時做這樣的事情呢？你會發現平均來說，會有兩千人在這十次賭博之中成為百萬富翁，如果這兩千人之中有一些人跑來出書或是上節目大談自己的投資經驗呢？沒錯，他們就變成老師了。 隨機現象讓這些人成為百萬富翁，然後這些人以及周遭的人開始用過度解釋和吹捧的方式來大談他們賺錢的成功，最後的結果就是：大家都被隨機現象給唬了。連這些老師自己都相信自己真有一套本領能在股市呼風喚雨。就像是現在發達的無名小站一樣，被過度解釋成台灣資訊界傳奇，甚至連交大的校刊都特地寫了一篇矯情的專文來吹捧無名小站。而我對於無名小站今天的發展只有簡單的解釋：運氣加上不惜犧牲道德品行的經營方式。 [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Posted by </strong><strong><font color="#964b00">Mr. Saturday</font></strong></p>
<p><strong>前言</strong></p>
<blockquote><p>MMDays 成立至今也過了一年多的時間，回頭審視自己曾經寫過的文章，如果要我從當中選一篇自己最喜愛的出來，我想「<a href="http://mmdays.com/2007/02/25/randomness/" target="_blank">別把隨機當必然</a>」這篇文章毫無疑問會是我的第一名。當時寫完其實有點意猶未盡的感覺，所以我總是一直在找機會想要來個續集，或是把文章再寫得更完整一點，不過懶散加上拖延，不知不覺一年就這樣過去了。今天我終於找到一些時間整理自己過往的文章，所以在下面我把一些新的想法和例子又加入了原本的文章裡面，其實這不應該算是續集，應該說是更新版吧！</p></blockquote>
<p><strong>瀑布中的一滴水滴，你知道它最終會流過河川、匯入大海，但是此時此刻，你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置</strong>。 這個觀察告訴了我們，我們可以看得見長期的趨勢，但是微觀的下一秒鐘，我們卻怎麼樣也難以窺見其變化，因為需要考慮的因素太多：水的流量、地形的細微變 化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。當因素太多太多，以至於我們無法掌握時，水滴在某一個瞬間的走向對我們來說就是<strong>隨機</strong>的。我們只知道：<strong>不管這個水滴現在怎麼走，最終它會進入大海</strong>。這就是我這邊想要淺談的<strong>隨機現象</strong>。 隨機現象在我們生活中處處可見，而且深深影響我們的生活，很多不同科學領域的尖端研究，現在都是在對付隨機現象。研究物理的人研究到量子的層次，會發現這 個穩固的世界居然是由一些隨機亂跑的粒子所堆砌而成。研究電腦科學的人，會發現隨機方法竟然可以用來設計出簡潔易懂的演算法，研究數學的人，會發現機率模 型竟然可以相當程度上幫助我們做出生活中的決策。那麼隨機現象對於我們現實生活中的啟示又什麼呢？以下我先舉出一個電腦科學界的例子來闡述。</p>
<p><span id="more-5608"></span><br />
機器學習 (Machine Learning) 這一個有關人工智慧的學門是電腦科學界最近相當熱門的一個研究領域，主要研究的方向和重點是結合演算法和統計資料，擷取出這些資料之內 所隱含的一些資訊，然後用這些擷取出來的資訊讓電腦去對一些事情做預測，以此模擬出類似學習的行為。Machine Learning 在近年來取得了巨大的成功，讓曾經一度委靡不振的人工智慧研究又開創了許多新的契機。市面上的各種搜尋引擎就有應用相當多機器學習的技巧 在裡面，讓這些搜尋引擎好像真的有智慧，去猜測你要搜尋甚麼東西，然後回傳精準的搜尋結果給你。在這個研究領域中，有一個很重要的現象是每個剛剛學習機器 學習的人都會接觸到的：這個現象叫做 Overfitting。要講解這個現象之前，我們先舉一個最簡單的例子來介紹機器學習。</p>
<p>如果你要教電腦去找出一個公式，用來計算出身高與體重的關係，那麼你的第一件事情就是收集很多人身高與體重的資料(data)，然後跑一個線性迴歸分析 (Linear Regression)，在身高與體重的平面上找出一條直線去 match 這些 data，這條直線電腦就拿來當作是計算身高體重的公式：你給了電腦身高，電腦就算出體重給你，反之亦然。這是機器學習最簡單的一個例子。電腦所做的事情不過就是從資料看出身高與體重之間的大略關係。之所以說是大略關係，是因為我 們讓電腦假設身高與體重的關係完全是線性的，所以我們找了一條直線去當作身高和體重的 model：身高越高，體重就越高。但是大家都知道身高和體重不可能 剛好是線性的關係，有些人很高但是體重卻很輕，有些人很矮但是體重卻很重。所以當我們用一條直線來解釋這些資料的時候，實際上我們會有一些誤差存在。但是我們知道，以<strong>統計上來講</strong>，這個趨勢是對的，身高越高的人通常體重會比較重，所以當我們知道了某個人的身高，然後用這條直線去預測那個人的體重時，大部分的時候我們預測出來的結果不會差太遠。</p>
<p>現在有人覺得直線不是一種預測身高體重很好的 model，所以想要用比較複雜的曲線來 fit 這些 data，結果他找出了一條完美的曲線來解釋這些 data，這條曲線毫無誤差，可以在平面上完全穿過所有資料點。但是這個曲線會出現一個大問題：這條曲線完全沒有辦法拿來預測一個人的體重：你有一個人的 身高，然後拿這條曲線去預測這個人的體重，你會發現大部分的時候算出的體重都是相當離譜。而且這條曲線看起來會彎彎曲曲，完全沒有辦法看出身高與體重大致 上是呈現線性的關係。這種現象就稱為Overfitting，從字面上的意思來看就是：<strong>我們對於資料做了過多的解釋</strong>。Overfitting 這個現象，在統計學習理論上已經可以用數學來量化，在這邊我們就略過不談。Overfitting 給我們最大的啟示就是，<strong>不要對你的資料和你看到的現象做過多的解釋</strong>。</p>
<p>研究哲學的人都知道 Occam’s Razor 這個原則：<strong>當你對一個現象有許多種解釋時，記得選擇最簡單的那一個</strong>。 這個指導原則在機器學習領域是相當重要的一個概念，很多統計學家和經濟學家會建構相當複雜的模型來詮釋他們的資料，試著去預測以後很多事物的走向。舉例來 說 LTCM 想要做的就是這種事情，兩個諾貝爾獎得主搞出了一套模型，可以保證長期下來，他們的投資絕對穩賺不賠，這群經濟學家以為自己掌握了世界每一秒的 趨勢，世界的金錢已經操弄在他們的經濟模型之中，結果最後他們突然倒掉了。為什麼？原因很簡單：因為他們沒有料到蘇聯解體後對於國債的意外處理方式。就這麼一個他們沒有料到的因素(其實當時誰又料得到呢？)，就讓他們的模型整個崩潰了。同樣地，搞出越複雜的模型，你就會發現常常這個模型對於解釋新的現象時是不管用的。</p>
<p>反應在我們的生活之中，炒股票的人和那些老師，整天都在跟你講明天股票是會漲還是會跌，他們在做的事情，就是在跟你講瀑布中的水滴下一秒鐘會流到什 麼地方。你覺得他們猜得準嗎？你還會相信他們嗎？一群自稱是趨勢專家的人在電視上講得口沫橫飛，說出千萬個理由分析給你聽，要你去買什麼什麼股票。在我看來，他們只是用極有限的知識在跟隨機現象對抗。像預測趨勢這種連那些科學家和統計學家都還做不好的事情，你覺得這些老師做得好嗎？一家公司的股價圖對於人類現在有限的認知而言，完全就是隨機的，你不可能準確預測下一秒鐘準確的走向。股市甚至於連長期的趨勢都難以預測，還記得我們的水滴例子嗎？如果你連長期的趨勢都看不清楚，想要微觀地分析更是難上加難。即使這個世界上沒有真正隨機的事情，一切都是命中注定的，以人類現在有限的知識和電腦的運算能力來說，也還是無法完全掌握的。</p>
<p>同樣的，在股票市場上你會常常看到一些靠股市成為百萬或是千萬富翁的人出書大談自己的投資經，說明自己如何致富，講得真是天花亂墜。我現在舉一個簡單的運算給大家看：假設以你現在的資本，在股市連續賭一支股票十次漲跌，十次都成功，你就可以成為百萬富翁，這樣的機率是多少？既然你每次都是閉上眼睛瞎猜，所以每次的成功率都是一半，連續十次成功就大約是千分之一。看起來連續十次成功真的很難，不過換個角度想，如果台灣有兩百萬人同時做這樣的事情呢？你會發現平均來說，會有兩千人在這十次賭博之中成為百萬富翁，如果這兩千人之中有一些人跑來出書或是上節目大談自己的投資經驗呢？沒錯，他們就變成老師了。 隨機現象讓這些人成為百萬富翁，然後這些人以及周遭的人開始用過度解釋和吹捧的方式來大談他們賺錢的成功，最後的結果就是：大家都被隨機現象給唬了。連這些老師自己都相信自己真有一套本領能在股市呼風喚雨。就像是現在發達的無名小站一樣，被過度解釋成台灣資訊界傳奇，甚至連交大的校刊都特地寫了一篇矯情的專文來吹捧無名小站。而我對於無名小站今天的發展只有簡單的解釋：運氣加上不惜犧牲道德品行的經營方式。</p>
<p>曾經有一些學者找來一群猩猩做實驗，這些學者把華爾街日報的股票版釘在牆上，讓這些猩猩對那些股票名稱射飛鏢，當作是猩猩建議他們買的股票。<span>結果矇著眼睛的猩猩，朝報紙股票版擲飛鏢所射中的股票，並不比投資專家們的選股遜色。看到這個實驗結果，你作何感想呢？</span></p>
<p>社會學在近年來，似乎也與隨機現象扯上了一些關係。我們都必須承認，任何一個人都是一個難以預測的隨機個體，我們無法看著一個人，說出他下一分鐘會做出些什麼。但是一群人下一分鐘會做出些什麼，或是之後會做出些什麼，居然是有模式可循的！Thomas Schelling 是美國馬里蘭大學的教授，是 2005 年諾貝爾經濟獎得主，他曾經針對種族隔離和種族歧視的關係做出研究，得出的結果令他非常驚訝。一般人直覺地會認為種族隔離的現象，肯定是由種族歧視所造成的，所以白人才會跟白人住在一起，黑人才會跟黑人住在一起。</p>
<p>但是 Thomas 做了一個實驗，他用電腦模擬了一個棋盤，上面隨機擺滿了黑子以及白子，就是分別代表黑人以及白人，一開始大家是隨便住，黑人與白人混雜，但是 Thomas 加入了一個條件之後，情況完全改觀。<strong>他假設每一個人都不希望成為附近的少數民族</strong>，也就是說當一個白子發現周遭大部分都是黑子的時候，他就會搬家，直到附近大部分都是白子，黑子也是遵循一樣的規則。然後 Thomas 就讓這些黑子白子自己去演化、搬家，結果最後當大家都停止搬家之後，就形成了白子和黑子群聚的現象。</p>
<p>這顯然跟種族歧視沒什麼關係，只是人們單純地對於鄰居的小小喜好，但沒想到就造成這樣一個種族隔離的結果。這就是 Thomas 提出的 Dynamic Models of Segregation。社會學上的現象，也因此與物理現象有著令人驚訝的巧合，雖然我們把人們看成一個一個隨機的粒子，但是這些粒子群聚在一起時，卻展現出有跡可尋的模式。</p>
<p>講了以上這麼多例子，並不是要告訴大家這個世界是隨機的，所以我們做出再多努力也是枉然。人類真正可貴的地方，就在於對這些不確定性所做出的努力， 能夠讓人類的智識更推進一步，讓我們更加了解這個世界。談隨機現象只是要提醒大家，很多我們想盡辦法解釋的現象，其實往往都是隨機的結果，這是這個世界運 作的機率，確確實實存在，支撐著量子力學，也支撐著我們的現實生活。我們應該做的，是去看整體的趨勢，而不是對於一個短期的現象，鑽牛角尖地想盡辦法去解 剖它。解剖的結果就會讓你像量子物理學家一樣，困惑地發現井然有序的世界，竟然是由一些到處亂跑的粒子組成。長期的趨勢是可以透過努力研究在一定程度上達 到預測的效果，短期趨勢是誰也說不準。</p>
<p>我一直有種感覺：微觀的隨機似乎是造物者阻止我們探究真理的一種方式，但巨觀的秩序井然卻又是造物者透露給我們的訊息，讓我們在這條路上不至於像是在迷霧中前進。隨機現象本身是一個相當深奧的議題，談到最後往往都會淪為「上帝究竟丟不丟骰子？」的哲學議題，人類也許永遠都無法了解這個世界是不是一切都命中注定，抑或是人總是可以隨時透過外在力量改變一些事物的隨機世界。無論是怎麼樣，努力之後得來的果實永遠都是甜美的。只是要記住，別被一些人解釋隨機現象的嘴砲所唬了，好像這些隨機現象真的像他們講的那樣完全可以預測。</p>
<p align="center"><strong>別把隨機當必然</strong>。</p>
<p><br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=acea0a6773ae661eb635f3dbb52fa52e" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2008%2F02%2F21%2Frandomness-2%2F+%28%E5%88%A5%E6%8A%8A%E9%9A%A8%E6%A9%9F%E7%95%B6%E5%BF%85%E7%84%B6+2%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2008/02/21/randomness-2/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>別把隨機當必然 &#8211; Don&#8217;t Be Fooled By Randomness</title>
		<link>http://mmdays.com/2007/02/25/randomness/</link>
		<comments>http://mmdays.com/2007/02/25/randomness/#comments</comments>
		<pubDate>Sun, 25 Feb 2007 08:08:26 +0000</pubDate>
		<dc:creator>Mr. Saturday</dc:creator>
				<category><![CDATA[Mr. Saturday]]></category>
		<category><![CDATA[專欄]]></category>
		<category><![CDATA[觀點]]></category>
		<category><![CDATA[Artificial Intelligence]]></category>
		<category><![CDATA[Chaos]]></category>
		<category><![CDATA[Linear Regression]]></category>
		<category><![CDATA[LTCM]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Occam's Razor]]></category>
		<category><![CDATA[Overfitting]]></category>
		<category><![CDATA[prediction]]></category>
		<category><![CDATA[Quantum Mechanics]]></category>
		<category><![CDATA[Randomness]]></category>
		<category><![CDATA[人工智慧]]></category>
		<category><![CDATA[投資]]></category>
		<category><![CDATA[機器學習]]></category>
		<category><![CDATA[混沌]]></category>
		<category><![CDATA[股市]]></category>
		<category><![CDATA[量子力學]]></category>
		<category><![CDATA[隨機]]></category>
		<category><![CDATA[隨機現象]]></category>
		<category><![CDATA[預測]]></category>

		<guid isPermaLink="false">http://mmdays.com/2007/02/25/randomness/</guid>
		<description><![CDATA[Posted by Mr. Saturday 瀑布中的一滴水滴，你知道它最終會流過河川、匯入大海，但是此時此刻，你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置。這個觀察告訴了我們，我們可以看得見長期的趨勢，但是微觀的下一秒鐘，我們卻怎麼樣也難以窺見其變化，因為需要考慮的因素太多：水的流量、地形的細微變化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。當因素太多太多，以至於我們無法掌握時，水滴在某一個瞬間的走向對我們來說就是隨機的。我們只知道：不管這個水滴現在怎麼走，最終它會進入大海。這就是Mr. Saturday這邊想要淺談的隨機現象。隨機現象在我們生活中處處可見，而且深深影響我們的生活，很多不同科學領域的尖端研究，現在都是在對付隨機現象。研究物理的人研究到量子的層次，會發現這個穩固的世界居然是由一些隨機亂跑的粒子所堆砌而成。研究電腦科學的人，會發現隨機方法竟然可以用來設計出簡潔易懂的演算法，研究數學的人，會發現機率模型竟然可以相當程度上幫助我們做出生活中的決策。那麼隨機現象對於我們現實生活中的啟示又什麼呢？以下Mr. Saturday先舉出一個電腦科學界的例子來闡述。 機器學習(Machine Learning)這一個有關人工智慧的學門是電腦科學界最近相當熱門的一個研究領域，主要研究的方向和重點是結合演算法和統計資料，擷取出這些資料之內所隱含的一些資訊，然後用這些擷取出來的資訊讓電腦去對一些事情做預測，以此模擬出類似學習的行為。Machine Learning在近年來取得了巨大的成功，讓曾經一度委靡不振的人工智慧研究又開創了許多新的契機。市面上的各種搜尋引擎就有應用相當多機器學習的技巧在裡面，讓這些搜尋引擎好像真的有智慧，去猜測你要搜尋甚麼東西，然後回傳精準的搜尋結果給你。在這個研究領域中，有一個很重要的現象是每個剛剛學習機器學習的人都會接觸到的：這個現象叫做Overfitting。要講解這個現象之前，我們先舉一個最簡單的例子來介紹機器學習。 如果你要教電腦去找出一個公式，用來計算出身高與體重的關係，那麼你的第一件事情就是收集很多人身高與體重的資料(data)，然後跑一個線性迴歸分析(Linear Regression)，在身高與體重的平面上找出一條直線去match這些data，這條直線電腦就拿來當作是計算身高體重的公式：你給了電腦身高，電腦就算出體重給你，反之亦然。這是機器學習最簡單的一個例子。電腦所做的事情不過就是從資料看出身高與體重之間的大略關係。之所以說是大略關係，是因為我們讓電腦假設身高與體重的關係完全是線性的，所以我們找了一條直線去當作身高和體重的model：身高越高，體重就越高。但是大家都知道身高和體重不可能剛好是線性的關係，有些人很高但是體重卻很輕，有些人很矮但是體重卻很重。所以當我們用一條直線來解釋這些資料的時候，實際上我們會有一些誤差存在。但是我們知道，以統計上來講，這個趨勢是對的，身高越高的人通常體重會比較重，所以當我們知道了某個人的身高，然後用這條直線去預測那個人的體重時，大部分的時候我們預測出來的結果不會差太遠。 現在有人覺得直線不是一種預測身高體重很好的model，所以想要用比較複雜的曲線來fit這些data，結果他找出了一條完美的曲線來解釋這些data，這條曲線毫無誤差，可以在平面上完全穿過所有資料點。但是這個曲線會出現一個大問題：這條曲線完全沒有辦法拿來預測一個人的體重：你有一個人的身高，然後拿這條曲線去預測這個人的體重，你會發現大部分的時候算出的體重都是相當離譜。而且這條曲線看起來會彎彎曲曲，完全沒有辦法看出身高與體重大致上是呈現線性的關係。這種現象就稱為Overfitting，從字面上的意思來看就是：我們對於資料做了過多的解釋。Overfitting這個現象，在統計學習理論上已經可以用數學來量化，在這邊我們就略過不談。Overfitting給我們最大的啟示就是，不要對你的資料和你看到的現象做過多的解釋。 研究哲學的人都知道Occam&#8217;s Razor這個原則：當你對一個現象有許多種解釋時，記得選擇最簡單的那一個。這個指導原則在機器學習領域是相當重要的一個概念，很多統計學家和經濟學家會建構相當複雜的模型來詮釋他們的資料，試著去預測以後很多事物的走向。舉例來說LTCM想要做的就是這種事情，兩個諾貝爾獎得主搞出了一套模型，可以保證長期下來，他們的投資絕對穩賺不賠，這群經濟學家以為自己掌握了世界每一秒的趨勢，世界的金錢已經操弄在他們的經濟模型之中，結果最後他們突然倒掉了。為什麼？原因很簡單：因為他們沒有料到蘇聯會忽然解體解體後對於國債的意外處理方式。就這麼一個他們沒有料到的因素(其實當時誰又料得到呢？)，就讓他們的模型整個崩潰了。同樣地，搞出越複雜的模型，你就會發現常常這個模型對於解釋新的現象時是不管用的。 反應在我們的生活之中，炒股票的人和那些老師，整天都在跟你講明天股票是會漲還是會跌，他們在做的事情，就是在跟你講瀑布中的水滴下一秒鐘會流到什麼地方。你覺得他們猜得準嗎？你還會相信他們嗎？一群自稱是趨勢專家的人在電視上講得口沫橫飛，說出千萬個理由分析給你聽，要你去買什麼什麼股票。在我看來，他們只是用極有限的知識在跟隨機現象對抗。像預測趨勢這種連那些科學家和統計學家都還做不好的事情，你覺得這些老師做得好嗎？一家公司的股價圖對於人類現在有限的認知而言，完全就是隨機的，你不可能準確預測下一秒鐘準確的走向。股市甚至於連長期的趨勢都難以預測，還記得我們的水滴例子嗎？如果你連長期的趨勢都看不清楚，想要微觀地分析更是難上加難。即使這個世界上沒有真正隨機的事情，一切都是命中注定的，以人類現在有限的知識和電腦的運算能力來說，也還是無法完全掌握的。 同樣的，在股票市場上你會常常看到一些靠股市成為百萬或是千萬富翁的人出書大談自己的投資經，說明自己如何致富，講得真是天花亂墜。我現在舉一個簡單的運算給大家看：假設以你現在的資本，在股市連續賭一支股票十次漲跌，十次都成功，你就可以成為百萬富翁，這樣的機率是多少？既然你每次都是閉上眼睛瞎猜，所以每次的成功率都是一半，連續十次成功就大約是千分之一。看起來連續十次成功真的很難，不過換個角度想，如果台灣有兩百萬人同時做這樣的事情呢？你會發現平均來說，會有兩千人在這十次賭博之中成為百萬富翁，如果這兩千人之中有一些人跑來出書或是上節目大談自己的投資經驗呢？沒錯，他們就變成老師了。隨機現象讓這些人成為百萬富翁，然後這些人以及週遭的人開始用過度解釋和吹捧的方式來大談他們賺錢的成功，最後的結果就是：大家都被隨機現象給唬了。連這些老師自己都相信自己真有一套本領能在股市呼風喚雨。就像是現在發達的無名小站一樣，被過度解釋成台灣資訊界傳奇，甚至連交大的校刊都特地寫了一篇矯情的專文來吹捧無名小站。而我對於無名小站今天的發展只有一個的解釋：運氣。 曾經有一些學者找來一群猩猩做實驗，這些學者把華爾街日報的股票版釘在牆上，讓這些猩猩對那些股票名稱射飛鏢，當作是猩猩建議他們買的股票。結果矇著眼睛的猩猩，朝報紙股票版擲飛鏢所射中的股票，並不比投資專家們的選股遜色。看到這個實驗結果，你作何感想呢？ 講了以上這麼多例子，並不是要告訴大家這個世界是隨機的，所以我們做出再多努力也是枉然。人類真正可貴的地方，就在於對這些不確定性所做出的努力，能夠讓人類的智識更推進一步，讓我們更加了解這個世界。談隨機現象只是要提醒大家，很多我們想盡辦法解釋的現象，其實往往都是隨機的結果，這是這個世界運作的機率，確確實實存在，支撐著量子力學，也支撐著我們的現實生活。我們應該做的，是去看整體的趨勢，而不是對於一個短期的現象，鑽牛角尖地想盡辦法去解剖它。解剖的結果就會讓你像量子物理學家一樣，困惑地發現井然有序的世界，竟然是由一些到處亂跑的粒子組成。長期的趨勢是可以透過努力研究在一定程度上達到預測的效果，短期趨勢是誰也說不準。 隨機現象本身是一個相當深奧的議題，談到最後往往都會淪為「上帝究竟丟不丟骰子？」的哲學議題， 人類也許永遠都無法了解這個世界是不是一切都命中注定，抑或是人總是可以隨時透過外在力量改變一些事物的隨機世界。無論是怎麼樣，努力之後得來的果實永遠都是甜美的。只是要記住，別被一些人解釋隨機現象的嘴砲所唬了，好像這些隨機現象真的像他們講的那樣完全可以預測。 別把隨機當必然。 加入MMDays在facebook的粉絲團 隨時閱讀最新文章]]></description>
			<content:encoded><![CDATA[<p><strong>Posted by <font color="#8a3324">Mr. Saturday</font></strong></p>
<p><strong>瀑布中的一滴水滴，你知道它最終會流過河川、匯入大海，但是此時此刻，你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置</strong>。這個觀察告訴了我們，我們可以看得見長期的趨勢，但是微觀的下一秒鐘，我們卻怎麼樣也難以窺見其變化，因為需要考慮的因素太多：水的流量、地形的細微變化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。當因素太多太多，以至於我們無法掌握時，水滴在某一個瞬間的走向對我們來說就是<strong>隨機</strong>的。我們只知道：<strong>不管這個水滴現在怎麼走，最終它會進入大海</strong>。這就是Mr. Saturday這邊想要淺談的<strong>隨機現象</strong>。隨機現象在我們生活中處處可見，而且深深影響我們的生活，很多不同科學領域的尖端研究，現在都是在對付隨機現象。研究物理的人研究到量子的層次，會發現這個穩固的世界居然是由一些隨機亂跑的粒子所堆砌而成。研究電腦科學的人，會發現隨機方法竟然可以用來設計出簡潔易懂的演算法，研究數學的人，會發現機率模型竟然可以相當程度上幫助我們做出生活中的決策。那麼隨機現象對於我們現實生活中的啟示又什麼呢？以下Mr. Saturday先舉出一個電腦科學界的例子來闡述。</p>
<p>機器學習(Machine Learning)這一個有關人工智慧的學門是電腦科學界最近相當熱門的一個研究領域，主要研究的方向和重點是結合演算法和統計資料，擷取出這些資料之內所隱含的一些資訊，然後用這些擷取出來的資訊讓電腦去對一些事情做預測，以此模擬出類似學習的行為。Machine Learning在近年來取得了巨大的成功，讓曾經一度委靡不振的人工智慧研究又開創了許多新的契機。市面上的各種搜尋引擎就有應用相當多機器學習的技巧在裡面，讓這些搜尋引擎好像真的有智慧，去猜測你要搜尋甚麼東西，然後回傳精準的搜尋結果給你。在這個研究領域中，有一個很重要的現象是每個剛剛學習機器學習的人都會接觸到的：這個現象叫做Overfitting。要講解這個現象之前，我們先舉一個最簡單的例子來介紹機器學習。</p>
<p>如果你要教電腦去找出一個公式，用來計算出身高與體重的關係，那麼你的第一件事情就是收集很多人身高與體重的資料(data)，然後跑一個線性迴歸分析(Linear Regression)，在身高與體重的平面上找出一條直線去match這些data，這條直線電腦就拿來當作是計算身高體重的公式：你給了電腦身高，電腦就算出體重給你，反之亦然。這是機器學習最簡單的一個例子。電腦所做的事情不過就是從資料看出身高與體重之間的大略關係。之所以說是大略關係，是因為我們讓電腦假設身高與體重的關係完全是線性的，所以我們找了一條直線去當作身高和體重的model：身高越高，體重就越高。但是大家都知道身高和體重不可能剛好是線性的關係，有些人很高但是體重卻很輕，有些人很矮但是體重卻很重。所以當我們用一條直線來解釋這些資料的時候，實際上我們會有一些誤差存在。但是我們知道，以<strong>統計上來講</strong>，這個趨勢是對的，身高越高的人通常體重會比較重，所以當我們知道了某個人的身高，然後用這條直線去預測那個人的體重時，大部分的時候我們預測出來的結果不會差太遠。</p>
<p>現在有人覺得直線不是一種預測身高體重很好的model，所以想要用比較複雜的曲線來fit這些data，結果他找出了一條完美的曲線來解釋這些data，這條曲線毫無誤差，可以在平面上完全穿過所有資料點。但是這個曲線會出現一個大問題：這條曲線完全沒有辦法拿來預測一個人的體重：你有一個人的身高，然後拿這條曲線去預測這個人的體重，你會發現大部分的時候算出的體重都是相當離譜。而且這條曲線看起來會彎彎曲曲，完全沒有辦法看出身高與體重大致上是呈現線性的關係。這種現象就稱為Overfitting，從字面上的意思來看就是：<strong>我們對於資料做了過多的解釋</strong>。Overfitting這個現象，在統計學習理論上已經可以用數學來量化，在這邊我們就略過不談。Overfitting給我們最大的啟示就是，<strong>不要對你的資料和你看到的現象做過多的解釋</strong>。</p>
<p>研究哲學的人都知道Occam&#8217;s Razor這個原則：<strong>當你對一個現象有許多種解釋時，記得選擇最簡單的那一個</strong>。這個指導原則在機器學習領域是相當重要的一個概念，很多統計學家和經濟學家會建構相當複雜的模型來詮釋他們的資料，試著去預測以後很多事物的走向。舉例來說LTCM想要做的就是這種事情，兩個諾貝爾獎得主搞出了一套模型，可以保證長期下來，他們的投資絕對穩賺不賠，這群經濟學家以為自己掌握了世界每一秒的趨勢，世界的金錢已經操弄在他們的經濟模型之中，結果最後他們突然倒掉了。為什麼？原因很簡單：因為他們沒有料到蘇聯<strike><font color="#c0c0c0">會忽然解體</font></strike>解體後對於國債的意外處理方式。就這麼一個他們沒有料到的因素(其實當時誰又料得到呢？)，就讓他們的模型整個崩潰了。同樣地，搞出越複雜的模型，你就會發現常常這個模型對於解釋新的現象時是不管用的。</p>
<p>反應在我們的生活之中，炒股票的人和那些老師，整天都在跟你講明天股票是會漲還是會跌，他們在做的事情，就是在跟你講瀑布中的水滴下一秒鐘會流到什麼地方。你覺得他們猜得準嗎？你還會相信他們嗎？一群自稱是趨勢專家的人在電視上講得口沫橫飛，說出千萬個理由分析給你聽，要你去買什麼什麼股票。在我看來，他們只是用極有限的知識在跟隨機現象對抗。像預測趨勢這種連那些科學家和統計學家都還做不好的事情，你覺得這些老師做得好嗎？一家公司的股價圖對於人類現在有限的認知而言，完全就是隨機的，你不可能準確預測下一秒鐘準確的走向。股市甚至於連長期的趨勢都難以預測，還記得我們的水滴例子嗎？如果你連長期的趨勢都看不清楚，想要微觀地分析更是難上加難。即使這個世界上沒有真正隨機的事情，一切都是命中注定的，以人類現在有限的知識和電腦的運算能力來說，也還是無法完全掌握的。</p>
<p>同樣的，在股票市場上你會常常看到一些靠股市成為百萬或是千萬富翁的人出書大談自己的投資經，說明自己如何致富，講得真是天花亂墜。我現在舉一個簡單的運算給大家看：假設以你現在的資本，在股市連續賭一支股票十次漲跌，十次都成功，你就可以成為百萬富翁，這樣的機率是多少？既然你每次都是閉上眼睛瞎猜，所以每次的成功率都是一半，連續十次成功就大約是千分之一。看起來連續十次成功真的很難，不過換個角度想，如果台灣有兩百萬人同時做這樣的事情呢？你會發現平均來說，會有兩千人在這十次賭博之中成為百萬富翁，如果這兩千人之中有一些人跑來出書或是上節目大談自己的投資經驗呢？沒錯，他們就變成老師了。隨機現象讓這些人成為百萬富翁，然後這些人以及週遭的人開始用過度解釋和吹捧的方式來大談他們賺錢的成功，最後的結果就是：大家都被隨機現象給唬了。連這些老師自己都相信自己真有一套本領能在股市呼風喚雨。就像是現在發達的無名小站一樣，被過度解釋成台灣資訊界傳奇，甚至連交大的校刊都特地寫了一篇矯情的專文來吹捧無名小站。而我對於無名小站今天的發展只有一個的解釋：運氣。</p>
<p>曾經有一些學者找來一群猩猩做實驗，這些學者把華爾街日報的股票版釘在牆上，讓這些猩猩對那些股票名稱射飛鏢，當作是猩猩建議他們買的股票。<span>結果矇著眼睛的猩猩，朝報紙股票版擲飛鏢所射中的股票，並不比投資專家們的選股遜色。看到這個實驗結果，你作何感想呢？</span></p>
<p>講了以上這麼多例子，並不是要告訴大家這個世界是隨機的，所以我們做出再多努力也是枉然。人類真正可貴的地方，就在於對這些不確定性所做出的努力，能夠讓人類的智識更推進一步，讓我們更加了解這個世界。談隨機現象只是要提醒大家，很多我們想盡辦法解釋的現象，其實往往都是隨機的結果，這是這個世界運作的機率，確確實實存在，支撐著量子力學，也支撐著我們的現實生活。我們應該做的，是去看整體的趨勢，而不是對於一個短期的現象，鑽牛角尖地想盡辦法去解剖它。解剖的結果就會讓你像量子物理學家一樣，困惑地發現井然有序的世界，竟然是由一些到處亂跑的粒子組成。長期的趨勢是可以透過努力研究在一定程度上達到預測的效果，短期趨勢是誰也說不準。</p>
<p>隨機現象本身是一個相當深奧的議題，談到最後往往都會淪為「上帝究竟丟不丟骰子？」的哲學議題， 人類也許永遠都無法了解這個世界是不是一切都命中注定，抑或是人總是可以隨時透過外在力量改變一些事物的隨機世界。無論是怎麼樣，努力之後得來的果實永遠都是甜美的。只是要記住，別被一些人解釋隨機現象的嘴砲所唬了，好像這些隨機現象真的像他們講的那樣完全可以預測。</p>
<p align="center"><strong>別把隨機當必然</strong>。</p>
<p><br/>
<div>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td><a href="http://plurktop.mmdays.com/replurkdetail/?link=6fd1d040453ce0f44da844257b986c6e" title="看看其他人討論內容" target="_blank"><img src="http://plurktop.mmdays.com/images/replurk_1.png" style="border:0"></a></td>
</tr>
<tr>
<td><a href="http://plurk.com/?qulaifier=shares&#038;status=http%3A%2F%2Fmmdays.com%2F2007%2F02%2F25%2Frandomness%2F+%28%E5%88%A5%E6%8A%8A%E9%9A%A8%E6%A9%9F%E7%95%B6%E5%BF%85%E7%84%B6+%26%238211%3B+Don%26%238217%3Bt+Be+Fooled+By+Randomness%29+-+%E8%BD%89%E5%99%97%E6%8E%92%E8%A1%8C%E6%A6%9C+http%3A%2F%2Fplurktop.mmdays.com%2Freplurk" title="推到噗浪" target="_blank"><img style="border:0" src="http://plurktop.mmdays.com/images/replurk_2.png" /></a></td>
</tr>
</table>
</div>
<p><br/><a href="http://www.facebook.com/MMDays" target="_blank">加入MMDays在facebook的粉絲團 隨時閱讀最新文章</a><br/></p>
]]></content:encoded>
			<wfw:commentRss>http://mmdays.com/2007/02/25/randomness/feed/</wfw:commentRss>
		<slash:comments>25</slash:comments>
		</item>
	</channel>
</rss>

