<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: 漫畫自動產生器</title>
	<atom:link href="http://mmdays.com/2008/08/04/comics-generator/feed/" rel="self" type="application/rss+xml" />
	<link>http://mmdays.com/2008/08/04/comics-generator/</link>
	<description>網路, 產業, 資訊, 觀察, 生活, 電影, 技術, 新知, 科技, 媒體, 趨勢, Web 2.0</description>
	<lastBuildDate>Thu, 09 Feb 2012 18:32:00 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
	<item>
		<title>By: Mr. Wednesday</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-18760</link>
		<dc:creator>Mr. Wednesday</dc:creator>
		<pubDate>Fri, 08 Aug 2008 07:43:26 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-18760</guid>
		<description>To Zeebra:
碰到專家了！你說的沒錯，主要就是利用文件自動摘要的方法來做。選句子的方法目前只採用比較簡單的TF-IDF概念，句子的位置，長度等還未列入考慮。詞性方面目前以名詞為主，次文化的辭彙真的不容易切出來，但是CKIP是我目前知道斷詞最準的系統了。
再次感謝你幫我點出不少該改善的地方。</description>
		<content:encoded><![CDATA[<p>To Zeebra:<br />
碰到專家了！你說的沒錯，主要就是利用文件自動摘要的方法來做。選句子的方法目前只採用比較簡單的TF-IDF概念，句子的位置，長度等還未列入考慮。詞性方面目前以名詞為主，次文化的辭彙真的不容易切出來，但是CKIP是我目前知道斷詞最準的系統了。<br />
再次感謝你幫我點出不少該改善的地方。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Mr. Wednesday</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-85110</link>
		<dc:creator>Mr. Wednesday</dc:creator>
		<pubDate>Fri, 08 Aug 2008 07:43:00 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-85110</guid>
		<description>To Zeebra:
碰到專家了！你說的沒錯，主要就是利用文件自動摘要的方法來做。選句子的方法目前只採用比較簡單的TF-IDF概念，句子的位置，長度等還未列入考慮。詞性方面目前以名詞為主，次文化的辭彙真的不容易切出來，但是CKIP是我目前知道斷詞最準的系統了。
再次感謝你幫我點出不少該改善的地方。</description>
		<content:encoded><![CDATA[<p>To Zeebra:<br />
碰到專家了！你說的沒錯，主要就是利用文件自動摘要的方法來做。選句子的方法目前只採用比較簡單的TF-IDF概念，句子的位置，長度等還未列入考慮。詞性方面目前以名詞為主，次文化的辭彙真的不容易切出來，但是CKIP是我目前知道斷詞最準的系統了。<br />
再次感謝你幫我點出不少該改善的地方。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Zeebra</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-18759</link>
		<dc:creator>Zeebra</dc:creator>
		<pubDate>Fri, 08 Aug 2008 07:19:48 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-18759</guid>
		<description>這個漫畫產生器看起來大概是利用文件自動摘要的一些方法,加上中研院的資料庫來做斷辭吧
基本上這領域研究有相當多的著作,例如除了考慮每個句子的TF-IDF分數總合,還會考慮句子的位置,即通常我們會認為一個句子出現在段落的前後會比出現在中間來的稍微重要.
另外有一些字辭可能會因為太一般而被過濾掉,像英文的however,whatever等,這些字雖不足以代表文章的主體,但卻文章意涵有相當大的影響.尤其出現以這種自為首的句子時,常被認為是相對重要的句子,因為他們才是作者真正想要表達的內容.
其他諸如詞性,例如名詞相對於形容詞可能比較利於摘要,數字可能較帶有決定性的意義等.
另外就是中研院的詞語資料庫太過於正式了,很多好笑的網誌或是文章,常含有次文化的辭彙,這讓這類的文章再斷詞切字彙遇到很多麻煩.
總之摘要的技術真的太多,多加一些機制搞不好會有更好的效(笑)果喔</description>
		<content:encoded><![CDATA[<p>這個漫畫產生器看起來大概是利用文件自動摘要的一些方法,加上中研院的資料庫來做斷辭吧<br />
基本上這領域研究有相當多的著作,例如除了考慮每個句子的TF-IDF分數總合,還會考慮句子的位置,即通常我們會認為一個句子出現在段落的前後會比出現在中間來的稍微重要.<br />
另外有一些字辭可能會因為太一般而被過濾掉,像英文的however,whatever等,這些字雖不足以代表文章的主體,但卻文章意涵有相當大的影響.尤其出現以這種自為首的句子時,常被認為是相對重要的句子,因為他們才是作者真正想要表達的內容.<br />
其他諸如詞性,例如名詞相對於形容詞可能比較利於摘要,數字可能較帶有決定性的意義等.<br />
另外就是中研院的詞語資料庫太過於正式了,很多好笑的網誌或是文章,常含有次文化的辭彙,這讓這類的文章再斷詞切字彙遇到很多麻煩.<br />
總之摘要的技術真的太多,多加一些機制搞不好會有更好的效(笑)果喔</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Zeebra</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-85109</link>
		<dc:creator>Zeebra</dc:creator>
		<pubDate>Fri, 08 Aug 2008 07:19:00 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-85109</guid>
		<description>這個漫畫產生器看起來大概是利用文件自動摘要的一些方法,加上中研院的資料庫來做斷辭吧
基本上這領域研究有相當多的著作,例如除了考慮每個句子的TF-IDF分數總合,還會考慮句子的位置,即通常我們會認為一個句子出現在段落的前後會比出現在中間來的稍微重要.
另外有一些字辭可能會因為太一般而被過濾掉,像英文的however,whatever等,這些字雖不足以代表文章的主體,但卻文章意涵有相當大的影響.尤其出現以這種自為首的句子時,常被認為是相對重要的句子,因為他們才是作者真正想要表達的內容.
其他諸如詞性,例如名詞相對於形容詞可能比較利於摘要,數字可能較帶有決定性的意義等.
另外就是中研院的詞語資料庫太過於正式了,很多好笑的網誌或是文章,常含有次文化的辭彙,這讓這類的文章再斷詞切字彙遇到很多麻煩.
總之摘要的技術真的太多,多加一些機制搞不好會有更好的效(笑)果喔</description>
		<content:encoded><![CDATA[<p>這個漫畫產生器看起來大概是利用文件自動摘要的一些方法,加上中研院的資料庫來做斷辭吧<br />
基本上這領域研究有相當多的著作,例如除了考慮每個句子的TF-IDF分數總合,還會考慮句子的位置,即通常我們會認為一個句子出現在段落的前後會比出現在中間來的稍微重要.<br />
另外有一些字辭可能會因為太一般而被過濾掉,像英文的however,whatever等,這些字雖不足以代表文章的主體,但卻文章意涵有相當大的影響.尤其出現以這種自為首的句子時,常被認為是相對重要的句子,因為他們才是作者真正想要表達的內容.<br />
其他諸如詞性,例如名詞相對於形容詞可能比較利於摘要,數字可能較帶有決定性的意義等.<br />
另外就是中研院的詞語資料庫太過於正式了,很多好笑的網誌或是文章,常含有次文化的辭彙,這讓這類的文章再斷詞切字彙遇到很多麻煩.<br />
總之摘要的技術真的太多,多加一些機制搞不好會有更好的效(笑)果喔</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Chen</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-18701</link>
		<dc:creator>Chen</dc:creator>
		<pubDate>Wed, 06 Aug 2008 07:34:21 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-18701</guid>
		<description>現在就已經可以感受到
如果字數太多的時候
實在沒有辦法擷取具有代表性的四段字幕出來</description>
		<content:encoded><![CDATA[<p>現在就已經可以感受到<br />
如果字數太多的時候<br />
實在沒有辦法擷取具有代表性的四段字幕出來</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Chen</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-85108</link>
		<dc:creator>Chen</dc:creator>
		<pubDate>Wed, 06 Aug 2008 07:34:00 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-85108</guid>
		<description>現在就已經可以感受到
如果字數太多的時候
實在沒有辦法擷取具有代表性的四段字幕出來</description>
		<content:encoded><![CDATA[<p>現在就已經可以感受到<br />
如果字數太多的時候<br />
實在沒有辦法擷取具有代表性的四段字幕出來</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Mr. Wednesday</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-18697</link>
		<dc:creator>Mr. Wednesday</dc:creator>
		<pubDate>Wed, 06 Aug 2008 03:42:27 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-18697</guid>
		<description>To jaxx:
你說的沒錯，單一關鍵字的圖片搜尋很容易有一字多義的『好笑』，另外就是圖片本身的Tag，如果下得特別，也會造成有趣的效果。</description>
		<content:encoded><![CDATA[<p>To jaxx:<br />
你說的沒錯，單一關鍵字的圖片搜尋很容易有一字多義的『好笑』，另外就是圖片本身的Tag，如果下得特別，也會造成有趣的效果。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Mr. Wednesday</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-85107</link>
		<dc:creator>Mr. Wednesday</dc:creator>
		<pubDate>Wed, 06 Aug 2008 03:42:00 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-85107</guid>
		<description>To jaxx:
你說的沒錯，單一關鍵字的圖片搜尋很容易有一字多義的『好笑』，另外就是圖片本身的Tag，如果下得特別，也會造成有趣的效果。</description>
		<content:encoded><![CDATA[<p>To jaxx:<br />
你說的沒錯，單一關鍵字的圖片搜尋很容易有一字多義的『好笑』，另外就是圖片本身的Tag，如果下得特別，也會造成有趣的效果。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: jaxx</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-18696</link>
		<dc:creator>jaxx</dc:creator>
		<pubDate>Wed, 06 Aug 2008 03:13:44 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-18696</guid>
		<description>我想好笑的點就在於
電腦看不出context關聯的特性
..像是Demo網站中小紅帽故事裡
大野狼找出搭配的野狼機車 這樣就挺好笑的
如果真的找出一匹狼 可能或許沒那麼好笑
但找出七匹狼的圖可能會相當好笑</description>
		<content:encoded><![CDATA[<p>我想好笑的點就在於<br />
電腦看不出context關聯的特性<br />
..像是Demo網站中小紅帽故事裡<br />
大野狼找出搭配的野狼機車 這樣就挺好笑的<br />
如果真的找出一匹狼 可能或許沒那麼好笑<br />
但找出七匹狼的圖可能會相當好笑</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: jaxx</title>
		<link>http://mmdays.com/2008/08/04/comics-generator/comment-page-1/#comment-85106</link>
		<dc:creator>jaxx</dc:creator>
		<pubDate>Wed, 06 Aug 2008 03:13:00 +0000</pubDate>
		<guid isPermaLink="false">http://mmdays.com/?p=6070#comment-85106</guid>
		<description>我想好笑的點就在於
電腦看不出context關聯的特性
..像是Demo網站中小紅帽故事裡
大野狼找出搭配的野狼機車 這樣就挺好笑的
如果真的找出一匹狼 可能或許沒那麼好笑
但找出七匹狼的圖可能會相當好笑</description>
		<content:encoded><![CDATA[<p>我想好笑的點就在於<br />
電腦看不出context關聯的特性<br />
..像是Demo網站中小紅帽故事裡<br />
大野狼找出搭配的野狼機車 這樣就挺好笑的<br />
如果真的找出一匹狼 可能或許沒那麼好笑<br />
但找出七匹狼的圖可能會相當好笑</p>
]]></content:encoded>
	</item>
</channel>
</rss>

