<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: (Lại) machine learning và statistics</title>
	<atom:link href="http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/</link>
	<description>Tầm nhìn ta thật ngắn mà đã thấy bao thứ  để làm -- Alan Turing</description>
	<lastBuildDate>Wed, 10 Mar 2010 07:15:49 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: Bach Hung Nguyen</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181316</link>
		<dc:creator>Bach Hung Nguyen</dc:creator>
		<pubDate>Sat, 27 Dec 2008 17:13:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181316</guid>
		<description>Anh Long giỏi văn phết nhỉ :D, khoái câu research statement của bác. Đồng tình với quan điểm mèo trắng hay mèo đen miễn là bắt được chuột. Trong nghành em (Machine Translation &amp; NLP) scalability &amp; feasibility rất là quan trọng. Về scalability, em thấy rất nhiều ML paper đề xuất các ideas xong rồi chạy experiments trên các toy dataset, đến khi áp dụng vào large dataset thi chịu ko train được vì complexity quá cao. Một trong những kinh nghiệm là em build protype translation systems trên bộ dữ liệu khoảng 5 triệu từ, rồi test các kiểu algorithms thấy cũng ngon. Đến lúc áp dụng vào data khoảng 200 triệu từ thì ngắc ngoải. Về feasibility, cái này liên quan đến inference, có khá nhiều ứng dụng trong nghành của em đòi hỏi chạy real-time, ví dụ như dịch tiếng nói-sang-tiếng nói, model càng phức tạp thì càng chạy lâu mặc dù cho kết quả tốt hơn. Chẳng hạn như nếu hệ thống dịch của em mà không xài parser thì chạy nhanh hơn khoảng 3 lần nhưng kết quả dịch thấp hơn. Bình thường đi đấu đá evaluation thì model nào cho kết quả tốt nhất thì chơi, nhưng còn thực tế sử dụng phải tinh giảm đi rất nhiều. Nên cái đoạn &quot;Computation complexity không chỉ đơn thuần là một khái niệm về hiệu quả về thời gian hay không gian của một algorithm, mà nó gắn liền với khái niệm về độ phức tạp về information, mà qua đó sẽ chi phối quyết định của một người modeler (statisticians) cho dù anh ta khách quan hay chủ quan hay không&quot; là hơi bị chuẩn.</description>
		<content:encoded><![CDATA[<p>Anh Long giỏi văn phết nhỉ <img src='http://www.procul.org/blog/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /> , khoái câu research statement của bác. Đồng tình với quan điểm mèo trắng hay mèo đen miễn là bắt được chuột. Trong nghành em (Machine Translation &amp; NLP) scalability &amp; feasibility rất là quan trọng. Về scalability, em thấy rất nhiều ML paper đề xuất các ideas xong rồi chạy experiments trên các toy dataset, đến khi áp dụng vào large dataset thi chịu ko train được vì complexity quá cao. Một trong những kinh nghiệm là em build protype translation systems trên bộ dữ liệu khoảng 5 triệu từ, rồi test các kiểu algorithms thấy cũng ngon. Đến lúc áp dụng vào data khoảng 200 triệu từ thì ngắc ngoải. Về feasibility, cái này liên quan đến inference, có khá nhiều ứng dụng trong nghành của em đòi hỏi chạy real-time, ví dụ như dịch tiếng nói-sang-tiếng nói, model càng phức tạp thì càng chạy lâu mặc dù cho kết quả tốt hơn. Chẳng hạn như nếu hệ thống dịch của em mà không xài parser thì chạy nhanh hơn khoảng 3 lần nhưng kết quả dịch thấp hơn. Bình thường đi đấu đá evaluation thì model nào cho kết quả tốt nhất thì chơi, nhưng còn thực tế sử dụng phải tinh giảm đi rất nhiều. Nên cái đoạn &#8220;Computation complexity không chỉ đơn thuần là một khái niệm về hiệu quả về thời gian hay không gian của một algorithm, mà nó gắn liền với khái niệm về độ phức tạp về information, mà qua đó sẽ chi phối quyết định của một người modeler (statisticians) cho dù anh ta khách quan hay chủ quan hay không&#8221; là hơi bị chuẩn.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Kiều Phương</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181302</link>
		<dc:creator>Kiều Phương</dc:creator>
		<pubDate>Fri, 26 Dec 2008 04:42:37 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181302</guid>
		<description>Chúc Blog KHMT giáng sinh vui vẻ, hy vọng có nhiều bài viết hay hơn nữa (về KHMT thôi nhé ^^ chính chị chính em mệt lắm)
hi, hôm nay là boxing day, ko biết blogger có quà gì không &gt;:)</description>
		<content:encoded><![CDATA[<p>Chúc Blog KHMT giáng sinh vui vẻ, hy vọng có nhiều bài viết hay hơn nữa (về KHMT thôi nhé ^^ chính chị chính em mệt lắm)<br />
hi, hôm nay là boxing day, ko biết blogger có quà gì không &gt;:)</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Nguyen Xuan Long</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181150</link>
		<dc:creator>Nguyen Xuan Long</dc:creator>
		<pubDate>Wed, 17 Dec 2008 04:15:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181150</guid>
		<description>Hi ba&#039;c Hu+ng, thich the^&#039;. Have fun in SG!</description>
		<content:encoded><![CDATA[<p>Hi ba&#8217;c Hu+ng, thich the^&#8217;. Have fun in SG!</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Ngô Quang Hưng</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181131</link>
		<dc:creator>Ngô Quang Hưng</dc:creator>
		<pubDate>Sat, 13 Dec 2008 08:18:35 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181131</guid>
		<description>Cảm ơn bác Long,

Bài của Breiman rất thú vị. Tôi đang ở SG và có Internet ba chớp ba nháng, sẽ bình luận sau khi về Mỹ. BTW, chúc bác có nhiều job offers.</description>
		<content:encoded><![CDATA[<p>Cảm ơn bác Long,</p>
<p>Bài của Breiman rất thú vị. Tôi đang ở SG và có Internet ba chớp ba nháng, sẽ bình luận sau khi về Mỹ. BTW, chúc bác có nhiều job offers.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->