<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: (Lại) machine learning và statistics</title>
	<atom:link href="http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/</link>
	<description>Tầm nhìn ta thật ngắn mà đã thấy bao thứ  để làm -- Alan Turing</description>
	<lastBuildDate>Wed, 08 Feb 2012 20:07:47 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>By: Nguyễn Xuân Long</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-200024</link>
		<dc:creator>Nguyễn Xuân Long</dc:creator>
		<pubDate>Fri, 11 Mar 2011 22:57:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-200024</guid>
		<description>Có rất nhiều tài liệu về vấn đề này trên mạng (qua homepage các lớp học về machine learning chẳng hạn), bạn có thể tìm được dễ dàng bằng google.</description>
		<content:encoded><![CDATA[<p>Có rất nhiều tài liệu về vấn đề này trên mạng (qua homepage các lớp học về machine learning chẳng hạn), bạn có thể tìm được dễ dàng bằng google.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Sinh vien BKHN</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-200005</link>
		<dc:creator>Sinh vien BKHN</dc:creator>
		<pubDate>Fri, 11 Mar 2011 14:27:35 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-200005</guid>
		<description>Chú Long có thể giải thích hay chỉ ra 1 số tài liệu liên quan hoặc chứng mình knowledge of the conditional distributions is sufficient to determine a jointdistribution (if it exists!)
Va Gibbs sampling liên hệ thế nào với EM algorithm và &quot;imcomplete data&quot; theory ạ ??
Xin cảm ơn chú !</description>
		<content:encoded><![CDATA[<p>Chú Long có thể giải thích hay chỉ ra 1 số tài liệu liên quan hoặc chứng mình knowledge of the conditional distributions is sufficient to determine a jointdistribution (if it exists!)<br />
Va Gibbs sampling liên hệ thế nào với EM algorithm và &#8220;imcomplete data&#8221; theory ạ ??<br />
Xin cảm ơn chú !</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Nguyễn Xuân Long</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-199932</link>
		<dc:creator>Nguyễn Xuân Long</dc:creator>
		<pubDate>Wed, 09 Mar 2011 23:11:52 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-199932</guid>
		<description>Lợi thế của dân KHMT là ở khía cạnh thuật toán, data structure trong việc xây và học mô hình. Các khái niệm trong KHMT như recursion, pointers, graphical structures thực ra có rất nhiều dấu vết trong XSTK hiện đại. Tất nhiên các lợi thế này chỉ được phát huy hiệu quả nhất khi bạn cũng học bài bản về xác suất và một số lĩnh vực khác nữa. Mà tôi thấy dân KHMT học toán nói chung rất tốt, nếu tìm được động cơ thích hợp. 

Tóm lại tôi không thấy bất lợi gì so với dân toán. Nếu bạn mới bắt đầu vào graduate school thì phần nhiều kiến thức còn ở phía trước.</description>
		<content:encoded><![CDATA[<p>Lợi thế của dân KHMT là ở khía cạnh thuật toán, data structure trong việc xây và học mô hình. Các khái niệm trong KHMT như recursion, pointers, graphical structures thực ra có rất nhiều dấu vết trong XSTK hiện đại. Tất nhiên các lợi thế này chỉ được phát huy hiệu quả nhất khi bạn cũng học bài bản về xác suất và một số lĩnh vực khác nữa. Mà tôi thấy dân KHMT học toán nói chung rất tốt, nếu tìm được động cơ thích hợp. </p>
<p>Tóm lại tôi không thấy bất lợi gì so với dân toán. Nếu bạn mới bắt đầu vào graduate school thì phần nhiều kiến thức còn ở phía trước.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Sinh vien BKHN</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-199928</link>
		<dc:creator>Sinh vien BKHN</dc:creator>
		<pubDate>Wed, 09 Mar 2011 21:31:13 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-199928</guid>
		<description>Cháu có băn khoăn 1 câu. Lợi thế của dân khoa học máy tính khi nghiên cứu machine learning so với dân thống kê thuần túy là ở  điểm nào ạ ?
Cháu thấy rất nhiều bất lợi của 1 người chuyên ngành CNTT khi nghiên cứu ML so với những người dân Toán hay cụ thể hơn là xác suất thuần túy.
Xin giải thích dùm cháu.</description>
		<content:encoded><![CDATA[<p>Cháu có băn khoăn 1 câu. Lợi thế của dân khoa học máy tính khi nghiên cứu machine learning so với dân thống kê thuần túy là ở  điểm nào ạ ?<br />
Cháu thấy rất nhiều bất lợi của 1 người chuyên ngành CNTT khi nghiên cứu ML so với những người dân Toán hay cụ thể hơn là xác suất thuần túy.<br />
Xin giải thích dùm cháu.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Bach Hung Nguyen</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181316</link>
		<dc:creator>Bach Hung Nguyen</dc:creator>
		<pubDate>Sat, 27 Dec 2008 17:13:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181316</guid>
		<description>Anh Long giỏi văn phết nhỉ :D, khoái câu research statement của bác. Đồng tình với quan điểm mèo trắng hay mèo đen miễn là bắt được chuột. Trong nghành em (Machine Translation &amp; NLP) scalability &amp; feasibility rất là quan trọng. Về scalability, em thấy rất nhiều ML paper đề xuất các ideas xong rồi chạy experiments trên các toy dataset, đến khi áp dụng vào large dataset thi chịu ko train được vì complexity quá cao. Một trong những kinh nghiệm là em build protype translation systems trên bộ dữ liệu khoảng 5 triệu từ, rồi test các kiểu algorithms thấy cũng ngon. Đến lúc áp dụng vào data khoảng 200 triệu từ thì ngắc ngoải. Về feasibility, cái này liên quan đến inference, có khá nhiều ứng dụng trong nghành của em đòi hỏi chạy real-time, ví dụ như dịch tiếng nói-sang-tiếng nói, model càng phức tạp thì càng chạy lâu mặc dù cho kết quả tốt hơn. Chẳng hạn như nếu hệ thống dịch của em mà không xài parser thì chạy nhanh hơn khoảng 3 lần nhưng kết quả dịch thấp hơn. Bình thường đi đấu đá evaluation thì model nào cho kết quả tốt nhất thì chơi, nhưng còn thực tế sử dụng phải tinh giảm đi rất nhiều. Nên cái đoạn &quot;Computation complexity không chỉ đơn thuần là một khái niệm về hiệu quả về thời gian hay không gian của một algorithm, mà nó gắn liền với khái niệm về độ phức tạp về information, mà qua đó sẽ chi phối quyết định của một người modeler (statisticians) cho dù anh ta khách quan hay chủ quan hay không&quot; là hơi bị chuẩn.</description>
		<content:encoded><![CDATA[<p>Anh Long giỏi văn phết nhỉ <img src='http://www.procul.org/blog/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /> , khoái câu research statement của bác. Đồng tình với quan điểm mèo trắng hay mèo đen miễn là bắt được chuột. Trong nghành em (Machine Translation &amp; NLP) scalability &amp; feasibility rất là quan trọng. Về scalability, em thấy rất nhiều ML paper đề xuất các ideas xong rồi chạy experiments trên các toy dataset, đến khi áp dụng vào large dataset thi chịu ko train được vì complexity quá cao. Một trong những kinh nghiệm là em build protype translation systems trên bộ dữ liệu khoảng 5 triệu từ, rồi test các kiểu algorithms thấy cũng ngon. Đến lúc áp dụng vào data khoảng 200 triệu từ thì ngắc ngoải. Về feasibility, cái này liên quan đến inference, có khá nhiều ứng dụng trong nghành của em đòi hỏi chạy real-time, ví dụ như dịch tiếng nói-sang-tiếng nói, model càng phức tạp thì càng chạy lâu mặc dù cho kết quả tốt hơn. Chẳng hạn như nếu hệ thống dịch của em mà không xài parser thì chạy nhanh hơn khoảng 3 lần nhưng kết quả dịch thấp hơn. Bình thường đi đấu đá evaluation thì model nào cho kết quả tốt nhất thì chơi, nhưng còn thực tế sử dụng phải tinh giảm đi rất nhiều. Nên cái đoạn &#8220;Computation complexity không chỉ đơn thuần là một khái niệm về hiệu quả về thời gian hay không gian của một algorithm, mà nó gắn liền với khái niệm về độ phức tạp về information, mà qua đó sẽ chi phối quyết định của một người modeler (statisticians) cho dù anh ta khách quan hay chủ quan hay không&#8221; là hơi bị chuẩn.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Kiều Phương</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181302</link>
		<dc:creator>Kiều Phương</dc:creator>
		<pubDate>Fri, 26 Dec 2008 04:42:37 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181302</guid>
		<description>Chúc Blog KHMT giáng sinh vui vẻ, hy vọng có nhiều bài viết hay hơn nữa (về KHMT thôi nhé ^^ chính chị chính em mệt lắm)
hi, hôm nay là boxing day, ko biết blogger có quà gì không &gt;:)</description>
		<content:encoded><![CDATA[<p>Chúc Blog KHMT giáng sinh vui vẻ, hy vọng có nhiều bài viết hay hơn nữa (về KHMT thôi nhé ^^ chính chị chính em mệt lắm)<br />
hi, hôm nay là boxing day, ko biết blogger có quà gì không &gt;:)</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Nguyen Xuan Long</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181150</link>
		<dc:creator>Nguyen Xuan Long</dc:creator>
		<pubDate>Wed, 17 Dec 2008 04:15:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181150</guid>
		<description>Hi ba&#039;c Hu+ng, thich the^&#039;. Have fun in SG!</description>
		<content:encoded><![CDATA[<p>Hi ba&#8217;c Hu+ng, thich the^&#8217;. Have fun in SG!</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Ngô Quang Hưng</title>
		<link>http://www.procul.org/blog/2008/12/12/l%e1%ba%a1i-machine-learning-va-statistics/comment-page-1/#comment-181131</link>
		<dc:creator>Ngô Quang Hưng</dc:creator>
		<pubDate>Sat, 13 Dec 2008 08:18:35 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=908#comment-181131</guid>
		<description>Cảm ơn bác Long,

Bài của Breiman rất thú vị. Tôi đang ở SG và có Internet ba chớp ba nháng, sẽ bình luận sau khi về Mỹ. BTW, chúc bác có nhiều job offers.</description>
		<content:encoded><![CDATA[<p>Cảm ơn bác Long,</p>
<p>Bài của Breiman rất thú vị. Tôi đang ở SG và có Internet ba chớp ba nháng, sẽ bình luận sau khi về Mỹ. BTW, chúc bác có nhiều job offers.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

