<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: HM4 &#8212; Độ phức tạp mẫu và VC-dimension</title>
	<atom:link href="http://www.procul.org/blog/2008/07/18/h%e1%bb%8dc-may-t%e1%bb%ab-goc-nhin-c%e1%bb%a7a-ly-thuy%e1%ba%bft-tinh-toan-4/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.procul.org/blog/2008/07/18/h%e1%bb%8dc-may-t%e1%bb%ab-goc-nhin-c%e1%bb%a7a-ly-thuy%e1%ba%bft-tinh-toan-4/</link>
	<description>Tầm nhìn ta thật ngắn mà đã thấy bao thứ  để làm -- Alan Turing</description>
	<lastBuildDate>Fri, 10 Sep 2010 16:22:30 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>By: Ngô Quang Hưng</title>
		<link>http://www.procul.org/blog/2008/07/18/h%e1%bb%8dc-may-t%e1%bb%ab-goc-nhin-c%e1%bb%a7a-ly-thuy%e1%ba%bft-tinh-toan-4/comment-page-1/#comment-182158</link>
		<dc:creator>Ngô Quang Hưng</dc:creator>
		<pubDate>Mon, 09 Feb 2009 15:39:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=891#comment-182158</guid>
		<description>&lt;strong&gt;@Chính Minh&lt;/strong&gt;: để trả lời câu hỏi của bạn, tôi cần hiểu câu hỏi đã.

Thế nào là &quot;giúp ích cho cuộc sống con người&quot;?

1. Hồi Cardano giải phương trình bậc 3 có &quot;giúp ích cho cuộc sống con người&quot; không?

2. Google có giúp ích cho cuộc sống con người không?

Nếu câu trả lời của bạn cho 1 &lt;strong&gt;hoặc&lt;/strong&gt; 2 là &quot;có&quot; thì câu trả lời của tôi (cho câu hỏi của bạn) là &quot;có&quot;, &quot;nó&quot; có giúp ích. (Tại sao liên quan đến Google, tại vì các thuật toán ML ít nhiều phải dùng boosting và support vector machines, những thứ đến từ lý thuyết học máy như đã và sẽ trình bày.)

Nếu câu trả lời của bạn cho cả hai câu 1 và 2 ở trên là &quot;không&quot;, thì câu trả lời của tôi (cho câu hỏi của bạn) là &quot;không&quot;, &quot;nó&quot; không giúp ích gì cho cuộc sống của bạn cả.

Tôi không biết nó có giúp ích cho bạn không; Tôi biết rằng &lt;a href=&quot;http://www.procul.org/blog/2006/09/13/h%E1%BB%8Dc-bao-nhieu-la-o%E1%BB%A7/&quot; rel=&quot;nofollow&quot;&gt;&quot;nó&quot; giúp ích cho cuộc sống của tôi&lt;/a&gt;.</description>
		<content:encoded><![CDATA[<p><strong>@Chính Minh</strong>: để trả lời câu hỏi của bạn, tôi cần hiểu câu hỏi đã.</p>
<p>Thế nào là &#8220;giúp ích cho cuộc sống con người&#8221;?</p>
<p>1. Hồi Cardano giải phương trình bậc 3 có &#8220;giúp ích cho cuộc sống con người&#8221; không?</p>
<p>2. Google có giúp ích cho cuộc sống con người không?</p>
<p>Nếu câu trả lời của bạn cho 1 <strong>hoặc</strong> 2 là &#8220;có&#8221; thì câu trả lời của tôi (cho câu hỏi của bạn) là &#8220;có&#8221;, &#8220;nó&#8221; có giúp ích. (Tại sao liên quan đến Google, tại vì các thuật toán ML ít nhiều phải dùng boosting và support vector machines, những thứ đến từ lý thuyết học máy như đã và sẽ trình bày.)</p>
<p>Nếu câu trả lời của bạn cho cả hai câu 1 và 2 ở trên là &#8220;không&#8221;, thì câu trả lời của tôi (cho câu hỏi của bạn) là &#8220;không&#8221;, &#8220;nó&#8221; không giúp ích gì cho cuộc sống của bạn cả.</p>
<p>Tôi không biết nó có giúp ích cho bạn không; Tôi biết rằng <a href="http://www.procul.org/blog/2006/09/13/h%E1%BB%8Dc-bao-nhieu-la-o%E1%BB%A7/" rel="nofollow">&#8220;nó&#8221; giúp ích cho cuộc sống của tôi</a>.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Chính Minh</title>
		<link>http://www.procul.org/blog/2008/07/18/h%e1%bb%8dc-may-t%e1%bb%ab-goc-nhin-c%e1%bb%a7a-ly-thuy%e1%ba%bft-tinh-toan-4/comment-page-1/#comment-182155</link>
		<dc:creator>Chính Minh</dc:creator>
		<pubDate>Mon, 09 Feb 2009 14:30:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=891#comment-182155</guid>
		<description>Thưa chú !

        Cháu là một người làm bên Công Nghệ Thông Tin, cụ thế là hướng theo Software Engineering, Information System, Business Management và Báo Chí Truyền Thông

         Tình cờ đi qua WebBlog này, tuy mới chỉ đọc lướt nhanh các bài viết này, cháu nhận thấy rằng : Các bài viết trên, quả là chứa đứng nhiều lý thuyết về toán học, trí tuệ nhân tạo, thuật toán, thi quốc tế, các kiểu...  Ấy thế mà, cái chứng minh cần thiết, mà nhiều người mong chờ, nó ko làm được là : nó phải chứng tỏ được nó tham ra quá quá trình thế nào, giúp ích ra sao cho cuộc sống con người đây ??  - Quá trình đó, phải chăng là mờ nhạt, 
 
         Rất mong chú có câu trả lời, dù chỉ đôi dòng ý nghĩa</description>
		<content:encoded><![CDATA[<p>Thưa chú !</p>
<p>        Cháu là một người làm bên Công Nghệ Thông Tin, cụ thế là hướng theo Software Engineering, Information System, Business Management và Báo Chí Truyền Thông</p>
<p>         Tình cờ đi qua WebBlog này, tuy mới chỉ đọc lướt nhanh các bài viết này, cháu nhận thấy rằng : Các bài viết trên, quả là chứa đứng nhiều lý thuyết về toán học, trí tuệ nhân tạo, thuật toán, thi quốc tế, các kiểu&#8230;  Ấy thế mà, cái chứng minh cần thiết, mà nhiều người mong chờ, nó ko làm được là : nó phải chứng tỏ được nó tham ra quá quá trình thế nào, giúp ích ra sao cho cuộc sống con người đây ??  &#8211; Quá trình đó, phải chăng là mờ nhạt, </p>
<p>         Rất mong chú có câu trả lời, dù chỉ đôi dòng ý nghĩa</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Ngô Quang Hưng</title>
		<link>http://www.procul.org/blog/2008/07/18/h%e1%bb%8dc-may-t%e1%bb%ab-goc-nhin-c%e1%bb%a7a-ly-thuy%e1%ba%bft-tinh-toan-4/comment-page-1/#comment-172096</link>
		<dc:creator>Ngô Quang Hưng</dc:creator>
		<pubDate>Sat, 19 Jul 2008 01:33:53 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=891#comment-172096</guid>
		<description>Hi bác Long, 

Vụ Kolmogorov entropy chắc phải chờ bác viết thôi. Đọc Vapnik review &quot;history of learning theory&quot; thấy rất ... tếu :-). BTW, tôi đọc sách Intro to COLT của Kearns và Vazirani cũng thấy cite Dudley (quyển &quot;A Course on Empirical Processes&quot;). 

Valiant sẽ được Turing vì nhiều đóng góp khác chứ không chỉ có PAC (#P, superconcentrator, algebraic complexity, mind circuit, evolvability, hollographic algorithms, v.v.) Hầu như  cứ  vài năm là Valiant lại có một ý tưởng original mở ra một field mới.

Cảm ơn bác giới thiệu quyển Empirical processes. Các bài báo về PAC trên FOCS/STOCS thật ra has little to do with learning, they&#039;re all about hardness of approximation. Tôi không ngạc nhiên nếu họ không biết statistics nhiều. COLT mới là về learning (from a TCS viewpoint) thật, vì thế COLT community mới rẽ nhánh ra khỏi STOC/FOCS.</description>
		<content:encoded><![CDATA[<p>Hi bác Long, </p>
<p>Vụ Kolmogorov entropy chắc phải chờ bác viết thôi. Đọc Vapnik review &#8220;history of learning theory&#8221; thấy rất &#8230; tếu <img src='http://www.procul.org/blog/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> . BTW, tôi đọc sách Intro to COLT của Kearns và Vazirani cũng thấy cite Dudley (quyển &#8220;A Course on Empirical Processes&#8221;). </p>
<p>Valiant sẽ được Turing vì nhiều đóng góp khác chứ không chỉ có PAC (#P, superconcentrator, algebraic complexity, mind circuit, evolvability, hollographic algorithms, v.v.) Hầu như  cứ  vài năm là Valiant lại có một ý tưởng original mở ra một field mới.</p>
<p>Cảm ơn bác giới thiệu quyển Empirical processes. Các bài báo về PAC trên FOCS/STOCS thật ra has little to do with learning, they&#8217;re all about hardness of approximation. Tôi không ngạc nhiên nếu họ không biết statistics nhiều. COLT mới là về learning (from a TCS viewpoint) thật, vì thế COLT community mới rẽ nhánh ra khỏi STOC/FOCS.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Nguyễn Xuân Long</title>
		<link>http://www.procul.org/blog/2008/07/18/h%e1%bb%8dc-may-t%e1%bb%ab-goc-nhin-c%e1%bb%a7a-ly-thuy%e1%ba%bft-tinh-toan-4/comment-page-1/#comment-172088</link>
		<dc:creator>Nguyễn Xuân Long</dc:creator>
		<pubDate>Fri, 18 Jul 2008 20:11:49 +0000</pubDate>
		<guid isPermaLink="false">http://www.procul.org/blog/?p=891#comment-172088</guid>
		<description>Hi bác Hưng, very nice presentation, again. Tôi có một số comments về Định lý 5.3.

1. Khái niệm VC-dimension đúng là rất độc đáo, original, đặc biệt là tính chất tổ hợp của chúng và liên hệ trực tiếp đến statistical efficiency (theo Định lý 5.3).  Tuy vậy VC dimensions có một số hạn chế fundamental, ở chỗ  phần nhiều các function classes hữu ích trên thực tế lại có infinite VC dimensions. Khái niệm tốt hơn để đo độ phức tạp của function classes là khái niệm entropy của Kolmogorov (liên quan đến packing và covering numbers). Không biết bác Hưng có dự định nói về khái niệm này không. 

2. Một kết quả rất thú vị là covering number của VC function class thì được chặn trên bởi một đa thức (đối với 1/delta, ở đây delta là kich cở của quả bóng con dùng để cover theo định nghĩa của covering number). Như vậy nếu VC dimension hữu hạn thì entropy cũng vậy, nhưng ngược lại không đúng. 

3. Trong một số comments trước tôi nói rằng bên thống kê họ đã phái triển rất sâu rộng khái niệm PAC, và có thể minh họa chính bằng khái niệm entropy này. Cuối thập niên 70 có nhiều kết quả quan trọng để (nói theo ngôn ngữ PAC) để chứng minh PAC-learnability cho các lớp hàm số dựa theo khái niệm entropy (e.g., ví dụ, sử dụng Dudley&#039;s entropy integral). Các kết quả tương tự như Định lý 5.1 ở trên: Ta có thể chặn trên \epsilon theo sample size m (từ Định lý 5.1) .Điều thú vị nhất là các chặn trên này cũng trùng với chặn dưới luôn (minimax bound: với một function class đây là chặn worse-case tốt nhất có thể được với mọi thuật toán learning).

4. Khái niệm entropy (khác với Shannon&#039;s entropy) xuất hiện đầu tiên bên approximation theory của Russian school (xem vi&#039; du.:
http://www.procul.org/blog/2006/05/24/cac-bai-bao-kinh-oi%e1%bb%83n-khmt-9-birman-and-solomjaks-1967-paper/
) 
và có liên hệ mật thiết với information theory. 

5. Khái niệm Shannon&#039;s entropy và approximation entropy thực ra có liên hệ với nhau cực kỳ hay, nếu ta sử dụng generalized Bayesian viewpoint. (Tong Zhang gần đây có một bài báo rất thú vị về cái này trên Annals of Statistics, 2006). Hy vọng một dịp nào đó tôi sẽ nói thêm về cái này. 

6. Vapnik thường được gắn liền với statistical learning theory như một cha đẻ. Điều này đúng.
Không chỉ trong learning theory, đóng góp của VC theory có thể coi là original trong theoretical statistics, góp phần tạo ra subfield gọi là empirical process theory trong statistics. Nếu Valiant đuợc Turing award, thì tôi nghĩ Vapnik cũng nên được một cái :-) Nhưng sách của Vapnik thường không cân bằng và không ghi nhận xứng đáng các khái niệm khác trong empirical process theory mà tôi nghĩ Vapnik biết rõ là sẽ rất hữu ích và powerful hơn cho learning theory. Có cảm tưởng ông này là một người egoistic. Một quyển sách cân bằng hơn về khái niệm VC theo tôi là của van der Vaart và Wellner (Weak convergence and empirical processes). Quyển này nói kỹ về VC theory, and much much more. Và ứng dụng không chỉ trong classification như PAC&#039;s setting mà trong estimation nói chung.

7. Tôi cảm tưởng dân FOCS/STOC làm về learning theory chưa có exposure nhiều về empirical process theory (ngoài lý thuyết VC ra).  Tuy vậy dân COLT với background statistics những năm gần đây có sự dịch chuyển đáng kể từ khái niệm VC sang sủ dụng khái niệm entropy.

8. Qua proof cu?a Định lý 5.3 có thể suy ra là NQH cũng có một cây Ramirez với xác suất cao.</description>
		<content:encoded><![CDATA[<p>Hi bác Hưng, very nice presentation, again. Tôi có một số comments về Định lý 5.3.</p>
<p>1. Khái niệm VC-dimension đúng là rất độc đáo, original, đặc biệt là tính chất tổ hợp của chúng và liên hệ trực tiếp đến statistical efficiency (theo Định lý 5.3).  Tuy vậy VC dimensions có một số hạn chế fundamental, ở chỗ  phần nhiều các function classes hữu ích trên thực tế lại có infinite VC dimensions. Khái niệm tốt hơn để đo độ phức tạp của function classes là khái niệm entropy của Kolmogorov (liên quan đến packing và covering numbers). Không biết bác Hưng có dự định nói về khái niệm này không. </p>
<p>2. Một kết quả rất thú vị là covering number của VC function class thì được chặn trên bởi một đa thức (đối với 1/delta, ở đây delta là kich cở của quả bóng con dùng để cover theo định nghĩa của covering number). Như vậy nếu VC dimension hữu hạn thì entropy cũng vậy, nhưng ngược lại không đúng. </p>
<p>3. Trong một số comments trước tôi nói rằng bên thống kê họ đã phái triển rất sâu rộng khái niệm PAC, và có thể minh họa chính bằng khái niệm entropy này. Cuối thập niên 70 có nhiều kết quả quan trọng để (nói theo ngôn ngữ PAC) để chứng minh PAC-learnability cho các lớp hàm số dựa theo khái niệm entropy (e.g., ví dụ, sử dụng Dudley&#8217;s entropy integral). Các kết quả tương tự như Định lý 5.1 ở trên: Ta có thể chặn trên \epsilon theo sample size m (từ Định lý 5.1) .Điều thú vị nhất là các chặn trên này cũng trùng với chặn dưới luôn (minimax bound: với một function class đây là chặn worse-case tốt nhất có thể được với mọi thuật toán learning).</p>
<p>4. Khái niệm entropy (khác với Shannon&#8217;s entropy) xuất hiện đầu tiên bên approximation theory của Russian school (xem vi&#8217; du.:<br />
<a href="http://www.procul.org/blog/2006/05/24/cac-bai-bao-kinh-oi%e1%bb%83n-khmt-9-birman-and-solomjaks-1967-paper/" rel="nofollow">http://www.procul.org/blog/2006/05/24/cac-bai-bao-kinh-oi%e1%bb%83n-khmt-9-birman-and-solomjaks-1967-paper/</a><br />
)<br />
và có liên hệ mật thiết với information theory. </p>
<p>5. Khái niệm Shannon&#8217;s entropy và approximation entropy thực ra có liên hệ với nhau cực kỳ hay, nếu ta sử dụng generalized Bayesian viewpoint. (Tong Zhang gần đây có một bài báo rất thú vị về cái này trên Annals of Statistics, 2006). Hy vọng một dịp nào đó tôi sẽ nói thêm về cái này. </p>
<p>6. Vapnik thường được gắn liền với statistical learning theory như một cha đẻ. Điều này đúng.<br />
Không chỉ trong learning theory, đóng góp của VC theory có thể coi là original trong theoretical statistics, góp phần tạo ra subfield gọi là empirical process theory trong statistics. Nếu Valiant đuợc Turing award, thì tôi nghĩ Vapnik cũng nên được một cái <img src='http://www.procul.org/blog/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' />  Nhưng sách của Vapnik thường không cân bằng và không ghi nhận xứng đáng các khái niệm khác trong empirical process theory mà tôi nghĩ Vapnik biết rõ là sẽ rất hữu ích và powerful hơn cho learning theory. Có cảm tưởng ông này là một người egoistic. Một quyển sách cân bằng hơn về khái niệm VC theo tôi là của van der Vaart và Wellner (Weak convergence and empirical processes). Quyển này nói kỹ về VC theory, and much much more. Và ứng dụng không chỉ trong classification như PAC&#8217;s setting mà trong estimation nói chung.</p>
<p>7. Tôi cảm tưởng dân FOCS/STOC làm về learning theory chưa có exposure nhiều về empirical process theory (ngoài lý thuyết VC ra).  Tuy vậy dân COLT với background statistics những năm gần đây có sự dịch chuyển đáng kể từ khái niệm VC sang sủ dụng khái niệm entropy.</p>
<p>8. Qua proof cu?a Định lý 5.3 có thể suy ra là NQH cũng có một cây Ramirez với xác suất cao.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
