<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog Khoa Học Máy Tính &#187; Lý thuyết tính toán</title>
	<atom:link href="http://www.procul.org/blog/category/ly-thuy%e1%ba%bft-tinh-toan/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.procul.org/blog</link>
	<description>Tầm nhìn ta thật ngắn mà đã thấy bao thứ  để làm -- Alan Turing</description>
	<lastBuildDate>Wed, 08 Feb 2012 13:27:56 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
		<item>
		<title>Polytime và polydata</title>
		<link>http://www.procul.org/blog/2011/10/25/polytime-va-polydata/</link>
		<comments>http://www.procul.org/blog/2011/10/25/polytime-va-polydata/#comments</comments>
		<pubDate>Tue, 25 Oct 2011 16:51:54 +0000</pubDate>
		<dc:creator>Nguyễn Xuân Long</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Lý thuyết thông tin]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[Toán Ứng Dụng]]></category>
		<category><![CDATA[Xác suất & thống kê]]></category>
		<category><![CDATA[học máy]]></category>
		<category><![CDATA[lỗi xấp xỉ]]></category>
		<category><![CDATA[lỗi ước lượng]]></category>
		<category><![CDATA[thống kê]]></category>
		<category><![CDATA[xác suất]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=3929</guid>
		<description><![CDATA[Mấy hôm nay đọc một số bài viết về việc học mô hình hỗn hợp (mixture models). Đây là lĩnh vực kinh điển trong thống kê, nhưng vẫn tiếp tục là một lĩnh vực mở đang được quan tâm trong thống kê, học máy cũng như thuật toán. [Tôi cũng vừa upload bài mới trên [...]]]></description>
			<content:encoded><![CDATA[<p>Mấy hôm nay đọc một số bài viết về việc học mô hình hỗn hợp (mixture models). Đây là lĩnh vực kinh điển trong thống kê, nhưng vẫn tiếp tục là một lĩnh vực mở đang được quan tâm trong thống kê, học máy cũng như thuật toán. [Tôi cũng vừa upload <a href= "http://arxiv.org/abs/1109.3250"> bài mới trên arxiv</a> về lĩnh vực này.]</p>
<p>Có một số khác biệt thú vị về tiêu chuẩn học/ước lượng bởi các cộng đồng khác nhau. Dân khmt đặc biệt là về thuật toán thì quan tâm đến làm sao tìm ra được thuật toán chạy có thời gian đa thức, và cần số lượng mẫu <img src='http://s.wordpress.com/latex.php?latex=%20n%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' n ' title=' n ' class='latex' /> cũng là đa thức. Đa thức đối với kích cỡ của đầu vào của bài toán (ở đây sẽ là chiều của mô hình = số lượng tham số), và đa thức đối với <img src='http://s.wordpress.com/latex.php?latex=%201%2F%5Cepsilon%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' 1/\epsilon ' title=' 1/\epsilon ' class='latex' />. Epsilon ở đây là lỗi ước lượng cho phép. Ví dụ như <a href= "http://research.microsoft.com/en-us/um/people/adum/publications/2010-Efficiently_Learning_Mixtures_of_Two_Gaussians.pdf"> bài báo này </a>, <a href="http://projecteuclid.org/DPubS?service=UI&#038;version=1.0&#038;verb=Display&#038;handle=euclid.aoap/1106922321"> bài này </a>.</p>
<p>Tôi không hiểu tại sao <img src='http://s.wordpress.com/latex.php?latex=%201%2F%5Cepsilon%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' 1/\epsilon ' title=' 1/\epsilon ' class='latex' /> và số lượng tham số lại &#8220;nghiễm nhiên&#8221; để ngang hàng nhau trong việc phân tích asymptotic. Nếu giới hạn cho polynomial asymptotic một cách chung chung thì chắc không sao &#8212; có nhiều ví dụ cho ta thấy điều đó. Phân biệt giữa độ phức tạp exponential và phức tạp polynomial là vấn đề truyền thống trong KHMT. Điều này cũng có nghĩa là trong khmt sự phân biệt giữa các tốc độ đa thức còn chưa được chú ý nhiều (<img src='http://s.wordpress.com/latex.php?latex=%20%281%2F%5Cepsilon%29%5E2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' (1/\epsilon)^2 ' title=' (1/\epsilon)^2 ' class='latex' /> vs. <img src='http://s.wordpress.com/latex.php?latex=%20%281%2F%5Cepsilon%29%5E3&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' (1/\epsilon)^3' title=' (1/\epsilon)^3' class='latex' /> chẳng hạn.) Kỳ thực so với thống kê thì các kết quả về phức tạp mẫu bên computational learning theory còn khá đơn giản, vì họ chưa chú trọng đến độ đa thức. </p>
<p>Trong thống kê hay học máy thống kê thì quan tâm chính là độ hội tụ của ước lượng (convergence of estimation error) đối với số mẫu. <img src='http://s.wordpress.com/latex.php?latex=%20%5Cepsilon%20%3D%20O%28n%5E%7B-1%2F2%7D%29%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \epsilon = O(n^{-1/2}) ' title=' \epsilon = O(n^{-1/2}) ' class='latex' /> là một tốc độ kinh điển trong thống kê tham số hữu hạn chiều (khi đó, ta cũng có <img src='http://s.wordpress.com/latex.php?latex=%20n%20%3D%20%281%2F%5Cepsilon%29%5E%7B2%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' n = (1/\epsilon)^{2} ' title=' n = (1/\epsilon)^{2} ' class='latex' />). Trong các vấn đề ước lượng khác thì tốc độ hội tụ có thể rất khác, <img src='http://s.wordpress.com/latex.php?latex=%20n%5E%7B-%5Cdelta%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' n^{-\delta} ' title=' n^{-\delta} ' class='latex' /> hoặc rất chậm theo tốc độ logarithm, <img src='http://s.wordpress.com/latex.php?latex=%5Blog%281%2Fn%29%5D%5E%7B%5Cdelta%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='[log(1/n)]^{\delta} ' title='[log(1/n)]^{\delta} ' class='latex' />, chẳng hạn. Lý thuyết minimax, nếu có, cho ta biết giá trị tốt nhất có thể của delta đạt được bởi một thuật toán tốt nhất có thể được. </p>
<p>Tuy nhiên bên thống kê chưa quan tâm đến sự phức tạp về thời gian của thuật toán. Có thể nói các kết quả về sự phức tạp của thuật toán ở bên thống kê hầu như không tồn tại.</p>
<p>Có thể tiếp cận vấn đề này theo hai hướng.</p>
<p>Một là tạm thời tách rời hai sự phức tạp khác nhau này ra. Thực ra cái này đã được làm ở một chừng mực nào đó: Đây chính là sự tách rời giữa lỗi xấp xỉ (approximation error) và lỗi ước lượng thống kê (estimation error). Thông thường lỗi xấp xỉ cũng cho ta biết tốc độ tốt nhất của một giải thuật tính xấp xỉ một đại lượng nào đó (không ngẫu nhiên), tuy điều này không phải luôn rõ ràng. Dân thống kê mới chỉ chú tâm đến cái thứ hai (lỗi ước lượng thống kê). Còn phân tích về lỗi xấp xỉ thì là địa hạt của những người nghiên cứu về lý thuyết xấp xỉ. Chỉ việc bê kết quả bên lý thuyết xấp xỉ sang áp dụng là xong. </p>
<p>Hướng này hay ở chỗ nó tách ra hai khái niệm mà bản thân chúng đều không đơn giản. Nhưng nếu không có kết quả về xấp xỉ cho một lớp mô hình cần quan tâm thì chịu. Điều này không phải là hy hữu, vì sự chú ý và động cơ của các ngành có nhiều khác nhau. Ví dụ, đân làm xấp xỉ có vẻ không quan tâm nhiều đến các biến rời rạc hoặc các dạng hàm số định nghĩa cho tập hợp (như hàm phân bố xác suất).</p>
<p>Hướng thứ hai là không tách rời hai dạng lỗi kể trên. Qua đó ta có thể nghiên cứu về sự tương tác giữa phức tạp về mẫu và phức tạp về thuật toán. Đặc biệt, sự tương tác giữa các mức phức tạp đa thức của cả mẫu và thời gian thuật toán. Tôi nghĩ đây là một trong những vấn đề thú vị trong lý thuyết học máy hiện nay. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2011/10/25/polytime-va-polydata/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Mật mã khóa công khai: hành trình 35 năm</title>
		<link>http://www.procul.org/blog/2011/04/12/m%e1%ba%adt-ma-khoa-cong-khai-s%e1%bb%b1-phat-tri%e1%bb%83n-t%c6%b0%c6%a1ng-h%e1%bb%97-v%e1%bb%9bi-cac-nganh-khoa-h%e1%bb%8dc-khac/</link>
		<comments>http://www.procul.org/blog/2011/04/12/m%e1%ba%adt-ma-khoa-cong-khai-s%e1%bb%b1-phat-tri%e1%bb%83n-t%c6%b0%c6%a1ng-h%e1%bb%97-v%e1%bb%9bi-cac-nganh-khoa-h%e1%bb%8dc-khac/#comments</comments>
		<pubDate>Tue, 12 Apr 2011 22:40:32 +0000</pubDate>
		<dc:creator>Phan Dương Hiệu</dc:creator>
				<category><![CDATA[Ảnh hưởng của CNTT]]></category>
		<category><![CDATA[Bảo mật và mật mã học]]></category>
		<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Toán Ứng Dụng]]></category>
		<category><![CDATA[Hàm cửa lật]]></category>
		<category><![CDATA[Khóa công khai]]></category>
		<category><![CDATA[Mật mã]]></category>
		<category><![CDATA[Mật mã học]]></category>
		<category><![CDATA[RSA]]></category>
		<category><![CDATA[xác suất]]></category>
		<category><![CDATA[Độ phức tạp tính toán]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=3250</guid>
		<description><![CDATA[(Một phiên bản ngắn hơn của bài  này sẽ đăng trong số kỷ niệm 20 năm báo Tia Sáng. Các bạn có thể xem tại đây) Mã hóa khóa công khai ra đời cách đây 35 năm, đánh dấu bởi công trình khoa học của Whitfield Diffie và Martin Hellman. Đó thực sự là một [...]]]></description>
			<content:encoded><![CDATA[<p><em>(Một phiên bản ngắn hơn của bài  này sẽ đăng trong số kỷ niệm 20 năm báo Tia Sáng. Các bạn có thể xem <a href="http://dl.dropbox.com/u/15421912/Tiasang_Matma.pdf">tại đây</a>)</em></p>
<p>Mã hóa khóa công khai ra đời cách đây 35 năm, đánh dấu bởi công trình khoa học của Whitfield Diffie và Martin Hellman. Đó thực sự là một bước ngoặt đưa mật mã từ một nghệ thuật thành một ngành khoa học. Trong quá trình 35 năm phát triển, những phát kiến trong mật mã hầu hết rất phản trực quan, và do đó càng bất ngờ thú vị, đã có ảnh hưởng lớn đến nhiều ngành khoa học khác: áp dụng những kết quả trừu tượng trong lý thuyết số vào thực tế; thúc đẩy sự phát triển của các thuật toán xác suất; đưa ra những khái niệm quan trọng trong lý thuyết tính toán mà điển hình là khái niệm chứng minh tương tác; tạo cầu nối giữa lý thuyết số và khoa học máy tính thông qua lý thuyết số tính toán… Trong bài này, chúng tôi sẽ điểm sơ qua sự phát triển của mật mã trong mối liên hệ với các ngành khoa học khác, và thảo luận về những hướng phát triển của mật mã trong những năm tới.</p>
<p><span id="more-3250"></span></p>
<p><strong>Thay đổi trong cách tiếp cận tính an toàn.</strong></p>
<p>Từ ngàn xưa con người ta đã có nhu cầu trao đổi bí mật: từ những mệnh lệnh trong các cuộc chiến tranh cho đến những hẹn hò thường nhật. Ta tìm thấy vết tích của mật mã từ thời Ai cập cổ đại, cho tới hệ mã nổi tiếng mà Ceasar dùng trong thời La mã, cho tới bức thư tình mà <a href="http://5ko.free.fr/fr/sand.html">George Sand gửi cho Alfred de Musset</a>… Ở thời kỳ sơ khai, mật mã có thể coi như nghệ thuật che giấu thông tin mà độ an toàn đạt được là nhờ có sự thống nhất một qui ước bí mật chung. Như vậy, thuật toán lập mã và giải mã là bí mật. Nhưng khi tầm ứng dụng càng rộng thì yêu cầu bí mật cơ chế mã lại càng không hợp lý vì nhiều người sử dụng nên tất yếu sẽ rất dễ bị lộ. Cuối thế kỷ 19, Kerckhoffs đề nghị một nguyên tắc xem xét độ an toàn chỉ dựa trên khóa bí mật còn thuật toán lập mã/giải mã không cần phải giữ kín. Qui tắc này đến nay vẫn còn là rất cơ bản. Xuyên suốt thế kỷ vừa qua, người ta đã xây dựng được rất nhiều các cơ chế mã tốt, với độ an toàn dựa trên sự bảo mật của khóa chung giữa người gửi và người nhận. Tuy vậy, sự cần thiết chia sẻ khóa bí mật là một điểm bất thuận lợi, nó là rào cản lớn cho việc trao đổi thông tin trên diện rộng: ví dụ để thiết lập kênh bí mật đôi mội giữa một nghìn người thì cần tới cả nửa triệu khóa bí mật.</p>
<p>Mật mã khóa công khai đã vượt qua rào cản đó và đưa đến một bước ngoặt trong sự phát triển ngành mật mã. Ý tưởng chính của nó khá giản đơn: lập mã và giải mã là hai quá trình có bản chất khác nhau, nếu như giải mã nhất thiết phải dùng khóa bí mật (nếu không ai cũng giải được) thì lập mã lại không nhất thiết như vậy, và thậm chí sẽ càng tốt hơn khi ai cũng có thể lập mã. Do vậy, nếu ta có thể sinh ra một khóa bí mật cho giải mã và một khóa công khai tương ứng cho lập mã thì quá trình lập mã không còn cần bất kỳ bí mật nào. Tuy có vẻ tự nhiên nhưng việc mã hóa sử dụng khóa công khai làm thay đổi hoàn toàn yêu cầu về sự an toàn: khóa bí mật không cần chia sẻ nữa, mỗi người có khóa bí mật của riêng mình và chỉ cần giữ kín nó, không cần thiết phải chia sẻ nó với bất kỳ ai khác. Sự đảm bảo an toàn không còn cần dựa trên sự tin tưởng lẫn nhau giữa người gửi và người nhận.</p>
<p>Mật mã khóa công khai còn làm thay đổi hoàn toàn phạm vi ứng dụng, cho phép mật mã được sử dụng rộng rãi trong thực tế: việc thiết lập kênh bí mật giữa một nghìn hay một triệu người thì cũng chỉ yêu cầu mỗi người cần giữ một khóa bí mật và công bố một khóa công khai, không cần phải thống nhất khóa chung nào. Áp dụng vào thực tế, một cửa hàng trực tuyến có thể thu hút hàng triệu khách hàng mà chỉ cần công khai duy nhất một khóa để ai mua hàng cũng chỉ cần dùng khóa công khai đó để gửi thông tin bảo mật về thẻ thanh toán.<strong> </strong></p>
<p><strong> </strong></p>
<p><strong>Mật mã với lý thuyết độ phức tạp tính toán</strong></p>
<p>Bên cạnh những ưu điểm mang tính bước ngoặt, mã hóa khóa công khai ẩn chứa một điều đáng lo ngại về tính an toàn: khi công bố khóa công khai tương ứng với khóa bí mật sẽ có thể dẫn tới việc khóa bí mật không còn … hoàn toàn bí mật! Điều lo ngại đó hoàn toàn có cơ sở bởi một kẻ tấn công có thể thử hết các trường hợp có thể để tìm ra khóa bí mật tương ứng với khóa công khai. Do đó, về nguyên tắc, kẻ tấn công có thể phá được sơ đồ mã hóa, tìm ra khóa bí mật mà không cần quan sát bất kể bản mã nào! Chính vì thế mà độ an toàn của mật mã khóa công khai sẽ không thể chỉ dựa trên sự giữ bí mật khóa nữa. Muốn đảm bảo sự an toàn, ta phải chứng tỏ làm sao, dù về nguyên tắc, kẻ tấn công có thể tìm ra khóa bí mật, nhưng thời gian để đạt được mục đích đó phải là rất lớn, cỡ hàng triệu năm trên một máy tính nhanh nhất chẳng hạn. Hay nói cách khác, độ phức tạp mà kẻ tấn công có thể tìm lại khóa bí mật là lớn phi thực tế.</p>
<p>Một cách rất tự nhiên, nghiên cứu độ an toàn của mật mã khóa công khai đã nằm gọn trong lý thuyết độ phức tạp tính toán (<em>Computational Complexity</em>). Trong lý thuyết độ phức tạp, ta không chỉ quan tâm xem một bài toán có thể giải được hay không, mà điều quan trọng nhất là nghiên cứu xem để giải bài toán đó thì độ khó khăn lớn đến đâu. Độ phức tạp được phân cấp theo các lớp, trong đó hai lớp quan trọng nhất là lớp P và lớp NP. Lớp P bao gồm những bài toán giải được trong thời gian đa thức, và nó được coi là lớp các bài toán có thể giải được trong thực tế. Chẳng hạn các bài toán sắp xếp dữ liệu theo một thứ tự định sẵn, tìm đường đi ngắn nhất giữa hai thành phố, biến đổi Fourrier rời rạc (đều có thể thực hiện được với cỡ <em>nlog(n) </em>bước cho <em>n</em> đối tượng, tức là bị chặn bên bởi một đa thức <img src='http://s.wordpress.com/latex.php?latex=p%28n%29%3Dn%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p(n)=n^2' title='p(n)=n^2' class='latex' />) là những bài toán trong P. Lớp NP là lớp các bài toán có thể kiểm tra được lời giải đúng hay sai trong thời gian đa thức. Chẳng hạn trò chơi Sudoku thuộc lớp NP vì để giải nó có thể rất khó (thậm chí nó được chứng minh là một trong những bài toán thuộc <a href="http://en.wikipedia.org/wiki/Mathematics_of_Sudoku">lớp khó giải nhất trong NP</a>) nhưng để kiểm tra một phương án có là lời giải không thì có lẽ chỉ cần đến một cậu bé biết phân biệt các con số với nhau và duyệt qua tất cả các ô. Rõ ràng chỉ khi lời giải có thể kiểm tra được trong thực tế thì bài toán mới được quan tâm, do vậy mà lớp NP có vai trò quan trọng. Câu hỏi trọng tâm của lý thuyết độ phức tạp là liệu các bài toán trong NP có thể có lời giải thực tế (tức trong thời gian đa thức) hay không, tức liệu P có bằng NP? Nếu P=NP thì điều đó đem lại một sự bất ngờ cho nhận thức của chúng ta: việc tìm ra lời giải cũng chỉ khó như việc kiểm tra lời giải. Điều khó tin đó làm người ta thường giả thuyết rằng P khác NP. Sự quan trọng của câu hỏi “P chọi NP?” là lý do để nó được viện Clay xếp vào một trong bảy bài toán thiên niên kỷ.</p>
<p>Quay trở lại với lý thuyết mật mã và xem xét nó dưới góc nhìn của lý thuyết độ phức tạp. Giờ đây ta có thể định nghĩa hệ mã bị phá nếu như có thuật toán phá mã (tìm lại khóa bí mật từ khóa công khai, hay đơn giản hơn, tìm lại bản rõ từ bản mã) trong thời gian đa thức. Vậy độ phức tạp của thuật toán phá mã liệu có thể đánh giá trong trường hợp chung? Câu trả lời là có và với mọi sơ đồ mã hóa khóa công khai đều có thuật toán phá mã thuộc lớp NP: do điều kiện cần của hệ mã là khi giải mã ta phải tìm lại đúng bản rõ, bài toán kiểm tra xem 1 khóa bí mật có tương ứng với 1 khóa công khai hay không là dễ dàng (chỉ cần chọn 1 bản rõ, mã nó dùng khóa công khai rồi giải mã nó với khóa bí mật xem có thu lại được đúng bản rõ hay không). Bài toán “P chọi NP” trở nên có tầm quan trọng sống còn tới lý thuyết mật mã: nếu hai lớp này tương đương thì toàn bộ lý thuyết nghiên cứu mật mã dưới góc nhìn độ phức tạp sẽ hoàn toàn sụp đổ vì việc phá mã, vốn thuộc NP, khi đó sẽ có thể thực hiện được trong thời gian đa thức. Và cũng do vậy, nghiên cứu độ phức tạp trong mật mã cần phải dựa trên giả thuyết “P khác NP”.</p>
<p><strong>Hàm cửa lật một chiều và sự phát triển của lý thuyết số tính toán </strong></p>
<p>Khi tính an toàn chia tay với nghệ thuật che giấu bí mật để chuyển sang dựa trên lý thuyết độ phức tạp thì cũng là lúc mật mã bất ngờ tìm đến và làm những nghiên cứu trừu tượng trong lý thuyết số bỗng có những áp dụng đầy ý nghĩa trong thực tế. Nó cũng đưa lý thuyết số tính toán (<em>computational number theory</em>) trở thành một nhánh nghiên cứu quan trọng, nằm giữa vùng giao thoa của toán học và tin học.</p>
<p>Tựu chung yêu cầu để xây dựng mật mã khóa công khai là: hàm lập mã thì dễ (với khóa công khai), nhưng hàm giải mã thì khó khi không có khóa bí mật. Đó là các hàm cửa lật một chiều (<em>trapdoor oneway functions</em>): tính xuôi thì dễ, tính ngược lại phải khó, nhưng với cửa lật là khóa bí mật thì tính ngược, tức giải mã, cũng phải dễ. Yêu cầu trông có vẻ đơn giản đó nhưng thực tế là sau rất nhiều năm tìm kiếm vẫn chỉ có rất ít hàm có thể thỏa mãn. Các bài toán trong lớp NP-đầy đủ (là lớp các bài khó nhất trong NP, trò chơi Sudoku là một trong số đó; ta chỉ cần giải được 1 bài trong lớp NP-đầy đủ trong thời gian đa thức là đủ để chứng tỏ P=NP) rõ ràng là những ứng cử viên tiềm năng để xây dựng hàm cửa lật một chiều. Nhưng thực tế không hề dễ như ban đầu người ta hình dung, vì hai lý do: thứ nhất là bởi các bài toán NP chỉ quan tâm đến độ khó trong trường hợp xấu nhất, trong khi mã hóa cần mã an toàn cho mọi bản rõ nên cần ít nhất độ khó trong trường hợp trung bình; thứ hai là bởi tính chất cửa lật, bài toán cần khó nhưng với một số thông tin thì nó lại phải trở nên dễ giải, và chính yêu cầu về tính chất cửa lật đó đã khiến nhiều hệ mã dựa trên bài toán NP-đầy đủ (như hệ mã Chor-Rivest dựa trên bài toán xếp ba lô) bị phá vỡ.</p>
<p>Những hàm cửa lật thông dụng trong mật mã đã đến từ những bài toán rất cổ điển của lý thuyết số! Đó là bài toán phân tích số (cho một số <em>N = pq</em> là tích của hai số nguyên tố, phân tích nó ra thừa số nguyên tố <em>p,q</em>) và bài toán logarit rời rạc trong trường hữu hạn (cho một phần tử sinh <em>g</em> của một nhóm con của một trường hữu hạn, và một phần tử nhóm <em>u=g<sup>a</sup></em>, bài toán là phải tìm lại <em>a</em>). Cả hai bài toán này, tuy về mặt toán học là giải được, nhưng cho đến nay không thể giải được trong thời gian đa thức. Bài toán phân tích số là nền tảng cho độ an toàn của hệ mã nổi tiếng RSA, và bài toán logarit rời rạc là cơ sở cho hệ mã Elgamal. Chính vì tính phổ dụng của hai hệ mã này mà một cách tất nhiên, bài toán phân tích số và bài toán logarit rời rạc trở thành đối tượng nghiên cứu rất được quan tâm. Việc nghiên cứu tính phức tạp của việc tìm ra lời giải cho các bài toán lý thuyết số đã đưa tới sự phát triển sâu rộng của lý thuyết số tính toán.</p>
<p>Sau nhiều công trình nghiên cứu quan trọng thì các bài toán bài toán phân tích số và bài toán logarit rời rạc tuy chưa giải được trong thời gian đa thức nhưng cũng không cần đến thời gian hàm mũ để giải nó, mà đã có các thuật toán dưới mũ (<em>sub-exponention</em>) như thuật toán dùng tính chỉ số (<em>index calculus</em>) và thuật toán dùng <em>đường cong</em> <em>elliptic</em> của Lenstra, được giới thiệu năm 1985. Dù cho những công trình này không làm các hệ mã sụp đổ, nhưng nó buộc phép xây dựng các hệ mã phải giảm hiệu quả vì phải dùng các khóa dài hơn để đảm bảo an toàn. Công trình của Lenstra cũng đánh dấu lần đầu tiên lý thuyết các đường cong elliptic được sử dụng vào mật mã, ở đây có vai trò như phá mã. Điều thú vị là ngay sau đó thì lý thuyết các đường cong elliptic đã được sử dụng cho việc lập mã. Koblitz và Miller cùng độc lập đề nghị thay thế việc sử dụng nhóm trong trường hữu hạn bằng nhóm các điểm trên đường cong elliptic vì ở đó, các thuật toán dưới mũ đã biết để giải quyết bài toán logarit rời rạc có vẻ như không thể áp dụng được. Từ đó việc sử dụng đường cong elliptic dẫn tới dẫn đến những hệ mã hiệu quả hơn (do không cần phải chọn khóa quá dài để chống lại các thuật toán dưới mũ).</p>
<p>Các kết quả lý thuyết sâu sắc trong lý thuyết số tiếp tục được áp dụng vào mật mã. Việc sử dụng đường cong elliptic dẫn tới yêu cầu cần phải lựa chọn những đường cong phù hợp. Tấn công MOV (đưa ra bởi Menezes, Okamoto, và Vanstone) chỉ ra không phải loại đường cong elliptic nào cũng có thể được sử dụng, bằng cách đưa việc giải quyết bài toán logarit rời rạc trên đường cong elliptic trở lại bài toán logarit rời rạc trên một trường hữu hạn mở rộng với độ mở rộng tùy thuộc vào loại đường cong. Do đó, các đường cong siêu lạ (<em>supersingular</em>) rất được ưa dùng ở giai đoạn đầu lại trở nên rất yếu vì ở đó độ mở rộng chỉ cao nhất là 6. Nét đặc biệt trong tấn công MOV là việc sử dụng phép ghép cặp (<em>pairings</em>) trên các đường cong elliptic, với những kết quả khá mới mẻ trong lý thuyết số. Không chỉ phục vụ cho việc phá mã, việc sử dụng phép ghép cặp sau đó đã trở nên cực kỳ hữu hiệu trong việc xây dựng mã. Khởi đầu là Joux đã dùng phép ghép cặp để xây dựng sơ đồ  trao đổi khóa 3 bên, nhưng sự kiện nổi bật là việc dùng phép ghép cặp để giải quyết vấn đề mở về xây dựng mã hóa dựa trên danh tính-<em>Identity based Encryption</em>. Một cách giản đơn, mã hóa dựa trên danh tính cho phép ta sử dụng một khóa công khai duy nhất cho tất cả mọi người (từ đó giải quyết được vấn đề quản lý khóa của mã hóa khóa công khai, tuy vậy nhược điểm của nó là lại cần có thêm người quản trị đáng tin cậy để sinh ra khóa công khai chung và khóa bí mật cho từng người) và hàm lập mã dựa trên khóa công khai chung và danh tính của người nhận như địa chỉ email.  Sau khi Sakai-Ohgishi-Kasahara và Boneh-Franklin đưa ra lời giải cho bài toán mã hóa dựa trên danh tính vào những năm 2000, phép ghép cặp đã được sử dụng hầu khắp trong mọi lĩnh vực của mật mã (mã hóa, chứa ký điện tử, sơ đồ định danh&#8230;) để nâng cao tính an toàn và hiệu quả và đôi khi là giải quyết những bài toán mở đã bế tắc trong thời gian dài (chẳng hạn như trong việc xây dựng chữ ký nhóm). Đến cách đây vài năm người ta đã tổ chức hẳn một hội nghị (Pairing-based Cryptograhy) dành cho các nghiên cứu liên quan đến các thuật toán xây dựng và phân tích các phép ghép cặp trên các đường cong elliptic hay hyperelliptic và các phương pháp mã và tấn công mã dựa trên phép ghép cặp.</p>
<p>Nhìn lại các phát triển của lý thuyết số tính toán, ta nhận thấy các phương pháp mới thường được đề nghị đầu tiên cho phá mã, nhưng rồi sau đó lại được sử dụng rất hiệu quả cho việc lập mã. Điều đó cũng phần nào chứng tỏ vai trò tương hỗ giữa cộng đồng những người thám mã và lập mã: trong rất nhiều trường hợp, chính những người say mê tìm cách phá tính an toàn của các hệ thống mật mã, sẽ là những người đem tới những phát kiến mới mẻ để xây dựng những hệ mã an toàn hơn.</p>
<p><strong> </strong></p>
<p><strong>Đảm bảo tính an toàn và sự phát triển của lý thuyết các thuật toán xác suất</strong></p>
<p>Để có thể cài đặt được hệ mã RSA, một phần tất yếu là sự cần thiết phải tìm được những số nguyên tố lớn để có thể đảm bảo yêu cầu an toàn tối thiểu (khóa công khai chứa tích của hai số nguyên tố, và nếu một trong hai số nguyên tố là nhỏ thì bài toán phân tích số sẽ là dễ). Từ đó mà yêu cầu tìm các số nguyên tố lớn trở nên rất cần thiết.</p>
<p>Cho tới nay, các phương pháp tìm số nguyên tố lớn đều theo nguyên tắc hai bước: bước 1 là chọn một số tự nhiên đủ lớn và bước 2 là kiểm tra xem số được chọn có là số nguyên tố hay không. Do các số nguyên tố có cấu trúc rất bí hiểm và ta chưa hiểu được quy luật tường minh của chúng nên bước 1 chưa có cách nào khác là chọn một số ngẫu nhiên. Bước thứ 2 là bước kiểm tra tính nguyên tố. Chính những thuật toán kiểm tra tính nguyên tố, mà điển hình là những thuật toán được sử dụng rộng rãi của của Rabin và Solovay, Strassen,  đã khởi đầu cho việc dùng xác suất để thiết kế các thuật toán (chú ý rằng trước đó khá lâu phương pháp xác suất đã được Erd ̋os sử dụng trong việc chỉ ra <em>sự tồn tại</em> của các đối tượng tổ hợp). Các thuật toán xác suất cho ta lời giải không hoàn toàn chính xác, nhưng độ không chính xác có thể làm nhỏ tới bao nhiêu cũng được, với điều kiện đầu vào của thuật toán có một nguồn ngẫu nhiên đủ lớn.</p>
<p>Việc phát triển các thuật toán xác suất dẫn tới sự cần thiết tìm nguồn ngẫu nhiên đủ lớn. Điều đó dẫn tới việc nghiên cứu những bài toán sau đó đã trở nên rất có ý nghĩa trong khoa học máy tính như bài toán trích nguồn ngẫu nhiên (<em>randomness extractor</em>, nhằm từ một nguồn không hoàn toàn ngẫu nhiên ta phải trích ra từ đó một lượng tin có độ ngẫu nhiên cao)  và bài toán sinh dãy giả ngẫu nhiên (<em>pseudo-random generator</em> &#8211; từ một nguồn ngẫu nhiên nhỏ làm sao sinh ra một nguồn gần như ngẫu nhiên lớn hơn rất nhiều, nó không hoàn toàn ngẫu nhiên nhưng không có thuật toán nào trong thời gian đa thức có thể chỉ ra tính không ngẫu nhiên của nó)</p>
<p>Sau nhiều phát triển quan trọng của lý thuyết thuật toán xác suất, người ta quay lại hoài nghi “liệu độ ngẫu nhiên có thực sự mang tới sự hiệu quả?”. Bài toán “BPP chọi P” (ở đó BPP là lớp các bài toán giải được theo nghĩa xác suất) là một bài toán mở trọng tâm của lý thuyết độ phức tạp. Cũng như bài toán “P vs. NP”, nếu câu trả lời là hai lớp tương đương thì nó sẽ dẫn tới một khẳng định bất ngờ: mọi thuật toán xác suât đều có thể có thuật toán tất định tương đương. Bên cạnh câu hỏi tổng quan này, các nhà nghiên cứu quay lại với bài toán tìm số nguyên tố nhằm đưa ra một lời giải tất định cho nó. Công trình lý thuyết đột phá của Agrawal–Kayal–Saxena đưa ra năm 2000, đã chỉ ra một thuật toán tất định để kiểm thử tính nguyên tố trong thời gian đa thức, giải quyết trọng vẹn bước thứ 2 một cách tất định. Sự hấp dẫn của một lời giải hoàn chỉnh cho bài toán tất định tìm số nguyên tố chính là nguồn cảm hứng chung rất lớn của các nhà toán-tin học và nó được chọn là bài toán khởi đầu cho một kế hoạch đầy tham vọng nhằm thay đổi tư duy trong hợp tác nghiên cứu khoa học: hợp tác mở thông qua đóng góp, trao đổi mở trên mạng. Với sự nhiệt tình của Timothy Gower, Terence Tao  (cả hai đều đạt giải thưởng Fields), đã có rất nhiều nhà khoa học tham gia vào dự án mở Polymath để cùng trao đổi nhằm tìm kiếm lời giải cho bài toán này. Tuy chưa thể đưa ra lời giải toàn phần, họ đã có một số kết quả dẫn tới một <a href="http://arxiv.org/abs/1009.3956">bài báo khoa học</a> dưới tên tác giả Polymath. Rất có thể đây sẽ là một hình thức cộng tác khoa học xuyên biên giới có sức mạnh tổng hợp lớn trong tương lai.</p>
<p><strong>Chứng minh tương tác không để lộ tri thức </strong></p>
<p><strong> </strong></p>
<p>Trong mật mã, mọi trao đổi thông tin đều giả thiết có sự hiện diện của kẻ xấu. Mục đích của ta là vừa có thể thuyết phục người đối thoại về tính đúng đắn của một mệnh đề nào đó, lại vừa không cần tin tưởng anh ta, và không muốn sau khi trao đổi anh ta cũng có khả năng chứng minh mệnh đề đó với người khác. Chẳng hạn, một thành viên của một câu lạc bộ bí mật muốn chứng minh danh tính của mình cho người gác cổng, nhưng lại không muốn nói mật khẩu của mình vì sợ chính người gác cổng sẽ bán nó cho kẻ khác. Trong ngữ cảnh đó, một trong những khái niệm thú vị nhất của khoa học máy tính đã được đề nghị: chứng minh tương tác (<em>interactive proofs</em>). Khái niệm này được đưa ra bởi Goldwasser, Micali và Rackof vào đầu những năm 80 và nhờ đó họ đã được trao giải Godel đầu tiên trong lịch sử (giải thưởng hàng năm cho công trình lý thuyết xuất sắc nhất trong khoa học máy tính).</p>
<p>Dưới góc độ toán học, ta thường quan niệm chứng minh là một dãy các lập luận lô gíc có thể trình bày tường minh trên giấy. Liệu chăng yếu tố đối thoại, tương tác giữa người chứng minh và người kiểm tra có mang đến điều mới mẻ? Để trả lời câu hỏi đó, trước hết khái niệm về một chứng minh sẽ phải thay đổi. Goldreich thường trích lời thầy giáo Simon của mình khi giảng về các chứng minh tương tác:</p>
<p style="text-align: center;"><em>“chứng minh là bất kể cách gì có thể thuyết phục được tôi” </em><em>(“ A proof is whatever convinces me”).</em></p>
<p><em> </em></p>
<p>Theo nghĩa đó, một chứng minh tương tác là một chuỗi các chất vấn, cho tới khi người hỏi bị thuyết phục hoàn toàn bởi người chứng minh. Một câu chuyện vui kể rằng, rằng, một cậu bé cho rằng mình có câu thần chú để mở vách ngăn giữa hai nhánh của một hang động. Tất nhiên cậu ta không muốn lộ câu thần chú của mình, nhưng lại muốn chứng minh khả năng đó.  Trò chơi đuổi bắt có thể là một chứng minh tương tác hiệu quả: chú bé chạy vào 1 trong hai ngã, một người đuổi chon một hướng nhằm dồn chú vào ngách ngăn nhưng cuối cùng không lần nào bắt được chú. Nếu đuổi một lần ta có thể cho là chú đã chọn ngã khác, nhưng lặp đi lặp lại trò chơi tới 100 lần mà không lần nào đuổi được thì có lẽ ta bị thuyết phục là chú đúng là có câu thần chú (ví dụ lấy từ <a href="http://en.wikipedia.org/wiki/Zero-knowledge_proof">Wikipedia</a>). Các chứng minh tương tác hầu hết dựa trên một tinh thần như thế.</p>
<p><a href="http://www.procul.org/blog/wp-content/uploads/2011/04/ZK2.png"><img class="alignright size-medium wp-image-3263" title="ZK" src="http://www.procul.org/blog/wp-content/uploads/2011/04/ZK2-300x209.png" alt="" width="300" height="209" /></a></p>
<p>Có những bài toán mà người ta chưa biết cách nào chứng minh trong thời gian đa thức, nhưng lại chứng minh được thông qua tương tác, chẳng hạn bài toán chứng minh hai đồ thị không đồng cấu với nhau.  Hơn thế nữa, trong nhiều bài toán, người chứng minh có thể không cần để lộ ra bất kể tri thức nào anh ta có về cái chứng minh đó (<em>zero-knowledge proofs</em>).</p>
<p><em> </em></p>
<p>Kết quả rất đẹp của Goldreich, Micali và Wigderson cho ta kết quả bất ngờ: dựa trên giả thuyết tồn tại các hàm một chiều, tất cả những gì ta có thể chứng minh trong thực tế (theo nghĩa trong thời gian đa thức), đều có thể chứng minh mà không để lộ tri thức! Bài toán chứng minh danh tính phía trên là một trong số đó.</p>
<p>Các chứng minh không để lộ tri thức đặc biệt quan trọng trong mật mã, là thành phần cơ bản trong việc xây dựng các sơ đồ mã hóa, chữ ký điện tử. Chứng minh không để lộ tri thức cũng là thành phần không thể thiếu trong một sơ đồ bầu cử điện tử, cho phép mỗi cử tri kiểm tra được lá phiếu của mình đã được tính đến mà việc kiểm phiếu lại không cần phải công bố nội dung từng lá phiếu, đảm bảo quyền lựa chọn bí mật của cử tri.</p>
<p>Ở một khía cạnh khác, chứng minh tương tác cũng là phần hồn của nhánh khoa học «chứng minh tính bảo mật » (<em>provable security</em>), nơi ta cố gắng chứng minh tính an toàn của hệ thống trong một thế giới tương tác rất phức tạp (với sự hiện diện của kẻ tấn công luôn muốn lừa hệ thống thông qua quan sát, nghe trộm, đóng giả người tốt để tương tác với hệ thống) dựa trên những giả thuyết tĩnh, giản đơn của toán học.</p>
<p><strong>Một số h</strong><strong>ướng đi tương lai của mật mã </strong></p>
<p><strong> </strong></p>
<p><em>Bảo mật trong điện toán đám mây (cloud computing)</em></p>
<p>Điện toán đám mây cho phép ta lưu trữ những khối lượng thông tin khổng lồ trên mạng và thực hiện các thao tác trên nó một cách dễ dàng. Nó có thể giúp ta giải quyết những bài toán lớn mà trước đây khó có thể giải quyết trên một mạng lưới các máy tính mang tính chất cục bộ. Tuy nhiên, điều đó mang tới một thách thức vô cùng lớn về tính bảo mật. Có hai điều có vẻ như mâu thuẫn nhau: lưu trữ dữ liệu lớn trên các hệ thống xa lạ rõ ràng rất dễ bị đánh cắp thông tin, nhưng nếu ta mã hóa toàn bộ dữ liệu thì sẽ khó có thể tận dụng sức mạnh của tính toán đám mây để thao tác dữ liệu đó.</p>
<p>Nhưng gần đây, vấn đề tưởng khó có thể giải quyết này đã có chút tia hy vọng, với công trình của Gentry năm 2009 về mật mã đẳng cấu theo cả phép nhân và phép cộng (<em>fully homomorphic encryption</em>). Hệ mã này cho phép, từ hai bản mã của hai bản rõ <em>m</em> và <em>m’</em>, ta có thể tính được bản mã nhân của <em> mm’</em> và bản mã cộng của <em>m+m’</em>. Vấn đề với bề ngoài đơn giản nhưng chứa đựng không ít nghịch lý trong đó: hệ mã vừa phải đảm bảo an toàn cho dữ liệu (không thể biết thông tin về bản rõ <em>m, m’</em>), mà lại vẫn thao tác được trên dữ liệu đó. Và cũng với bề ngoài giản đơn như vậy, nó lại mang đến một ý nghĩa rất bao quát: do mọi tính toán đều có thể qui về các phép toán cơ bản là cộng và nhân, một hệ mã như thế sẽ cho ta khả năng làm mọi tính toán trên dự liệu được mã hóa! Điều đó có nghĩa ta có thể để tất cả dữ liệu bảo mật trên những máy mạng không an toàn mà vẫn có thể tận dụng được sức tính toán lớn của điện toán đám mây để thao tác trên dữ liệu được mã hóa. Tuy nhiên, hiện tại, hệ mã Gentry và một số hệ mã cải tiến còn có hiệu quả vô cùng thấp, hầu như chỉ mang tính lý thuyết. Một hệ mã hiệu quả sẽ là lời giải tuyệt vời cho bài toán an toàn thông tin trong điện toán đám mây.</p>
<p><em>Mở rộng mô hình mã hóa: cho đối tượng nhóm và cho việc giải mã bộ phận</em></p>
<p><strong> </strong></p>
<p>Mã hóa thường cho ta thiết lập kênh trao đổi thông tin giữa một người với một người. Tuy nhiên, những ứng dụng thực tế đòi hỏi khả năng ta mã một lần sao cho nhiều người cùng có thể giải mã. Một ví dụ điển hình là việc phát chương trình truyền hình mã hóa sao cho hàng triệu thuê bao đều giải được mã. Nhưng một ứng dụng như vậy sẽ đặt ra hai vấn đề: mã một lần cho nhiều người (<em>broadcast encryption</em>) và ngăn chặn một người hay một nhóm người thuê bao cấu kết nhau để làm một bộ giải mã giả (<em>tracing traitor</em>). Hiện tại các thuật toán được sử dụng trong truyền hình thuê bao hầu hết đang còn ở thời nguyên thủy: độ an toàn buộc phải dựa trên tính bí mật của thuật toán. Nhưng cũng bởi vậy nên khi một nhóm phá mã có thể phá được nguyên lý bằng kỹ nghệ đảo ngược (<em>reverse engineering</em>) thì thị trường chợ đen có thể bán tràn lan các bộ giải mã giả mà không có cách gì truy lại được ai là thủ phạm.</p>
<p>Hai năm trở lại đây, một hướng nghiên cứu khá mới là về một kiểu mã tổng quát có thể bao quát hết các khái niệm về mã hóa công khai, mã hóa dựa trên danh tính, hay mã hóa một lần cho nhiều người. Đó là loại mã hàm (<em>functional encryption</em>) ở đó nó cho phép người lập mã định nghĩa một cơ chế giải mã<em> </em>để đối với mỗi người nhận, tùy vào thuộc tính được gán có mà có thể truy cập sâu vào bản rõ tới đâu. Cho tới nay, đối với những cơ chế mã với các cấu trúc tương đối phức tạp, các phương án lập mã còn rất hạn chế về hiệu quả. Những kết quả trong tương lai chắc chắn sẽ mang tới những ứng dụng rất hiệu quả, đặc biệt là cho việc truy cập các cơ sở dữ liệu mã hóa lớn.</p>
<p><em>An toàn trước các tấn công vật lý</em></p>
<p><em> </em></p>
<p>Mật mã thường phân tích tính an toàn dựa trên giả thuyết là khóa bí mật được bảo vệ tốt. Tuy nhiên, những tấn công vật lý đôi khi lại có thể tìm ra những thông tin về khóa (chẳng hạn bằng cách đo năng lượng tiêu thụ của máy giải mã trên các bản mã khác nhau). Do vậy, một trong các mục đích của mật mã là tìm cách hình thức hóa các khái niệm tấn công vật lý và tiếp sau đó là thiết kế các sơ đồ mã hóa mà tính an toàn có thể đảm bảo chỉ duy nhất dựa trên các giả thiết toán học. Hướng nghiên cứu an toàn trong mô hình khóa bị lộ (<em>key leakage resilient cryptography</em>) đang khá được quan tâm trong cộng đồng mật mã.</p>
<p><strong> </strong></p>
<p><em>An toàn trước sự tấn công của máy tính lượng tử </em></p>
<p>Cuối cùng, chúng ta không thể bỏ qua sự hiện diện tiềm tàng của máy tính lượng tử, dù rằng cho tới nay các máy tính lượng tử mới chỉ phân tích được số 21 ra thừa số nguyên tố. Nhưng về mặt lý thuyết, nó có tiềm năng to lớn không thể không kể tới. Công trình của Shor năm 94 đã chỉ ra rằng bài toán phân tích số có thể giải được trong thời gian đa thức bởi máy tính lượng tử.  Bài toán logarít rời rạc trong trường hữu hạn hay trên đường cong elliptic cũng có thể giải được trong thời gian đa thức bởi máy tính lượng tử. Điều đó có nghĩa là các hệ mã thông dụng hiện nay sẽ bị phá vỡ một khi máy tính lượng tử được thiết kế chạy được trên dữ liệu lớn. Để phòng ngừa trước điều đó (dù khả năng sớm xảy ra được đánh giá là rất nhỏ), nhiều nghiên cứu nhằm xây dựng các hệ mã có thể an toàn trước máy tính lượng tử được đề nghị. Hai hướng chính đang được quan tâm là các hệ mã dựa trên mã sửa sai (<em>error correcting codes</em>) và dựa trên lý thuyết lưới Euclid (<em>lattice based cryptography</em>), nơi sự hiện diện của máy tính lượng tử có vẻ như không đem lại hiệu quả đặc biệt.<br />
<!-- Start of StatCounter Code --><br />
<script type="text/javascript">// <![CDATA[
 var sc_project=5132594; var sc_invisible=1; var sc_partition=58; var sc_click_stat=1; var sc_security="b1a02981";
// ]]&gt;</script></p>
<p><script src="http://www.statcounter.com/counter/counter.js" type="text/javascript"></script><noscript></p>
<div class="statcounter"><a title="wordpress statistics" href="http://www.statcounter.com/wordpress.com/" target="_blank"><img class="statcounter" src="http://c.statcounter.com/5132594/0/b1a02981/1/" alt="wordpress statistics" ></a></div>
<p></noscript><br />
<!-- End of StatCounter Code --></p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2011/04/12/m%e1%ba%adt-ma-khoa-cong-khai-s%e1%bb%b1-phat-tri%e1%bb%83n-t%c6%b0%c6%a1ng-h%e1%bb%97-v%e1%bb%9bi-cac-nganh-khoa-h%e1%bb%8dc-khac/feed/</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
		<item>
		<title>HM5 &#8212; Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán</title>
		<link>http://www.procul.org/blog/2010/08/30/hm5-d%e1%bb%8bnh-ly-vapnik-chervonenkis-cho-mo-hinh-gi%e1%ba%a3-thuy%e1%ba%bft-khong-nh%e1%ba%a5t/</link>
		<comments>http://www.procul.org/blog/2010/08/30/hm5-d%e1%bb%8bnh-ly-vapnik-chervonenkis-cho-mo-hinh-gi%e1%ba%a3-thuy%e1%ba%bft-khong-nh%e1%ba%a5t/#comments</comments>
		<pubDate>Mon, 30 Aug 2010 10:35:01 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Trí tuệ nhân tạo]]></category>
		<category><![CDATA[Xác suất & thống kê]]></category>
		<category><![CDATA[COLT]]></category>
		<category><![CDATA[học máy]]></category>
		<category><![CDATA[VC-dimension]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=2263</guid>
		<description><![CDATA[HM4: Độ phức tạp mẫu và VC dimension. HM6: Độ phức tạp Rademacher Hai mô hình (nhất quán và PAC) chúng ta thấy cho đến nay đều không thực tế lắm. Trên thực tế dữ liệu thường có nhiễu, việc tìm một giả thuyết nhất quán với nhiều mẫu trở nên khó khăn. Đôi khi [...]]]></description>
			<content:encoded><![CDATA[<ul>
<li> <a href="http://www.procul.org/blog/2008/07/18/h&#37;e1&#37;bb&#37;8dc-may-t&#37;e1&#37;bb&#37;ab-goc-nhin-c&#37;e1&#37;bb&#37;a7a-ly-thuy&#37;e1&#37;ba&#37;bft-tinh-toan-4/">HM4</a>: Độ phức tạp mẫu và VC dimension.
<li> <a href="http://www.procul.org/blog/2011/03/15/hm6-d%E1%BB%99-ph%E1%BB%A9c-t%E1%BA%A1p-rademacher/">HM6</a>: Độ phức tạp Rademacher
</ul>
<p>
Hai mô hình (nhất quán và PAC) chúng ta thấy cho đến nay đều không thực tế lắm. Trên thực tế dữ liệu thường có nhiễu, việc tìm một giả thuyết nhất quán với nhiều mẫu trở nên khó khăn. Đôi khi không tồn tại giả thuyết nào nhất quán với dữ liệu, hoặc cho dù có tồn tại thì nhiễu cũng làm cho không tồn tại. Vả lại, nhất quán với dữ liệu bị nhiễu thì cũng không hay ho gì. Đó là chưa kể việc đi tìm một giả thuyết nhất quán với dữ liệu có thể là bài toán NP-khó, và thậm chí có thể trên thực tế không tồn tại cái khái niệm mà mình đang muốn học.</p>
<p>
(Từ giờ trở đi, tôi sẽ dịch &#8220;learner&#8221; là &#8220;học giả&#8221;. Học giả ở đây là một thuật toán máy tính chứ không phải là một gã hói đầu. &#8220;Học giả như hòa như đạo. Bất học giả như cảo như thảo.&#8221;)</p>
<p>
Như vậy chúng ta cần một mô hình cho phép học giả trả về một giả thuyết không nhất quán với mẫu, và phải tìm cách đo chất lượng học giả &#8212; kể cả khi không có cái khái niệm mà mình muốn học. Bài này kết thúc bằng chứng minh định lý Vapnik-Chervonenkis, một trong những định lý quan trọng nhất của lý thuyết học máy thống kê (statistical learning theory).</p>
<p>
<span id="more-2263"></span></p>
<p>
<b> 7. Mô hình giả thuyết không nhất quán </b></p>
<p><p>
Trong mô hình này, ta giả sử cả training data lẫn test data đều gồm các điểm <img src='http://s.wordpress.com/latex.php?latex=%7B%28%7B%5Cbf%20x%7D%2Cy%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{({\bf x},y)}' title='{({\bf x},y)}' class='latex' /> được lấy mẫu từ không gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5COmega%20%5Ctimes%20%5C%7B0%2C1%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\Omega \times \{0,1\}}' title='{\Omega \times \{0,1\}}' class='latex' /> theo một phân bố <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal D}' title='{\mathcal D}' class='latex' /> chưa biết nào đó. Dễ thấy rằng giả định này tổng quát hơn giả định của mô hình PAC, vì với PAC thì các điểm <img src='http://s.wordpress.com/latex.php?latex=%7B%28%7B%5Cbf%20x%7D%2Cy%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{({\bf x},y)}' title='{({\bf x},y)}' class='latex' /> được lấy mẫu dựa trên phân bố của <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x}}' title='{{\bf x}}' class='latex' /> và khái niệm cần học.</p>
<p>
Chất lượng của một giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> được đo bằng <em>&#8220;lỗi thật&#8221;</em> của nó, định nghĩa như sau:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7Berr%7D%28h%29%20%3A%3D%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%28%7B%5Cbf%20x%7D%2C%20y%29%20%5Cleftarrow%20%5Cmathcal%20D%7D%20%5Bh%28%7B%5Cbf%20x%7D%29%20%5Cneq%20y%5D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{err}(h) := \mathop{\textnormal{Prob}}_{({\bf x}, y) \leftarrow \mathcal D} [h({\bf x}) \neq y] ' title='\displaystyle  \text{err}(h) := \mathop{\textnormal{Prob}}_{({\bf x}, y) \leftarrow \mathcal D} [h({\bf x}) \neq y] ' class='latex' /></p>
<p> Lỗi này cũng được gọi là <em>lỗi tổng quát hóa</em> (generalization error) của giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' />. Trong trường hợp lý tưởng thì chúng ta muốn giải quyết vấn đề sau đây.</p>
<blockquote><p><b>Định nghĩa 1 (Bài toán lý tưởng)</b> <em> Tìm giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7Bh%5E%2A%20%5Cin%20%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h^* \in \mathcal H}' title='{h^* \in \mathcal H}' class='latex' /> sao cho lỗi thật <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Berr%7D%28h%5E%2A%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{err}(h^*)}' title='{\text{err}(h^*)}' class='latex' /> là tối thiểu. Nói cách khác,
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20h%5E%2A%20%3D%20%5Cmathop%7B%5Ctext%7Bargmin%7D%7D_%7Bh%5Cin%20%5Cmathcal%20H%7D%20%5Ctext%7B%20err%7D%28h%29.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  h^* = \mathop{\text{argmin}}_{h\in \mathcal H} \text{ err}(h). ' title='\displaystyle  h^* = \mathop{\text{argmin}}_{h\in \mathcal H} \text{ err}(h). ' class='latex' /></p>
<p> </em></p></blockquote>
<p> Gọi là trường hợp lý tưởng vì chúng ta không biết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal D}' title='{\mathcal D}' class='latex' />, do đó không thể tính hàm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Berr%7D%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{err}(h)}' title='{\text{err}(h)}' class='latex' />. Nếu ta biết phân bố <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal D}' title='{\mathcal D}' class='latex' /> thì rõ ràng là giả thuyết sau đây là tối ưu:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20h_%7B%5Ctext%7B%5Csc%20opt%7D%7D%28%7B%5Cbf%20x%7D%29%20%3D%20%5Cbegin%7Bcases%7D%201%20%26%20%5Ctextnormal%7Bif%7D%20%5C%20%5Ctext%7BProb%7D%5B%20y%3D1%20%5C%20%7C%20%5C%20%7B%5Cbf%20x%7D%5D%20%5Cgeq%201%2F2%5C%5C%200%20%26%20%5Ctextnormal%7Bif%7D%20%5C%20%5Ctext%7BProb%7D%5B%20y%3D0%20%5C%20%7C%20%5C%20%7B%5Cbf%20x%7D%5D%20%3C%201%2F2%20%5Cend%7Bcases%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  h_{\text{\sc opt}}({\bf x}) = \begin{cases} 1 &amp; \textnormal{if} \ \text{Prob}[ y=1 \ | \ {\bf x}] \geq 1/2\\ 0 &amp; \textnormal{if} \ \text{Prob}[ y=0 \ | \ {\bf x}] &lt; 1/2 \end{cases}. ' title='\displaystyle  h_{\text{\sc opt}}({\bf x}) = \begin{cases} 1 &amp; \textnormal{if} \ \text{Prob}[ y=1 \ | \ {\bf x}] \geq 1/2\\ 0 &amp; \textnormal{if} \ \text{Prob}[ y=0 \ | \ {\bf x}] &lt; 1/2 \end{cases}. ' class='latex' /></p>
<p> Giả thuyết này được gọi là <a href="http://www-speech.sri.com/people/anand/771/html/node9.html">Bayes optimal classifier</a>, còn giá trị <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Berr%7D%28h_%7B%5Ctext%7B%5Csc%20opt%7D%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{err}(h_{\text{\sc opt}})}' title='{\text{err}(h_{\text{\sc opt}})}' class='latex' /> &#8212; gọi là <em>lỗi Bayes</em> &#8212; nhỏ hơn bất kỳ <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Berr%7D%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{err}(h)}' title='{\text{err}(h)}' class='latex' /> nào khác. Cũng lưu ý rằng <img src='http://s.wordpress.com/latex.php?latex=%7Bh_%7B%5Ctext%7B%5Csc%20opt%7D%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h_{\text{\sc opt}}}' title='{h_{\text{\sc opt}}}' class='latex' /> không nhất thiết là phải thuộc về lớp giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> cho trước. (Chúng ta sẽ quay lại với chủ đề giả thuyết cuối cùng không thuộc <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> trong bài tới khi ta thảo luận thuật toán AdaBoost.)</p>
<p>
Quay lại với cách &#8220;cài đặt&#8221; vấn đề trong mô hình giả thuyết không nhất quán ở trên. Do ta không biết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal D}' title='{\mathcal D}' class='latex' />, bài toán thật sự không thể là bài toán tìm giả thuyết với lỗi thật tối thiểu. Một lối ra khá phổ dụng trong các trường hợp tối ưu các hàm không tính được là ta dùng một hàm khác, tính/ước lượng được, để xấp xỉ cái lỗi thật <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Berr%7D%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{err}(h)}' title='{\text{err}(h)}' class='latex' /> mà ta không tính được. Cụ thể hơn, định nghĩa <em>lỗi thực nghiệm</em> (empirical error) như sau:</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%20%3D%20%5Cfrac%7B%7C%5C%7Bi%20%3A%20h%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7C%7D%7Bm%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \widehat{\text{err}}(h) = \frac{|\{i : h({\bf x}_i) \neq y_i\}|}{m} ' title='\displaystyle  \widehat{\text{err}}(h) = \frac{|\{i : h({\bf x}_i) \neq y_i\}|}{m} ' class='latex' /></p>
<p>
Lỗi thực nghiệm còn được gọi là <em>lỗi huấn luyện</em> (training error) hoặc <em>rủi ro thực nghiệm</em> (empirical risk cho <a href="http://en.wikipedia.org/wiki/0-1_loss_function">01 loss function</a>). Đôi khi, để nhấn mạnh là lỗi thực nghiệm được đo trên bộ mẫu <img src='http://s.wordpress.com/latex.php?latex=%7BS%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S}' title='{S}' class='latex' />, ta dùng ký hiệu <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\widehat{\text{err}}_S(h)}' title='{\widehat{\text{err}}_S(h)}' class='latex' />.</p>
<p>
Chúng ta sẽ chứng minh cái gọi là <em>định lý hội tụ đều</em> (uniform convergence theorem). Định lý này nói rằng, với số mẫu đủ lớn thì lỗi thật và lỗi thực nghiệm của một giả thuyết <em>bất kỳ</em> không xa nhau là mấy. (Với một giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> cố định thì trị kỳ vọng của lỗi thực nghiệm là lỗi thật, do đó định lý này hữu lý.) Do đó, thay vì tìm giả thuyết với lỗi thật nhỏ nhất (đằng nào cũng không làm được) thì ta có thể cố tìm giả thuyết với lỗi thực nghiệm nhỏ nhất. Chiến lược này gọi là chiến lược <em>tối thiểu rủi ro thực nghiệm</em> (<a href="http://en.wikipedia.org/wiki/Empirical_risk_minimization">empirical risk minimization</a> hay ERM)</p>
<blockquote><p><b>Định nghĩa 2 (ERM)</b> <em> Tìm giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Chat%20h%5E%2A%20%5Cin%20%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\hat h^* \in \mathcal H}' title='{\hat h^* \in \mathcal H}' class='latex' /> sao cho lỗi thực nghiệm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28%5Chat%20h%5E%2A%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\widehat{\text{err}}(\hat h^*)}' title='{\widehat{\text{err}}(\hat h^*)}' class='latex' /> là tối thiểu. Nói cách khác,
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Chat%20h%5E%2A%20%3D%20%5Cmathop%7B%5Ctext%7Bargmin%7D%7D_%7Bh%5Cin%20%5Cmathcal%20H%7D%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \hat h^* = \mathop{\text{argmin}}_{h\in \mathcal H} \widehat{\text{err}}(h). ' title='\displaystyle  \hat h^* = \mathop{\text{argmin}}_{h\in \mathcal H} \widehat{\text{err}}(h). ' class='latex' /></p>
<p> </em></p></blockquote>
<p><p>
Các học giả Occam như thảo luận trong các bài trước (tìm giả thuyết nhất quán với toàn bộ mẫu &#8212; lỗi thực nghiệm bằng không) là trường hợp đặc biệt của lời giải bài toán trên. Bài toán ERM trên cho phép cả trường hợp ta không tìm được giả thuyết nhất quán. Một trong những điểm yếu của ERM (với 01 loss function như định nghĩa ở trên) là nó thường là bài toán NP-khó (xem <a href="http://en.wikipedia.org/wiki/Empirical_risk_minimization">bài này</a> chẳng hạn).</p>
<blockquote><p><b>Định lý 3 (Định lý hội tụ đều cho <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> hữu hạn)</b> <em> Xét trường hợp lớp giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> là hữu hạn. Nếu ta lấy
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20m%20%5Cgeq%20%5Cfrac%7B%5Clog%5Cleft%28%20%5Cfrac%7B2%7C%5Cmathcal%20H%7C%7D%7B%5Cdelta%7D%5Cright%29%7D%7B2%5Cepsilon%5E2%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  m \geq \frac{\log\left( \frac{2|\mathcal H|}{\delta}\right)}{2\epsilon^2} ' title='\displaystyle  m \geq \frac{\log\left( \frac{2|\mathcal H|}{\delta}\right)}{2\epsilon^2} ' class='latex' /></p>
<p> mẫu từ phân bố <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal D}' title='{\mathcal D}' class='latex' /> thì
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BProb%7D%5Cleft%5B%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%7C%20%5Cleq%20%5Cepsilon%2C%20%5C%20%5Cforall%20h%20%5Cin%20%5Cmathcal%20H%20%5Cright%5D%20%5Cgeq%201-%5Cdelta.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Prob}\left[|\text{err}(h) - \widehat{\text{err}}(h)| \leq \epsilon, \ \forall h \in \mathcal H \right] \geq 1-\delta. ' title='\displaystyle  \text{Prob}\left[|\text{err}(h) - \widehat{\text{err}}(h)| \leq \epsilon, \ \forall h \in \mathcal H \right] \geq 1-\delta. ' class='latex' /></p>
<p> </em></p></blockquote>
<p> <em>Chứng minh:</em>  Rất dễ. Áp dụng <a href="McDiarmid’s">bất đẳng thức Hoeffing</a> (một dạng <a href="http://www.procul.org/blog/2010/07/10/gt-9-ti&#37;e1&#37;bb&#37;81n-xu-chernoff-bernstein-va-m&#37;e1&#37;ba&#37;b9o-trung-v&#37;e1&#37;bb&#37;8b/">con gà Chernoff</a>, và là trường hợp đặc biệt của bất đẳng thức McDiarmid) ta có, với <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> bất kỳ:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BProb%7D%5Cleft%5B%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%7C%20%3E%20%5Cepsilon%5Cright%5D%20%3C%202e%5E%7B-2%5Cepsilon%5E2m%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Prob}\left[|\text{err}(h) - \widehat{\text{err}}(h)| &gt; \epsilon\right] &lt; 2e^{-2\epsilon^2m}. ' title='\displaystyle  \text{Prob}\left[|\text{err}(h) - \widehat{\text{err}}(h)| &gt; \epsilon\right] &lt; 2e^{-2\epsilon^2m}. ' class='latex' /></p>
<p> Sau đó, union bound cho ta
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BProb%7D%5Cleft%5B%5Cforall%20h%20%5Cin%20%5Cmathcal%20H%2C%20%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%7C%20%3E%20%5Cepsilon%5Cright%5D%20%3C%202%7C%5Cmathcal%20H%7Ce%5E%7B-2%5Cepsilon%5E2m%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Prob}\left[\forall h \in \mathcal H, |\text{err}(h) - \widehat{\text{err}}(h)| &gt; \epsilon\right] &lt; 2|\mathcal H|e^{-2\epsilon^2m}. ' title='\displaystyle  \text{Prob}\left[\forall h \in \mathcal H, |\text{err}(h) - \widehat{\text{err}}(h)| &gt; \epsilon\right] &lt; 2|\mathcal H|e^{-2\epsilon^2m}. ' class='latex' /></p>
<p> Từ đó dẫn đến kết luận của định lý. <img src='http://s.wordpress.com/latex.php?latex=%5CBox&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Box' title='\Box' class='latex' /></p>
<p>
Từ định lý hội tụ đều, ta thấy rằng lời giải cho bài toán ERM cũng khá tốt so với lời giải của bài toán lý tưởng:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7Berr%7D%28%5Chat%20h%5E%2A%29%20%5Cleq%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28%5Chat%20h%5E%2A%29%20%2B%20%5Cepsilon%20%5Cleq%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%5E%2A%29%20%2B%20%5Cepsilon%20%5Cleq%20%5Ctext%7Berr%7D%28h%5E%2A%29%20%2B%202%5Cepsilon.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{err}(\hat h^*) \leq \widehat{\text{err}}(\hat h^*) + \epsilon \leq \widehat{\text{err}}(h^*) + \epsilon \leq \text{err}(h^*) + 2\epsilon. ' title='\displaystyle  \text{err}(\hat h^*) \leq \widehat{\text{err}}(\hat h^*) + \epsilon \leq \widehat{\text{err}}(h^*) + \epsilon \leq \text{err}(h^*) + 2\epsilon. ' class='latex' /></p>
<p> Ta có thể viết lại sự phụ thuộc của lỗi tổng quát hóa <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Berr%7D%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{err}(h)}' title='{\text{err}(h)}' class='latex' /> vào lỗi thực nghiệm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\widehat{\text{err}}(h)}' title='{\widehat{\text{err}}(h)}' class='latex' />, độ phức tạp của lớp giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Clog%20%7C%5Cmathcal%20H%7C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\log |\mathcal H|}' title='{\log |\mathcal H|}' class='latex' />, tổng số mẫu <img src='http://s.wordpress.com/latex.php?latex=%7Bm%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m}' title='{m}' class='latex' /> và độ tin cậy như sau:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7Berr%7D%28h%29%20%5Cleq%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%20%2B%20%5Csqrt%7B%5Cfrac%7B%5Clog%282%7C%5Cmathcal%20H%7C%29%20%2B%20%5Clog%281%2F%5Cdelta%29%7D%7Bm%7D%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{err}(h) \leq \widehat{\text{err}}(h) + \sqrt{\frac{\log(2|\mathcal H|) + \log(1/\delta)}{m}} ' title='\displaystyle  \text{err}(h) \leq \widehat{\text{err}}(h) + \sqrt{\frac{\log(2|\mathcal H|) + \log(1/\delta)}{m}} ' class='latex' /></p>
<p> Có vài điểm đáng chú ý: </p>
<ul>
<li> Độ phức tạp mẫu phụ thuộc vào <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cepsilon%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\epsilon^2}' title='{\epsilon^2}' class='latex' /> chứ không còn là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\epsilon}' title='{\epsilon}' class='latex' /> như trong mô hình PAC.
<li> Tăng <img src='http://s.wordpress.com/latex.php?latex=%7Bm%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m}' title='{m}' class='latex' /> thì lỗi tổng quát hóa giảm. Cho học giả càng nhiều ví dụ càng tốt. Dĩ nhiên làm thế sẽ ảnh hưởng đến thời gian chạy của học giả.
<li> Độ phức tạp của lớp giả thuyết càng nhỏ càng tốt.
<li> Lỗi thực nghiệm càng bé càng tốt.
<li> Tuy nhiên, có một trade-off giữa lỗi thực nghiệm và độ phức tạp của lớp giả thuyết. Nếu lớp giả thuyết quá đơn giản thì khả năng ta tìm được một giả thuyết có lỗi thực nghiệm bé sẽ giảm. Khi độ phức tạp của lớp giả thuyết tăng lên thì sẽ dễ tìm giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> có lỗi thực nghiệm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\widehat{\text{err}}(h)}' title='{\widehat{\text{err}}(h)}' class='latex' /> nhỏ. Nhưng đến một lúc nào đó thì số hạng thứ hai (chứa <img src='http://s.wordpress.com/latex.php?latex=%7B%5Clog%20%282%7C%5Cmathcal%20H%7C%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\log (2|\mathcal H|)}' title='{\log (2|\mathcal H|)}' class='latex' />) sẽ áp đảo số hạng thứ nhất, và ta bị vấn đề <a href="http://en.wikipedia.org/wiki/Overfitting">overfitting</a>, một vấn đề thật sự đau đầu trong thống kê.
</ul>
<p>
Trong hai bài tới, chúng ta sẽ thảo luận thuật toán AdaBoost và thuật toán Support Vector Machine; có vẻ như chúng chống chọi vấn đề overfitting khá tốt.</p>
<p>
Trong trường hợp <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> vô hạn thì ta có định lý hội tụ đều dùng VC-dimension, là một trong những định lý quan trọng nhất trong statistical learning theory.</p>
<blockquote><p><b>Định lý 4 (Định lý hội tụ đều cho <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> vô hạn &#8212; Còn gọi là định lý Vapnik-Chervonenkis)</b> <em> Xét trường hợp lớp giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> là vô hạn với <img src='http://s.wordpress.com/latex.php?latex=%7Bd%20%3D%20%5Ctext%7B%5Csc%20vcd%7D%28%5Cmathcal%20H%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d = \text{\sc vcd}(\mathcal H)}' title='{d = \text{\sc vcd}(\mathcal H)}' class='latex' />. Nếu ta lấy
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20m%20%3D%20%5COmega%5Cleft%28%20%5Cfrac%7Bd%7D%7B%5Cepsilon%5E2%7D%5Clog%5Cfrac%7B1%7D%7B%5Cepsilon%7D%20%2B%20%5Cfrac%7B1%7D%7B%5Cepsilon%5E2%7D%20%5Clog%20%5Cfrac%201%20%5Cdelta%5Cright%29%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  m = \Omega\left( \frac{d}{\epsilon^2}\log\frac{1}{\epsilon} + \frac{1}{\epsilon^2} \log \frac 1 \delta\right) ' title='\displaystyle  m = \Omega\left( \frac{d}{\epsilon^2}\log\frac{1}{\epsilon} + \frac{1}{\epsilon^2} \log \frac 1 \delta\right) ' class='latex' /></p>
<p> mẫu từ phân bố <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal D}' title='{\mathcal D}' class='latex' /> thì
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BProb%7D%5Cleft%5B%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D%28h%29%7C%20%5Cleq%20%5Cepsilon%2C%20%5C%20%5Cforall%20h%20%5Cin%20%5Cmathcal%20H%20%5Cright%5D%20%5Cgeq%201-%5Cdelta.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Prob}\left[|\text{err}(h) - \widehat{\text{err}}(h)| \leq \epsilon, \ \forall h \in \mathcal H \right] \geq 1-\delta. ' title='\displaystyle  \text{Prob}\left[|\text{err}(h) - \widehat{\text{err}}(h)| \leq \epsilon, \ \forall h \in \mathcal H \right] \geq 1-\delta. ' class='latex' /></p>
<p> </em></p></blockquote>
<p> <em>Chứng minh:</em>  Ta cần chứng minh bất đẳng thức sau đây:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_S%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h%29%7C%20%3E%20%5Cepsilon%20%5Cright%5D%20%5Cleq%20%5Cdelta%2C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_S \left[ \sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon \right] \leq \delta, ' title='\displaystyle  \mathop{\text{Prob}}_S \left[ \sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon \right] \leq \delta, ' class='latex' /></p>
<p> trong đó <img src='http://s.wordpress.com/latex.php?latex=%7BS%3D%5C%7B%28%7B%5Cbf%20x%7D_1%2Cy_1%29%2C%20%5Ccdots%2C%20%28%7B%5Cbf%20x%7D_m%2Cy_m%29%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S=\{({\bf x}_1,y_1), \cdots, ({\bf x}_m,y_m)\}}' title='{S=\{({\bf x}_1,y_1), \cdots, ({\bf x}_m,y_m)\}}' class='latex' /> là tập <img src='http://s.wordpress.com/latex.php?latex=%7Bm%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m}' title='{m}' class='latex' /> mẫu độc lập. Giống như trong trường hợp định lý VC cho mô hình PAC, ta dùng cái mẹo lấy mẫu kép. Ta lấy thêm <img src='http://s.wordpress.com/latex.php?latex=%7Bm%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m}' title='{m}' class='latex' /> mẫu độc lập <img src='http://s.wordpress.com/latex.php?latex=%7BS%27%3D%5C%7B%28%7B%5Cbf%20x%7D%27_1%2Cy%27_1%29%2C%20%5Ccdots%2C%20%28%7B%5Cbf%20x%7D%27_m%2Cy%27_m%29%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S&#039;=\{({\bf x}&#039;_1,y&#039;_1), \cdots, ({\bf x}&#039;_m,y&#039;_m)\}}' title='{S&#039;=\{({\bf x}&#039;_1,y&#039;_1), \cdots, ({\bf x}&#039;_m,y&#039;_m)\}}' class='latex' /> nữa (chỉ là công cụ chứng minh, không lấy thật). Chứng minh bao gồm bốn bước.</p>
<p><ul>
<li> <b>Bước 1.</b> chuyển từ vô hạn xuống hữu hạn. Ta sẽ chứng minh rằng</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_S%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h%29%7C%20%3E%20%5Cepsilon%20%5Cright%5D%20%5Cleq%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h%29%7C%20%3E%20%5Cepsilon%2F2%20%5Cright%5D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_S \left[ \sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon \right] \leq 2 \cdot \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right] ' title='\displaystyle  \mathop{\text{Prob}}_S \left[ \sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon \right] \leq 2 \cdot \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right] ' class='latex' /></p>
<p>
Với một bộ mẫu <img src='http://s.wordpress.com/latex.php?latex=%7BS%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S}' title='{S}' class='latex' /> đã lấy, nếu <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h%29%7C%20%3E%20%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon}' title='{\sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon}' class='latex' /> thì định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%7Bh_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h_S}' title='{h_S}' class='latex' /> là một hàm (tùy hỉ) trong <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> miễn sao <img src='http://s.wordpress.com/latex.php?latex=%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h_S%29%7C%20%3E%20%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon}' title='{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon}' class='latex' />; còn nếu <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h%29%7C%20%5Cleq%20%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| \leq \epsilon}' title='{\sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| \leq \epsilon}' class='latex' /> thì định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%7Bh_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h_S}' title='{h_S}' class='latex' /> là một hàm bất kỳ trong <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' />.</p>
<p>
Trước hết, dùng bất đẳng thức Chernoff, dễ chứng minh được rằng, với mọi <img src='http://s.wordpress.com/latex.php?latex=%7BS%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S}' title='{S}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7Bm%20%5Cgeq%20100%2F%5Cepsilon%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m \geq 100/\epsilon^2}' title='{m \geq 100/\epsilon^2}' class='latex' /> ta có:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%27%7D%20%5Cleft%5B%20%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h_S%29%7C%20%3C%20%5Cepsilon%2F2%20%5Cright%5D%20%5Cgeq%201%2F2.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_{S&#039;} \left[ |\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2 \right] \geq 1/2. ' title='\displaystyle  \mathop{\text{Prob}}_{S&#039;} \left[ |\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2 \right] \geq 1/2. ' class='latex' /></p>
<p> (Không cần đến <img src='http://s.wordpress.com/latex.php?latex=%7B100%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{100}' title='{100}' class='latex' />, để cho vui thôi; cỡ <img src='http://s.wordpress.com/latex.php?latex=%7B8%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{8}' title='{8}' class='latex' /> là đủ.)</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cbegin%7Barray%7D%7Brcl%7D%20%20%26%26%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_S%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Ctext%7Berr%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h%29%7C%20%3E%20%5Cepsilon%20%5Cright%5D%5C%5C%20%26%3D%26%20%5Cmathop%7B%5Ctext%7BE%7D%7D_S%20%5Cleft%5B%20%7B%5Cbf%201%7D_%7B%5C%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h_S%29%7C%20%3E%20%5Cepsilon%5C%7D%7D%20%5Cright%5D%5C%5C%20%26%5Cleq%20%26%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BE%7D%7D_S%20%5Cleft%5B%20%7B%5Cbf%201%7D_%7B%5C%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h_S%29%7C%20%3E%20%5Cepsilon%5C%7D%7D%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%27%7D%20%5Cleft%5B%20%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h_S%29%7C%20%3C%20%5Cepsilon%2F2%20%5Cright%5D%20%5Cright%5D%5C%5C%20%26%5Cleq%20%26%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BE%7D%7D_S%20%5Cleft%5B%20%7B%5Cbf%201%7D_%7B%5C%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h_S%29%7C%20%3E%20%5Cepsilon%5C%7D%7D%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BE%7D%7D_%7BS%27%7D%20%5Cleft%5B%20%7B%5Cbf%201%7D_%7B%5C%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h_S%29%7C%20%3C%20%5Cepsilon%2F2%5C%7D%7D%20%5Cright%5D%20%5Cright%5D%5C%5C%20%26%3D%26%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BE%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%7B%5Cbf%201%7D_%7B%5C%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h_S%29%7C%20%3E%20%5Cepsilon%5C%7D%7D%20%5Ccdot%20%7B%5Cbf%201%7D_%7B%5C%7B%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h_S%29%7C%20%3C%20%5Cepsilon%2F2%5C%7D%7D%20%5Cright%5D%5C%5C%20%26%3D%26%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_S%28h_S%29%7C%20%3E%20%5Cepsilon%20%5Ctext%7B%20and%20%7D%20%7C%5Ctext%7Berr%7D%28h_S%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h_S%29%7C%20%3C%20%5Cepsilon%2F2%20%5Cright%5D%5C%5C%20%26%5Cleq%20%26%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h%29%7C%20%3E%20%5Cepsilon%2F2%20%5Cright%5D%20%5Cend%7Barray%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \begin{array}{rcl}  &amp;&amp; \mathop{\text{Prob}}_S \left[ \sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon \right]\\ &amp;=&amp; \mathop{\text{E}}_S \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \right]\\ &amp;\leq &amp; 2 \cdot \mathop{\text{E}}_S \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \cdot \mathop{\text{Prob}}_{S&#039;} \left[ |\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2 \right] \right]\\ &amp;\leq &amp; 2 \cdot \mathop{\text{E}}_S \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \cdot \mathop{\text{E}}_{S&#039;} \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2\}} \right] \right]\\ &amp;=&amp; 2 \cdot \mathop{\text{E}}_{S,S&#039;} \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \cdot {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2\}} \right]\\ &amp;=&amp; 2 \cdot \mathop{\text{Prob}}_{S,S&#039;} \left[ |\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon \text{ and } |\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2 \right]\\ &amp;\leq &amp; 2 \cdot \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right] \end{array} ' title='\displaystyle  \begin{array}{rcl}  &amp;&amp; \mathop{\text{Prob}}_S \left[ \sup_{h \in \mathcal H} |\text{err}(h) - \widehat{\text{err}}_S(h)| &gt; \epsilon \right]\\ &amp;=&amp; \mathop{\text{E}}_S \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \right]\\ &amp;\leq &amp; 2 \cdot \mathop{\text{E}}_S \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \cdot \mathop{\text{Prob}}_{S&#039;} \left[ |\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2 \right] \right]\\ &amp;\leq &amp; 2 \cdot \mathop{\text{E}}_S \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \cdot \mathop{\text{E}}_{S&#039;} \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2\}} \right] \right]\\ &amp;=&amp; 2 \cdot \mathop{\text{E}}_{S,S&#039;} \left[ {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon\}} \cdot {\bf 1}_{\{|\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2\}} \right]\\ &amp;=&amp; 2 \cdot \mathop{\text{Prob}}_{S,S&#039;} \left[ |\text{err}(h_S) - \widehat{\text{err}}_S(h_S)| &gt; \epsilon \text{ and } |\text{err}(h_S) - \widehat{\text{err}}_{S&#039;}(h_S)| &lt; \epsilon/2 \right]\\ &amp;\leq &amp; 2 \cdot \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right] \end{array} ' class='latex' /></p>
<p><li> <b>Bước 2.</b> đối xứng hóa dùng các <a href="http://en.wikipedia.org/wiki/Rademacher_complexity">biến Rademacher</a> <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csigma_i%20%5Cin%20%5C%7B-1%2C1%5C%7D%2C%20i%20%5Cin%20%5Bm%5D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sigma_i \in \{-1,1\}, i \in [m]}' title='{\sigma_i \in \{-1,1\}, i \in [m]}' class='latex' />, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7BProb%7D%5B%5Csigma_i%3D1%5D%3D%5Ctext%7BProb%7D%5B%5Csigma_i%3D-1%5D%3D1%2F2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{Prob}[\sigma_i=1]=\text{Prob}[\sigma_i=-1]=1/2}' title='{\text{Prob}[\sigma_i=1]=\text{Prob}[\sigma_i=-1]=1/2}' class='latex' />. Ta sẽ chứng minh rằng
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h%29%7C%20%3E%20%5Cepsilon%2F2%20%5Cright%5D%20%5Cleq%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2C%5Csigma%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cright%5D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right] \leq 2 \cdot \mathop{\text{Prob}}_{S,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right] ' title='\displaystyle  \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right] \leq 2 \cdot \mathop{\text{Prob}}_{S,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right] ' class='latex' /></p>
<p>
Lưu ý rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf 1}_{\{h({\bf x}_i) \neq y_i\}}}' title='{{\bf 1}_{\{h({\bf x}_i) \neq y_i\}}}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D%27_i%29%20%5Cneq%20y%27_i%5C%7D%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}}}' title='{{\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}}}' class='latex' /> có cùng phân bố, do đó <img src='http://s.wordpress.com/latex.php?latex=%7B%28%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20-%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D%27_i%29%20%5Cneq%20y%27_i%5C%7D%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}})}' title='{({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}})}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B-%28%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20-%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D%27_i%29%20%5Cneq%20y%27_i%5C%7D%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}})}' title='{-({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}})}' class='latex' /> có cùng phân bố với trị kỳ vọng bằng <img src='http://s.wordpress.com/latex.php?latex=%7B0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{0}' title='{0}' class='latex' />. Ta có:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cbegin%7Barray%7D%7Brcl%7D%20%20%26%26%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%7C%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%7D%28h%29%20-%20%5Cwidehat%7B%5Ctext%7Berr%7D%7D_%7BS%27%7D%28h%29%7C%20%3E%20%5Cepsilon%2F2%20%5Cright%5D%5C%5C%20%26%3D%26%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%28%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20-%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D%27_i%29%20%5Cneq%20y%27_i%5C%7D%7D%29%20%5Cright%7C%20%3E%20%5Cepsilon%2F2%20%5Cright%5D%5C%5C%20%26%3D%26%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%2C%5Csigma%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%5Cleft%28%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20-%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D%27_i%29%20%5Cneq%20y%27_i%5C%7D%7D%5Cright%29%20%5Cright%7C%20%3E%20%5Cepsilon%2F2%20%5Cright%5D%5C%5C%20%26%5Cleq%26%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2CS%27%2C%5Csigma%7D%20%5Cleft%5B%20%5Cleft%5C%7B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cright%5C%7D%20%5Ctext%7B%20or%20%7D%20%5Cleft%5C%7B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D%27_i%29%20%5Cneq%20y%27_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cright%5C%7D%20%5Cright%5D%5C%5C%20%26%5Cleq%26%202%20%5Ccdot%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2C%5Csigma%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cright%5D%20%5Cend%7Barray%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \begin{array}{rcl}  &amp;&amp; \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right]\\ &amp;=&amp; \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m ({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}}) \right| &gt; \epsilon/2 \right]\\ &amp;=&amp; \mathop{\text{Prob}}_{S,S&#039;,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i \left({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}}\right) \right| &gt; \epsilon/2 \right]\\ &amp;\leq&amp; \mathop{\text{Prob}}_{S,S&#039;,\sigma} \left[ \left\{ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right\} \text{ or } \left\{ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}} \right| &gt; \epsilon/4 \right\} \right]\\ &amp;\leq&amp; 2 \cdot \mathop{\text{Prob}}_{S,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right] \end{array} ' title='\displaystyle  \begin{array}{rcl}  &amp;&amp; \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} |\widehat{\text{err}}_{S}(h) - \widehat{\text{err}}_{S&#039;}(h)| &gt; \epsilon/2 \right]\\ &amp;=&amp; \mathop{\text{Prob}}_{S,S&#039;} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m ({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}}) \right| &gt; \epsilon/2 \right]\\ &amp;=&amp; \mathop{\text{Prob}}_{S,S&#039;,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i \left({\bf 1}_{\{h({\bf x}_i) \neq y_i\}} - {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}}\right) \right| &gt; \epsilon/2 \right]\\ &amp;\leq&amp; \mathop{\text{Prob}}_{S,S&#039;,\sigma} \left[ \left\{ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right\} \text{ or } \left\{ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}&#039;_i) \neq y&#039;_i\}} \right| &gt; \epsilon/4 \right\} \right]\\ &amp;\leq&amp; 2 \cdot \mathop{\text{Prob}}_{S,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right] \end{array} ' class='latex' /></p>
<p><li> <b>Bước 3.</b> thay vì xét cái <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csup_%7Bh%5Cin%20%5Cmathcal%20H%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sup_{h\in \mathcal H}}' title='{\sup_{h\in \mathcal H}}' class='latex' /> ở vế phải bất đẳng thức trên, ta chỉ cần xét các &#8220;dichotomies&#8221; của lớp giả thuyết <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathcal%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathcal H}' title='{\mathcal H}' class='latex' /> trên tập <img src='http://s.wordpress.com/latex.php?latex=%7B%5C%7B%20%7B%5Cbf%20x%7D_i%20%5C%20%7C%20%5C%20%28%7B%5Cbf%20x%7D_i%2C%20y_i%29%20%5Cin%20S%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\{ {\bf x}_i \ | \ ({\bf x}_i, y_i) \in S\}}' title='{\{ {\bf x}_i \ | \ ({\bf x}_i, y_i) \in S\}}' class='latex' />. Áp dụng bất đẳng thức Hoeffding và union bound là ta sẽ có:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%7BS%2C%5Csigma%7D%20%5Cleft%5B%20%5Csup_%7Bh%20%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cright%5D%20%5Cleq%20%5CPi_%7B%5Cmathcal%20H%7D%28m%29%20%5Ccdot%202%20%5Ccdot%20e%5E%7B-m%5Cepsilon%5E2%2F32%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_{S,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right] \leq \Pi_{\mathcal H}(m) \cdot 2 \cdot e^{-m\epsilon^2/32}. ' title='\displaystyle  \mathop{\text{Prob}}_{S,\sigma} \left[ \sup_{h \in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \right] \leq \Pi_{\mathcal H}(m) \cdot 2 \cdot e^{-m\epsilon^2/32}. ' class='latex' /></p>
<p> Cụ thể hơn, với mọi <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}}}' title='{\sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}}}' class='latex' /> là các biến độc lập với trị kỳ vọng bằng <img src='http://s.wordpress.com/latex.php?latex=%7B0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{0}' title='{0}' class='latex' />, dao động giữa <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-1}' title='{-1}' class='latex' />. Do đó, <a href="http://en.wikipedia.org/wiki/Hoeffding's_inequality">bất đẳng thức Hoeffding</a> cho ta biết (conditioning on <img src='http://s.wordpress.com/latex.php?latex=%7BS%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S}' title='{S}' class='latex' />)
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%5Csigma%20%5Cleft%5B%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cleft%7C%20%5Cright.%20S%20%5Cright%5D%20%5Cleq%202%20%5Ccdot%20e%5E%7B-m%5Cepsilon%5E2%2F32%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_\sigma \left[ \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \left| \right. S \right] \leq 2 \cdot e^{-m\epsilon^2/32}. ' title='\displaystyle  \mathop{\text{Prob}}_\sigma \left[ \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \left| \right. S \right] \leq 2 \cdot e^{-m\epsilon^2/32}. ' class='latex' /></p>
<p> Với một bộ mẫu <img src='http://s.wordpress.com/latex.php?latex=%7BS%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S}' title='{S}' class='latex' /> đã chọn thì tổng số dãy <img src='http://s.wordpress.com/latex.php?latex=%7B%28%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_1%29%20%5Cneq%20y_1%5C%7D%7D%2C%20%5Ccdots%2C%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_m%29%20%5Cneq%20y_m%5C%7D%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{({\bf 1}_{\{h({\bf x}_1) \neq y_1\}}, \cdots, {\bf 1}_{\{h({\bf x}_m) \neq y_m\}})}' title='{({\bf 1}_{\{h({\bf x}_1) \neq y_1\}}, \cdots, {\bf 1}_{\{h({\bf x}_m) \neq y_m\}})}' class='latex' /> khác nhau bị chặn trên bởi <img src='http://s.wordpress.com/latex.php?latex=%7B%5CPi_%7B%5Cmathcal%20H%7D%28m%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\Pi_{\mathcal H}(m)}' title='{\Pi_{\mathcal H}(m)}' class='latex' />. Do đó, union bound hoàn tất bước 3, vì
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctext%7BProb%7D%7D_%5Csigma%20%5Cleft%5B%20%5Csup_%7Bh%5Cin%20%5Cmathcal%20H%7D%20%5Cfrac%201%20m%20%5Cleft%7C%20%5Csum_%7Bi%3D1%7D%5Em%20%5Csigma_i%20%7B%5Cbf%201%7D_%7B%5C%7Bh%28%7B%5Cbf%20x%7D_i%29%20%5Cneq%20y_i%5C%7D%7D%20%5Cright%7C%20%3E%20%5Cepsilon%2F4%20%5Cleft%7C%20%5Cright.%20S%20%5Cright%5D%20%5Cleq%20%5CPi_%7B%5Cmathcal%20H%7D%28m%29%20%5Ccdot%202%20%5Ccdot%20e%5E%7B-m%5Cepsilon%5E2%2F32%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\text{Prob}}_\sigma \left[ \sup_{h\in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \left| \right. S \right] \leq \Pi_{\mathcal H}(m) \cdot 2 \cdot e^{-m\epsilon^2/32}. ' title='\displaystyle  \mathop{\text{Prob}}_\sigma \left[ \sup_{h\in \mathcal H} \frac 1 m \left| \sum_{i=1}^m \sigma_i {\bf 1}_{\{h({\bf x}_i) \neq y_i\}} \right| &gt; \epsilon/4 \left| \right. S \right] \leq \Pi_{\mathcal H}(m) \cdot 2 \cdot e^{-m\epsilon^2/32}. ' class='latex' /></p>
<p><li> <b>Bước 4.</b> Bổ đề Sauer và tính toán cơ bắp hoàn tất chứng minh định lý. Bổ đề Sauer cho biết <img src='http://s.wordpress.com/latex.php?latex=%7B%5CPi_%7B%5Cmathcal%20H%7D%28m%29%20%5Cleq%20%28em%2Fd%29%5Ed%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\Pi_{\mathcal H}(m) \leq (em/d)^d}' title='{\Pi_{\mathcal H}(m) \leq (em/d)^d}' class='latex' />. Do đó ta chỉ cần chọn <img src='http://s.wordpress.com/latex.php?latex=%7Bm%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m}' title='{m}' class='latex' /> sao cho
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%208%20%28em%2Fd%29%5Ed%20e%5E%7B-m%5Cepsilon%5E2%2F32%7D%20%5Cleq%20%5Cdelta%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  8 (em/d)^d e^{-m\epsilon^2/32} \leq \delta ' title='\displaystyle  8 (em/d)^d e^{-m\epsilon^2/32} \leq \delta ' class='latex' /></p>
<p> là xong. Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%7Bm%20%3D%20%5COmega%5Cleft%28%20%5Cfrac%7Bd%7D%7B%5Cepsilon%5E2%7D%5Clog%5Cfrac%7B1%7D%7B%5Cepsilon%7D%20%2B%20%5Cfrac%7B1%7D%7B%5Cepsilon%5E2%7D%20%5Clog%20%5Cfrac%201%20%5Cdelta%5Cright%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{m = \Omega\left( \frac{d}{\epsilon^2}\log\frac{1}{\epsilon} + \frac{1}{\epsilon^2} \log \frac 1 \delta\right)}' title='{m = \Omega\left( \frac{d}{\epsilon^2}\log\frac{1}{\epsilon} + \frac{1}{\epsilon^2} \log \frac 1 \delta\right)}' class='latex' /> đủ thỏa.
</ul>
<img src='http://s.wordpress.com/latex.php?latex=%5CBox&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Box' title='\Box' class='latex' />
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2010/08/30/hm5-d%e1%bb%8bnh-ly-vapnik-chervonenkis-cho-mo-hinh-gi%e1%ba%a3-thuy%e1%ba%bft-khong-nh%e1%ba%a5t/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>Trả lời nhanh vài câu hỏi về phân tích thuật toán</title>
		<link>http://www.procul.org/blog/2010/08/02/tr%e1%ba%a3-l%e1%bb%9di-nhanh-vai-cau-h%e1%bb%8fi-v%e1%bb%81-phan-tich-thu%e1%ba%adt-toan/</link>
		<comments>http://www.procul.org/blog/2010/08/02/tr%e1%ba%a3-l%e1%bb%9di-nhanh-vai-cau-h%e1%bb%8fi-v%e1%bb%81-phan-tich-thu%e1%ba%adt-toan/#comments</comments>
		<pubDate>Mon, 02 Aug 2010 21:43:07 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[FNP]]></category>
		<category><![CDATA[Gỡ rối tơ lòng]]></category>
		<category><![CDATA[NP]]></category>
		<category><![CDATA[Phân tích thuật toán]]></category>
		<category><![CDATA[TFNP]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=2171</guid>
		<description><![CDATA[Bạn Thắng có vài câu hỏi về phân tích độ phức tạp thuật toán, tôi trả lời vắn tắt dưới đây. 1) “intractable problems” là gì trong 2 đáp án sau: 1.a) Là bài toán đã bị chứng minh là cận dưới của độ phức tạp thuật toán là super-polinominal. 1.b) Là bài toán mà [...]]]></description>
			<content:encoded><![CDATA[<p>Bạn Thắng có <a href="http://www.procul.org/blog/g-ri-t-long/comment-page-17/#comments">vài câu hỏi</a> về phân tích độ phức tạp thuật toán, tôi trả lời vắn tắt dưới đây.</p>
<p><span id="more-2171"></span></p>
<blockquote><p>
1) “intractable problems” là gì trong 2 đáp án sau:<br />
1.a) Là bài toán đã bị chứng minh là cận dưới của độ phức tạp thuật toán là super-polinominal.<br />
1.b) Là bài toán mà cho đến nay người ta chỉ tìm được thuật toán có độ phức tạp superpolinominal, ngoài ra chưa thể kết luận gì thêm được.<br />
(Trong trường hợp đáp án là 1.b) thì các bài toán 1.a) có thuật ngữ riêng để gọi không ? Đó là thuật ngữ gì ?)</p>
<p>2) “intractable problems” không đồng nghĩa với “NP-complete” hoặc “NP-hard”, “intractable problems” là khái niệm không liên quan gì đến NP, NP-hard. Phát biểu này đúng hay sai ?</p>
<p>3) Có thể xảy ra (dù khả năng là vô cùng nhỏ) NP-hard = NP ?</p>
<p>4) Phát biểu “Non-Determined Turing Machine là máy có khả năng siêu nhiên: khi nó phải quyết định chuyển trạng thái với nhiều lựa chọn thì nó sẽ biết trạng thái tối ưu để chuyển. Tuy nhiên ngay cả khi có khả năng siêu nhiên nó cũng có thể thất bại.” là đúng hay sai ?</p>
<p>5) Giả sử có một máy non-determined Turing machine được chạy 2 lần với cùng trạng thái ban đầu. Kết quả của 2 lần chạy có giống nhau không ?</p>
<p>6) Bài toán: “Liệt kê (in ra màn hình) tất cả các giá trị có thể có của một xâu nhị phân n bit. Tức là liệt kê ra 2^n – 1 xâu: 00…00, 00…01, 00…10, … … … , 11…11.”</p>
<p>6.1) Theo như định nghĩa “NP problems là các problems mà ta có thể verify lời giải của nó trong thời gian đa thức” thì bài toán trên có là NP không ?</p>
<p>6.2) Thuật toán giải bài này hiển nhiên phải chứa thao tác in được 2^n – 1 xâu ra màn hình. Nếu mỗi thao tác in ra màn hình chỉ in được 1 xâu thì thuật toán là O(2^n). Liệu có thể nào mà mỗi thao tác in ra màn hình có thể in được f(n) xâu, và do đó thuật toán là O(2^n/f(n)) ? (nếu không thể nào 1 lần in mà in được f(n) xâu thì chứng tỏ độ phức tạp thuật toán của bài toán này có cận dưới là 2^n.)</p>
<p>7. Người ta nghĩ về máy Turing nhưng lại ngồi gõ bàn phím máy Intel. Liệu trong lịch sử “Theory of computation” có bài báo nào chứng minh: “Máy Turing quả thật có thể mô phỏng hoạt động của máy Intel (giả sử với bộ vi xử lý sơ khai nhất của hãng) mà số bước mô phỏng chỉ bị chậm đi với hệ nhân O(n^k).” Chiều ngược lại thì đơn giản. Điều này được gọi là máy Turing và máy Intel tương đương đa thức với nhau về khả năng tính toán hiệu quả (độ phức tạp thuật toán).
</p></blockquote>
<p>Trả lời (vắn tắt):</p>
<p><strong>1. &#038; 2.</strong> Tại sao lại cho multiple-choice khi mà bạn chưa biết câu trả lời là gì? (Đây là tôi giả sử bạn hỏi thật lòng, không phải đánh đố.)</p>
<p><em>Intractable problems</em> cũng giống như <em>phụ nữ đẹp</em>. Không có một định nghĩa toán học cho &#8220;intractability&#8221;. Người ta thường (nhưng không phải luôn luôn) dùng &#8220;intractable problems&#8221; để nói về các bài toán mà lời giải tốt nhất mà ta biết nhiều khả năng là không hoạt động được trên thực tế. Giả sử có bài toán mà thuật toán tốt nhất mà ta biết giải được trong thời gian O(n), nhưng cái hằng số trong big-O bằng tổng số nguyên tử trong vũ trụ, thì bài toán đó là &#8220;intractable&#8221;.</p>
<p><strong>3.</strong> NP-hard khác NP. Bài toán dừng (halting problem) là NP-hard nhưng không thuộc NP.</p>
<p><strong>4.</strong> Tôi không hiểu câu hỏi. &#8220;Thất bại&#8221; là sao? &#8220;Siêu nhiên&#8221; là sao? Một trong những cách hiểu NTM là nó là cái máy &#8220;may mắn&#8221; tuyệt đối.</p>
<p><strong>5.</strong> NTM chỉ là một công cụ toán học để mô tả sức mạnh và giới hạn của một kiểu tính toán, không thể &#8220;chạy&#8221; nó được như DTM (cái dùng để mô hình hóa một quá trình tính toán cụ thể và vì thế có thể chạy được).</p>
<p><strong>6.1.</strong> Bài toán &#8220;in&#8221; của bạn không phải là decision-problem, chẳng thuộc P hay NP hay EXP. </p>
<p><strong>6.2.</strong> Tùy theo mô hình tính toán của bạn là gì. Nếu cụm từ &#8220;in ra màn hình&#8221; ý nói đến việc &#8220;Máy Turing ghi từng bit ra output tape&#8221; thì dĩ nhiên độ phức tạp thời gian của bài toán ít nhất là <img src='http://s.wordpress.com/latex.php?latex=n2%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n2^n' title='n2^n' class='latex' />. Điều đó không có gì ngạc nhiên cả. (Đó là giả sử unary-input, nếu binary input thì thời gian còn tệ hơn nhiều.)</p>
<p><strong>7</strong> Tính tương đương của máy tính hiện đại dùng bộ vi xử lý mới nhất thì chưa ai chứng minh. Nhưng cũng không cần phải chứng minh. Những thứ có cấu hình tương tự như một máy tính hiện đại (ví dụ như lớp các mô hình <a href="http://en.wikipedia.org/wiki/Register_machine">Register Machine</a>, và trường hợp đặc biệt là <a href="http://en.wikipedia.org/wiki/Random_access_machine">Random Access Machine</a>) thì người ta đã chứng minh lâu rồi. Nói chung, trừ phi bộ vi xử lý mới toanh của Intel có thể tính được một hàm số nào mà TM không tính được, sự tương đương là hiển nhiên. Các tập lệnh kiểu cộng trừ nhân chia, if .. then .. else, goto đều có thể mô phỏng được bằng TM hết.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2010/08/02/tr%e1%ba%a3-l%e1%bb%9di-nhanh-vai-cau-h%e1%bb%8fi-v%e1%bb%81-phan-tich-thu%e1%ba%adt-toan/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>PCP 10 &#8212; Biến đổi Fourier, định lý Arrow và tính duy lý của sự độc tài</title>
		<link>http://www.procul.org/blog/2010/07/29/pcp10/</link>
		<comments>http://www.procul.org/blog/2010/07/29/pcp10/#comments</comments>
		<pubDate>Thu, 29 Jul 2010 12:30:51 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[KHMT và Kinh Tế]]></category>
		<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[Xác suất & thống kê]]></category>
		<category><![CDATA[Biến đổi Fourier]]></category>
		<category><![CDATA[Biểu diễn nhóm]]></category>
		<category><![CDATA[Lý thuyết bầu cử]]></category>
		<category><![CDATA[PCP]]></category>
		<category><![CDATA[xác suất]]></category>
		<category><![CDATA[Định lý Arrow]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=2160</guid>
		<description><![CDATA[Trong bài này chúng ta giới thiệu biến đổi Fourier trên các nhóm Abel hữu hạn, giải tích Fourier của các hàm Bool, và giới thiệu lý thuyết bầu cử cùng với chứng minh định lý Arrow về tính duy lý của sự độc tài. Như vậy chúng ta đã có chuyến &#8220;de-tour&#8221; sang các [...]]]></description>
			<content:encoded><![CDATA[<p>Trong bài này chúng ta giới thiệu biến đổi Fourier trên các nhóm Abel hữu hạn, giải tích Fourier của các hàm Bool, và giới thiệu lý thuyết bầu cử cùng với chứng minh định lý Arrow về tính duy lý của sự độc tài.<br />
<span id="more-2160"></span></p>
<p>
Như vậy chúng ta đã có chuyến &#8220;de-tour&#8221; sang các phép xây dựng đồ thị expanders, tính chất của chúng, và tích zig-zag. Đáng lẽ bài kế tiếp này tôi định viết về kết quả <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathsf%7BL%20%3D%20SL%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathsf{L = SL}}' title='{\mathsf{L = SL}}' class='latex' /> của Omer Reingold hồi 2005. Nhưng lại thôi vì thật ra nếu hiểu tích zig-zag rồi thì hiểu <a href="http://www.google.com/url?sa=t&#038;source=web&#038;cd=4&#038;ved=0CCYQFjAD&#038;url=http&#37;3A&#37;2F&#37;2Fwww.weizmann.ac.il&#37;2Fmathusers&#37;2Freingold&#37;2Fpublications&#37;2Fsl.ps&#038;ei=Y9lQTNn0GMHflged2di7CQ&#038;usg=AFQjCNFnkkK9JJNxfsZoDhTU7qym-1F1TA">chứng minh</a> của Reingold không khó khăn gì. Năm đó có chú Vladimir Trifonov rất ư là &#8220;xui&#8221;. Số là cả Trifonov và Reingold đều có kết quả rất tốt cho bài toán tìm sự liên thông trên đồ thị vô hướng (undirected st-connectivity). Dĩ nhiên ta có thể dùng BFS/DFS để giải bài này, nhưng tổng bộ nhớ cần thiết là <img src='http://s.wordpress.com/latex.php?latex=%7BO%28n%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{O(n)}' title='{O(n)}' class='latex' />. <a href="http://en.wikipedia.org/wiki/Savitch's_theorem">Định lý Savich</a> (1970) nói rằng có thể giải bài này dùng <img src='http://s.wordpress.com/latex.php?latex=%7BO%28%5Clog%5E2n%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{O(\log^2n)}' title='{O(\log^2n)}' class='latex' />-bộ nhớ. Mấy mươi năm sau đó thì có vài kết quả tốt dần lên, cho đến <img src='http://s.wordpress.com/latex.php?latex=%7BO%28%5Clog%5E%7B4%2F3%7Dn%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{O(\log^{4/3}n)}' title='{O(\log^{4/3}n)}' class='latex' /> của Armoni&#8211;Ta-Shma&#8211;Wigderson&#8211;Zhou năm 1997. Trifonov <a href="http://www.math.uic.edu/~vladot/papers/trifonov07.pdf">cải tiến</a> đến <img src='http://s.wordpress.com/latex.php?latex=%7BO%28%5Clog%20n%20%5Clog%5Clog%20n%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{O(\log n \log\log n)}' title='{O(\log n \log\log n)}' class='latex' />, còn Reingold chứng minh được <img src='http://s.wordpress.com/latex.php?latex=%7BO%28%5Clog%20n%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{O(\log n)}' title='{O(\log n)}' class='latex' /> luôn. Trifonov xui là vì nếu không có kết quả của Reingold thì kết quả của Trifonov thật sự là một phát triển rất mạnh (từ log xuống log-log). Kết quả là Reingold được giải bài báo hay nhất, còn Trifonov được giải bài báo sinh viên hay nhất cho STOC 2005.</p>
<p>
Để chuẩn bị kiến thức nền cho mấy bài tới, chúng ta lại làm thêm một chuyến de-tour nữa, sang món giải tích Fourier của các hàm nhị phân. Để giải trí, ta chứng minh định lý Arrow về tính duy lý của sự độc tài bằng phân tích Fourier.</p>
<p><b> 9. Biểu diễn nhóm và biến đổi Fourier </b></p>
<p>
<p><b> 9.1. Các ký tự bất khả qui của nhóm Abel hữu hạn </b></p>
<p><p>
Trong <a href="http://www.procul.org/blog/2005/12/04/nhan-ma-tr&#37;E1&#37;BA&#37;ADn-dft-va-ly-thuy&#37;E1&#37;BA&#37;BFt-bi&#37;E1&#37;BB&#37;83u-di&#37;E1&#37;BB&#37;85n-nhom-3/">chuỗi</a> <a href="http://www.procul.org/blog/2007/01/16/nhan-ma-tr&#37;e1&#37;ba&#37;adn-dft-va-ly-thuy&#37;e1&#37;ba&#37;bft-bi&#37;e1&#37;bb&#37;83u-di&#37;e1&#37;bb&#37;85n-nhom-4/">bài</a> về nhân ma trận đang viết dở, tôi đã tóm tắt lại một số kiến thức cơ bản về lý thuyết biểu diễn nhóm. Xem thêm <a href="http://thichhoctoan.wordpress.com/2010/04/25/bi&#37;E1&#37;BB&#37;83u-di&#37;E1&#37;BB&#37;85n-nhom/">bài này</a> của HT THT. Ta sẽ thu thập lại vài kết quả cần thiết để dùng trong bài này và trong một bài tương lai khi ta phân tích cái expander của Margulis.</p>
<p>
Các biểu diễn bất khả qui của một nhóm Abel bất kỳ đều là các biểu diễn với số chiều bằng một. Nếu nhóm có <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> phần tử thì có <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> ký tự trực giao. Nhóm tuần toàn là một nhóm Abel. Nhóm tuần hoàn <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20Z_n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb Z_n}' title='{\mathbb Z_n}' class='latex' /> có đúng <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> ký tự (characters) <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_a%2C%20a%5Cin%20%5Cmathbb%20Z_n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_a, a\in \mathbb Z_n}' title='{\chi_a, a\in \mathbb Z_n}' class='latex' />. Mỗi ký tự <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_a%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_a}' title='{\chi_a}' class='latex' /> là một vector trong không gian vector phức <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20C%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb C^n}' title='{\mathbb C^n}' class='latex' />, định nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_a%28b%29%20%3D%20%5Comega_n%5E%7Bab%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_a(b) = \omega_n^{ab}}' title='{\chi_a(b) = \omega_n^{ab}}' class='latex' />, trong đó <img src='http://s.wordpress.com/latex.php?latex=%7B%5Comega_n%20%3D%20e%5E%7B2%5Cpi%20i%2Fn%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\omega_n = e^{2\pi i/n}}' title='{\omega_n = e^{2\pi i/n}}' class='latex' />. Các ký tự này là một hệ trực chuẩn theo tích Hermit này:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Clangle%20%5Cchi_a%2C%20%5Cchi_b%20%5Crangle%20%3D%20%5Cfrac%7B1%7D%7Bn%7D%20%5Csum_%7Bc%20%5Cin%20%5Cmathbb%20Z_n%7D%20%5Coverline%7B%5Cchi_a%28c%29%7D%5Cchi_b%28c%29%20%3D%20%5Cdelta_%7Bab%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \langle \chi_a, \chi_b \rangle = \frac{1}{n} \sum_{c \in \mathbb Z_n} \overline{\chi_a(c)}\chi_b(c) = \delta_{ab}. ' title='\displaystyle  \langle \chi_a, \chi_b \rangle = \frac{1}{n} \sum_{c \in \mathbb Z_n} \overline{\chi_a(c)}\chi_b(c) = \delta_{ab}. ' class='latex' /></p>
<p>
<a href="http://en.wikipedia.org/wiki/Fundamental_theorem_of_finitely_generated_abelian_groups#Classification">Định lý cơ bản</a> của các nhóm Abel hữu hạn cho ta biết một nhóm Abel <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> hữu hạn bất kỳ đều có thể viết dưới dạng tổng trực tiếp của các nhóm tuần hoàn: <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ccong%20%5Cmathbb%20Z_%7Bm_1%7D%20%5Coplus%20%5Ccdots%20%5Coplus%20%5Cmathbb%20Z_%7Bm_k%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \cong \mathbb Z_{m_1} \oplus \cdots \oplus \mathbb Z_{m_k}}' title='{G \cong \mathbb Z_{m_1} \oplus \cdots \oplus \mathbb Z_{m_k}}' class='latex' />. Các biểu diễn bất khả qui của nhóm <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> là <a href="http://thichhoctoan.wordpress.com/2009/10/24/tang-s&#37;e1&#37;bb&#37;9d-1/">tăng sờ</a> của các biểu diễn bất khả qui của các nhóm tuần hoàn <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20Z_%7Bm_i%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb Z_{m_i}}' title='{\mathbb Z_{m_i}}' class='latex' />. Các ký tự bất khả qui của nhóm <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> là tích tăng sờ của các ký tự bất khả qui của các nhóm tuần hoàn <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20Z_%7Bm_i%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb Z_{m_i}}' title='{\mathbb Z_{m_i}}' class='latex' />. Với mỗi <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20a%7D%20%3D%20%28a_1%2C%20%5Ccdots%2C%20a_k%29%20%5Cin%20Z_%7Bm_1%7D%20%5Coplus%20%5Ccdots%20%5Coplus%20%5Cmathbb%20Z_%7Bm_k%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf a} = (a_1, \cdots, a_k) \in Z_{m_1} \oplus \cdots \oplus \mathbb Z_{m_k}}' title='{{\bf a} = (a_1, \cdots, a_k) \in Z_{m_1} \oplus \cdots \oplus \mathbb Z_{m_k}}' class='latex' />, ta có một ký tự bất khả quy <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_%7B%5Cbf%20a%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_{\bf a}}' title='{\chi_{\bf a}}' class='latex' /> của nhóm <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> định nghĩa như sau: với một &#8220;tọa độ&#8221; <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20b%7D%20%3D%20%28b_1%2C%20%5Ccdots%2C%20b_k%29%20%5Cin%20Z_%7Bm_1%7D%20%5Coplus%20%5Ccdots%20%5Coplus%20%5Cmathbb%20Z_%7Bm_k%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf b} = (b_1, \cdots, b_k) \in Z_{m_1} \oplus \cdots \oplus \mathbb Z_{m_k}}' title='{{\bf b} = (b_1, \cdots, b_k) \in Z_{m_1} \oplus \cdots \oplus \mathbb Z_{m_k}}' class='latex' /> thì
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cchi_%7B%5Cbf%20a%7D%28%7B%5Cbf%20b%7D%29%20%3D%20%5Cprod_%7Bi%3D1%7D%5Ek%20%5Comega_%7Bm_i%7D%5E%7Ba_ib_i%7D%3D%20%5Comega_%7Bm_1%7D%5E%7Ba_1b_1%7D%5Ccdots%20%5Comega_%7Bm_k%7D%5E%7Ba_kb_k%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \chi_{\bf a}({\bf b}) = \prod_{i=1}^k \omega_{m_i}^{a_ib_i}= \omega_{m_1}^{a_1b_1}\cdots \omega_{m_k}^{a_kb_k}. ' title='\displaystyle  \chi_{\bf a}({\bf b}) = \prod_{i=1}^k \omega_{m_i}^{a_ib_i}= \omega_{m_1}^{a_1b_1}\cdots \omega_{m_k}^{a_kb_k}. ' class='latex' /></p>
<p>
Một trường hợp đặc biệt của nhóm Abel hữu hạn rất quan trọng trong chuỗi bài này và trong KHMT nói chung là <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%3D%20%5Cmathbb%20Z_2%5En%20%3D%20%5C%7B0%2C1%5C%7D%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G = \mathbb Z_2^n = \{0,1\}^n}' title='{G = \mathbb Z_2^n = \{0,1\}^n}' class='latex' />. Có thể nghĩ về mỗi phần tử của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> như một đỉnh của khối <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' />-cube, hoặc là một phép gán sự thật (truth assignment) vào <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> biến, hoặc là một tập con <img src='http://s.wordpress.com/latex.php?latex=%7BS%20%5Csubseteq%20%5Bn%5D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S \subseteq [n]}' title='{S \subseteq [n]}' class='latex' /> trong đó <img src='http://s.wordpress.com/latex.php?latex=%7BS%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{S}' title='{S}' class='latex' /> là tập các tọa độ bằng <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> của phần tử. Ở đây, nhóm <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> có <img src='http://s.wordpress.com/latex.php?latex=%7BN%20%3D%202%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{N = 2^n}' title='{N = 2^n}' class='latex' /> phần tử, và vì thế <img src='http://s.wordpress.com/latex.php?latex=%7BN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{N}' title='{N}' class='latex' /> ký tự bất khả qui. Do <img src='http://s.wordpress.com/latex.php?latex=%7B%5Comega_2%20%3D%20-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\omega_2 = -1}' title='{\omega_2 = -1}' class='latex' />, với mỗi cặp <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20a%2C%20b%7D%20%5Cin%20%5Cmathbb%20Z_2%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf a, b} \in \mathbb Z_2^n}' title='{{\bf a, b} \in \mathbb Z_2^n}' class='latex' /> ta có <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_%7B%5Cbf%20a%7D%28%7B%5Cbf%20b%7D%29%20%3D%20%28-1%29%5E%7B%7B%5Cbf%20a%20%5Ccdot%20b%7D%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_{\bf a}({\bf b}) = (-1)^{{\bf a \cdot b}}}' title='{\chi_{\bf a}({\bf b}) = (-1)^{{\bf a \cdot b}}}' class='latex' />.</p>
<p>
Thay vì dùng <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20a%2C%20b%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf a, b}}' title='{{\bf a, b}}' class='latex' /> để đánh chỉ số các ký tự và các tọa độ của chúng, ta có thể dùng các tập con <img src='http://s.wordpress.com/latex.php?latex=%7BA%2C%20B%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{A, B}' title='{A, B}' class='latex' /> của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Bn%5D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{[n]}' title='{[n]}' class='latex' /> để đánh chỉ số, trong đó <img src='http://s.wordpress.com/latex.php?latex=%7BA%20%3D%20%5C%7Bi%20%5C%20%7C%20%5C%20a_i%3D1%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{A = \{i \ | \ a_i=1\}}' title='{A = \{i \ | \ a_i=1\}}' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%7BB%20%3D%20%5C%7Bi%20%5C%20%7C%20%5C%20b_i%20%3D%201%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{B = \{i \ | \ b_i = 1\}}' title='{B = \{i \ | \ b_i = 1\}}' class='latex' />. Theo cách này, bộ các ký tự có thể định nghĩa bằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_%7BA%7D%28B%29%20%3D%20%28-1%29%5E%7B%7CA%20%5Ccap%20B%7C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_{A}(B) = (-1)^{|A \cap B|}}' title='{\chi_{A}(B) = (-1)^{|A \cap B|}}' class='latex' />. Còn nếu chúng ta dùng <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20b%7D%20%5Cin%20%5Cmathbb%20Z_2%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf b} \in \mathbb Z_2^n}' title='{{\bf b} \in \mathbb Z_2^n}' class='latex' /> làm tọa độ thì <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_A%28%7B%5Cbf%20b%7D%29%20%3D%20%28-1%29%5E%7B%5Csum_%7Bi%5Cin%20A%7Db_i%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_A({\bf b}) = (-1)^{\sum_{i\in A}b_i}}' title='{\chi_A({\bf b}) = (-1)^{\sum_{i\in A}b_i}}' class='latex' />. Bạn nên làm quen với việc chuyển qua lại giữa các tập con của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Bn%5D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{[n]}' title='{[n]}' class='latex' /> và các vectors của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20Z_2%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb Z_2^n}' title='{\mathbb Z_2^n}' class='latex' />.</p>
<p>
Lý do chính chúng ta quan tâm đến các ký tự bất khả qui của nhóm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20Z_2%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb Z_2^n}' title='{\mathbb Z_2^n}' class='latex' /> là như sau. Trong phân tích độ khó xấp xỉ, chúng ta thường quan tâm đến các hàm Bool (hàm nhị phân) gồm <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> biến nhị phân loại <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B0%2C1%5C%7D%5En%20%5Crightarrow%20%5C%7B0%2C%201%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{0,1\}^n \rightarrow \{0, 1\}}' title='{f: \{0,1\}^n \rightarrow \{0, 1\}}' class='latex' />. Mỗi hàm loại này có thể xem là một vector trong không gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5C%7B0%2C1%5C%7D%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\{0,1\}^N}' title='{\{0,1\}^N}' class='latex' />. Dĩ nhiên, chúng cũng là các vectors trong không gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20R%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb R^N}' title='{\mathbb R^N}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20C%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb C^N}' title='{\mathbb C^N}' class='latex' />. Như đã nói ở trên, các ký tự bất khả qui là một cơ sở trực chuẩn của không gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20C%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb C^N}' title='{\mathbb C^N}' class='latex' />. Vì thế, một hàm nhị phân <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> biến bất kỳ, nếu viết thành một vector trong không gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20C%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb C^N}' title='{\mathbb C^N}' class='latex' />, đều là tổ hợp tuyến tính của các ký tự bất khả qui.</p>
<p>
Thay vì làm việc trên không gian vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20C%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb C^N}' title='{\mathbb C^N}' class='latex' />, chúng ta cũng có thể làm việc trên không gian (tuyến tính) của hàm số <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B0%2C1%5C%7D%5En%20%5Crightarrow%20%5Cmathbb%20C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{0,1\}^n \rightarrow \mathbb C}' title='{f: \{0,1\}^n \rightarrow \mathbb C}' class='latex' />. Chúng tương đương với nhau. Hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B0%2C1%5C%7D%5En%20%5Crightarrow%20%5Cmathbb%20C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{0,1\}^n \rightarrow \mathbb C}' title='{f: \{0,1\}^n \rightarrow \mathbb C}' class='latex' /> bất kỳ đều có thể biểu diễn dưới dạng
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20f%28%7B%5Cbf%20y%7D%29%20%3D%20%5Csum_%7BS%20%5Csubseteq%20%5Bn%5D%7D%20%5Chat%20f_S%20%5Cchi_S%28%7B%5Cbf%20y%7D%29%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%5Chat%20f_S%20%28-1%29%5E%7B%5Csum_%7Bi%5Cin%20S%7Dy_i%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  f({\bf y}) = \sum_{S \subseteq [n]} \hat f_S \chi_S({\bf y}) = \sum_{S\subseteq [n]} \hat f_S (-1)^{\sum_{i\in S}y_i}. ' title='\displaystyle  f({\bf y}) = \sum_{S \subseteq [n]} \hat f_S \chi_S({\bf y}) = \sum_{S\subseteq [n]} \hat f_S (-1)^{\sum_{i\in S}y_i}. ' class='latex' /></p>
<p> Để cái đám <img src='http://s.wordpress.com/latex.php?latex=%7By_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{y_i}' title='{y_i}' class='latex' /> trên số mũ thì hơi khó chịu. Chúng ta đổi biến. Đặt <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%20%3D%20%28-1%29%5E%7By_i%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i = (-1)^{y_i}}' title='{x_i = (-1)^{y_i}}' class='latex' />. Nghĩa là nếu <img src='http://s.wordpress.com/latex.php?latex=%7By_i%20%3D%200%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{y_i = 0}' title='{y_i = 0}' class='latex' /> (FALSE) thì <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i = 1}' title='{x_i = 1}' class='latex' />, còn <img src='http://s.wordpress.com/latex.php?latex=%7By_i%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{y_i = 1}' title='{y_i = 1}' class='latex' /> (TRUE) thì <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%20%3D%20-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i = -1}' title='{x_i = -1}' class='latex' />. Thì mọi hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B-1%2C%201%5C%7D%5En%20%5Crightarrow%20%5Cmathbb%20C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{-1, 1\}^n \rightarrow \mathbb C}' title='{f: \{-1, 1\}^n \rightarrow \mathbb C}' class='latex' /> đều có thể viết dưới dạng
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20f%28%7B%5Cbf%20x%7D%29%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20f_S%20%5Cchi_S%28%7B%5Cbf%20x%7D%29%2C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  f({\bf x}) = \sum_{S\subseteq [n]} f_S \chi_S({\bf x}), ' title='\displaystyle  f({\bf x}) = \sum_{S\subseteq [n]} f_S \chi_S({\bf x}), ' class='latex' /></p>
<p> trong đó (lạm dụng ký hiệu một chút) <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_S%3A%20%5C%7B-1%2C1%5C%7D%5En%20%5Crightarrow%20%5C%7B-1%2C1%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_S: \{-1,1\}^n \rightarrow \{-1,1\}}' title='{\chi_S: \{-1,1\}^n \rightarrow \{-1,1\}}' class='latex' /> là một hàm đơn thức
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cchi_S%28%7B%5Cbf%20x%7D%29%20%3D%20%5Cchi_S%28x_1%2C%5Ccdots%2Cx_n%29%20%3D%20%5Cprod_%7Bi%5Cin%20S%7D%20x_i.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \chi_S({\bf x}) = \chi_S(x_1,\cdots,x_n) = \prod_{i\in S} x_i. ' title='\displaystyle  \chi_S({\bf x}) = \chi_S(x_1,\cdots,x_n) = \prod_{i\in S} x_i. ' class='latex' /></p>
<p> Đám <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_S}' title='{\chi_S}' class='latex' /> bây giờ gọi là <em>hệ cơ sở đơn thức</em> (monomial basis) của các hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B-1%2C1%5C%7D%5En%20%5Crightarrow%20%5Cmathbb%20C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{-1,1\}^n \rightarrow \mathbb C}' title='{f: \{-1,1\}^n \rightarrow \mathbb C}' class='latex' />. Nhớ rằng cái hệ cơ sở đơn thức này là một hệ cơ sở trực chuẩn của không gian các hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B-1%2C1%5C%7D%5En%20%5Crightarrow%20%5Cmathbb%20C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{-1,1\}^n \rightarrow \mathbb C}' title='{f: \{-1,1\}^n \rightarrow \mathbb C}' class='latex' />. Trong đó, &#8220;tích vô hướng&#8221; của hai hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%2C%20g%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f, g}' title='{f, g}' class='latex' /> bất kỳ được định nghĩa là
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clangle%20f%2C%20g%20%5Crangle%20%3D%20%5Cfrac%7B1%7D%7B2%5En%7D%20%5Csum_%7B%7B%5Cbf%20x%7D%20%5Cin%20%5C%7B-1%2C1%5C%7D%5En%7D%20f%28%7B%5Cbf%20x%7D%29%20%5Coverline%7Bg%28%7B%5Cbf%20x%7D%29%7D%20%3D%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%5Coverline%7Bg%28%7B%5Cbf%20x%7D%29%7D%5D%2C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \langle f, g \rangle = \frac{1}{2^n} \sum_{{\bf x} \in \{-1,1\}^n} f({\bf x}) \overline{g({\bf x})} = \mathop{\textnormal{E}}_{\bf x}[f({\bf x})\overline{g({\bf x})}], ' title='\displaystyle \langle f, g \rangle = \frac{1}{2^n} \sum_{{\bf x} \in \{-1,1\}^n} f({\bf x}) \overline{g({\bf x})} = \mathop{\textnormal{E}}_{\bf x}[f({\bf x})\overline{g({\bf x})}], ' class='latex' /></p>
<p> trong đó trị kỳ vọng ở vế phải tính trên phân bố đều của các vectors <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%20%5Cin%20%5C%7B-1%2C1%5C%7D%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x} \in \{-1,1\}^n}' title='{{\bf x} \in \{-1,1\}^n}' class='latex' />. Chúng ta sẽ thấy rằng hiểu tích vô hướng của hai hàm như trị kỳ vọng của tích rất hữu dụng về sau.</p>
<p>
<p><b> 9.2. Biến đổi Fourier </b></p>
<p><p>
Ý tưởng chính của biến đổi Fourier rời rạc chỉ là một phát biểu cơ bản của đại số tuyến tính: các vector trong một không gian vector đều là tổ hợp tuyến tính của một hệ cơ sở của không gian đó. (Xem thêm <a href="http://terrytao.wordpress.com/2009/04/06/the-fourier-transform/">bài của Terry Tao</a> giới thiệu về biến đổi Fourier. Một chương của <a href="http://www.amazon.com/gp/product/0521136563?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0521136563">quyển sách</a> mới của bác Văn với Terry cũng giới thiệu cách dùng giải tích điều hòa &#8212; harmonic analysis &#8212; trong toán tổ hợp cộng tính &#8212; additive combinatorics.)</p>
<p>
Trong ngữ cảnh của chúng ta, mỗi hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B-1%2C1%5C%7D%5En%20%5Crightarrow%20%5Cmathbb%20R%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{-1,1\}^n \rightarrow \mathbb R}' title='{f: \{-1,1\}^n \rightarrow \mathbb R}' class='latex' /> đều là tổ hợp tuyến tính của các hàm đơn thức:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20f%28%7B%5Cbf%20x%7D%29%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%5Chat%20f_S%20%5Cchi_S%28%7B%5Cbf%20x%7D%29%2C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  f({\bf x}) = \sum_{S\subseteq [n]} \hat f_S \chi_S({\bf x}), ' title='\displaystyle  f({\bf x}) = \sum_{S\subseteq [n]} \hat f_S \chi_S({\bf x}), ' class='latex' /></p>
<p> Tổ hợp này là duy nhất. Các hệ số <img src='http://s.wordpress.com/latex.php?latex=%7B%5Chat%20f_S%20%3D%20%5Clangle%20f%2C%20%5Cchi_S%20%5Crangle%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\hat f_S = \langle f, \chi_S \rangle}' title='{\hat f_S = \langle f, \chi_S \rangle}' class='latex' /> gọi là các <em>hệ số Fourier</em> của <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' />. Chúng là các số thực vì <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_S}' title='{\chi_S}' class='latex' /> là các vectors thực. Từ giờ trở đi chúng ta có thể làm việc luôn trên không gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20R%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb R^N}' title='{\mathbb R^N}' class='latex' /> thay vì <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbb%20C%5EN%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbb C^N}' title='{\mathbb C^N}' class='latex' /> và không cần cái liên hợp (conjugate) khi tính tích vô hướng của hai vectors nữa. Hệ cơ sở đơn thức <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_S}' title='{\chi_S}' class='latex' /> cũng được gọi là <em>hệ cơ sở Fourier</em>.</p>
<p>
Hai đẳng thức cơ bản nhất của biến đổi Fourier là </p>
<ul>
<li> <a href="http://en.wikipedia.org/wiki/Plancherel_theorem">đẳng thức Plancherel</a>
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29g%28%7B%5Cbf%20x%7D%29%5D%20%3D%20%5Clangle%20f%2C%20g%20%5Crangle%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%5Chat%20f_S%20%5Chat%20g_S%20%3D%20N%20%5Clangle%20%5Chat%20f%2C%20%5Chat%20g%20%5Crangle%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{E}}_{\bf x}[f({\bf x})g({\bf x})] = \langle f, g \rangle = \sum_{S\subseteq [n]} \hat f_S \hat g_S = N \langle \hat f, \hat g \rangle ' title='\displaystyle  \mathop{\textnormal{E}}_{\bf x}[f({\bf x})g({\bf x})] = \langle f, g \rangle = \sum_{S\subseteq [n]} \hat f_S \hat g_S = N \langle \hat f, \hat g \rangle ' class='latex' /></p>
<li> và trường hợp đặc biệt là <a href="http://en.wikipedia.org/wiki/Parseval's_theorem">đẳng thức Paserval</a>
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%5E2%28%7B%5Cbf%20x%7D%29%5D%20%3D%20%5Clangle%20f%2C%20f%20%5Crangle%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%5Chat%20f%5E2_S.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{E}}_{\bf x}[f^2({\bf x})] = \langle f, f \rangle = \sum_{S\subseteq [n]} \hat f^2_S. ' title='\displaystyle  \mathop{\textnormal{E}}_{\bf x}[f^2({\bf x})] = \langle f, f \rangle = \sum_{S\subseteq [n]} \hat f^2_S. ' class='latex' /></p>
</ul>
<p> <b>Bài tập.</b> chứng minh hai đẳng thức trên từ định nghĩa và tính trực chuẩn của các <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_S}' title='{\chi_S}' class='latex' />. </p>
<p>
<p><b> 10. Luật bầu cử và biến đổi Fourier cho các hàm nhị phân </b></p>
<p><p>
Trong trường hợp hàm nhị phân <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3A%20%5C%7B-1%2C1%5C%7D%5En%20%5Crightarrow%20%5C%7B-1%2C1%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f: \{-1,1\}^n \rightarrow \{-1,1\}}' title='{f: \{-1,1\}^n \rightarrow \{-1,1\}}' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%7Bf%5E2%28%7B%5Cbf%20x%7D%29%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f^2({\bf x}) = 1}' title='{f^2({\bf x}) = 1}' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' />, vì thế đẳng thức Parseval cho
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%5Chat%20f%5E2_S%20%3D%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%5E2%28%7B%5Cbf%20x%7D%29%5D%20%3D%201.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \sum_{S\subseteq [n]} \hat f^2_S = \mathop{\textnormal{E}}_{\bf x}[f^2({\bf x})] = 1. ' title='\displaystyle  \sum_{S\subseteq [n]} \hat f^2_S = \mathop{\textnormal{E}}_{\bf x}[f^2({\bf x})] = 1. ' class='latex' /></p>
<p> Có thể nghĩ về một hàm nhị phân như một &#8220;luật&#8221; bầu cử. Có <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> phiếu bầu <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i}' title='{x_i}' class='latex' /> cho hai ứng cử viên <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-1}' title='{-1}' class='latex' />. Hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> trả về người thắng cử. Sau đây là một số hàm (luật) bầu cử hay thấy trên thực tế: </p>
<ul>
<li> <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7BMaj%7D_n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{Maj}_n}' title='{\text{Maj}_n}' class='latex' /> là hàm bầu đa số, chỉ định nghĩa với <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> lẻ, trả về <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> nếu đa số các &#8220;phiếu&#8221; là <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> và ngược lại.
<li> <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7BDict%7D_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{Dict}_i}' title='{\text{Dict}_i}' class='latex' /> là hàm độc tài (dictator) thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' />, trả về phiếu bầu của <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i}' title='{x_i}' class='latex' />, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7BDict%7D_i%28%7B%5Cbf%20x%7D%29%20%3D%20x_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{Dict}_i({\bf x}) = x_i}' title='{\text{Dict}_i({\bf x}) = x_i}' class='latex' />.
<li> <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7BConst%7D_1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{Const}_1}' title='{\text{Const}_1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7BConst%7D_%7B-1%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{Const}_{-1}}' title='{\text{Const}_{-1}}' class='latex' /> là các hàm hằng số (hay hàm &#8220;đảng cử, dân bầu&#8221;), luôn trả về giá trị đảng cử <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> hoặc <img src='http://s.wordpress.com/latex.php?latex=%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-1}' title='{-1}' class='latex' />.
</ul>
<p> Ta cũng có thể định nghĩa một số hàm khác như hàm chẵn lẻ, hàm &#8220;electoral college&#8221; (như trong luật bầu cử của Mỹ), vân vân. Xem <a href="http://www.cs.cmu.edu/~odonnell/papers/analysis-survey.pdf">bài này</a> của Ryan O&#8217;Donnell để thêm một số ví dụ.</p>
<p>
Với một luật bầu cử nhất định, chúng ta muốn biết nhiều thuộc tính của nó. </p>
<ul>
<li> <em>Nó có thiên vị không?</em> Thiên vị ở đây được hiểu như sau, nếu ta lấy một bộ <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> phiếu bầu ngẫu nhiên thì xác suất mà kết quả là <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> hoặc <img src='http://s.wordpress.com/latex.php?latex=%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-1}' title='{-1}' class='latex' /> khác nhau cỡ nào. Một luật bầu là &#8220;công bằng&#8221; nếu hai xác suất này bằng nhau. Do đó, ta định nghĩa sự thiên vị của hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> bằng
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%3D1%5D%20-%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%3D-1%5D%20%3D%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%5D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x})=1] - \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x})=-1] = \mathop{\textnormal{E}}_{\bf x}[f({\bf x})]. ' title='\displaystyle  \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x})=1] - \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x})=-1] = \mathop{\textnormal{E}}_{\bf x}[f({\bf x})]. ' class='latex' /></p>
<p> Đến đây thì ta thấy phân tích Fourier có lợi thế nào. Do hàm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cchi_%7B%5Cemptyset%7D%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\chi_{\emptyset} = 1}' title='{\chi_{\emptyset} = 1}' class='latex' />, độ thiên vị của <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> là
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%5D%20%3D%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%5Cchi_%7B%5Cemptyset%7D%28%7B%5Cbf%20x%7D%29%5D%20%3D%20%5Chat%20f_%5Cemptyset.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{E}}_{\bf x}[f({\bf x})] = \mathop{\textnormal{E}}_{\bf x}[f({\bf x})\chi_{\emptyset}({\bf x})] = \hat f_\emptyset. ' title='\displaystyle  \mathop{\textnormal{E}}_{\bf x}[f({\bf x})] = \mathop{\textnormal{E}}_{\bf x}[f({\bf x})\chi_{\emptyset}({\bf x})] = \hat f_\emptyset. ' class='latex' /></p>
<p> Độ thiên vị của <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> chính là hệ số Fourier thứ nhất! Dễ thấy rằng các hàm đảng cử/dân bầu có thiên vị là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cpm%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\pm 1}' title='{\pm 1}' class='latex' />. Các hàm độc tài và hàm đa số có độ thiên vị bằng <img src='http://s.wordpress.com/latex.php?latex=%7B0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{0}' title='{0}' class='latex' />.
<li> <em>Ảnh hưởng của một phiếu nào đó ra sao?</em> Nếu Tám Tàng đổi phiếu từ <img src='http://s.wordpress.com/latex.php?latex=%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-1}' title='{-1}' class='latex' /> sang <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> thì kết quả bị đổi thế nào? Với bộ phiếu <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x}}' title='{{\bf x}}' class='latex' />, gọi <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%5E%7B%5Coplus%20i%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x}^{\oplus i}}' title='{{\bf x}^{\oplus i}}' class='latex' /> là bộ phiếu mà ta đổi phiếu <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i}' title='{x_i}' class='latex' /> lại. Thì tầm ảnh hưởng của phiếu thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' /> trên kết quả được định nghĩa là
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BInf%7D_i%28f%29%20%3A%3D%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%20%5Cneq%20f%28%7B%5Cbf%20x%7D%5E%7B%5Coplus%20i%7D%29%5D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Inf}_i(f) := \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) \neq f({\bf x}^{\oplus i})]. ' title='\displaystyle  \text{Inf}_i(f) := \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) \neq f({\bf x}^{\oplus i})]. ' class='latex' /></p>
<p> Trong lý thuyết chọn lựa xã hội (social choice theory) thì tầm ảnh hưởng này còn được gọi là <a href="http://en.wikipedia.org/wiki/Banzhaf_power_index">Banzhaf power index</a> hoặc Banzhaf-Penrose index. Chỉ số này đã được dùng trong một vài phiên tòa về bầu cử. Các hệ số Fourier lại giúp ta:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BInf%7D_i%28f%29%20%3D%20%5Csum_%7Bi%20%5Cin%20S%7D%20%5Chat%20f%5E2_S.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Inf}_i(f) = \sum_{i \in S} \hat f^2_S. ' title='\displaystyle  \text{Inf}_i(f) = \sum_{i \in S} \hat f^2_S. ' class='latex' /></p>
<p> (<b>bài tập</b>!)</p>
<p>
Dễ thấy rằng tầm ảnh hưởng của các hàm đảng cử là <img src='http://s.wordpress.com/latex.php?latex=%7B0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{0}' title='{0}' class='latex' />, tầm ảnh hưởng của hàm độc tài là <img src='http://s.wordpress.com/latex.php?latex=%7B0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{0}' title='{0}' class='latex' /> cho tất cả trừ anh độc tài có ảnh hưởng bằng <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' />. Tầm ảnh hưởng của hàm đa số thì mất công hơn một chút. Dùng <a href="http://en.wikipedia.org/wiki/Stirling's_approximation">xấp xỉ Stirling</a> ta tính được nó bằng khoảng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csqrt%7B%5Cfrac%7B2%7D%7B%5Cpi%20n%7D%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sqrt{\frac{2}{\pi n}}}' title='{\sqrt{\frac{2}{\pi n}}}' class='latex' />.
<li> <em>Ảnh hưởng của nhiễu ra sao?</em> Khi ghi lại cả triệu phiếu bầu thì xác suất mà một phiếu bị ghi sai không bỏ qua được. Gọi xác suất này là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\epsilon}' title='{\epsilon}' class='latex' /> chẳng hạn. Giả sử ta lấy một bộ phiếu bầu <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' /> hoàn toàn ngẫu nhiên. Gọi <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20y%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf y}' title='{\bf y}' class='latex' /> là bộ phiếu đạt được bằng cách lật mỗi phiếu <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i}' title='{x_i}' class='latex' /> với xác suất <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\epsilon}' title='{\epsilon}' class='latex' />. Dễ thấy, với mọi <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' />,
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D%5Bx_iy_i%5D%20%3D%201-2%5Cepsilon.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{E}}[x_iy_i] = 1-2\epsilon. ' title='\displaystyle  \mathop{\textnormal{E}}[x_iy_i] = 1-2\epsilon. ' class='latex' /></p>
<p> Do đó cặp <img src='http://s.wordpress.com/latex.php?latex=%7B%28%5Cbf%20x%2C%20y%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(\bf x, y)}' title='{(\bf x, y)}' class='latex' /> được gọi là <img src='http://s.wordpress.com/latex.php?latex=%7B%281-2%5Cepsilon%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(1-2\epsilon)}' title='{(1-2\epsilon)}' class='latex' />-correlated. <em>Độ ổn định nhiễu</em> của <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> tại <img src='http://s.wordpress.com/latex.php?latex=%7B%281-2%5Cepsilon%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(1-2\epsilon)}' title='{(1-2\epsilon)}' class='latex' /> được định nghĩa là
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BStab%7D_%7B1-2%5Cepsilon%7D%28f%29%20%3D%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%5Cstackrel%7B%7B%5Cbf%20x%2C%20y%7D%7D%7B%281-2%5Cepsilon%29-%5Ctext%7Bcor%7D%7D%7D%20%5Bf%28%7B%5Cbf%20x%7D%29f%28%7B%5Cbf%20y%7D%29%5D%20%3D%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%20%3D%20f%28%7B%5Cbf%20y%7D%29%5D%20-%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%20%5Cneq%20f%28%7B%5Cbf%20y%7D%29%5D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Stab}_{1-2\epsilon}(f) = \mathop{\textnormal{E}}_{\stackrel{{\bf x, y}}{(1-2\epsilon)-\text{cor}}} [f({\bf x})f({\bf y})] = \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) = f({\bf y})] - \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) \neq f({\bf y})]. ' title='\displaystyle  \text{Stab}_{1-2\epsilon}(f) = \mathop{\textnormal{E}}_{\stackrel{{\bf x, y}}{(1-2\epsilon)-\text{cor}}} [f({\bf x})f({\bf y})] = \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) = f({\bf y})] - \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) \neq f({\bf y})]. ' class='latex' /></p>
<p> Ngược lại:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BProb%7D%7D_%7B%5Cbf%20x%7D%5Bf%28%7B%5Cbf%20x%7D%29%20%3D%20f%28%7B%5Cbf%20y%7D%29%5D%20%3D%20%5Cfrac%201%202%20%2B%20%5Cfrac%201%202%20%5Ctext%7BStab%7D_%7B1-2%5Cepsilon%7D%28f%29.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) = f({\bf y})] = \frac 1 2 + \frac 1 2 \text{Stab}_{1-2\epsilon}(f). ' title='\displaystyle  \mathop{\textnormal{Prob}}_{\bf x}[f({\bf x}) = f({\bf y})] = \frac 1 2 + \frac 1 2 \text{Stab}_{1-2\epsilon}(f). ' class='latex' /></p>
<p> Ta cũng tính được độ ổn định nhiễu dùng các hệ số Fourier:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BStab%7D_%7B1-2%5Cepsilon%7D%28f%29%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%281-2%5Cepsilon%29%5E%7B%7CS%7C%7D%20%5Chat%20f_S%5E2.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{Stab}_{1-2\epsilon}(f) = \sum_{S\subseteq [n]} (1-2\epsilon)^{|S|} \hat f_S^2. ' title='\displaystyle  \text{Stab}_{1-2\epsilon}(f) = \sum_{S\subseteq [n]} (1-2\epsilon)^{|S|} \hat f_S^2. ' class='latex' /></p>
<p> (<b>bài tập</b>!)</p>
<p>
Độ ổn định nhiễu của các hàm đảng cử là <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' />, của hàm độc tài thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B1-2%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1-2\epsilon}' title='{1-2\epsilon}' class='latex' />. Độ ổn định nhiễu của hàm đa số là thú vị nhất. Có thể chứng minh được điều sau đây:
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Clim_%7Bn%20%5Crightarrow%20%5Cinfty%7D%20%5Ctext%7BStab%7D_%7B1-2%5Cepsilon%7D%28%5Ctext%7BMaj%7D_n%29%20%3D%201%20-%20%5Cfrac%202%20%5Cpi%20%5Carccos%281-2%5Cepsilon%29.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \lim_{n \rightarrow \infty} \text{Stab}_{1-2\epsilon}(\text{Maj}_n) = 1 - \frac 2 \pi \arccos(1-2\epsilon). ' title='\displaystyle  \lim_{n \rightarrow \infty} \text{Stab}_{1-2\epsilon}(\text{Maj}_n) = 1 - \frac 2 \pi \arccos(1-2\epsilon). ' class='latex' /></p>
<p> Nếu ta dùng xấp xỉ <img src='http://s.wordpress.com/latex.php?latex=%7B%5Carccos%281-2%5Cepsilon%29%20%5Capprox%202%5Csqrt%7B%5Cepsilon%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\arccos(1-2\epsilon) \approx 2\sqrt{\epsilon}}' title='{\arccos(1-2\epsilon) \approx 2\sqrt{\epsilon}}' class='latex' /> (khá tốt khi <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\epsilon}' title='{\epsilon}' class='latex' /> nhỏ) thì ta thấy rằng cái nhiễu <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\epsilon}' title='{\epsilon}' class='latex' /> dẫn đến xác suất khoảng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cfrac%7B2%7D%7B%5Cpi%7D%20%5Csqrt%7B%5Cepsilon%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\frac{2}{\pi} \sqrt{\epsilon}}' title='{\frac{2}{\pi} \sqrt{\epsilon}}' class='latex' /> là kết quả bầu cử bị thay đổi.
</ul>
<p>
<p><b> 11. Định lý Arrow và tính duy lý của sự độc tài </b></p>
<p><p>
<a href="http://en.wikipedia.org/wiki/Marquis_de_Condorcet">Marquis de Condorcet</a> là một triết gia, nhà toán học, và nhà khoa học chính trị người Pháp sống ở thế kỷ 18. Năm 1785, ông viết bài &#8220;Essay on the Application of Analysis to the Probability of Majority Decisions&#8221; có ảnh hưởng sâu rộng đến lý thuyết chọn lựa xã hội, kinh tế học, và hiện nay đến các thuật toán xếp hạng quảng cáo của các công ty như Google, Yahoo, Microsoft. Condorcet là một trong những người đầu tiên mang (tính chặt chẽ của) toán học vào nghiên cứu khoa học xã hội. Ông tham gia cách mạng Pháp, viết vài quyển sách bất hủ ủng hộ cho tinh thần Khai Sáng. Ông bị bắt giam gần một năm, và mất trong tù. Nhiều khả năng là do tự uống thuốc độc.</p>
<p>
Ông khám phá ra <a href="http://en.wikipedia.org/wiki/Voting_paradox">&#8220;nghịch lý Condorcet&#8221;</a>. Đại để cái nghịch lý này như sau. Giả sử nhà nước cần đầu tư vào ngành đóng tàu (ĐT), cầu đường (CĐ), hoặc giáo dục (GD). Nhà nước làm trưng cầu dân ý. Mỗi người cho biết xếp hạng của riêng mình về tầm quan trọng của ba thứ này. Ví dụ, anh Tám Tàng bảo tôi nghĩ GD trước, rồi đến CĐ, rồi đến ĐT. Anh Bảy Xị cho một thứ tự khác, vân vân. Thì có khả năng là đa số mọi người xếp GD trên CĐ, đa số xếp CĐ trên ĐT, <b>và</b> đa số xếp ĐT trên GD. Đó là tính phi lý của chọn lựa xã hội. Khi biết cái nghịch lý Condorcet rồi, chúng ta đọc các thống kê xã hội cẩn thận hơn. Obama với McCain cãi nhau, đều lôi thống kê ra. Một ông bảo phải đầu tư cái này do đa số dân chúng ủng hộ cái này hơn cái kia, McCain bảo cái kia hơn cái nọ. Chúng ta nên nghĩ ngay đến khả năng vô lý của chọn lựa xã hội. Có khả năng cả Obama lẫn McCain đều đúng, nhưng đều vô lý.</p>
<p>
Đến năm 1950, <a href="http://en.wikipedia.org/wiki/Kenneth_Arrow">Kenneth Arrow</a> (giải Nobel kinh tế 1972) viết một bài báo rất nổi tiếng về các luật bầu cử, trong đó ông chứng minh <a href="http://en.wikipedia.org/wiki/Arrow's_impossibility_theorem">định lý Arrow</a> nói rằng hàm độc tài là luật bầu cử duy nhất có tính &#8220;duy lý&#8221; tuyệt đối. Chúng ta sẽ chứng minh định lý Arrow bằng giải tích Fourier.</p>
<p>
Để đơn giản (nhưng không mất tính tổng quát) ta giả sử xã hội có 3 đề mục A, B, C cần xếp hạng bằng bầu cử (GD-CĐ-ĐT, hoặc Obama-McCain-Nader, hoặc cơm-sữa-bia). Người thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' /> bầu 3 phiếu: phiếu <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i}' title='{x_i}' class='latex' /> chọn A hơn B (<img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i = 1}' title='{x_i = 1}' class='latex' />) hoặc B hơn A (<img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%3D-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i=-1}' title='{x_i=-1}' class='latex' />), <img src='http://s.wordpress.com/latex.php?latex=%7By_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{y_i}' title='{y_i}' class='latex' /> chọn giữa B và C, và <img src='http://s.wordpress.com/latex.php?latex=%7Bz_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{z_i}' title='{z_i}' class='latex' /> chọn giữa C và A. Nếu anh nào xếp hạng vòng tròn (A hơn B, B hơn C, và C hơn A) thì anh ấy bị chập, không cho bầu. Do đó chúng ta giả sử là ba phiếu bầu <img src='http://s.wordpress.com/latex.php?latex=%7Bx_i%2C%20y_i%2C%20z_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_i, y_i, z_i}' title='{x_i, y_i, z_i}' class='latex' /> của người thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' /> mang tính duy lý. Nói cách khác, bộ ba <img src='http://s.wordpress.com/latex.php?latex=%7B%28x_i%2C%20y_i%2C%20z_i%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(x_i, y_i, z_i)}' title='{(x_i, y_i, z_i)}' class='latex' /> là duy lý nếu và chỉ nếu chúng không cùng bằng <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> hoặc <img src='http://s.wordpress.com/latex.php?latex=%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{-1}' title='{-1}' class='latex' />.</p>
<p>
Như vậy, nếu có <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> người thì ta có ba vectors <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%2C%20y%2C%20z%7D%20%5Cin%20%5C%7B-1%2C1%5C%7D%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x, y, z} \in \{-1,1\}^n}' title='{{\bf x, y, z} \in \{-1,1\}^n}' class='latex' />. Từ ba vectors này, &#8220;luật&#8221; bầu cử sẽ phải tính xem xã hội xếp hạng A, B, C như thế nào, nghĩa là xã hội thích cái nào hơn giữa A và B, giữa B và C, và giữa C và A. Luật bầu cử sẽ phải thỏa mãn một số tiên đề nhất định: </p>
<ul>
<li> Tính nhất trí (còn gọi là hiệu suất Pareto): nếu mỗi người đều thích A hơn B thì xã hội cũng phải chọn A hơn B.
<li> Không độc tài: xếp hạng của xã hội không thể luôn giống hệt như xếp hạng của một anh Bảy Xị nào đó.
<li> Sự độc lập của các chọn lựa không liên quan (independence of irrelevant alternatives &#8212; IIA): việc xã hội xếp hạng A hơn B hay B hơn A thì độc lập với thứ hạng của anh C trong các chọn lựa cá nhân.
<li> Tính duy lý: xã hội không thể xếp hạng quẩn quanh theo vòng tròn (A hơn B, B hơn C, và C hơn A).
</ul>
<p> Arrow chứng minh rằng không có hàm nào thỏa cả bốn điều kiện trên, cho dù các cá nhân đều duy lý. (Bài báo của Arrow khá là dài dòng văn tự. Với mỗi giả thuyết, tiên đề, ông lại đá sang triết lý và vài kết quả trước đó.) Định lý của Arrow thật sự là một định lý mang tính tổ hợp, và có các <a href="http://www.google.com/url?sa=t&#038;source=web&#038;cd=6&#038;ved=0CCsQFjAF&#038;url=http&#37;3A&#37;2F&#37;2Fcowles.econ.yale.edu&#37;2F~gean&#37;2Fart&#37;2Fp1116.pdf&#038;ei=s4VRTNbvJ4GClAeq55iIBg&#038;usg=AFQjCNENVifETv9cnBzuJFY3Ny18mocuoA">chứng minh tổ hợp ngắn gọn cho nó</a>.</p>
<p>
Chúng ta sẽ chứng minh định lý Arrow bằng phân tích Fourier. Chứng minh này là <a href="http://www.ma.huji.ac.il/~kalai/arr.pdf">phát kiến tuyệt vời của Gil Kalai</a>.</p>
<p>
Từ giả thiết IIA, ta kết luận rằng chọn lựa xã hội có thể đúc kết bằng ba hàm số <img src='http://s.wordpress.com/latex.php?latex=%7Bf%28%7B%5Cbf%20x%7D%29%3A%20%5C%7B-1%2C1%5C%7D%5En%20%5Crightarrow%20%5C%7B-1%2C1%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f({\bf x}): \{-1,1\}^n \rightarrow \{-1,1\}}' title='{f({\bf x}): \{-1,1\}^n \rightarrow \{-1,1\}}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7Bg%28%7B%5Cbf%20y%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g({\bf y})}' title='{g({\bf y})}' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%7Bh%28%7B%5Cbf%20z%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h({\bf z})}' title='{h({\bf z})}' class='latex' />. Hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> cho ta biết xã hội thích A hơn hay B hơn, <img src='http://s.wordpress.com/latex.php?latex=%7Bg%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g}' title='{g}' class='latex' /> xếp hạng B và C, và <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> xếp hạng C và A.</p>
<p>
Từ tính nhất trí và tính duy lý, ta sẽ chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3Dg%3Dh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f=g=h}' title='{f=g=h}' class='latex' />. Tính duy lý nói rằng không thể tồn tại các vectors <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%2C%20y%2C%20z%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x, y, z}}' title='{{\bf x, y, z}}' class='latex' />, mỗi bộ <img src='http://s.wordpress.com/latex.php?latex=%7B%28x_i%2Cy_i%2Cz_i%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(x_i,y_i,z_i)}' title='{(x_i,y_i,z_i)}' class='latex' /> đều duy lý, mà lại cho ra kết quả phi lý <img src='http://s.wordpress.com/latex.php?latex=%7Bf%28%7B%5Cbf%20x%7D%29%20%3D%20g%28%7B%5Cbf%20y%7D%29%20%3D%20h%28%7B%5Cbf%20z%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f({\bf x}) = g({\bf y}) = h({\bf z})}' title='{f({\bf x}) = g({\bf y}) = h({\bf z})}' class='latex' />. Xét bộ ba <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%2C%20%7B%5Cbf%20y%20%3D%20-x%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x}, {\bf y = -x}}' title='{{\bf x}, {\bf y = -x}}' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20z%7D%20%3D%20%28f%28%7B%5Cbf%20x%7D%29%2C%20%5Ccdots%2C%20f%28%7B%5Cbf%20x%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf z} = (f({\bf x}), \cdots, f({\bf x})}' title='{{\bf z} = (f({\bf x}), \cdots, f({\bf x})}' class='latex' />. Do tính nhất trí ta có <img src='http://s.wordpress.com/latex.php?latex=%7Bh%28%7B%5Cbf%20z%7D%29%20%3D%20f%28%7B%5Cbf%20x%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h({\bf z}) = f({\bf x})}' title='{h({\bf z}) = f({\bf x})}' class='latex' />. Như vậy <img src='http://s.wordpress.com/latex.php?latex=%7Bg%28%7B%5Cbf%20y%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g({\bf y})}' title='{g({\bf y})}' class='latex' /> phải khác với <img src='http://s.wordpress.com/latex.php?latex=%7Bf%28%7B%5Cbf%20x%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f({\bf x})}' title='{f({\bf x})}' class='latex' />. Nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%7Bg%28-%7B%5Cbf%20x%7D%29%20%3D%20-f%28%7B%5Cbf%20x%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g(-{\bf x}) = -f({\bf x})}' title='{g(-{\bf x}) = -f({\bf x})}' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x}}' title='{{\bf x}}' class='latex' />. Tương tự ta có <img src='http://s.wordpress.com/latex.php?latex=%7Bg%28-%7B%5Cbf%20x%7D%29%20%3D%20-h%28%7B%5Cbf%20x%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g(-{\bf x}) = -h({\bf x})}' title='{g(-{\bf x}) = -h({\bf x})}' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x}}' title='{{\bf x}}' class='latex' />. Do đó <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3Dh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f=h}' title='{f=h}' class='latex' />. Tương tự ta có <img src='http://s.wordpress.com/latex.php?latex=%7Bf%3Dg%3Dh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f=g=h}' title='{f=g=h}' class='latex' />.</p>
<p>
Bây giờ giả sử tồn tại hàm <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> sao cho, với bất kỳ bộ ba duy lý <img src='http://s.wordpress.com/latex.php?latex=%7B%28%7B%5Cbf%20x%2C%20y%2C%20z%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{({\bf x, y, z})}' title='{({\bf x, y, z})}' class='latex' /> nào, cái chọn lựa xã hội <img src='http://s.wordpress.com/latex.php?latex=%7B%28f%28%7B%5Cbf%20x%7D%29%2C%20f%28%7B%5Cbf%20y%7D%29%2C%20f%28%7B%5Cbf%20z%7D%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(f({\bf x}), f({\bf y}), f({\bf z}))}' title='{(f({\bf x}), f({\bf y}), f({\bf z}))}' class='latex' /> cũng duy lý. <b>Ta sẽ chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> phải là hàm độc tài</b>. Với mỗi cá nhân <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' />, chọn bộ ba <img src='http://s.wordpress.com/latex.php?latex=%7B%28x_i%2Cy_i%2Cz_i%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(x_i,y_i,z_i)}' title='{(x_i,y_i,z_i)}' class='latex' /> ngẫu nhiên từ một trong 6 bộ ba duy lý <img src='http://s.wordpress.com/latex.php?latex=%7B%281%2C1%2C-1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(1,1,-1)}' title='{(1,1,-1)}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7B%281%2C-1%2C1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(1,-1,1)}' title='{(1,-1,1)}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7B%281%2C-1%2C-1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(1,-1,-1)}' title='{(1,-1,-1)}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7B%28-1%2C1%2C1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(-1,1,1)}' title='{(-1,1,1)}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7B%28-1%2C-1%2C1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(-1,-1,1)}' title='{(-1,-1,1)}' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%7B%28-1%2C1%2C-1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(-1,1,-1)}' title='{(-1,1,-1)}' class='latex' />. Ta sẽ có một bộ ba vectors <img src='http://s.wordpress.com/latex.php?latex=%7B%28%7B%5Cbf%20x%2C%20y%2C%20z%7D%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{({\bf x, y, z})}' title='{({\bf x, y, z})}' class='latex' /> duy lý. Xác suất mà <img src='http://s.wordpress.com/latex.php?latex=%7B%28f%28%7B%5Cbf%20x%7D%29%2C%20f%28%7B%5Cbf%20y%7D%29%2C%20f%28%7B%5Cbf%20z%7D%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(f({\bf x}), f({\bf y}), f({\bf z}))}' title='{(f({\bf x}), f({\bf y}), f({\bf z}))}' class='latex' /> là duy lý phải bằng <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' />, nếu luật bầu cử <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> là duy lý trong mọi trường hợp.</p>
<p>
Định nghĩa hàm <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctextnormal%7BNAE%7D%28a%2Cb%2Cc%29%3A%20%5C%7B-1%2C1%5C%7D%5E3%20%5Crightarrow%20%5C%7B0%2C1%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\textnormal{NAE}(a,b,c): \{-1,1\}^3 \rightarrow \{0,1\}}' title='{\textnormal{NAE}(a,b,c): \{-1,1\}^3 \rightarrow \{0,1\}}' class='latex' /> như sau. (NAE là &#8220;not all equal&#8221;.) <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctextnormal%7BNAE%7D%28a%2Cb%2Cc%29%20%3D%200%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\textnormal{NAE}(a,b,c) = 0}' title='{\textnormal{NAE}(a,b,c) = 0}' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=%7Ba%3Db%3Dc%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{a=b=c}' title='{a=b=c}' class='latex' />. Khai triển Fourier của hàm này là
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctextnormal%7BNAE%7D%28a%2Cb%2Cc%29%20%3D%20%5Cfrac%203%204%20-%20%5Cfrac%201%204%20ab-%5Cfrac%201%204%20bc-%5Cfrac%201%204%20ca.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \textnormal{NAE}(a,b,c) = \frac 3 4 - \frac 1 4 ab-\frac 1 4 bc-\frac 1 4 ca. ' title='\displaystyle  \textnormal{NAE}(a,b,c) = \frac 3 4 - \frac 1 4 ab-\frac 1 4 bc-\frac 1 4 ca. ' class='latex' /></p>
<p> Như vậy, xác suất mà <img src='http://s.wordpress.com/latex.php?latex=%7B%28f%28%7B%5Cbf%20x%7D%29%2C%20f%28%7B%5Cbf%20y%7D%29%2C%20f%28%7B%5Cbf%20z%7D%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(f({\bf x}), f({\bf y}), f({\bf z}))}' title='{(f({\bf x}), f({\bf y}), f({\bf z}))}' class='latex' /> là duy lý sẽ bằng
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%7B%5Cbf%20x%2Cy%2Cz%7D%7D%5B%5Ctext%7BNAE%7D%28f%28%7B%5Cbf%20x%7D%29%2C%20f%28%7B%5Cbf%20y%7D%29%2C%20f%28%7B%5Cbf%20z%7D%29%5D%20%3D%20%5Cfrac%203%204%20-%20%5Cfrac%201%204%20%5Ctext%7BE%7D%5Bf%28%7B%5Cbf%20x%7D%29f%28%7B%5Cbf%20y%7D%29%5D%20-%20%5Cfrac%201%204%20%5Ctext%7BE%7D%5Bf%28%7B%5Cbf%20y%7D%29f%28%7B%5Cbf%20z%7D%29%5D%20-%20%5Cfrac%201%204%20%5Ctext%7BE%7D%5Bf%28%7B%5Cbf%20z%7D%29f%28%7B%5Cbf%20x%7D%29%5D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{E}}_{{\bf x,y,z}}[\text{NAE}(f({\bf x}), f({\bf y}), f({\bf z})] = \frac 3 4 - \frac 1 4 \text{E}[f({\bf x})f({\bf y})] - \frac 1 4 \text{E}[f({\bf y})f({\bf z})] - \frac 1 4 \text{E}[f({\bf z})f({\bf x})]. ' title='\displaystyle  \mathop{\textnormal{E}}_{{\bf x,y,z}}[\text{NAE}(f({\bf x}), f({\bf y}), f({\bf z})] = \frac 3 4 - \frac 1 4 \text{E}[f({\bf x})f({\bf y})] - \frac 1 4 \text{E}[f({\bf y})f({\bf z})] - \frac 1 4 \text{E}[f({\bf z})f({\bf x})]. ' class='latex' /></p>
<p> Do <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%2C%20y%2C%20z%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x, y, z}}' title='{{\bf x, y, z}}' class='latex' /> có vai trò như nhau, ta kết luận
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathop%7B%5Ctextnormal%7BE%7D%7D_%7B%7B%5Cbf%20x%2Cy%2Cz%7D%7D%5B%5Ctext%7BNAE%7D%28f%28%7B%5Cbf%20x%7D%29%2C%20f%28%7B%5Cbf%20y%7D%29%2C%20f%28%7B%5Cbf%20z%7D%29%5D%20%3D%20%5Cfrac%203%204%20-%20%5Cfrac%203%204%20%5Ctext%7BE%7D%5Bf%28%7B%5Cbf%20x%7D%29f%28%7B%5Cbf%20y%7D%29%5D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathop{\textnormal{E}}_{{\bf x,y,z}}[\text{NAE}(f({\bf x}), f({\bf y}), f({\bf z})] = \frac 3 4 - \frac 3 4 \text{E}[f({\bf x})f({\bf y})]. ' title='\displaystyle  \mathop{\textnormal{E}}_{{\bf x,y,z}}[\text{NAE}(f({\bf x}), f({\bf y}), f({\bf z})] = \frac 3 4 - \frac 3 4 \text{E}[f({\bf x})f({\bf y})]. ' class='latex' /></p>
<p> Nhớ rằng trị kỳ vọng được tính từ cách lấy các bộ ba duy lý <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%2C%20y%2C%20z%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x, y, z}}' title='{{\bf x, y, z}}' class='latex' /> như mô tả ở trên. Từ đó dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%7B%5Cbf%20x%2Cy%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{{\bf x,y}}' title='{{\bf x,y}}' class='latex' /> là một cặp <img src='http://s.wordpress.com/latex.php?latex=%7B%28-1%2F3%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(-1/3)}' title='{(-1/3)}' class='latex' />-correlated. Do đó
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Ctext%7BE%7D%5Bf%28%7B%5Cbf%20x%7D%29f%28%7B%5Cbf%20y%7D%29%5D%20%3D%20%5Ctext%7BStab%7D_%7B-1%2F3%7D%28f%29%20%3D%20%5Csum_%7BS%5Csubseteq%20%5Bn%5D%7D%20%28-1%2F3%29%5E%7B%7CS%7C%7D%20%5Chat%20f_S%5E2.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \text{E}[f({\bf x})f({\bf y})] = \text{Stab}_{-1/3}(f) = \sum_{S\subseteq [n]} (-1/3)^{|S|} \hat f_S^2. ' title='\displaystyle  \text{E}[f({\bf x})f({\bf y})] = \text{Stab}_{-1/3}(f) = \sum_{S\subseteq [n]} (-1/3)^{|S|} \hat f_S^2. ' class='latex' /></p>
<p> Để cho gọn, ta định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%7BW_k%28f%29%20%3D%20%5Csum_%7B%7CS%7C%3Dk%7C%7D%5Chat%20f%5E2_S%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{W_k(f) = \sum_{|S|=k|}\hat f^2_S}' title='{W_k(f) = \sum_{|S|=k|}\hat f^2_S}' class='latex' />. Nhớ rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csum_S%20%5Chat%20f_S%5E2%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sum_S \hat f_S^2 = 1}' title='{\sum_S \hat f_S^2 = 1}' class='latex' />, do đó <img src='http://s.wordpress.com/latex.php?latex=%7B%5Csum_k%20W_k%28f%29%3D1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\sum_k W_k(f)=1}' title='{\sum_k W_k(f)=1}' class='latex' />. Do đó, xác suất mà <img src='http://s.wordpress.com/latex.php?latex=%7B%28f%28%7B%5Cbf%20x%7D%29%2C%20f%28%7B%5Cbf%20y%7D%29%2C%20f%28%7B%5Cbf%20z%7D%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(f({\bf x}), f({\bf y}), f({\bf z}))}' title='{(f({\bf x}), f({\bf y}), f({\bf z}))}' class='latex' /> là duy lý bằng
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cfrac%203%204%20-%20%5Cfrac%203%204%20%5Csum_%7Bk%3D0%7D%5En%20%28-1%2F3%29%5Ek%20W_k%28f%29%20%3D%20%5Cfrac%203%204%20-%20%5Cfrac%203%204%20W_0%28f%29%20%2B%20%5Cfrac%7B1%7D%7B4%7DW_1%28f%29%20-%20%5Cfrac%7B1%7D%7B12%7D%20W_2%28f%29%20%2B%20%5Cfrac%7B1%7D%7B36%7D%20W_3%28f%29%20%5Ccdots%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \frac 3 4 - \frac 3 4 \sum_{k=0}^n (-1/3)^k W_k(f) = \frac 3 4 - \frac 3 4 W_0(f) + \frac{1}{4}W_1(f) - \frac{1}{12} W_2(f) + \frac{1}{36} W_3(f) \cdots ' title='\displaystyle  \frac 3 4 - \frac 3 4 \sum_{k=0}^n (-1/3)^k W_k(f) = \frac 3 4 - \frac 3 4 W_0(f) + \frac{1}{4}W_1(f) - \frac{1}{12} W_2(f) + \frac{1}{36} W_3(f) \cdots ' class='latex' /></p>
<p> Xác suất này chỉ có thể bằng <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> nếu <img src='http://s.wordpress.com/latex.php?latex=%7BW_1%28f%29%3D1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{W_1(f)=1}' title='{W_1(f)=1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7BW_k%28f%29%3D0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{W_k(f)=0}' title='{W_k(f)=0}' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=%7Bk%5Cneq%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{k\neq 1}' title='{k\neq 1}' class='latex' />. Nhưng <img src='http://s.wordpress.com/latex.php?latex=%7BW_1%28f%29%3D1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{W_1(f)=1}' title='{W_1(f)=1}' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=%7Bf%20%3D%20%5Ctext%7BDict%7D_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f = \text{Dict}_i}' title='{f = \text{Dict}_i}' class='latex' /> hoặc <img src='http://s.wordpress.com/latex.php?latex=%7Bf%20%3D%20-%5Ctext%7BDict%7D_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f = -\text{Dict}_i}' title='{f = -\text{Dict}_i}' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=%7Bi%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{i}' title='{i}' class='latex' /> nào đó. Nhưng <img src='http://s.wordpress.com/latex.php?latex=%7Bf%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f}' title='{f}' class='latex' /> phải thỏa tính nhất trí, do đó <img src='http://s.wordpress.com/latex.php?latex=%7Bf%20%3D%20%5Ctext%7BDict%7D_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f = \text{Dict}_i}' title='{f = \text{Dict}_i}' class='latex' />. Và đó là tính duy lý của sự độc tài.</p>
<p>
Chứng minh định lý Arrow bằng phương pháp này không chỉ để cho vui. Chứng minh cũ của Arrow không cho chúng ta biết xác suất sự phí lý của chọn lựa xã hội là bao nhiêu. Phân tích Fourier cho chúng ta biết, nếu ta dùng hàm đa số, khi <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> tiến đến vô cùng thì xác suất có chọn lựa xã hội duy lý là
<p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cfrac%203%204%20-%20%5Cfrac%203%204%5Cleft%281-%5Cfrac%202%20%5Cpi%20%5Carccos%28-1%2F3%29%5Cright%29%20%5Capprox%20.912.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \frac 3 4 - \frac 3 4\left(1-\frac 2 \pi \arccos(-1/3)\right) \approx .912. ' title='\displaystyle  \frac 3 4 - \frac 3 4\left(1-\frac 2 \pi \arccos(-1/3)\right) \approx .912. ' class='latex' /></p>
<p> Con số <img src='http://s.wordpress.com/latex.php?latex=%7B.912%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{.912}' title='{.912}' class='latex' /> này gọi là số Guilbaud. Chúng ta không những biết nghịch lý Condorcet có thể xảy ra mà còn biết cả xác suất của nó. Còn nhiều điều hay ho nữa từ chứng minh này, nhưng để dịp khác. Bài tới ta bàn về cái PCP của Hastad. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2010/07/29/pcp10/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Mật mã dưới góc nhìn độ phức tạp tính toán</title>
		<link>http://www.procul.org/blog/2009/09/20/m%e1%ba%adt-ma-d%c6%b0%e1%bb%9bi-goc-nhin-d%e1%bb%99-ph%e1%bb%a9c-t%e1%ba%a1p-tinh-toan/</link>
		<comments>http://www.procul.org/blog/2009/09/20/m%e1%ba%adt-ma-d%c6%b0%e1%bb%9bi-goc-nhin-d%e1%bb%99-ph%e1%bb%a9c-t%e1%ba%a1p-tinh-toan/#comments</comments>
		<pubDate>Sun, 20 Sep 2009 11:35:04 +0000</pubDate>
		<dc:creator>Phan Dương Hiệu</dc:creator>
				<category><![CDATA[Bảo mật và mật mã học]]></category>
		<category><![CDATA[Lý thuyết tính toán]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=1713</guid>
		<description><![CDATA[Bài này thảo luận mối liên hệ mất thiết giữa lý thuyết mật mã và lý thuyết độ phức tạp tính toán. I. Khởi động: Bài toán quyết định và bài toán tìm kiếm (Decision versus Search) Trong thực tế, khi có một bài toán, ta thường quan tâm tới việc tìm ra lời giải [...]]]></description>
			<content:encoded><![CDATA[<p>Bài này thảo luận mối liên hệ mất thiết giữa lý thuyết mật mã và lý thuyết độ phức tạp tính toán.</p>
<p><span id="more-1713"></span></p>
<p><strong>I. Khởi động: Bài toán quyết định và bài toán tìm kiếm (Decision versus Search)</strong></p>
<p>Trong thực tế, khi có một bài toán, ta thường quan tâm tới việc tìm ra lời giải cho bài toán đó hơn là xem xét liệu bài toán đó có tồn tại lời giải hay không. Tuy nhiên, trong lý thuyết độ phức tạp tính toán, ta lại toàn bắt gặp các bài toán quyết định (chẳng hạn như với <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BSAT%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{SAT}' title='\mathsf{SAT}' class='latex' /> là xem 1 công thức có thỏa được hay không) mà ít chú ý đến việc tìm kiếm lời giải (tìm một phép gán giá trị cho các biến để công thức là thỏa được). Các lớp phổ biến <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%2C%20NP%2C%20EXP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P, NP, EXP}' title='\mathbf{P, NP, EXP}' class='latex' />,&#8230; đều là các lớp các bài toán quyết định. Điều đó hẳn làm chúng ta băn khoăn tự hỏi, lý do nào mà ta thường ít nói tới các bài toán tìm kiếm? Một số lý do cơ bản (tất nhiên có thể có nhiều lý do khác) là như sau :<br />
- Nếu lý thuyết thuật toán là đưa ra cận trên (upper bound) của sự phức tạp để giải quyết một bài toán (thực vậy, khi ta có thiết kế một thuật toán để giải một bài toán, thì đồng thời độ phức tạp của thuật toán đó cho ta một cận trên để giải bài toán) thì lý thuyết độ phức tạp nghiên cứu chủ yếu cận dưới (lower bound) hay độ khó tối thiểu để giải một bài toán. Bài toán quyết định hiển nhiên không thể khó hơn bài toán tìm kiếm nên nếu ta chứng minh được bài toán quyết định là khó thì nghiễm nhiên bài toán tìm kiếm cũng khó theo. Do vậy, dù gì cũng nên nghiên cứu độ khó của bài toán quyết định trước.<br />
- Trong nhiều bài toán ta có sự &#8220;tương đương&#8221; giữa bài toán quyết định và bài toán tìm kiếm nên chỉ cần nghiên cứu bài toán quyết định. Thực tế, tất cả các bài toán trong lớp NP-đầy đủ đều có tính chất này. Kỹ thuật qui dẫn một bài toán tìm kiếm về bài toán quyết định thường là dùng cách phương pháp tìm kiếm nhị phân. Chẳng hạn đối với <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BSAT%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{SAT}' title='\mathsf{SAT}' class='latex' />, giả sử ta giải được bài toán quyết định xác định một công thức thỏa được hay không, khi đó ta cũng có thể tìm một phép gán giá trị các biến để công thức thỏa được như sau: cho biến đầu tiên giá trị đúng ; nếu công thức giản lược là thỏa được thì ta tiếp tục tìm phép gán cho biến thứ hai, nếu không ta cho biến đầu giá trị sai và tiếp tục với công thức giản lược cho trường hợp này; chỉ sau n bước như vậy (n = số biến) là ta có được phép gán giá trị cho tất cả các biến.<br />
- Ta tạm gọi (sẽ định nghĩa chính xác dưới đây) lớp bài toán tìm kiếm tương ứng với các lớp bài toán quyết định <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%2C%20NP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P, NP}' title='\mathbf{P, NP}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%2C%20FNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP, FNP}' title='\mathbf{FP, FNP}' class='latex' /> (Function <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P}' title='\mathbf{P}' class='latex' />, Function <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' />). Khi đó ta có thể chứng minh được <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%3D%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P}=\mathbf{NP}' title='\mathbf{P}=\mathbf{NP}' class='latex' /> khi và chỉ khi <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D%3D%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP}=\mathbf{FNP}' title='\mathbf{FP}=\mathbf{FNP}' class='latex' />. Như vậy tình trạng đối với các bài toán tìm kiếm cũng tương tự như các bài toán quyết định: tìm kiếm lời giải cho một bài toán <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> thực hiện được trong thời gia đa thức khi và chỉ khi bài toán quyết định cũng thực hiện được trong thời gian đa thức. Do vậy nghiên cứu vấn đề nổi cộm &#8220;<img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P}' title='\mathbf{P}' class='latex' /> vs. <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' />&#8221; là bao quát được vấn đề chung.</p>
<p>Tuy vậy, những lý do trên chưa đủ thuyết phục để ta hoàn toàn quên đi các bài toán tìm kiếm. Vẫn có nhiều bài toán tìm kiếm có vẻ thực sự khó hơn là quyết định (chẳng hạn <a id="bnr5" title="Bellare và Goldwasser" href="http://cseweb.ucsd.edu/users/mihir/papers/compip.pdf">Bellare và Goldwasser</a> chứng minh rằng, dưới giả thiết khá hợp lý (<img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BEE%7D%20%5Cneq%20%5Cmathbf%7BNEE%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{EE} \neq \mathbf{NEE}' title='\mathbf{EE} \neq \mathbf{NEE}' class='latex' />), có những ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> mà ở đó bài toán tìm kiếm không thể qui dẫn về bài toán quyết định). Một số ví dụ khác liên quan đến mật mã nơi chủ yếu dựa trên các bài toán không phải NP-đầy đủ (phân tích thành thừa số nguyên tố chẳng hạn) và do vậy, bài toán tìm kiếm có thể rất khác bài toán quyết định.</p>
<p>Trong bài này, chúng ta sẽ xem xét lớp các bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%2C%20FNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP, FNP}' title='\mathbf{FP, FNP}' class='latex' /> và sự liên quan tới mật mã. Sự liên hệ giữa các lớp bài toán <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%2C%20FNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP, FNP}' title='\mathbf{FP, FNP}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%2C%20NP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P, NP}' title='\mathbf{P, NP}' class='latex' /> cuối cùng giúp chúng ta có một liên hệ giữa sự tồn tại của mật mã với câu hỏi trọng tâm của lý thuyết độ phức tạp &#8211; &#8220;<img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20vs.%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} vs. \mathbf{NP}' title='\mathbf{P} vs. \mathbf{NP}' class='latex' />&#8220;.</p>
<p><strong>I.1 Lớp bài toán <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFNP%2C%20FP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FNP, FP}' title='\mathbf{FNP, FP}' class='latex' /></strong></p>
<p>Một cách nôm na, cho một ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> (<img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BSAT%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{SAT}' title='\mathsf{SAT}' class='latex' /> chẳng hạn) và một đầu vào <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' /> (một công thức lô gíc chẳng hạn), bài toán quyết định là xác định xem liệu <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' /> có thuộc <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> (công thức lô gíc đầu vào liệu có thỏa được) còn bài toán tìm kiếm là bài toán chỉ ra, khi <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' />  thuộc <img src='http://s.wordpress.com/latex.php?latex=L%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L ' title='L ' class='latex' /> (công thức đã cho là thỏa được), một lời giải chứng tỏ <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' />  thuộc <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> (một phép gán giá trị cho các biến để công thức đã cho là thỏa được).</p>
<p>Mọi việc tưởng chừng đơn giản trừ việc ta chưa nói cho chính xác thế nào là một lời giải để chứng tỏ <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' />  thuộc <img src='http://s.wordpress.com/latex.php?latex=L%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L ' title='L ' class='latex' />. Một bài toán có thể có nhiều cách chứng minh chứ không phải chỉ có một. Và như vậy, để định nghĩa chính xác bài toán tìm kiếm, ta cần đưa ra quan hệ giữa đầu vào và lời giải cho nó một cách thích hợp.</p>
<p>Ta hãy xem xét một cách viết lại định nghĩa của ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> dựa trên các quan hệ hai ngôi.</p>
<blockquote><p><strong> Quan hệ NP-relation</strong><br />
Một quan hệ hai ngôi <img src='http://s.wordpress.com/latex.php?latex=%20R%20%5Cin%20%5CSigma%5E%2A%20%5Ctimes%20%20%5CSigma%5E%2A%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' R \in \Sigma^* \times  \Sigma^* ' title=' R \in \Sigma^* \times  \Sigma^* ' class='latex' /> (với <img src='http://s.wordpress.com/latex.php?latex=%20%5CSigma%5E%2A%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \Sigma^* ' title=' \Sigma^* ' class='latex' /> là bảng ký hiệu dùng trong một ngôn ngữ) được gọi là NP-relation nếu nó thỏa mãn các điều kiện sau:<br />
- <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> có thể xác định được trong thời gian đa thức. Tức là, với các đầu vào <img src='http://s.wordpress.com/latex.php?latex=%20x%2C%20y%20%5Cin%20%5CSigma%5E%2A%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x, y \in \Sigma^* ' title=' x, y \in \Sigma^* ' class='latex' />, ta có thể xác định liệu <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' /> có quan hệ <img src='http://s.wordpress.com/latex.php?latex=%20R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' R' title=' R' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> (ký hiệu <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y)' title='R(x,y)' class='latex' />) hay không trong thời gian đa thức tính trên <img src='http://s.wordpress.com/latex.php?latex=%7Cx%7C%2C%7Cy%7C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|x|,|y| ' title='|x|,|y| ' class='latex' /> (độ dài của <img src='http://s.wordpress.com/latex.php?latex=x%2Cy&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x,y' title='x,y' class='latex' />).<br />
- <img src='http://s.wordpress.com/latex.php?latex=R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R ' title='R ' class='latex' /> có tính chất cân bằng đa thức (polynomially balanced), tức là tồn tại một đa thức <img src='http://s.wordpress.com/latex.php?latex=p%28.%29%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p(.) ' title='p(.) ' class='latex' /> để, nếu <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y) ' title='R(x,y) ' class='latex' />thì <img src='http://s.wordpress.com/latex.php?latex=%7Cy%7C%20%5Cleq%20p%28%7Cx%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|y| \leq p(|x|' title='|y| \leq p(|x|' class='latex' />). Đó là một yêu cầu tự nhiên : lời giải không thể quá dài so với đầu vào (nếu không thì riêng việc viết ra lời giải đã không thể thực hiện trong thời gian đa thức).</p>
</blockquote>
<p>(Ta hãy cứ hình dung, cho <img src='http://s.wordpress.com/latex.php?latex=%20x%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' x ' title=' x ' class='latex' /> là một bài toán, <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> là định nghĩa của &#8220;lời giải&#8221;, thì <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> là lời giải của <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> nếu <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y)' title='R(x,y)' class='latex' />).</p>
<p>Nhìn lại (và chép lại) định nghĩa về lớp <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> trong bài PCP số 1 của anh Hưng: một ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> thuộc <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> nếu tồn tại một poly-time algorithm verifier <img src='http://s.wordpress.com/latex.php?latex=V&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V' title='V' class='latex' />:</p>
<ul>
<li>Verifier nhận inputs <img src='http://s.wordpress.com/latex.php?latex=x%2C%20%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x, \pi' title='x, \pi' class='latex' />, và trả lời YES/NO. Nhiệm vụ là xác định xem <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> là YES-instance hay NO-instance của <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' />.</li>
<li>Nếu <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> là YES-instance thì tồn tại &#8220;chứng minh&#8221; <img src='http://s.wordpress.com/latex.php?latex=%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi' title='\pi' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=V%28x%2C%20%5Cpi%29%20%3D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V(x, \pi) = ' title='V(x, \pi) = ' class='latex' /> YES.</li>
<li>Nếu <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> là NO-instance thì với bất kỳ &#8220;chứng minh&#8221;<img src='http://s.wordpress.com/latex.php?latex=%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi' title='\pi' class='latex' /> nào ta cũng có <img src='http://s.wordpress.com/latex.php?latex=V%28x%2C%5Cpi%29%20%3D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V(x,\pi) = ' title='V(x,\pi) = ' class='latex' /> NO.</li>
</ul>
<p>Một verifier <img src='http://s.wordpress.com/latex.php?latex=V&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V' title='V' class='latex' /> như vậy thực chất chính là một NP-relation và ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=%20L%20%3D%20%5C%7Bx%20%5Cin%20%5CSigma%5E%2A%3A%20%5Cexists%20y%20%5Cin%20%5CSigma%5E%2A%20V%28x%2Cy%29%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' L = \{x \in \Sigma^*: \exists y \in \Sigma^* V(x,y)\}' title=' L = \{x \in \Sigma^*: \exists y \in \Sigma^* V(x,y)\}' class='latex' />.<br />
Ngược lại, với mỗi NP-relation <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' />, ta cũng có thể định nghĩa một ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L_R%20%3D%20%5C%7Bx%20%5Cin%20%5CSigma%5E%2A%3A%20%5Cexists%20y%20%5Cin%20%5CSigma%5E%2A%20R%28x%2Cy%29%5C%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R = \{x \in \Sigma^*: \exists y \in \Sigma^* R(x,y)\} ' title='L_R = \{x \in \Sigma^*: \exists y \in \Sigma^* R(x,y)\} ' class='latex' /> và ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R ' title='L_R ' class='latex' /> hiển nhiên là thuộc <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> (bằng cách đặt <img src='http://s.wordpress.com/latex.php?latex=V&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V' title='V' class='latex' />  chính là <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' />).</p>
<p>Như vậy thực chất <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> là tập hợp tất cả các ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L_R%20%3D%20%5C%7Bx%20%5Cin%20%5CSigma%5E%2A%3A%20%5Cexists%20y%20%5Cin%20%5CSigma%5E%2A%20R%28x%2Cy%29%5C%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R = \{x \in \Sigma^*: \exists y \in \Sigma^* R(x,y)\} ' title='L_R = \{x \in \Sigma^*: \exists y \in \Sigma^* R(x,y)\} ' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R ' title='R ' class='latex' /> là NP-relation.</p>
<p>Điểm hay là quan hệ <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> giúp ta có thể định nghĩa được bài toán tìm kiếm một cách tường minh.</p>
<blockquote><p><strong>Định nghĩa bài toán tìm kiếm</strong></p>
<p>Với quan hệ <img src='http://s.wordpress.com/latex.php?latex=R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R ' title='R ' class='latex' />, ta có thể định nghĩa một bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R ' title='\Pi_R ' class='latex' /> như sau:<br />
- Đầu vào:  Cho một <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20%5CSigma%5E%2A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in \Sigma^*' title='x \in \Sigma^*' class='latex' /><br />
- Trả lời:  Tìm một <img src='http://s.wordpress.com/latex.php?latex=y%20%5Cin%20%5CSigma%5E%2A%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y \in \Sigma^* ' title='y \in \Sigma^* ' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y)' title='R(x,y)' class='latex' /> nếu tồn tại một <img src='http://s.wordpress.com/latex.php?latex=%20y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' y ' title=' y ' class='latex' /> như vậy, hoặc trả lời &#8220;KHONG&#8221; nếu không tồn tại <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' />.</p>
</blockquote>
<p>Như vậy, ta đã định nghĩa được bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R ' title='\Pi_R ' class='latex' /> tương ứng cho bài toán quyết định <img src='http://s.wordpress.com/latex.php?latex=L_R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R' title='L_R' class='latex' />: nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L_R ' title='x \notin L_R ' class='latex' /> thì câu trả lời là KHONG, còn nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20L_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in L_R ' title='x \in L_R ' class='latex' /> thì phải chỉ ra lời giải <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> chứng tỏ điều đó (<img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' />  thỏa mãn <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y)' title='R(x,y)' class='latex' />).</p>
<blockquote><p><strong>Định nghĩa các lớp <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFNP%2C%20FP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FNP, FP}' title='\mathbf{FNP, FP}' class='latex' /></strong><br />
- <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FNP}' title='\mathbf{FNP}' class='latex' /> là tập hợp tất cả các bài toán <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R' title='\Pi_R' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> là NP-relation.<br />
- <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP}' title='\mathbf{FP}' class='latex' /> là tập con của <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FNP}' title='\mathbf{FNP}' class='latex' /> bao gồm các bài toán <img src='http://s.wordpress.com/latex.php?latex=%20%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \Pi_R ' title=' \Pi_R ' class='latex' /> ở đó câu &#8220;Trả lời&#8221; (trong định nghĩa bài toán tìm kiếm trên) được thực hiện trong thời gian đa thức.</p>
</blockquote>
<p>Để ý rằng, cho trước một ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L%20%5Cin%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L \in \mathbf{NP}' title='L \in \mathbf{NP}' class='latex' />, ta chưa có ngay bài toán tìm kiếm tương ứng với nó. Ta phải định nghĩa thế nào là một lời giải chứng tỏ <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in L' title='x \in L' class='latex' />, đó chính là việc định nghĩa quan hệ <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> thỏa mãn <img src='http://s.wordpress.com/latex.php?latex=L_R%20%3D%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R = L' title='L_R = L' class='latex' />. Chỉ khi đã định nghĩa được <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> thì tương ứng với nó ta mới định nghĩa được bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%20%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \Pi_R ' title=' \Pi_R ' class='latex' />. <img src='http://s.wordpress.com/latex.php?latex=%20%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \Pi_R ' title=' \Pi_R ' class='latex' /> chính là một bài toán tìm kiếm tương ứng với bài toán quyết định <img src='http://s.wordpress.com/latex.php?latex=L_R%3DL&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R=L' title='L_R=L' class='latex' />.</p>
<p>Do vậy, với một bài toán quyết định, có thể cho tương ứng nhiều bài toán tìm kiếm. Chẳng hạn, nếu ta tìm được hai quan hệ <img src='http://s.wordpress.com/latex.php?latex=R_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R_1' title='R_1' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=R_2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R_2 ' title='R_2 ' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=L_%7BR_1%7D%20%3D%20L_%7BR_2%7D%20%3D%20L%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_{R_1} = L_{R_2} = L ' title='L_{R_1} = L_{R_2} = L ' class='latex' /> thì tương ứng với <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> có hai bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_%7BR_1%7D%20%3D%20%5CPi_%7BR_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_{R_1} = \Pi_{R_2}' title='\Pi_{R_1} = \Pi_{R_2}' class='latex' />. Điều này phù hợp với thực tế, một phát biểu có thể đúng hoặc sai, nhưng chứng minh nó là đúng hay sai thì có thể có nhiều cách khác nhau.</p>
<p>Có những bài toán mà tương ứng với nó có hai bài toán tìm kiếm mà một thì có thể dễ, mà một thì lại có vẻ khó. Ta sẽ xem xét một ví dụ thú vị liên quan đến bài toán phân tích thành thừa số nguyên tố. Nhưng trước hết ta hãy chứng minh định lý quan trọng sau đây:</p>
<blockquote><p><strong>Định lý về sự liên quan giữa lớp các bài toán quyết định và lớp các bài toán tìm kiếm </strong></p>
<p><img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%3D%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P}=\mathbf{NP}' title='\mathbf{P}=\mathbf{NP}' class='latex' /> khi và chỉ khi <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D%3D%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP}=\mathbf{FNP}' title='\mathbf{FP}=\mathbf{FNP}' class='latex' /></p>
</blockquote>
<p>Chứng minh rất đơn giản:<br />
- Đầu tiên, nếu <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D%3D%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP}=\mathbf{FNP}' title='\mathbf{FP}=\mathbf{FNP}' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%3D%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P}=\mathbf{NP}' title='\mathbf{P}=\mathbf{NP}' class='latex' />. Điều này hiển nhiên, tìm được lời giải nhanh nếu có (trong thời gian đa thức) thì cũng sẽ quyết định được nhanh là có lời giải hay không.<br />
- Ngược lại, nếu <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%3D%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P}=\mathbf{NP}' title='\mathbf{P}=\mathbf{NP}' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D%3D%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP}=\mathbf{FNP}' title='\mathbf{FP}=\mathbf{FNP}' class='latex' />. Ý tưởng là sử dụng tìm kiếm nhị phân.<br />
Cho một quan hệ NP-relation bất kỳ <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' />, ta cần chứng minh <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R%20%5Cin%20%5Cmathbf%7BFP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R \in \mathbf{FP}' title='\Pi_R \in \mathbf{FP}' class='latex' />. Điều đó có nghĩa là với mọi <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' />, cần tìm trong thời gian đa thức <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' /> để <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y)' title='R(x,y)' class='latex' /> (nếu có <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> như vậy), hoặc trả lời KHONG nếu không có <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> nào thỏa mãn <img src='http://s.wordpress.com/latex.php?latex=R%28x%2Cy%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(x,y)' title='R(x,y)' class='latex' />.<br />
Do <img src='http://s.wordpress.com/latex.php?latex=L_R%20%5Cin%20%20%5Cmathbf%7BNP%7D%3D%5Cmathbf%7BP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R \in  \mathbf{NP}=\mathbf{P}' title='L_R \in  \mathbf{NP}=\mathbf{P}' class='latex' />, nên việc quyết định có tồn tại <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' /> hay không được thực hiện trong thời gian đa thức. Nếu không có <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> thì trả lời KHONG là xong.<br />
Trường hợp tồn tại <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' />, ta làm sao tìm được <img src='http://s.wordpress.com/latex.php?latex=y%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y ' title='y ' class='latex' /> đây?<br />
Với mỗi <img src='http://s.wordpress.com/latex.php?latex=z%5Cin%20%5CSigma%5E%2A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='z\in \Sigma^*' title='z\in \Sigma^*' class='latex' />, định nghĩa một quan hệ <img src='http://s.wordpress.com/latex.php?latex=R_z%28x%2Cy%29%20%3A%3D%20%28R%28x%2Cy%29%20%5Cland%20%28y%5Cleq%20z%29%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R_z(x,y) := (R(x,y) \land (y\leq z))' title='R_z(x,y) := (R(x,y) \land (y\leq z))' class='latex' />. (quan hệ thứ tự tính theo quan hệ thứ tự từ trên bảng chữ cái <img src='http://s.wordpress.com/latex.php?latex=%5CSigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Sigma' title='\Sigma' class='latex' />)<br />
Do <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> là NP-relation, <img src='http://s.wordpress.com/latex.php?latex=R_z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R_z' title='R_z' class='latex' /> cũng là NP-relation. Do vậy <img src='http://s.wordpress.com/latex.php?latex=L_%7BR_z%7D%20%5Cin%20%5Cmathbf%7BNP%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_{R_z} \in \mathbf{NP} ' title='L_{R_z} \in \mathbf{NP} ' class='latex' /> và do đó việc bài toán quyết định <img src='http://s.wordpress.com/latex.php?latex=L_%7BR_z%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_{R_z}' title='L_{R_z}' class='latex' /> thực hiện được trong thời gian đa thức.</p>
<p>Nếu lấy <img src='http://s.wordpress.com/latex.php?latex=%20z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' z' title=' z' class='latex' /> là điểm giữa <img src='http://s.wordpress.com/latex.php?latex=%5Cemptyset&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\emptyset' title='\emptyset' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=U&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='U' title='U' class='latex' /> &#8211; xâu lớn nhất có độ dài <img src='http://s.wordpress.com/latex.php?latex=%20p%28%7Cx%7C%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' p(|x|)' title=' p(|x|)' class='latex' /> (với <img src='http://s.wordpress.com/latex.php?latex=%20p%28%29%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' p() ' title=' p() ' class='latex' /> là đa thức chặn trên độ dài của <img src='http://s.wordpress.com/latex.php?latex=%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' y' title=' y' class='latex' /> theo độ dài của <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' />. Hiển nhiên ta có <img src='http://s.wordpress.com/latex.php?latex=y%20%5Cleq%20U&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y \leq U' title='y \leq U' class='latex' />). Nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20L_%7BR_z%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in L_{R_z}' title='x \in L_{R_z}' class='latex' /> thì tồn tại lời giải <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' /> giữa <img src='http://s.wordpress.com/latex.php?latex=%5Cemptyset&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\emptyset' title='\emptyset' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%20z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' z' title=' z' class='latex' />, ngược lại, nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L_%7BR_z%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L_{R_z}' title='x \notin L_{R_z}' class='latex' /> thì tồn tại lời giải <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' /> giữa <img src='http://s.wordpress.com/latex.php?latex=z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='z' title='z' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=U&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='U' title='U' class='latex' />.<br />
Như vậy ta giới hạn miền tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' /> xuống còn một nửa. Tiếp tục một cách tương tự ta sẽ tìm được chính xác <img src='http://s.wordpress.com/latex.php?latex=y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='y' title='y' class='latex' /> trong thời gian đa thức.</p>
<p><strong>I.2 Có những bài toán quyết định dễ, còn tìm kiếm lại khó</strong><br />
Phía trên ta nhắc đến kêt quả của <a id="cuzt" title="Bellare và Goldwasser" href="http://cseweb.ucsd.edu/users/mihir/papers/compip.pdf">Bellare và Goldwasser</a> chứng minh rằng, dưới một giả thiết khá hợp lý (<img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BEE%7D%20%5Cneq%20%5Cmathbf%7BNEE%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{EE} \neq \mathbf{NEE}' title='\mathbf{EE} \neq \mathbf{NEE}' class='latex' />), có những ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{NP}' title='\mathbf{NP}' class='latex' /> mà ở đó bài toán tìm kiếm không thể qui dẫn bài toán quyết định. Ở đây ta xét một ví dụ đơn giản hơn và kết quả tuy không mạnh bằng nhưng khá lý thú.<br />
Ta xét một số <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> và một dãy cặp  <img src='http://s.wordpress.com/latex.php?latex=%28p_1%2C%5Calpha_1%29%2C%20%28p_2%2C%5Calpha_2%29%2C%20%5Ccdots%2C%20%28p_k%2C%5Calpha_k%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(p_1,\alpha_1), (p_2,\alpha_2), \cdots, (p_k,\alpha_k)' title='(p_1,\alpha_1), (p_2,\alpha_2), \cdots, (p_k,\alpha_k)' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=p_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p_i' title='p_i' class='latex' /> là các số nguyên tố và <img src='http://s.wordpress.com/latex.php?latex=%5Calpha_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha_i' title='\alpha_i' class='latex' /> là các số tự nhiên.<br />
Ta định nghĩa một quan hệ <img src='http://s.wordpress.com/latex.php?latex=R%28n%2C%20%28%28p_1%2C%5Calpha_1%29%2C%20%28p_2%2C%5Calpha_2%29%2C%20%5Ccdots%2C%20%28p_k%2C%5Calpha_k%29%29%29%20%3A%3D%20%28n%20%3D%20p_1%5E%7B%5Calpha_1%7Dp_2%5E%7B%5Calpha_2%7D%5Ccdots%20p_k%5E%7B%5Calpha_k%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n, ((p_1,\alpha_1), (p_2,\alpha_2), \cdots, (p_k,\alpha_k))) := (n = p_1^{\alpha_1}p_2^{\alpha_2}\cdots p_k^{\alpha_k})' title='R(n, ((p_1,\alpha_1), (p_2,\alpha_2), \cdots, (p_k,\alpha_k))) := (n = p_1^{\alpha_1}p_2^{\alpha_2}\cdots p_k^{\alpha_k})' class='latex' />.<br />
Điều đó có nghĩa là <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%28p_1%2C%5Calpha_1%29%2C%20%28p_2%2C%5Calpha_2%29%2C%20%5Ccdots%2C%20%28p_k%2C%5Calpha_k%29%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(p_1,\alpha_1), (p_2,\alpha_2), \cdots, (p_k,\alpha_k) ' title='(p_1,\alpha_1), (p_2,\alpha_2), \cdots, (p_k,\alpha_k) ' class='latex' /> có quan hệ <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> nếu phân tích thành thừa số nguyên tố của <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> chính là <img src='http://s.wordpress.com/latex.php?latex=p_1%5E%7B%5Calpha_1%7Dp_2%5E%7B%5Calpha_2%7D%5Ccdots%20p_k%5E%7B%5Calpha_k%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p_1^{\alpha_1}p_2^{\alpha_2}\cdots p_k^{\alpha_k}' title='p_1^{\alpha_1}p_2^{\alpha_2}\cdots p_k^{\alpha_k}' class='latex' />.</p>
<p>Với quan hệ <img src='http://s.wordpress.com/latex.php?latex=R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R' title='R' class='latex' /> định nghĩa như vậy, ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R ' title='L_R ' class='latex' /> chính là toàn bộ các số tự nhiên vì mọi số tự nhiên đều có tương ứng một cách phân tích thành thừa số nguyên tố. Bài toán quyết định <img src='http://s.wordpress.com/latex.php?latex=L_R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R' title='L_R' class='latex' /> do đó là tầm thường.<br />
Trong khi đó, bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R ' title='\Pi_R ' class='latex' /> chính là việc cho số <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' />, phân tích <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> ra thừa số nguyên tố. Bài toán này được tin là khó.</p>
<p><strong>I.3 Sự khéo léo trong việc định nghĩa bài toán tìm kiếm cho các bài toán quyết định</strong></p>
<p><strong></strong>Bây giờ ta hãy xem một ví dụ cho thấy, cùng một bài toán quyết định, có thể có hai bài toán tìm kiếm khá xa nhau. Hơn nhau là việc định nghĩa bài toán tìm kiếm sao cho hợp lý để có thể giải nó một cách hiệu quả nhất.</p>
<p>Xét ngôn ngữ COMPOSITE gồm các số tự nhiên <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số.</p>
<p><strong> Bài toán tìm kiếm 1 tương ứng với COMPOSITE:</strong><br />
Ta định nghĩa một quan hệ giữa một số tự nhiên <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> và một chứng minh <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> (một số tự nhiên) như sau: <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29%20%3A%3D%20%28%20%281%3Ca%3Cn%29%20%5Cland%20%28a%7Cn%29%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a) := ( (1&lt;a&lt;n) \land (a|n))' title='R(n,a) := ( (1&lt;a&lt;n) \land (a|n))' class='latex' />.<br />
Đây là cách định nghĩa tự nhiên nhất để chứng minh một số  <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số: đưa ra một ước số không tầm thường của nó.<br />
Bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R' title='\Pi_R' class='latex' /> tương ứng là cho <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' />, nếu <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số thì tìm một ước số không tầm thường của nó.<br />
Rõ ràng bài toán tìm kiếm này tương đương bài toán phân tích một số thành thừa số nguyên tố, do vậy nó được tin là khó.</p>
<p><strong> Bài toán tìm kiếm 2 tương ứng với COMPOSITE:</strong><br />
Ta định nghĩa một quan hệ giữa một số tự nhiên <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> và một chứng minh <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> (một số tự nhiên) như sau: <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29%3A%3D%20%28%28%5Cfrac%7Ba%7D%7Bn%7D%29%20%5Cneq%20a%5E%20%7B%5Cfrac%7Bn-1%7D%7B2%7D%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a):= ((\frac{a}{n}) \neq a^ {\frac{n-1}{2}})' title='R(n,a):= ((\frac{a}{n}) \neq a^ {\frac{n-1}{2}})' class='latex' /></p>
<p>với <img src='http://s.wordpress.com/latex.php?latex=%28%5Cfrac%7Ba%7D%7Bn%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\frac{a}{n})' title='(\frac{a}{n})' class='latex' /> là <a id="oetb" title="ký hiệu Jacobi" href="http://en.wikipedia.org/wiki/Jacobi_symbol">ký hiệu Jacobi</a> (một mở rộng tự nhiên của ký hiệu Legendre cho trường hợp các số tự nhiên thay vì chỉ cho các số nguyên tố).</p>
<p>Ta đã biết:</p>
<ul>
<li> Nếu <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là số nguyên tố thì, với mọi <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> ta đều có <img src='http://s.wordpress.com/latex.php?latex=%28%5Cfrac%7Ba%7D%7Bn%7D%29%20%3D%20a%5E%20%7B%5Cfrac%7Bn-1%7D%7B2%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\frac{a}{n}) = a^ {\frac{n-1}{2}}' title='(\frac{a}{n}) = a^ {\frac{n-1}{2}}' class='latex' />, tức là <img src='http://s.wordpress.com/latex.php?latex=%5Clnot%20R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lnot R(n,a)' title='\lnot R(n,a)' class='latex' />.</li>
<li> Ngược lại, nếu <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số thì, ít nhất một nửa các số <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> nguyên tố cùng nhau với <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> thỏa mãn <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a)' title='R(n,a)' class='latex' />. (Chứng minh điều này không khó, bởi tập các <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> để <img src='http://s.wordpress.com/latex.php?latex=%5Clnot%20R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lnot R(n,a)' title='\lnot R(n,a)' class='latex' /> tạo thành 1 nhóm, và ta có thể chứng minh khi <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số thì tồn tại ít nhất một phần tử <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> để <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a)' title='R(n,a)' class='latex' />. Điều đó dẫn đến tập các <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> để <img src='http://s.wordpress.com/latex.php?latex=%5Clnot%20R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lnot R(n,a)' title='\lnot R(n,a)' class='latex' /> tạo thành một nhóm con thực sự của  <img src='http://s.wordpress.com/latex.php?latex=%28%5Cmathbb%7BZ%7D%2Fn%5Cmathbb%7BZ%7D%29%5E%2A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\mathbb{Z}/n\mathbb{Z})^*' title='(\mathbb{Z}/n\mathbb{Z})^*' class='latex' />, và do đó số phần tử của nó nhiều nhất bằng nửa số phần tử của <img src='http://s.wordpress.com/latex.php?latex=%28%5Cmathbb%7BZ%7D%2Fn%5Cmathbb%7BZ%7D%29%5E%2A%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\mathbb{Z}/n\mathbb{Z})^*)' title='(\mathbb{Z}/n\mathbb{Z})^*)' class='latex' />.</li>
</ul>
<p>Từ đó ta thấy ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L_R%20%3D%20%5C%7Bn%20%3A%20%5Cexists%20a%2C%20R%28n%2Ca%29%20%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L_R = \{n : \exists a, R(n,a) \}' title='L_R = \{n : \exists a, R(n,a) \}' class='latex' /> chính là COMPOSITE.<br />
Tuy vậy, bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R' title='\Pi_R' class='latex' /> ở đây khá là dễ dàng.<br />
Thực vậy, nếu <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số, ta chỉ cần lấy ngẫu nhiên một <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> nguyên tố cùng nhau với <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là đã có khả năng chí ít là 50% để có <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a)' title='R(n,a)' class='latex' />.</p>
<p>Vấn đề còn lại là tính <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a)' title='R(n,a)' class='latex' /> có dễ không? Tính <img src='http://s.wordpress.com/latex.php?latex=a%5E%20%7B%5Cfrac%7Bn-1%7D%7B2%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a^ {\frac{n-1}{2}}' title='a^ {\frac{n-1}{2}}' class='latex' /> là dễ nhưng còn ký hiệu Jacobi <img src='http://s.wordpress.com/latex.php?latex=%28%5Cfrac%7Ba%7D%7Bn%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\frac{a}{n})' title='(\frac{a}{n})' class='latex' />? Định nghĩa của <img src='http://s.wordpress.com/latex.php?latex=%28%5Cfrac%7Ba%7D%7Bn%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\frac{a}{n})' title='(\frac{a}{n})' class='latex' /> dựa trên việc phân tích thành thừa số nguyên tố của <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' />. Nhưng nếu mà ta biết phân tích thành thừa số nguyên tố của <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> thì đã xác định được <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là hợp số hay không rồi! Rất may, ta có thể tính <img src='http://s.wordpress.com/latex.php?latex=%28%5Cfrac%7Ba%7D%7Bn%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\frac{a}{n})' title='(\frac{a}{n})' class='latex' /> dựa trên <a id="ah77" title="luật tương hỗ toàn phương" href="http://en.wikipedia.org/wiki/Law_of_quadratic_reciprocity">luật tương hỗ toàn phương</a> một cách rất nhanh chóng mà không cần thông qua phân tích thành thừa số nguyên tố của <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' />.</p>
<p>Các bạn có thể đọc thêm về luật tương hỗ toàn phương (<a id="pf:m" title="bài 1" href="http://thichhoctoan.wordpress.com/2009/07/29/t%C6%B0%C6%A1ng-h%E1%BB%97-toan-ph%C6%B0%C6%A1ng/">bài 1</a>, <a id="lwuz" title="bài 2" href="http://thichhoctoan.wordpress.com/2009/08/04/t%C6%B0%C6%A1ng-h%E1%BB%97-toan-ph%C6%B0%C6%A1ng-2/">bài 2</a>) trên blog của hòa thượng Thích Học Toán. Luật &#8220;tương hỗ toàn phương&#8221; như hòa thượng giải thích dành cho số nguyên tố, ở đây ta phải dùng một luật tương tự cho các số tự nhiên tổng quat. Bình loạn một chút về hai luật tương hỗ:</p>
<ul>
<li>Luật &#8220;tương hỗ toàn phương&#8221; nguyên thủy dành cho số nguyên tố thật đẹp, nó có ý nghĩa thế nào hòa thượng đã giải thích. Chỉ muốn nói thêm là trong suốt một thời gian dài, người ta đã tưởng thể loại số nguyên tố là rất kỳ bí và có tính độc lập nhau, tức là 2 kẻ khác nhau trong bọn chúng là chả có quan hệ dây mơ rễ má chi cả. Nhưng luật tương hỗ cho thấy không hẳn là thế, nó cho ta quan hệ họ hàng giữa hai số nguyên tố bất kỳ: nếu anh là thặng dư bậc hai của tôi thì tôi cũng xác định được ngay mình có phải là thặng dư bậc hai trong thế giới của anh hay không!</li>
<li>Luật &#8220;tương hỗ toàn phương&#8221; áp dụng cho số không nguyên tố dĩ nhiên làm mất cái vẻ đẹp nguyên tố trên. Ấy vậy mà nó lại đem đến một ứng dụng bất ngờ trong việc tìm ra các &#8230; số nguyên tố lớn phục vụ các ứng dụng mật mã trong thực tế nhốn nháo ngày nay. Nó giúp ta có một thuật toán kiểm tra xem một số <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> bất kỳ có là nguyên tố hay không. <a id="nnl4" title="Thuật toán này" href="http://en.wikipedia.org/wiki/Solovay%E2%80%93Strassen_primality_test">Thuật toán này</a> thực chất ý tưởng đã được mô tả phía trên : lấy <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> bất kỳ nguyên tố cùng nhau với <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' />, nếu <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a)' title='R(n,a)' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> chắc chắn là hợp số, nếu không thì ít nhất 50% khả năng <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là số nguyên tố. Thực hiện thao tác này 100 lần mà đều không có <img src='http://s.wordpress.com/latex.php?latex=a&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a' title='a' class='latex' /> nào thỏa mãn <img src='http://s.wordpress.com/latex.php?latex=R%28n%2Ca%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(n,a)' title='R(n,a)' class='latex' /> thì có nghĩa <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> là số nguyên tố với sai số chỉ là <img src='http://s.wordpress.com/latex.php?latex=%5Cfrac%7B1%7D%7B2%5E%7B100%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\frac{1}{2^{100}}' title='\frac{1}{2^{100}}' class='latex' />! Gần đây đã có một kết quả lý thuyết đẹp đưa ra <a id="niy8" title="thuật toán đơn định" href="http://www.mta.ca/%7Efsica/math4651/PRIMES-is-in-P.pdf">thuật toán đơn định</a> để kiểm tra tính nguyên tố trong thời gian đa thức (thú vị là chứng minh khá sơ cấp) nhưng trong thực tế thì người ta vẫn dùng các thuật toán xác suất vì nó hiệu quả hơn rất nhiều.</li>
</ul>
<p><strong>II. </strong><strong>Điều kiện cần cho sự tồn tại của mã hóa, dưới cách nhìn của </strong><strong>lý thuyết độ phức tạp tính toán</strong></p>
<p>Ta sẽ nhìn mật mã bằng con mắt của lý thuyết độ phức tạp tính toán và giới hạn việc bàn luận cho mã hóa (Encryption) &#8211; mục tiêu trọng tâm của mật mã.</p>
<p><strong>Mục đích của mã hóa là gì nhỉ?</strong> Thật đơn giản, tôi có thể mã hóa một bản rõ dễ dàng để: nếu anh có khóa thích hợp thì anh có thể mở được nó và kẻ địch (không có khoá) thì không thể giải được mã.</p>
<p>Tạm gác chuyện chiếc chìa khoá thần kỳ trong mã hóa (ừ, thế đấy, mã hóa phải có khóa, nhưng ta cứ tạm bỏ qua nó đã) và bỏ qua luôn việc anh có giải được mã hay không, ta có thể rút gọn câu trên: tôi có thể mã hóa một bản rõ dễ dàng để kẻ địch (tay không &#8211; không có ngoại lực trợ giúp) không thể giải được mã.</p>
<p>Ta giản lược yêu cầu như trên nhằm đưa ra một điều kiện cần để mã hoá tồn tại. Đó là phải có các &#8220;hàm xuôi dễ ngược khó&#8221;, tức là các hàm <img src='http://s.wordpress.com/latex.php?latex=f%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f ' title='f ' class='latex' /> để, với một đầu vào <img src='http://s.wordpress.com/latex.php?latex=m&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='m' title='m' class='latex' /> (có thể coi là bản mã &#8211; message), thì tính  <img src='http://s.wordpress.com/latex.php?latex=c%3Df%28m%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c=f(m)' title='c=f(m)' class='latex' /> (có thể coi là bản mã &#8211; ciphertext) là dễ, nhưng cho <img src='http://s.wordpress.com/latex.php?latex=c&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c' title='c' class='latex' /> thì việc tính ngược một <img src='http://s.wordpress.com/latex.php?latex=m&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='m' title='m' class='latex' /> (có thể có nhiều <img src='http://s.wordpress.com/latex.php?latex=m&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='m' title='m' class='latex' />) để <img src='http://s.wordpress.com/latex.php?latex=f%28m%29%20%3D%20c&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f(m) = c' title='f(m) = c' class='latex' /> thì là khó.</p>
<p><strong>Vậy câu hỏi đặt ra là:</strong> Các hàm xuôi dễ ngược khó có liên quan gì tới bài toán trọng tâm &#8220;P vs. NP&#8221; của lý thuyết độ phức tạp?</p>
<p>Ta hãy giả thiết rằng là tồn tại các hàm <img src='http://s.wordpress.com/latex.php?latex=f&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f' title='f' class='latex' /> xuôi dễ ngược khó.<br />
Theo định nghĩa &#8220;dễ, khó&#8221; trong độ phức tạp thì  <img src='http://s.wordpress.com/latex.php?latex=f%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f ' title='f ' class='latex' /> tính được trong thời gian đa thức và việc tính <img src='http://s.wordpress.com/latex.php?latex=f%5E%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f^{-1}' title='f^{-1}' class='latex' /> là không thực hiện được trong thời gian đa thức.</p>
<p>Khi đó ta định nghĩa một quan hệ <img src='http://s.wordpress.com/latex.php?latex=R%28c%2Cm%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(c,m)' title='R(c,m)' class='latex' /> như sau: <img src='http://s.wordpress.com/latex.php?latex=R%28c%2Cm%29%20%3A%3D%20%28c%3Df%28m%29%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(c,m) := (c=f(m))' title='R(c,m) := (c=f(m))' class='latex' />.<br />
Dễ thấy <img src='http://s.wordpress.com/latex.php?latex=R%28c%2Cm%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R(c,m)' title='R(c,m)' class='latex' /> là một NP-relation.<br />
Như vậy, bài toán tìm kiếm <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R ' title='\Pi_R ' class='latex' /> thuộc lớp <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FNP}' title='\mathbf{FNP}' class='latex' />. Mà bài toán <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R' title='\Pi_R' class='latex' /> chính là việc tính ngược hàm <img src='http://s.wordpress.com/latex.php?latex=f&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f' title='f' class='latex' />.</p>
<p>Theo giả thiết, việc tính <img src='http://s.wordpress.com/latex.php?latex=f%5E%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f^{-1}' title='f^{-1}' class='latex' /> là không thực hiện được trong thời gian đa thức. Từ đó ta có <img src='http://s.wordpress.com/latex.php?latex=%5CPi_R%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Pi_R ' title='\Pi_R ' class='latex' /> không thể thuộc <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP}' title='\mathbf{FP}' class='latex' />, và suy ra <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BFP%7D%20%5Cneq%20%5Cmathbf%7BFNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{FP} \neq \mathbf{FNP}' title='\mathbf{FP} \neq \mathbf{FNP}' class='latex' />. Theo định lý phía trên, nó tương đương <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' />.</p>
<p>Như vậy ta có kết luận đầu tiên:</p>
<blockquote><p><strong><em>Yêu cầu tối thiểu không thể ít hơn để ngành lý thuyết mã hóa tồn tại, đó là &#8220;<img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' />&#8220;. Nói cách khác, nếu ta chứng minh được &#8220;<img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%3D%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} = \mathbf{NP}' title='\mathbf{P} = \mathbf{NP}' class='latex' />&#8221; thì ngành lý thuyết </em><em> mã hóa sụp đổ!</em></strong><em></em></p>
</blockquote>
<p>Kết luận này có nghĩa ta không thể hy vọng vào việc xây dựng mã hóa dựa trên các lớp có độ phức tạp cao hơn như <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BEXP%2C%20NEXP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{EXP, NEXP}' title='\mathbf{EXP, NEXP}' class='latex' /> để phòng trường hợp <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%3D%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} = \mathbf{NP}' title='\mathbf{P} = \mathbf{NP}' class='latex' />. Bản chất sự tồn tại của mã hóa bắt buộc phải dựa trên giả thiết <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' />. Tất nhiên sự sụp đổ chỉ là trong lý thuyết độ phức tạp, còn trong thực tế thì dù phá mã có thể trong thời gian đã thức nhưng bậc đa thức là 100 hay 1000 thì các hệ mã vẫn còn vững lắm <img src='http://www.procul.org/blog/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
<p><strong>III. Một cái nhìn thoáng qua về điều kiện đủ cho sự tồn tại của mã hóa</strong></p>
<p>Ta đã thấy lý thuyết mã hóa (đặt trong lý thuyết độ phức tạp) chỉ có nghĩa khi <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' />. Câu hỏi ngược lại là liệu nếu <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' /> thì ta có xây dựng được các sơ đồ mật mã hay không? Câu trả lời là &#8230; không biết (hay nói cách khác, đó là một câu hỏi mở). Điều đó tuy vậy không làm ta nhụt chí đi tìm kiểm các điều kiện đủ để xây dựng mã hóa.</p>
<p>Trước tiên ta thấy hàm &#8220;xuôi dễ ngược khó&#8221; chủ yếu nói về trường hợp tệ nhất (worst-case), nó chỉ yêu cầu tồn tại những <img src='http://s.wordpress.com/latex.php?latex=c&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c' title='c' class='latex' /> để ta không tính ngược được <img src='http://s.wordpress.com/latex.php?latex=f%5E%7B-1%7D%28c%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f^{-1}(c)' title='f^{-1}(c)' class='latex' />. Điều đó có thể hiểu như, có những bản mã mà ta không giải được. Tuy nhiên điều này không phản ánh được yêu cầu của mã hoá, nơi ta cần kẻ địch không thể giải mã được một bản mã bất kỳ. Với yêu cầu tối thiểu này của mã hoá, ta có điều kiện cần là sự tồn tại của các <strong><em>hàm một chiều</em></strong> (one-way function), đó là các hàm thoả mãn: cho <img src='http://s.wordpress.com/latex.php?latex=c%20%3D%20%20f%28m%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c =  f(m)' title='c =  f(m)' class='latex' /> với một <img src='http://s.wordpress.com/latex.php?latex=m&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='m' title='m' class='latex' /> được lấy ngẫu nhiên, khó có thể tính ngược được <img src='http://s.wordpress.com/latex.php?latex=f%5E%7B-1%7D%28c%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='f^{-1}(c)' title='f^{-1}(c)' class='latex' /> (tức là xác suất kẻ địch tính ngược được <img src='http://s.wordpress.com/latex.php?latex=c&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c' title='c' class='latex' /> là rất nhỏ).</p>
<p><em>Câu hỏi trọng tâm của mã hoá là sự tồn tại của các hàm một chiều có là đủ để xây dựng các sơ đồ mã hoá?</em></p>
<p>Một cách tóm tắt, từ các hàm một chiều ta có thể xây dựng được các phép sinh dãy giả ngẫu nhiên rồi từ đó xây dựng được các sơ đồ mã hóa khóa bí mật. Đối với các sơ đồ mã hóa khóa công khai, ta sẽ phải dựa trên các hàm mạnh hơn các hàm một chiều. Đó là hoán vị cửa lật một chiều (trapdoor one-way permutation: bản chất như hàm một chiều nhưng có thêm một cửa lật, bình thường tính ngược khó nhưng có cửa lật sẽ giúp ta tính hàm ngược dễ).</p>
<p>Kết luận là :</p>
<ul>
<li> các hàm một chiều là cần và đủ để xây dựng mã hóa khóa bí mật.</li>
<li> các hàm một chiều là cần và các hoán vị cửa lật một chiều là đủ để xây dựng mã hóa khóa công khai. Quan hệ thân thiết giữa các hàm một chiều và các hoán vị cửa lật một chiều hiện vẫn còn đang trong quá trình tìm hiểu nhau</li>
</ul>
<p><em>Quan hệ giữa các hàm một chiều và lý thuyết độ phức tạp ra sao?</em><br />
Sự tồn tại hàm một chiều hiển nhiên dẫn đến sự tồn tại các bài toán NP khó tính theo độ phức tạp trung bình (average-case complexity), từ đó dẫn tới sự tồn tại các bài toán NP khó (tức là tính theo độ phức tạp của trường hợp tệ nhất), có nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' />. Chiều ngược lại vẫn còn là câu hỏi mở. Do đó dù <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BP%7D%20%5Cneq%20%5Cmathbf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{P} \neq \mathbf{NP}' title='\mathbf{P} \neq \mathbf{NP}' class='latex' /> vẫn chưa chắc đã tồn tại các bài toán bài toán NP khó tính theo độ phức tạp trung bình và dù tồn tại các bài toán bài toán NP khó tính theo độ phức tạp trung bình vẫn chưa chắc đã tồn tại các hàm một chiều!</p>
<p>Hy vọng khi có thời gian sẽ tiềp tục được trao đổi chi tiết hơn các kết quả trên cùng các bạn.<br />
Chúc mọi người một năm học, năm dạy mới đầy lý thú!<br />
<!-- Start of StatCounter Code --><br />
<script type="text/javascript">
var sc_project=5132594;
var sc_invisible=1;
var sc_partition=58;
var sc_click_stat=1;
var sc_security="b1a02981";
</script></p>
<p><script type="text/javascript" src="http://www.statcounter.com/counter/counter.js"></script><noscript></p>
<div class="statcounter"><a title="wordpress statistics" href="http://www.statcounter.com/wordpress.com/" target="_blank"><img class="statcounter" src="http://c.statcounter.com/5132594/0/b1a02981/1/" alt="wordpress statistics" ></a></div>
<p></noscript><br />
<!-- End of StatCounter Code --></p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2009/09/20/m%e1%ba%adt-ma-d%c6%b0%e1%bb%9bi-goc-nhin-d%e1%bb%99-ph%e1%bb%a9c-t%e1%ba%a1p-tinh-toan/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>PCP 9 &#8212; Expanders: tích zig-zag</title>
		<link>http://www.procul.org/blog/2009/06/25/pcp-9-expanders-tich-zig-zag/</link>
		<comments>http://www.procul.org/blog/2009/06/25/pcp-9-expanders-tich-zig-zag/#comments</comments>
		<pubDate>Thu, 25 Jun 2009 15:01:56 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[Expanders]]></category>
		<category><![CDATA[PCP]]></category>
		<category><![CDATA[Tích zig-zag]]></category>
		<category><![CDATA[xác suất]]></category>
		<category><![CDATA[Đại số tuyến tính]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=1549</guid>
		<description><![CDATA[8.j. Tích zig-zag Chúng ta đã thấy rằng đã số các ứng dụng của expanders không những cần sự tồn tại của expanders mà còn cần thuật toán xây dựng expanders hiệu quả (hoặc tương đối cụ thể, hoặc rất cụ thể). Bài này viết về một phương pháp/thuật toán hiệu quả để xây dựng [...]]]></description>
			<content:encoded><![CDATA[<p>
<p><b> 8.j. Tích zig-zag </b></p>
<p><p>
Chúng ta đã thấy rằng đã số các ứng dụng của expanders không những cần sự tồn tại của expanders mà còn cần thuật toán xây dựng expanders hiệu quả (hoặc tương đối cụ thể, hoặc rất cụ thể). Bài này viết về một phương pháp/thuật toán hiệu quả để xây dựng expanders một cách rất cụ thể gọi là tích zig-zag. Quan trọng hơn, phương pháp này tiềm ẩn những ý tưởng áp dụng được vào các bài toán khác, như trong chứng minh <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathsf%7BL%3DSL%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathsf{L=SL}}' title='{\mathsf{L=SL}}' class='latex' /> sẽ trình bày trong bài tới, hoặc trong bản thân chứng minh định lý PCP của Dinur sẽ trình bày sau.</p>
<p>
<p><b> 8.j.1. Trực quan </b></p>
<p><p>
Tạo một expander tốt không khó khăn gì, ví dụ như <img src='http://s.wordpress.com/latex.php?latex=%7BK_n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{K_n}' title='{K_n}' class='latex' /> là expander tốt nhất có thể có. Nhưng tạo expander <em>thưa</em>, với constant degree, thì khó. Một ý tưởng tự nhiên là thử tìm cách xây dựng một expander lớn từ một số các expanders nhỏ hơn sao cho không làm tăng degree quá đáng thì ta có hy vọng. Ví dụ, một cách xây dựng expander lớn từ expander nhỏ là &#8220;bình phương&#8221; cái expander nhỏ: <img src='http://s.wordpress.com/latex.php?latex=%7B%5Chat%5Clambda%28G%5E2%29%20%3D%20%5Chat%5Clambda%5E2%28G%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\hat\lambda(G^2) = \hat\lambda^2(G)}' title='{\hat\lambda(G^2) = \hat\lambda^2(G)}' class='latex' />. Cái dở là ta không thể &#8220;nhân&#8221; với <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> mãi được vì degree cũng bị bình phương luôn.</p>
<p>
Tích zig-zag là một cách xây dựng một expander lớn từ hai expanders nhỏ hơn. Cụ thể là, cho trước <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B%28n%2Cm%2C%5Calpha%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(n,m,\alpha)}' title='{(n,m,\alpha)}' class='latex' />-spectral expander và <img src='http://s.wordpress.com/latex.php?latex=%7B%28m%2Cd%2C%5Cbeta%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(m,d,\beta)}' title='{(m,d,\beta)}' class='latex' />-spectral expander, theo thứ tự. Chúng ta sẽ xây dựng một đồ thị mới, ký hiệu là <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />, gọi là &#8220;tích zig-zag&#8221; của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' />. Tích này sẽ là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28mn%2C%20d%5E2%2C%20f%28%5Calpha%2C%5Cbeta%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(mn, d^2, f(\alpha,\beta))}' title='{(mn, d^2, f(\alpha,\beta))}' class='latex' />-spectral expander, trong đó cái spectral expansion rate mới <img src='http://s.wordpress.com/latex.php?latex=%7Bf%28%5Calpha%2C%20%5Cbeta%29%3C1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f(\alpha, \beta)&lt;1}' title='{f(\alpha, \beta)&lt;1}' class='latex' /> nếu <img src='http://s.wordpress.com/latex.php?latex=%7B%5Calpha%3C1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\alpha&lt;1}' title='{\alpha&lt;1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbeta%3C1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\beta&lt;1}' title='{\beta&lt;1}' class='latex' />. Nôm na là, nếu <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> là expanders thì <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> cũng là expander. </p>
<p>
Ta sẽ chứng minh được rằng <img src='http://s.wordpress.com/latex.php?latex=%7Bf%28%5Calpha%2C%5Cbeta%29%5Cleq%20%5Calpha%20%2B%5Cbeta%2B%5Cbeta%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f(\alpha,\beta)\leq \alpha +\beta+\beta^2}' title='{f(\alpha,\beta)\leq \alpha +\beta+\beta^2}' class='latex' /> (đây là chặn trên cụ thể, còn <img src='http://s.wordpress.com/latex.php?latex=%7B%5Calpha%2C%5Cbeta%3C1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\alpha,\beta&lt;1}' title='{\alpha,\beta&lt;1}' class='latex' /> vẫn suy ra <img src='http://s.wordpress.com/latex.php?latex=%7Bf%28%5Calpha%2C%5Cbeta%29%3C1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{f(\alpha,\beta)&lt;1}' title='{f(\alpha,\beta)&lt;1}' class='latex' /> nhưng đó không phải là chặn trên cụ thể). Từ đó, nếu ta bắt đầu bằng một đồ thị <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B%28d%5E4%2Cd%2C%201%2F5%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(d^4,d, 1/5)}' title='{(d^4,d, 1/5)}' class='latex' />-spectral expander (<b>Bài tập</b>: chứng minh tồn tại bằng phương pháp xác suất), thì ta có thể xây dựng một họ các expanders như sau: </p>
<ul>
<li> <img src='http://s.wordpress.com/latex.php?latex=%7BG_1%20%3D%20H%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_1 = H^2}' title='{G_1 = H^2}' class='latex' />
<li> <img src='http://s.wordpress.com/latex.php?latex=%7BG_2%20%3D%20G_i%5E2%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_2 = G_i^2 \textcircled{z} H}' title='{G_2 = G_i^2 \textcircled{z} H}' class='latex' />
</ul>
<p> Dễ thấy rằng đây là một chuỗi vô hạn các expanders. Đồ thị <img src='http://s.wordpress.com/latex.php?latex=%7BG_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_i}' title='{G_i}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28d%5E%7B4i%7D%2C%20d%5E2%2C%202%2F5%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(d^{4i}, d^2, 2/5)}' title='{(d^{4i}, d^2, 2/5)}' class='latex' />-spectral expander. Có thể cải tiến cái chặn trên <img src='http://s.wordpress.com/latex.php?latex=%7B%5Calpha%2B%5Cbeta%2B%5Cbeta%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\alpha+\beta+\beta^2}' title='{\alpha+\beta+\beta^2}' class='latex' /> được, nhưng điều đó không quan trọng. Xem thêm <a href="http://people.seas.harvard.edu/~salil/papers/zigzag-abs.html">bài báo tích zig-zag nguyên thủy</a> của Reingold, Vahdan, và Wigderson.</p>
<p>
Bây giờ ta mô tả <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />. Chú ý rằng degree của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> bằng tổng số đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' />. Trước hết, với mỗi đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7Bv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{v}' title='{v}' class='latex' /> của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' />, đặt tên các cạnh xung quanh <img src='http://s.wordpress.com/latex.php?latex=%7Bv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{v}' title='{v}' class='latex' /> bằng các đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> một cách tùy hỉ. Xem hình dưới đây, tôi đã đặt tên các cạnh xung quanh <img src='http://s.wordpress.com/latex.php?latex=v%2C%20u%2C%20w&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v, u, w' title='v, u, w' class='latex' />.</p>
<p><center><img src="http://www.procul.org/blog/wp-content/uploads/2009/06/zigzag.jpg" alt="zigzag" title="zigzag" width="600" height="589" class="aligncenter size-full wp-image-1605" /></center></p>
<p>
Mỗi đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> là một cặp đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B%28u%2Cv%29%20%5Cin%20V%28G%29%20%5Ctimes%20V%28H%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(u,v) \in V(G) \times V(H)}' title='{(u,v) \in V(G) \times V(H)}' class='latex' />. Có thể hình dung tập đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> được chia thành <img src='http://s.wordpress.com/latex.php?latex=%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n}' title='{n}' class='latex' /> &#8220;đám mây&#8221;, mỗi đám mây là một nhân bản của <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> (cạnh màu xanh lá cây). Sau đó, ta nối một đỉnh của đám mây này đến một đỉnh của đám mây khác nếu đỉnh này là tên của đầu này của cạnh và đỉnh kia là tên ở đầu kia của cạnh. Ví dụ, trong hình thì ở <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> có cạnh <img src='http://s.wordpress.com/latex.php?latex=%7Bwv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{wv}' title='{wv}' class='latex' /> với tên ở đầu <img src='http://s.wordpress.com/latex.php?latex=%7Bw%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{w}' title='{w}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{2}' title='{2}' class='latex' /> và tên ở đầu <img src='http://s.wordpress.com/latex.php?latex=%7Bv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{v}' title='{v}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' />, ta nối đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{2}' title='{2}' class='latex' /> trong đám mây của <img src='http://s.wordpress.com/latex.php?latex=%7Bw%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{w}' title='{w}' class='latex' /> với đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> trong đám mây của <img src='http://s.wordpress.com/latex.php?latex=%7Bv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{v}' title='{v}' class='latex' /> bằng một cạnh màu đen.</p>
<p>
Nếu ta chỉ giữ các cạnh màu xanh lá cây và cạnh màu đen, thì ta có cái gọi là &#8220;tích thay thế&#8221; (replacement product). Degree của tích thay thế là <img src='http://s.wordpress.com/latex.php?latex=%7Bd%2B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d+1}' title='{d+1}' class='latex' />. Ta có thể chứng minh được tích thay thế cũng là expander. Tuy nhiên, về mặt kỹ thuật sẽ tiện hơn nếu ta thêm <img src='http://s.wordpress.com/latex.php?latex=%7Bd%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d}' title='{d}' class='latex' /> cạnh song song cho mỗi cạnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' />; ví dụ như sẽ có <img src='http://s.wordpress.com/latex.php?latex=%7Bd%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d}' title='{d}' class='latex' /> cạnh song song giữa đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{2}' title='{2}' class='latex' /> trong đám mây của <img src='http://s.wordpress.com/latex.php?latex=%7Bw%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{w}' title='{w}' class='latex' /> và đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' /> trong đám mây của <img src='http://s.wordpress.com/latex.php?latex=%7Bv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{v}' title='{v}' class='latex' />. Kết quả là một đồ thị với degree <img src='http://s.wordpress.com/latex.php?latex=%7B2d%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{2d}' title='{2d}' class='latex' />, cũng thường được gọi là tích thay thế hoặc tích thay thế cân bằng (balanced replacement product). <a href="http://www.cs.tau.ac.il/~nogaa/PDFS/expander7.pdf">Bài này</a> (SODA 2007) của Alon, Schartz, và Shapira dùng tích thay thế này để xây dựng expanders (constant degree). Phép xây dựng này của Alon et al. cũng là một combinatorial construction, nhưng nó xuất hiện 6, 7 năm sau zig-zag; ngoài ra phép zig-zag cũng đóng vai trò quan trọng trong việc phát triển trực quan cho các kết quả khác, do đó chúng ta nói về tích zig-zag.</p>
<p>
Quay lại với xây dựng tích zig-zag: các cạnh màu xanh và cạnh màu đen <b>không</b> phải là các cạnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />. Nếu ta có thể đi từ một đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7Bx%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x}' title='{x}' class='latex' /> của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> đến một đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7By%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{y}' title='{y}' class='latex' /> của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> bằng cách thăm <img src='http://s.wordpress.com/latex.php?latex=%7B3%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{3}' title='{3}' class='latex' /> cạnh: xanh-đen-xanh, thì ta nối <img src='http://s.wordpress.com/latex.php?latex=%7Bx%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x}' title='{x}' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=%7By%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{y}' title='{y}' class='latex' /> thành một cạnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />. (Vì thế mới gọi là tích zig-zag.) Trong hình, các cạnh màu đỏ mới là các cạnh của tích <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />. Tôi chỉ vẽ ví dụ vài cạnh màu đỏ, vẽ hết sẽ cực rối.</p>
<p>
Như vậy, một bước ngẫu nhiên trên <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> bao gồm một bước ngẫu nhiên màu xanh trong một &#8220;đám mây&#8221; <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' />, một bước xác định (deterministic) qua một cạnh đen của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' />, và một bước ngẫu nhiên (màu xanh) khác trong đám mây bên kia của <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' />. Về mặt trực quan, chúng ta phải chứng minh rằng ba bước này làm cho phân bố các đỉnh trở nên gần cân bằng (uniform) hơn. (Nhớ góc nhìn xác suất của expanders.) Mỗi một đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> là một cặp đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B%28g%2C%20h%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(g, h)}' title='{(g, h)}' class='latex' />, với <img src='http://s.wordpress.com/latex.php?latex=%7Bg%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g}' title='{g}' class='latex' /> là một đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> là một đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' />. Đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B%28g%2Ch%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(g,h)}' title='{(g,h)}' class='latex' /> sẽ gần uniform nếu mỗi tọa độ là gần uniform và độc lập với nhau. Giả sử ta bắt đầu từ một phân bố mà phân bố của <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> (bên trong đám mây) là xa uniform (entropy thấp), thì bước ngẫu nhiên màu xanh đầu tiên sẽ làm cho phân bố của <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> gần uniform hơn vì <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> là expander. Hai bước còn lại thì một bước là xác định, và một bước ngẫu nhiên trên <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> sẽ không làm giảm độ uniform của phân bố của <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' />. Còn nếu phân bố của <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' /> đã là uniform thì bước một bước vẫn giữ nó uniform, trong khi đó phân bố của <img src='http://s.wordpress.com/latex.php?latex=%7Bg%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g}' title='{g}' class='latex' /> sẽ trở nên uniform hơn vì bước màu đen (cùng với bước màu xanh đầu) sẽ tương tự như một bước ngẫu nhiên trên <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' />. Tuy nhiên, vì các cạnh đen thực sự là một matching của các đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />, do đó nếu ta tăng entropy của (phân bố của) <img src='http://s.wordpress.com/latex.php?latex=%7Bg%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{g}' title='{g}' class='latex' /> thì sẽ làm giảm entropy của <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' />. Do đó, ta cần bước màu xanh thứ <img src='http://s.wordpress.com/latex.php?latex=%7B3%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{3}' title='{3}' class='latex' /> để tăng lại entropy của <img src='http://s.wordpress.com/latex.php?latex=%7Bh%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{h}' title='{h}' class='latex' />. (Vì thế, bài zig-zag nguyên thủy có chữ &#8220;entropy wave&#8221; trong đó.) Chứng minh dưới đây theo trực quan này.</p>
<p>
<p><b> 8.j.2. Định nghĩa cụ thể và phân tích </b></p>
<p>
<p>
Với mỗi đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7Bu%20%5Cin%20V%28G%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{u \in V(G)}' title='{u \in V(G)}' class='latex' />, đặt tên các cạnh kề với <img src='http://s.wordpress.com/latex.php?latex=%7Bu%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{u}' title='{u}' class='latex' /> theo thứ tự tùy ý là <img src='http://s.wordpress.com/latex.php?latex=%7Be_u%5E1%2C%20%5Cdots%2C%20e_u%5Em%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{e_u^1, \dots, e_u^m}' title='{e_u^1, \dots, e_u^m}' class='latex' />. Đồ thị <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> được xây dựng như sau: </p>
<ul>
<li> <img src='http://s.wordpress.com/latex.php?latex=%7BV%28G%20%5Ctextcircled%7Bz%7D%20H%29%20%3D%20%5C%7B%28u%2Ci%29%20%5C%20%7C%20%5C%20u%5Cin%20V%28G%29%2C%20i%20%5Cin%20%5Bm%5D%3DV%28H%29%5C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{V(G \textcircled{z} H) = \{(u,i) \ | \ u\in V(G), i \in [m]=V(H)\}}' title='{V(G \textcircled{z} H) = \{(u,i) \ | \ u\in V(G), i \in [m]=V(H)\}}' class='latex' />.
<li> Có một cạnh nối <img src='http://s.wordpress.com/latex.php?latex=%7B%28u%2Ci%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(u,i)}' title='{(u,i)}' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=%7B%28v%2Cj%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(v,j)}' title='{(v,j)}' class='latex' /> nếu và chỉ nếu tồn tại <img src='http://s.wordpress.com/latex.php?latex=%7Bk%2C%20l%20%5Cin%20%5Bm%5D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{k, l \in [m]}' title='{k, l \in [m]}' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=%7Bik%20%5Cin%20E%28H%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{ik \in E(H)}' title='{ik \in E(H)}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7Be_u%5Ek%20%3D%20e_v%5El%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{e_u^k = e_v^l}' title='{e_u^k = e_v^l}' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%7Blj%20%5Cin%20E%7BH%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{lj \in E{H}}' title='{lj \in E{H}}' class='latex' />.
</ul>
<p> Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> có <img src='http://s.wordpress.com/latex.php?latex=%7Bmn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{mn}' title='{mn}' class='latex' /> đỉnh và (regular) degree <img src='http://s.wordpress.com/latex.php?latex=%7Bd%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d^2}' title='{d^2}' class='latex' />.  Gọi <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%7B%5Chat%20A%7D%2C%20%5Cmathbf%7B%5Chat%20B%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf{\hat A}, \mathbf{\hat B}}' title='{\mathbf{\hat A}, \mathbf{\hat B}}' class='latex' /> là các normalized adjacency matrices của <img src='http://s.wordpress.com/latex.php?latex=%7BG%2C%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G, H}' title='{G, H}' class='latex' />, theo thứ tự. Định nghĩa một ma trận <img src='http://s.wordpress.com/latex.php?latex=%7Bmn%20%5Ctimes%20mn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{mn \times mn}' title='{mn \times mn}' class='latex' /> đặt tên là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20P%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf P}' title='{\mathbf P}' class='latex' /> như sau: <img src='http://s.wordpress.com/latex.php?latex=%7Bp_%7B%28u%2Ck%29%2C%28v%2Cl%29%7D%20%3D%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{p_{(u,k),(v,l)} = 1}' title='{p_{(u,k),(v,l)} = 1}' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=%7Be_u%5Ek%20%3D%20e_v%5El%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{e_u^k = e_v^l}' title='{e_u^k = e_v^l}' class='latex' />. Lưu ý rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20P%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf P}' title='{\mathbf P}' class='latex' /> là một ma trận hoán vị đối xứng (symmetric permutation matrix). Định nghĩa ma trận <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%7B%5Ctilde%20B%7D%20%3D%20%5Cmathbf%20I_n%20%5Cotimes%20%5Cmathbf%7B%5Chat%20B%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf{\tilde B} = \mathbf I_n \otimes \mathbf{\hat B}}' title='{\mathbf{\tilde B} = \mathbf I_n \otimes \mathbf{\hat B}}' class='latex' /> (trong đó <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cotimes%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\otimes}' title='{\otimes}' class='latex' /> là ký hiệu của tensor product của hai ma trận). </p>
<p>
<b>Bài tập</b>: chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20M%20%3D%20%5Cmathbf%7B%5Ctilde%20B%20P%20%5Ctilde%20B%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf M = \mathbf{\tilde B P \tilde B}}' title='{\mathbf M = \mathbf{\tilde B P \tilde B}}' class='latex' /> chính là normalized adjacency matrix của tích zig-zag <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' />.</p>
<p>
Từ đó, ta có</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20f%28%5Calpha%2C%5Cbeta%29%20%3D%20%5Cmax_%7B%5Cmathbf%7Bx%20%5Cperp%20u%7D%7D%20%5Cfrac%7B%7C%5Clangle%20%5Cmathbf%7B%5Ctilde%20B%20P%20%5Ctilde%20B%20x%2C%20x%7D%20%5Crangle%7C%7D%7B%5Clangle%20%5Cmathbf%7Bx%2C%20x%7D%20%5Crangle%7D.%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  f(\alpha,\beta) = \max_{\mathbf{x \perp u}} \frac{|\langle \mathbf{\tilde B P \tilde B x, x} \rangle|}{\langle \mathbf{x, x} \rangle}. ' title='\displaystyle  f(\alpha,\beta) = \max_{\mathbf{x \perp u}} \frac{|\langle \mathbf{\tilde B P \tilde B x, x} \rangle|}{\langle \mathbf{x, x} \rangle}. ' class='latex' /></p>
<p>
Xét một vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%7Bx%20%5Cperp%20u%7D%2C%20%5Cmathbf%20x%20%5Cin%20%5Cmathbb%20R%5E%7Bmn%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf{x \perp u}, \mathbf x \in \mathbb R^{mn}}' title='{\mathbf{x \perp u}, \mathbf x \in \mathbb R^{mn}}' class='latex' /> tùy ý. Định nghĩa một &#8220;vector thu thập&#8221; <img src='http://s.wordpress.com/latex.php?latex=%7BC%28%5Cmathbf%20x%29%20%5Cin%20%5Cmathbb%20R%5En%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{C(\mathbf x) \in \mathbb R^n}' title='{C(\mathbf x) \in \mathbb R^n}' class='latex' /> như sau: <img src='http://s.wordpress.com/latex.php?latex=%7BC%28%5Cmathbf%20x%29_u%20%3D%20%5Cfrac%201%20m%20%5Csum_%7Bi%5Cin%20%5Bm%5D%7D%20x_%7B%28u%2Ci%29%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{C(\mathbf x)_u = \frac 1 m \sum_{i\in [m]} x_{(u,i)}}' title='{C(\mathbf x)_u = \frac 1 m \sum_{i\in [m]} x_{(u,i)}}' class='latex' />. Nói cách khác, tọa độ thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bu%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{u}' title='{u}' class='latex' /> của <img src='http://s.wordpress.com/latex.php?latex=%7BC%28%5Cmathbf%20x%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{C(\mathbf x)}' title='{C(\mathbf x)}' class='latex' /> là giá trị trung bình của các tọa độ <img src='http://s.wordpress.com/latex.php?latex=%7Bx_%7B%28u%2Ci%29%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{x_{(u,i)}}' title='{x_{(u,i)}}' class='latex' /> trong &#8220;đám mây&#8221; thứ <img src='http://s.wordpress.com/latex.php?latex=%7Bu%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{u}' title='{u}' class='latex' /> của vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf x}' title='{\mathbf x}' class='latex' />. Đến đây, định nghĩa các thành phần song song và vuông góc:</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathbf%20x%5E%7B%5C%7C%7D%20%3A%3D%20C%28%5Cmathbf%20x%29%20%5Cotimes%20%5Cmathbf%201_m&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathbf x^{\|} := C(\mathbf x) \otimes \mathbf 1_m' title='\displaystyle  \mathbf x^{\|} := C(\mathbf x) \otimes \mathbf 1_m' class='latex' /></p>
<p> trong đó <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%201_m%20%5Cin%20%5Cmathbb%20R%5Em%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf 1_m \in \mathbb R^m}' title='{\mathbf 1_m \in \mathbb R^m}' class='latex' /> là vector mà tất cả các tọa độ đều bằng <img src='http://s.wordpress.com/latex.php?latex=%7B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{1}' title='{1}' class='latex' />; và, </p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Cmathbf%20x%5E%5Cperp%20%3D%20%5Cmathbf%20x%20-%20%5Cmathbf%20x%5E%5C%7C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \mathbf x^\perp = \mathbf x - \mathbf x^\| ' title='\displaystyle  \mathbf x^\perp = \mathbf x - \mathbf x^\| ' class='latex' /></p>
<p>
Xét vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20x%20%5Cperp%20%5Cmathbf%20u%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf x \perp \mathbf u}' title='{\mathbf x \perp \mathbf u}' class='latex' />, chúng ta muốn chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%7C%5Clangle%20%5Cmathbf%7B%5Ctilde%20B%20P%20%5Ctilde%20B%20x%2C%20x%7D%20%5Crangle%7C%20%5Cleq%20f%28%5Calpha%2C%20%5Cbeta%29%20%5Clangle%20%5Cmathbf%7Bx%2Cx%7D%20%5Crangle%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{|\langle \mathbf{\tilde B P \tilde B x, x} \rangle| \leq f(\alpha, \beta) \langle \mathbf{x,x} \rangle}' title='{|\langle \mathbf{\tilde B P \tilde B x, x} \rangle| \leq f(\alpha, \beta) \langle \mathbf{x,x} \rangle}' class='latex' />. Hãy bắt đầu với vế trái trước. Lưu ý rằng, do <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20x%5E%5C%7C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf x^\|}' title='{\mathbf x^\|}' class='latex' /> &#8220;phân bố đều&#8221; trên mỗi &#8220;đám mây&#8221;, ta có <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%7B%5Ctilde%20Bx%5E%5C%7C%20%3D%20x%5E%5C%7C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf{\tilde Bx^\| = x^\|}}' title='{\mathbf{\tilde Bx^\| = x^\|}}' class='latex' />. (<b>Bài tập:</b> chứng minh điều này.)</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%7C%5Clangle%20%5Cmathbf%7B%5Ctilde%20B%20P%20%5Ctilde%20B%20%28x%5E%5C%7C%2Bx%5E%5Cperp%29%2C%20%28x%5E%5C%7C%2Bx%5E%5Cperp%29%7D%20%5Crangle%7C%20%5Cleq%20%7C%5Clangle%20%5Cmathbf%7BPx%5E%5C%7C%2C%20x%5E%5C%7C%7D%20%5Crangle%7C%20%2B%202%7C%5Clangle%20%5Cmathbf%7BP%5Ctilde%20B%20x%5E%5Cperp%2C%20%5Ctilde%20B%20x%5E%5C%7C%7D%20%5Crangle%7C%20%2B%20%5C%7C%5Cmathbf%7B%5Ctilde%20Bx%5E%5Cperp%7D%20%5C%7C%5E2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  |\langle \mathbf{\tilde B P \tilde B (x^\|+x^\perp), (x^\|+x^\perp)} \rangle| \leq |\langle \mathbf{Px^\|, x^\|} \rangle| + 2|\langle \mathbf{P\tilde B x^\perp, \tilde B x^\|} \rangle| + \|\mathbf{\tilde Bx^\perp} \|^2 ' title='\displaystyle  |\langle \mathbf{\tilde B P \tilde B (x^\|+x^\perp), (x^\|+x^\perp)} \rangle| \leq |\langle \mathbf{Px^\|, x^\|} \rangle| + 2|\langle \mathbf{P\tilde B x^\perp, \tilde B x^\|} \rangle| + \|\mathbf{\tilde Bx^\perp} \|^2 ' class='latex' /></p>
<p>
Xét số hạng cuối cùng. Do vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20x%5E%5Cperp%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf x^\perp}' title='{\mathbf x^\perp}' class='latex' /> &#8220;phản phân bố đều&#8221; trên mỗi &#8220;đám mây&#8221; (nghĩa là tổng của các tọa độ của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20x%5E%5Cperp%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf x^\perp}' title='{\mathbf x^\perp}' class='latex' /> trên từng đám mây là bằng <img src='http://s.wordpress.com/latex.php?latex=%7B0%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{0}' title='{0}' class='latex' />), ta suy ra rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5C%7C%5Cmathbf%7B%5Ctilde%20Bx%5E%5Cperp%7D%5C%7C%20%5Cleq%20%5Cbeta%20%5C%7C%5Cmathbf%20x%5E%5Cperp%5C%7C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\|\mathbf{\tilde Bx^\perp}\| \leq \beta \|\mathbf x^\perp\|}' title='{\|\mathbf{\tilde Bx^\perp}\| \leq \beta \|\mathbf x^\perp\|}' class='latex' />.</p>
<p>
Kế tiếp, ta chặn số hạng thứ hai. Do <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cmathbf%20P%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\mathbf P}' title='{\mathbf P}' class='latex' /> là một ma trận hoán vị, nó không thay đổi norm của một vector. Ta có: </p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%202%7C%5Clangle%20%5Cmathbf%7BP%5Ctilde%20B%20x%5E%5Cperp%2C%20%5Ctilde%20B%20x%5E%5C%7C%7D%20%5Crangle%7C%20%5Cleq%202%5C%7C%20%5Cmathbf%7BP%5Ctilde%20Bx%5E%5Cperp%7D%5C%7C%20%5C%7C%5Cmathbf%7B%5Ctilde%20B%20x%5E%5C%7C%7D%5C%7C%20%5Cleq%202%5Cbeta%20%5C%7C%20%7B%5Cbf%20x%7D%5E%5Cperp%5C%7C%20%5C%7C%7B%5Cbf%20x%7D%5E%5C%7C%5C%7C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  2|\langle \mathbf{P\tilde B x^\perp, \tilde B x^\|} \rangle| \leq 2\| \mathbf{P\tilde Bx^\perp}\| \|\mathbf{\tilde B x^\|}\| \leq 2\beta \| {\bf x}^\perp\| \|{\bf x}^\|\| ' title='\displaystyle  2|\langle \mathbf{P\tilde B x^\perp, \tilde B x^\|} \rangle| \leq 2\| \mathbf{P\tilde Bx^\perp}\| \|\mathbf{\tilde B x^\|}\| \leq 2\beta \| {\bf x}^\perp\| \|{\bf x}^\|\| ' class='latex' /></p>
<p>
Cuối cùng, ta chặn số hạng thứ nhất.</p>
<p>
<b>Bài tập</b>: chứng minh rằng</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%5Clangle%20%5Cmathbf%7BPx%5E%5C%7C%2C%20x%5E%5C%7C%7D%20%5Crangle%20%3D%20m%20%5Clangle%20%5Cmathbf%7B%5Chat%20A%7D%20C%28%5Cmathbf%20x%29%2C%20C%28%5Cmathbf%20x%29%5Crangle%20%5Cleq%20m%5Calpha%20%5C%7CC%28%5Cmathbf%20x%29%5C%7C%5E2%20%3D%20%5Calpha%20%5C%7C%5Cmathbf%20x%5E%5C%7C%5C%7C%5E2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  \langle \mathbf{Px^\|, x^\|} \rangle = m \langle \mathbf{\hat A} C(\mathbf x), C(\mathbf x)\rangle \leq m\alpha \|C(\mathbf x)\|^2 = \alpha \|\mathbf x^\|\|^2 ' title='\displaystyle  \langle \mathbf{Px^\|, x^\|} \rangle = m \langle \mathbf{\hat A} C(\mathbf x), C(\mathbf x)\rangle \leq m\alpha \|C(\mathbf x)\|^2 = \alpha \|\mathbf x^\|\|^2 ' class='latex' /></p>
<p>
Vì thế,</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%7C%5Clangle%20%5Cmathbf%7B%5Ctilde%20B%20P%20%5Ctilde%20B%20x%2C%20x%7D%20%5Crangle%7C%20%5Cleq%20%5Calpha%20%5C%7C%5Cmathbf%20x%5E%5C%7C%5C%7C%5E2%20%2B%202%5Cbeta%20%5C%7C%20%7B%5Cbf%20x%7D%5E%5Cperp%5C%7C%20%5C%7C%7B%5Cbf%20x%7D%5E%5C%7C%5C%7C%20%20%2B%20%5Cbeta%5E2%20%5C%7C%5Cmathbf%20x%5E%5Cperp%5C%7C%5E2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  |\langle \mathbf{\tilde B P \tilde B x, x} \rangle| \leq \alpha \|\mathbf x^\|\|^2 + 2\beta \| {\bf x}^\perp\| \|{\bf x}^\|\|  + \beta^2 \|\mathbf x^\perp\|^2 ' title='\displaystyle  |\langle \mathbf{\tilde B P \tilde B x, x} \rangle| \leq \alpha \|\mathbf x^\|\|^2 + 2\beta \| {\bf x}^\perp\| \|{\bf x}^\|\|  + \beta^2 \|\mathbf x^\perp\|^2 ' class='latex' /></p>
<p>
Lưu ý rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5C%7C%5Cmathbf%20x%5C%7C%5E2%20%3D%20%5C%7C%5Cmathbf%20x%5E%5C%7C%5C%7C%5E2%20%2B%20%5C%7C%5Cmathbf%20x%5E%5Cperp%5C%7C%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\|\mathbf x\|^2 = \|\mathbf x^\|\|^2 + \|\mathbf x^\perp\|^2}' title='{\|\mathbf x\|^2 = \|\mathbf x^\|\|^2 + \|\mathbf x^\perp\|^2}' class='latex' />. Ta suy ra</p>
<p><p align=center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%20%7C%5Clangle%20%5Cmathbf%7B%5Ctilde%20B%20P%20%5Ctilde%20B%20x%2C%20x%7D%20%5Crangle%7C%20%5Cleq%20%5Cmax%28%5Calpha%2B%5Cbeta%2C%20%5Cbeta%2B%5Cbeta%5E2%29%5C%7C%5Cmathbf%20x%5C%7C%5E2%20%5Cleq%20%28%5Calpha%2B%5Cbeta%2B%5Cbeta%5E2%29%5C%7C%5Cmathbf%20x%5C%7C%5E2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle  |\langle \mathbf{\tilde B P \tilde B x, x} \rangle| \leq \max(\alpha+\beta, \beta+\beta^2)\|\mathbf x\|^2 \leq (\alpha+\beta+\beta^2)\|\mathbf x\|^2 ' title='\displaystyle  |\langle \mathbf{\tilde B P \tilde B x, x} \rangle| \leq \max(\alpha+\beta, \beta+\beta^2)\|\mathbf x\|^2 \leq (\alpha+\beta+\beta^2)\|\mathbf x\|^2 ' class='latex' /></p>
<p>
Như vậy, ta vừa chứng minh được định lý sau đây:</p>
<blockquote><p><b>Định lý 1 (Định lý zig-zag)</b> <em></p>
<p>
Nếu <img src='http://s.wordpress.com/latex.php?latex=%7BG%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G}' title='{G}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28n%2Cm%2C%5Calpha%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(n,m,\alpha)}' title='{(n,m,\alpha)}' class='latex' />-spectral expander và <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28m%2Cd%2C%5Cbeta%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(m,d,\beta)}' title='{(m,d,\beta)}' class='latex' />-spectral expander thì tích zig-zag <img src='http://s.wordpress.com/latex.php?latex=%7BG%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G \textcircled{z} H}' title='{G \textcircled{z} H}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28mn%2C%20d%5E2%2C%20%5Calpha%2B%5Cbeta%2B%5Cbeta%5E2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(mn, d^2, \alpha+\beta+\beta^2)}' title='{(mn, d^2, \alpha+\beta+\beta^2)}' class='latex' />-spectral expander. </em></p></blockquote>
<p>
<p><b> 8.j.3. Xây dựng rất cụ thể (chạy trong thời gian poly-log) </b></p>
<p><p>
Theo như cách mô tả xây dựng họ expanders ở trên, thời gian cần để xây dựng đồ thị <img src='http://s.wordpress.com/latex.php?latex=%7BG_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_i}' title='{G_i}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Bpoly%7D%28%7CV%28G_i%29%7C%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{poly}(|V(G_i)|)}' title='{\text{poly}(|V(G_i)|)}' class='latex' />. Muốn một họ expanders được xây dựng một cách rất cụ thể (định nghĩa trong bài <a href="http://www.procul.org/blog/2009/05/31/pcp8/">PCP 8</a>), thì ta cần phép xây dựng này chạy trong thời gian poly-log. Ý tưởng chính là dùng phương pháp tương tự như &#8220;<a href="http://www.itl.nist.gov/div897/sqg/dads/HTML/repeatedSquaring.html">repeated squaring</a>&#8221;. </p>
<p>
Trước hết, cần định nghĩa <a href="http://en.wikipedia.org/wiki/Tensor_product_of_graphs">tích tensor</a> của hai đồ thị. Gọi <img src='http://s.wordpress.com/latex.php?latex=%7BG_1%3D%28V_1%2CE_1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_1=(V_1,E_1)}' title='{G_1=(V_1,E_1)}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7Bd_1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d_1}' title='{d_1}' class='latex' />-regular graph với <img src='http://s.wordpress.com/latex.php?latex=%7Bn_1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n_1}' title='{n_1}' class='latex' /> đỉnh, <img src='http://s.wordpress.com/latex.php?latex=%7BG_2%3D%28V_2%2CE_2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_2=(V_2,E_2)}' title='{G_2=(V_2,E_2)}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7Bd_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d_2}' title='{d_2}' class='latex' />-regular graph với <img src='http://s.wordpress.com/latex.php?latex=%7Bn_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n_2}' title='{n_2}' class='latex' /> đỉnh. Tích tensor <img src='http://s.wordpress.com/latex.php?latex=%7BG_1%20%5Cotimes%20G_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_1 \otimes G_2}' title='{G_1 \otimes G_2}' class='latex' /> được định nghĩa như sau: <img src='http://s.wordpress.com/latex.php?latex=%7BV%28G_1%20%5Cotimes%20G_2%29%20%3D%20V_1%20%5Ctimes%20V_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{V(G_1 \otimes G_2) = V_1 \times V_2}' title='{V(G_1 \otimes G_2) = V_1 \times V_2}' class='latex' />, và hai đỉnh <img src='http://s.wordpress.com/latex.php?latex=%7B%28u_1%2Cu_2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(u_1,u_2)}' title='{(u_1,u_2)}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7B%28v_1%2Cv_2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(v_1,v_2)}' title='{(v_1,v_2)}' class='latex' /> là kề nhau nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=%7Bu_1v_1%5Cin%20E_1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{u_1v_1\in E_1}' title='{u_1v_1\in E_1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7Bu_2v_2%5Cin%20E_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{u_2v_2\in E_2}' title='{u_2v_2\in E_2}' class='latex' />.</p>
<p>
<b>Bài tập:</b> chứng minh rằng nếu <img src='http://s.wordpress.com/latex.php?latex=%7BG_1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_1}' title='{G_1}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7BG_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_2}' title='{G_2}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B%28n_1%2Cd_1%2C%5Calpha_1%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(n_1,d_1,\alpha_1)}' title='{(n_1,d_1,\alpha_1)}' class='latex' />-spectral expander và <img src='http://s.wordpress.com/latex.php?latex=%7B%28n_2%2Cd_2%2C%5Calpha_2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(n_2,d_2,\alpha_2)}' title='{(n_2,d_2,\alpha_2)}' class='latex' />-spectral expander, theo thứ tự, thì <img src='http://s.wordpress.com/latex.php?latex=%7BG_1%20%5Cotimes%20G_2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_1 \otimes G_2}' title='{G_1 \otimes G_2}' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B%28n_1n_2%2Cd_1d_2%2C%20%5Cmax%28%5Calpha_1%2C%5Calpha_2%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(n_1n_2,d_1d_2, \max(\alpha_1,\alpha_2))}' title='{(n_1n_2,d_1d_2, \max(\alpha_1,\alpha_2))}' class='latex' />-spectral expander. (Gợi ý: normalized adjacency matrix của đồ thị tích là <a href="http://en.wikipedia.org/wiki/Tensor_product">tích tensor</a> của hai normalized adjacency matrices.)</p>
<p>
Từ đó, có thể xây dựng họ expanders như sau. Gọi <img src='http://s.wordpress.com/latex.php?latex=%7BH%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{H}' title='{H}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28d%5E8%2Cd%2C%5Calpha%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(d^8,d,\alpha)}' title='{(d^8,d,\alpha)}' class='latex' />-spectral expander với các hằng số <img src='http://s.wordpress.com/latex.php?latex=%7Bd%2C%5Calpha%3C1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{d,\alpha&lt;1}' title='{d,\alpha&lt;1}' class='latex' /> nào đó. Sau đó, định nghĩa </p>
<ul>
<li> <img src='http://s.wordpress.com/latex.php?latex=%7BG_1%20%3D%20H%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_1 = H^2}' title='{G_1 = H^2}' class='latex' />
<li> <img src='http://s.wordpress.com/latex.php?latex=%7BG_2%20%3D%20H%20%5Cotimes%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_2 = H \otimes H}' title='{G_2 = H \otimes H}' class='latex' />
<li> <img src='http://s.wordpress.com/latex.php?latex=%7BG_n%20%3D%20%5Cleft%28G_%7B%5Cleft%5Clceil%5Cfrac%7Bn-1%7D%7B2%7D%5Cright%5Crceil%7D%20%5Cotimes%20G_%7B%5Cleft%5Clfloor%5Cfrac%7Bn%2B1%7D%7B2%7D%5Cright%5Crfloor%7D%20%5Cright%29%5E2%20%5Ctextcircled%7Bz%7D%20H%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_n = \left(G_{\left\lceil\frac{n-1}{2}\right\rceil} \otimes G_{\left\lfloor\frac{n+1}{2}\right\rfloor} \right)^2 \textcircled{z} H}' title='{G_n = \left(G_{\left\lceil\frac{n-1}{2}\right\rceil} \otimes G_{\left\lfloor\frac{n+1}{2}\right\rfloor} \right)^2 \textcircled{z} H}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7Bn%20%5Cgeq%203%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n \geq 3}' title='{n \geq 3}' class='latex' />
</ul>
<p>
<b>Bài tập:</b> chứng minh rằng, với mọi <img src='http://s.wordpress.com/latex.php?latex=%7Bn%20%5Cgeq%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{n \geq 1}' title='{n \geq 1}' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%7BG_n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_n}' title='{G_n}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%7B%28d%5E%7B8n%7D%2C%20d%5E2%2C%20%5Calpha_n%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{(d^{8n}, d^2, \alpha_n)}' title='{(d^{8n}, d^2, \alpha_n)}' class='latex' />-spectral expander trong đó <img src='http://s.wordpress.com/latex.php?latex=%7B%5Calpha_n%20%3D%20%5Calpha%20%2B%20O%28%5Calpha%5E2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\alpha_n = \alpha + O(\alpha^2)}' title='{\alpha_n = \alpha + O(\alpha^2)}' class='latex' />; và nếu cho trước một đỉnh của <img src='http://s.wordpress.com/latex.php?latex=%7BG_n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{G_n}' title='{G_n}' class='latex' /> thì ta có thể tính được các đỉnh kề với nó trong thời gian <img src='http://s.wordpress.com/latex.php?latex=%7B%5Ctext%7Bpoly%7D%28n%29%20%3D%20%5Ctext%7Bpoly%7D%28%5Clog%28%7CV%28G_n%29%7C%29%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\text{poly}(n) = \text{poly}(\log(|V(G_n)|))}' title='{\text{poly}(n) = \text{poly}(\log(|V(G_n)|))}' class='latex' />.</p>
<p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2009/06/25/pcp-9-expanders-tich-zig-zag/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>PCP 8 &#8212; Expanders: tiết kiệm random bits và khuếch đại gap</title>
		<link>http://www.procul.org/blog/2009/05/31/pcp8/</link>
		<comments>http://www.procul.org/blog/2009/05/31/pcp8/#comments</comments>
		<pubDate>Sun, 31 May 2009 11:05:29 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[Expanders]]></category>
		<category><![CDATA[Khuếch đại gap]]></category>
		<category><![CDATA[thuật toán]]></category>
		<category><![CDATA[xác suất]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=1500</guid>
		<description><![CDATA[Trong bài này ta thảo luận các phép xây dựng đồ thị expander, và một vài ứng dụng của chúng: tiết kiệm bit ngẫu nhiên và khuếch đại gap. 8.f. Sơ lược về các kết quả xây dựng một họ expanders Định nghĩa. (Họ expanders) Cho trước các hằng số , một chuỗi các đồ [...]]]></description>
			<content:encoded><![CDATA[<p>Trong bài này ta thảo luận các phép xây dựng đồ thị expander, và một vài ứng dụng của chúng: tiết kiệm bit ngẫu nhiên và khuếch đại gap. </p>
<p><span id="more-1500"></span></p>
<p><strong>8.f. Sơ lược về các kết quả xây dựng một họ expanders</strong></p>
<blockquote><p>
<strong>Định nghĩa. (Họ expanders)</strong> </p>
<p>Cho trước các hằng số <img src='http://s.wordpress.com/latex.php?latex=d%2C%5Calpha%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d,\alpha&gt;0' title='d,\alpha&gt;0' class='latex' />, một chuỗi các đồ thị <img src='http://s.wordpress.com/latex.php?latex=%5C%7BG_i%5C%7D_%7Bi%3D1%7D%5E%5Cinfty&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\{G_i\}_{i=1}^\infty' title='\{G_i\}_{i=1}^\infty' class='latex' /> là một họ <img src='http://s.wordpress.com/latex.php?latex=%28d%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(d,\alpha)' title='(d,\alpha)' class='latex' /> của các spectral expanders nếu <img src='http://s.wordpress.com/latex.php?latex=G_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G_i' title='G_i' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%28n_i%2Cd%2Cc%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(n_i,d,c)' title='(n_i,d,c)' class='latex' />-spectral expander. Trong đó, <img src='http://s.wordpress.com/latex.php?latex=n_1%3Cn_2%3C%5Cdots&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n_1&lt;n_2&lt;\dots' title='n_1&lt;n_2&lt;\dots' class='latex' />, và tồn tại một đa thức <img src='http://s.wordpress.com/latex.php?latex=g%28n%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='g(n)' title='g(n)' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=n_%7Bi%2B1%7D%20%3D%20O%28g%28n_i%29%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n_{i+1} = O(g(n_i))' title='n_{i+1} = O(g(n_i))' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' />. Điều kiện cuối cùng này chỉ để giới hạn kích thước của các expanders trong họ. Cái sau không thể có kích thước bằng số mũ của cái trước.
</p></blockquote>
<p>Trong đa số các ứng dụng (xem dưới đây), cho trước một hằng số <img src='http://s.wordpress.com/latex.php?latex=%5Calpha%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha&lt;1' title='\alpha&lt;1' class='latex' />, chúng ta muốn là có một hằng số <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' /> sao cho một họ <img src='http://s.wordpress.com/latex.php?latex=%28d%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(d,\alpha)' title='(d,\alpha)' class='latex' /> của các spectral expanders tồn tại, và mỗi thành viên trong họ có thể xây dựng được trong polynomial time. </p>
<blockquote><p>
<strong>Định nghĩa. (Họ expanders xây dựng tương đối cụ thể)</strong></p>
<p>Một họ <img src='http://s.wordpress.com/latex.php?latex=%5C%7BG_i%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\{G_i\}' title='\{G_i\}' class='latex' /> của các expanders có thể xây dựng được một cách tương đối cụ thể (mildly explicit) nếu tồn tại một thuật toán mà cho input là <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' /> nó output đồ thị <img src='http://s.wordpress.com/latex.php?latex=G_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G_i' title='G_i' class='latex' /> trong thời gian <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7Bpoly%7D%28i%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{poly}(i)' title='\text{poly}(i)' class='latex' />.
</p></blockquote>
<p><strong>Ví dụ</strong>: có thể xây dựng một họ các expanders như sau. Gọi <img src='http://s.wordpress.com/latex.php?latex=n_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n_i' title='n_i' class='latex' /> là số nguyên tố thứ <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' />. Đặt <img src='http://s.wordpress.com/latex.php?latex=V%28G_i%29%20%3D%20%5Cmathbb%20Z_%7Bn_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V(G_i) = \mathbb Z_{n_i}' title='V(G_i) = \mathbb Z_{n_i}' class='latex' /> (nhóm Abel). Với một đỉnh bất kỳ <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20%5Cmathbb%20Z_%7Bn_i%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in \mathbb Z_{n_i}' title='x \in \mathbb Z_{n_i}' class='latex' /> thì nối <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> với các hàng xóm <img src='http://s.wordpress.com/latex.php?latex=x%2B1%2Cx-1%2Cx%5E%7B-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x+1,x-1,x^{-1}' title='x+1,x-1,x^{-1}' class='latex' />. Trong đó, các phép tính cộng, trừ, nghịch đảo là tính trên nhóm. Và, ta định nghĩa nghịch đảo của <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' />. Đáng lẽ, ta có thể xây dựng đồ thị thứ <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' /> rất nhanh, nhưng vì không biết cách nào để sinh số nguyên tố thứ <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' /> ngoài cách cơ bắp (thử từng số từ <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' /> trở đi và dùng <a href="http://www.math.princeton.edu/~annals/issues/2004/Sept2004/Agrawal.pdf">thuật toán AKS</a>), cho nên tổng thời gian chạy để sinh ra đồ thị thứ <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7Bpoly%7D%28i%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{poly}(i)' title='\text{poly}(i)' class='latex' />. </p>
<blockquote><p>
<strong>Định nghĩa. (Họ expanders xây dựng rất cụ thể)</strong></p>
<p>Một họ <img src='http://s.wordpress.com/latex.php?latex=%5C%7BG_i%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\{G_i\}' title='\{G_i\}' class='latex' /> của các expanders có thể xây dựng được một cách rất cụ thể (strongly explicit) nếu tồn tại một thuật toán mà cho input là <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' />, đỉnh <img src='http://s.wordpress.com/latex.php?latex=v%20%5Cin%20%5Bn_i%5D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v \in [n_i]' title='v \in [n_i]' class='latex' />, và số <img src='http://s.wordpress.com/latex.php?latex=k%20%5Cin%20%5Bd%5D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k \in [d]' title='k \in [d]' class='latex' />, thuật toán in ra hàng xóm thứ <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' /> của đỉnh <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> trong đồ thị <img src='http://s.wordpress.com/latex.php?latex=G_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G_i' title='G_i' class='latex' /> trong thời gian <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7Bpoly%7D%28%5Clog%20i%2C%20%5Clog%20n_i%2C%20%5Clog%20d%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{poly}(\log i, \log n_i, \log d)' title='\text{poly}(\log i, \log n_i, \log d)' class='latex' /> (đại khái là thời gian đa thức trong tổng số bits để biểu diễn bộ ba <img src='http://s.wordpress.com/latex.php?latex=%28i%2Cn_i%2Cd%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(i,n_i,d)' title='(i,n_i,d)' class='latex' />.
</p></blockquote>
<p><strong>Ví dụ:</strong> <a href="http://www.math.yale.edu/public_html/People/Margulis.html">Grigory Margulis</a> (giải Fields năm 1978) chứng minh từ hồi 1973 rằng họ đồ thị xây dựng như sau là một họ expanders. Đặt <img src='http://s.wordpress.com/latex.php?latex=V%28G_n%29%20%3D%20%5Cmathbb%20Z_n%20%5Ctimes%20%5Cmathbb%20Z_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V(G_n) = \mathbb Z_n \times \mathbb Z_n' title='V(G_n) = \mathbb Z_n \times \mathbb Z_n' class='latex' />. Định nghĩa</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20T_1%20%3D%20%5Cbegin%7Bbmatrix%7D%201%262%5C%5C0%261%5Cend%7Bbmatrix%7D%2CT_1%20%3D%20%5Cbegin%7Bbmatrix%7D%201%260%5C%5C2%261%5Cend%7Bbmatrix%7D%2Ce_1%20%3D%20%5Cbegin%7Bbmatrix%7D%201%5C%5C0%5Cend%7Bbmatrix%7D%2C%20e_2%20%3D%20%5Cbegin%7Bbmatrix%7D0%5C%5C1%5Cend%7Bbmatrix%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle T_1 = \begin{bmatrix} 1&amp;2\\0&amp;1\end{bmatrix},T_1 = \begin{bmatrix} 1&amp;0\\2&amp;1\end{bmatrix},e_1 = \begin{bmatrix} 1\\0\end{bmatrix}, e_2 = \begin{bmatrix}0\\1\end{bmatrix}' title='\displaystyle T_1 = \begin{bmatrix} 1&amp;2\\0&amp;1\end{bmatrix},T_1 = \begin{bmatrix} 1&amp;0\\2&amp;1\end{bmatrix},e_1 = \begin{bmatrix} 1\\0\end{bmatrix}, e_2 = \begin{bmatrix}0\\1\end{bmatrix}' class='latex' /></center></p>
<p>Trong đồ thị thứ <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> <img src='http://s.wordpress.com/latex.php?latex=G_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G_n' title='G_n' class='latex' />, đỉnh <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> sẽ được nối với <img src='http://s.wordpress.com/latex.php?latex=4&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='4' title='4' class='latex' /> đỉnh <img src='http://s.wordpress.com/latex.php?latex=T_1v%2C%20T_2v%2C%20T_1v%2Be_1%2CT_2v%2Be2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='T_1v, T_2v, T_1v+e_1,T_2v+e2' title='T_1v, T_2v, T_1v+e_1,T_2v+e2' class='latex' /> (và sẽ có <img src='http://s.wordpress.com/latex.php?latex=4&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='4' title='4' class='latex' /> đỉnh khác nối với nó dùng định nghĩa này). Vì thế, đây là đồ thị <img src='http://s.wordpress.com/latex.php?latex=8&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='8' title='8' class='latex' />-regular. Gabber và Galil hồi năm 1981 chứng minh rằng đây là họ <img src='http://s.wordpress.com/latex.php?latex=%288%2C%205%5Csqrt%202%2F8%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(8, 5\sqrt 2/8)' title='(8, 5\sqrt 2/8)' class='latex' /> các spectral expanders, có thể xây dựng được một cách rất cụ thể như trên. Nếu có thời gian và hứng thú tôi sẽ duyệt qua chứng minh này dùng phương pháp của Jimbo và Marouka hồi năm 1987 (dùng giải tích Fourier).</p>
<p><strong>Ví dụ:</strong> Alon và Boppana khoảng năm 1990 chứng minh được rằng, nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là một đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular thì <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda%28G%29%20%5Cgeq%20%5Cfrac%7B2%5Csqrt%7Bd-1%7D%7D%7Bd%7D%20-%20o_n%281%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda(G) \geq \frac{2\sqrt{d-1}}{d} - o_n(1)' title='\hat\lambda(G) \geq \frac{2\sqrt{d-1}}{d} - o_n(1)' class='latex' />. Do đó, với một họ <img src='http://s.wordpress.com/latex.php?latex=%28d%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(d,\alpha)' title='(d,\alpha)' class='latex' /> spectral expanders ta chỉ có thể hy vọng là <img src='http://s.wordpress.com/latex.php?latex=%5Calpha%20%3D%20%5Cfrac%7B2%5Csqrt%7Bd-1%7D%7D%7Bd%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha = \frac{2\sqrt{d-1}}{d}' title='\alpha = \frac{2\sqrt{d-1}}{d}' class='latex' /> là tối ưu rồi. (Đây là tối ưu về mặt eigenvalue, nhưng không nhất thiết là tối ưu về edge/vertex expansion rate.) Lubotzky-Phillips-Sarnak hồi 1988 xây dựng một họ các đồ thị đạt đến ngưỡng này. Các đồ thị này gọi là các <a href="http://en.wikipedia.org/wiki/Ramanujan_graph">đồ thị Ramanujan</a>. Phép xây dựng của họ có tính <em>rất cụ thể</em>. Họ đồ thị mà họ xây dựng là các Cayley graphs của một họ các nhóm tuyến tính tổng quát. Quyển sách nho nhỏ dễ thương này là giới thiệu tốt về Ramanujan graphs: <a href="http://www.amazon.com/gp/product/0521531438?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0521531438">Elementary Number Theory, Group Theory and Ramanujan Graphs (London Mathematical Society Student Texts)</a><img src="http://www.assoc-amazon.com/e/ir?t=bk06d-20&#038;l=as2&#038;o=1&#038;a=0521531438" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" />.</p>
<p><strong>Ví dụ:</strong> Gần đây, tích zig-zag là một cách khác nữa để xây dựng một cách rất cụ thể một họ expanders. Chúng ta sẽ định nghĩa và chứng minh kết quả vừa đạt <a href="http://www.procul.org/blog/2009/05/20/on-a-related-note/">giải thưởng Godel năm 2008</a> này trong bài tới.</p>
<blockquote><p>
<strong>Định lý. (Xây dựng expander mạnh từ expander yếu.)</strong></p>
<p>Nếu có thể xây dựng được một họ <img src='http://s.wordpress.com/latex.php?latex=%28d%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(d,\alpha)' title='(d,\alpha)' class='latex' /> các spectral expanders trong đó <img src='http://s.wordpress.com/latex.php?latex=d%2C%20%5Calpha%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d, \alpha&lt;1' title='d, \alpha&lt;1' class='latex' /> là các hằng số, thì cho trước <img src='http://s.wordpress.com/latex.php?latex=0%3C%5Cbeta%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0&lt;\beta&lt;1' title='0&lt;\beta&lt;1' class='latex' /> nhỏ tùy ý, tồn tại hằng số <img src='http://s.wordpress.com/latex.php?latex=d%27&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d&#039;' title='d&#039;' class='latex' /> sao cho ta cũng xây dựng được một họ <img src='http://s.wordpress.com/latex.php?latex=%28d%27%2C%5Cbeta%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(d&#039;,\beta)' title='(d&#039;,\beta)' class='latex' /> các spectral expanders.
</p></blockquote>
<p><em>Chứng minh.</em> Gọi latex <img src='http://s.wordpress.com/latex.php?latex=G%5Ek&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G^k' title='G^k' class='latex' /> là lũy thừa bậc <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' /> của đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=uv%20%5Cin%20E%28G%5Ek%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='uv \in E(G^k)' title='uv \in E(G^k)' class='latex' /> nếu và chỉ nếu khoảng cách giữa <img src='http://s.wordpress.com/latex.php?latex=u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='u' title='u' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> trong <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> nhiều nhất là <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' />. Dễ thấy rằng adjacency matrix của <img src='http://s.wordpress.com/latex.php?latex=G%5Ek&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G^k' title='G^k' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D%5Ek&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}^k' title='{\bf A}^k' class='latex' />, trong đó <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}' title='{\bf A}' class='latex' /> là adjacency matrix của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Do đó, <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%28G%5Ek%29%20%3D%20%28%5Chat%5Clambda%28G%29%29%5Ek&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda(G^k) = (\hat\lambda(G))^k' title='\hat \lambda(G^k) = (\hat\lambda(G))^k' class='latex' />. Chỉ cần chọn <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=%28%5Chat%5Clambda%28G%29%29%5Ek%20%5Cleq%20%5Cbeta&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\hat\lambda(G))^k \leq \beta' title='(\hat\lambda(G))^k \leq \beta' class='latex' /> là xong!</p>
<div align=right>QED</div>
<p><strong>8.g. Tiết kiệm random bits dùng expanders</strong></p>
<p><a href="http://qwiki.stanford.edu/wiki/Complexity_Zoo:C#corp"><img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BcoRP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{coRP}' title='\mathsf{coRP}' class='latex' /></a> là lớp các bài toán (hay ngôn ngữ) <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> sao cho, tồn tại một thuật toán ngẫu nhiên hóa <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chạy trong poly-time thỏa mãn điều kiện sau đây:</p>
<ul>
<li> nếu <img src='http://s.wordpress.com/latex.php?latex=x%5Cin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x\in L' title='x\in L' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BA%20%5Ctext%7B%20accepts%20%7D%20x%5D%20%3D%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[A \text{ accepts } x] = 1' title='\text{Prob}[A \text{ accepts } x] = 1' class='latex' /></p>
<li> nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L' title='x \notin L' class='latex' /> thì  <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BA%20%5Ctext%7B%20accepts%20%7D%20x%5D%20%5Cleq%201%2F2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[A \text{ accepts } x] \leq 1/2' title='\text{Prob}[A \text{ accepts } x] \leq 1/2' class='latex' />
</ul>
<p>Để giảm xác suất lỗi của thuật toán <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> xuống, phương pháp đơn giản nhất là chạy <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần độc lập, và chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> nếu và chỉ nếu cả <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> đều chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' />. Khi đó, nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L' title='x \notin L' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BA%20%5Ctext%7B%20accepts%20%7D%20x%5D%20%5Cleq%201%2F2%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[A \text{ accepts } x] \leq 1/2^t' title='\text{Prob}[A \text{ accepts } x] \leq 1/2^t' class='latex' />, nghĩa là xác suất lỗi đã được giảm theo hàm mũ. Điểm bất lợi của phương pháp <strong>&#8220;lặp tuần tự&#8221;</strong> (sequential repetition) này là, nếu tổng số random bits mà <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> cần trong một lần chạy là <img src='http://s.wordpress.com/latex.php?latex=r&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='r' title='r' class='latex' /> bits, thì tổng số random bits cần dùng là <img src='http://s.wordpress.com/latex.php?latex=tr&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='tr' title='tr' class='latex' />.</p>
<p>Dùng expanders, chúng ta có thể giảm tổng số random bits cần dùng xuống mà vẫn giảm được xác suất lỗi của <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> theo hàm mũ. Giả sử ta xây dựng được (một cách rất cụ thể) một <img src='http://s.wordpress.com/latex.php?latex=%282%5Er%2C%20d%2C%20%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(2^r, d, \alpha)' title='(2^r, d, \alpha)' class='latex' />-spectral expander với <img src='http://s.wordpress.com/latex.php?latex=d%2C%20%5Calpha%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d, \alpha&lt;1' title='d, \alpha&lt;1' class='latex' /> là các hằng số. Mỗi một đỉnh của expander này được "dán nhãn" là một chuỗi <img src='http://s.wordpress.com/latex.php?latex=r&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='r' title='r' class='latex' /> bits. Vì thế, có thể xem mỗi đỉnh của expander như một chuỗi random bits để tặng cho thuật toán <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' />. Nếu chúng ta chọn <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> đỉnh ngẫu nhiên, độc lập nhau, và đưa chúng cho <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> thì kết quả như trước. Ý tưởng <strong>&#8220;lặp dùng expander&#8221;</strong> là: thay vì chọn <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> đỉnh ngẫu nhiên độc lập nhau, thì ta chọn <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> đỉnh ngẫu nhiên bằng cách chọn một khởi điểm ngẫu nhiên và bước <img src='http://s.wordpress.com/latex.php?latex=t-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t-1' title='t-1' class='latex' /> bước ngẫu nhiên. Dùng các đỉnh gặp dọc đường làm chuỗi ngẫu nhiên cho <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chạy. Cuối cùng, vẫn chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> luôn chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> trong cả <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần này. Tổng số bits ngẫu nhiên ta dùng là <img src='http://s.wordpress.com/latex.php?latex=r%20%2B%20t%5Clog_2d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='r + t\log_2d' title='r + t\log_2d' class='latex' />. Do <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' /> là hằng số, tổng số bits ngẫu nhiên trở nên tuyến tính trên hai tham số <img src='http://s.wordpress.com/latex.php?latex=t%2Cr&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t,r' title='t,r' class='latex' />, thay vì <img src='http://s.wordpress.com/latex.php?latex=tr&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='tr' title='tr' class='latex' /> như trong cách lặp tuần tự.</p>
<p>Trực quan là: do random walk trên expanders mau chóng hội tụ đến trạng thái cân bằng là phân bố đều, lấy mẫu bằng random walk cũng gần tốt bằng lấy mẫu hoàn toàn ngẫu nhiên, độc lập.</p>
<p>Khi <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in L' title='x \in L' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> luôn chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> bất kể random walk của ta là gì. Khi <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L' title='x \notin L' class='latex' />, gọi <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> là tập các chuỗi ngẫu nhiên làm cho <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' />. Do <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BA%20%5Ctext%7B%20accepts%20%7D%20x%5D%20%5Cleq%201%2F2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[A \text{ accepts } x] \leq 1/2' title='\text{Prob}[A \text{ accepts } x] \leq 1/2' class='latex' />, ta có <img src='http://s.wordpress.com/latex.php?latex=%7CB%7C%20%5Cleq%20%5Cfrac%201%202%202%5Er&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|B| \leq \frac 1 2 2^r' title='|B| \leq \frac 1 2 2^r' class='latex' />. Xác suất mà <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> chính là xác suất mà cái random walk của ta bị &#8220;giam cầm&#8221; trong <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> trong toàn bộ <img src='http://s.wordpress.com/latex.php?latex=t-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t-1' title='t-1' class='latex' /> bước. Từ bài trước, xác suất này <img src='http://s.wordpress.com/latex.php?latex=%5Cleq%20%5Csqrt%7B1%2F2%7D%20%28%20%5Calpha%20%2B%20%281-%5Calpha%29%2F2%20%29%5E%7Bt-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\leq \sqrt{1/2} ( \alpha + (1-\alpha)/2 )^{t-1}' title='\leq \sqrt{1/2} ( \alpha + (1-\alpha)/2 )^{t-1}' class='latex' /> cũng giảm theo hàm mũ!</p>
<p><strong>8.h. Khuếch đại gap dùng expanders</strong></p>
<p>Ý tưởng trong mục 8.g. cũng dùng được để chứng minh một kết quả khó xấp xỉ mạnh hơn cho bài toán Max-Clique. Nhớ rằng, trong bài PCP 3 chúng ta đã chứng minh rằng, nếu <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BNP%7D%20%5Csubseteq%20%5Cmathsf%7BPCP%7D_%7Bc%2Cs%7D%5Br%2Cq%5D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{NP} \subseteq \mathsf{PCP}_{c,s}[r,q]' title='\mathsf{NP} \subseteq \mathsf{PCP}_{c,s}[r,q]' class='latex' /> và nếu <img src='http://s.wordpress.com/latex.php?latex=2%5E%7Br%2Bq%7D%20%3D%20%5Ctext%7Bpoly%7D%28n%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='2^{r+q} = \text{poly}(n)' title='2^{r+q} = \text{poly}(n)' class='latex' />, thì chúng ta không thể xấp xỉ Max-Clique đến tỉ lệ <img src='http://s.wordpress.com/latex.php?latex=s%2Fc%2B%5Cepsilon&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='s/c+\epsilon' title='s/c+\epsilon' class='latex' /> với bất kỳ <img src='http://s.wordpress.com/latex.php?latex=%5Cepsilon%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\epsilon&gt;0' title='\epsilon&gt;0' class='latex' /> nào.</p>
<p>Từ định lý PCP, ta biết rằng tồn tại một <img src='http://s.wordpress.com/latex.php?latex=%28O%28%5Clog%20n%29%2C%20O%281%29%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(O(\log n), O(1))' title='(O(\log n), O(1))' class='latex' />-restricted verifier cho <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{NP}' title='\mathsf{NP}' class='latex' /> với completeness <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' /> và soundness <img src='http://s.wordpress.com/latex.php?latex=1%2F2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/2' title='1/2' class='latex' />. Dùng expander như trong mục 8.g và lập lại verifier này <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần, chúng ta có thể giảm soundness xuống còn <img src='http://s.wordpress.com/latex.php?latex=s%20%3D%20%5Csigma%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='s = \sigma^t' title='s = \sigma^t' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=%5Csigma%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma&lt;1' title='\sigma&lt;1' class='latex' /> là một hằng số . Completeness vẫn bằng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />. Tổng số query bits ta dùng là <img src='http://s.wordpress.com/latex.php?latex=q%20%3D%20tO%281%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='q = tO(1)' title='q = tO(1)' class='latex' />. Tổng số random bits ta dùng là <img src='http://s.wordpress.com/latex.php?latex=r%20%3D%20O%28%5Clog%20n%29%20%2B%20t%20%5Clog%20d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='r = O(\log n) + t \log d' title='r = O(\log n) + t \log d' class='latex' />. Do đó, để giữ cho <img src='http://s.wordpress.com/latex.php?latex=2%5E%7Br%2Bq%7D%20%3D%20%5Ctext%7Bpoly%7D%28n%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='2^{r+q} = \text{poly}(n)' title='2^{r+q} = \text{poly}(n)' class='latex' />, ta có thể lập lại verifier đến <img src='http://s.wordpress.com/latex.php?latex=t%20%3D%20%5Clog_2%20n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t = \log_2 n' title='t = \log_2 n' class='latex' /> (hoặc bất kỳ một hằng số nào nhân với <img src='http://s.wordpress.com/latex.php?latex=%5Clog_2n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\log_2n' title='\log_2n' class='latex' /> lần).</p>
<p>Như vậy, ta kết luận rằng không thể xấp xỉ Max-Clique đến tỉ lệ <img src='http://s.wordpress.com/latex.php?latex=s%2F1%20%2B%20%5Cepsilon%20%3D%20%5Csigma%5E%7B%5Clog_2n%7D%2B%5Cepsilon&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='s/1 + \epsilon = \sigma^{\log_2n}+\epsilon' title='s/1 + \epsilon = \sigma^{\log_2n}+\epsilon' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=%5Cepsilon&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\epsilon' title='\epsilon' class='latex' />. Có một điểm hơi tinh tế cần chú ý là, khi viết tỉ lệ khó xấp xỉ, ta phải viết nó thành hàm số của kích thước instance của bài toán Max-Clique. Tổng số đỉnh của đồ thị trong FGLSS reduction là <img src='http://s.wordpress.com/latex.php?latex=N%20%3D%202%5E%7Br%2Bq%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='N = 2^{r+q}' title='N = 2^{r+q}' class='latex' />. Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Csigma%5E%7B%5Clog_2n%7D%20%3D%201%2FN%5E%5Cdelta&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma^{\log_2n} = 1/N^\delta' title='\sigma^{\log_2n} = 1/N^\delta' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=%5Cdelta%20%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\delta &gt;0' title='\delta &gt;0' class='latex' /> là một hằng số. Do đó, ta kết luận rằng </p>
<blockquote><p>
<strong>Định lý</strong>. </p>
<p>Trừ phi <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BP%3DNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{P=NP}' title='\mathsf{P=NP}' class='latex' />, tồn tại một hằng số <img src='http://s.wordpress.com/latex.php?latex=%5Cdelta%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\delta&gt;0' title='\delta&gt;0' class='latex' /> sao cho không thể xấp xỉ Max-Clique đến tỉ lệ <img src='http://s.wordpress.com/latex.php?latex=1%2FN%5E%5Cdelta%20%2B%20%5Cepsilon&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/N^\delta + \epsilon' title='1/N^\delta + \epsilon' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=%5Cepsilon%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\epsilon&gt;0' title='\epsilon&gt;0' class='latex' />.
</p></blockquote>
<p>Kết quả trên rất mạnh, là vì thuật toán ngu xuẩn xuất ra <strong>một đỉnh</strong> đã có tỉ lệ xấp xỉ là <img src='http://s.wordpress.com/latex.php?latex=1%2FN&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/N' title='1/N' class='latex' />. Sau này, chúng ta sẽ chứng minh rằng xấp xỉ Max-Clique đến tỉ lệ <img src='http://s.wordpress.com/latex.php?latex=1%2FN%5E%7B1-%5Cepsilon%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/N^{1-\epsilon}' title='1/N^{1-\epsilon}' class='latex' /> là không thể được (trừ phi <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BP%3DNP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{P=NP}' title='\mathsf{P=NP}' class='latex' />) với mọi <img src='http://s.wordpress.com/latex.php?latex=%5Cepsilon%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\epsilon&gt;0' title='\epsilon&gt;0' class='latex' /> cho trước.</p>
<p><strong>8.i. Tiết kiệm random bits cho các thuật toán &#8220;lỗi hai bên&#8221;</strong></p>
<p>Có một điểm khá tinh tế là ý tưởng &#8220;lặp tuần tự&#8221; hoặc &#8220;lặp dùng expanders&#8221; để giảm xác suất lỗi sẽ không áp dụng trực tiếp được cho các thuật toán bị lỗi hai bên; hoặc cho các PCP verifiers không có completeness bằng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />. </p>
<p><img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BBPP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{BPP}' title='\mathsf{BPP}' class='latex' /> là lớp các ngôn ngữ <img src='http://s.wordpress.com/latex.php?latex=L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='L' title='L' class='latex' /> sao cho, tồn tại một thuật toán ngẫu nhiên hóa <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chạy trong poly-time thỏa mãn điều kiện sau đây:</p>
<ul>
<li> nếu <img src='http://s.wordpress.com/latex.php?latex=x%5Cin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x\in L' title='x\in L' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BA%20%5Ctext%7B%20accepts%20%7D%20x%5D%20%5Cgeq%202%2F3&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[A \text{ accepts } x] \geq 2/3' title='\text{Prob}[A \text{ accepts } x] \geq 2/3' class='latex' /></p>
<li> nếu <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L' title='x \notin L' class='latex' /> thì  <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BA%20%5Ctext%7B%20accepts%20%7D%20x%5D%20%5Cleq%201%2F3&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[A \text{ accepts } x] \leq 1/3' title='\text{Prob}[A \text{ accepts } x] \leq 1/3' class='latex' />
</ul>
<p>Để giảm lỗi (ở cả hai phía &#8212; cả false positives lẫn false negatives), chúng ta cần một thuật toán khác, không thể đơn giản chỉ &#8220;lặp lại <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần và chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> nếu <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> toàn bộ <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần&#8221;. (<strong>Bài tập:</strong> ta gặp khó khăn gì khi dùng chiến lược đơn giản này?)</p>
<p>Trước hết, chiến lược &#8220;lặp tuần tự&#8221; cho trường hợp lỗi hai bên này là chạy <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần độc lập, với <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lẻ, và chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> chấp nhân trong đa số các lần chạy; không chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> trong trường hợp ngược lại. Để phân tích thuật toán <em>&#8220;bầu cử dân chủ&#8221;</em> này, chúng ta cần biết chặn Chernoff &#8212; một trong những bất đẳng thức hữu dụng nhất trong lý thuyết xác suất.</p>
<blockquote><p>
<strong>Chặn Chernoff.</strong></p>
<p>Cho các biến ngẫu nhiên <img src='http://s.wordpress.com/latex.php?latex=X_1%2C%20%5Cdots%2C%20X_t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='X_1, \dots, X_t' title='X_1, \dots, X_t' class='latex' /> trong đó <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5BX_i%20%3D%201%5D%20%3D%20p&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}[X_i = 1] = p' title='\text{Prob}[X_i = 1] = p' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Cmbox%7BProb%7D%5BX_i%20%3D%200%5D%20%3D%201-p&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mbox{Prob}[X_i = 0] = 1-p' title='\mbox{Prob}[X_i = 0] = 1-p' class='latex' />, với <img src='http://s.wordpress.com/latex.php?latex=p&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p' title='p' class='latex' /> là một xác suất cho trước. Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbb%7BE%7D%5Cleft%5B%20%5Csum_%7Bi%3D1%7D%5Et%20X_i%20%5Cright%5D%20%3D%20tp.&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbb{E}\left[ \sum_{i=1}^t X_i \right] = tp.' title='\mathbb{E}\left[ \sum_{i=1}^t X_i \right] = tp.' class='latex' /> Các chặn Chernoff cho ta ước lượng xác suất mà <img src='http://s.wordpress.com/latex.php?latex=%5Csum_%7Bi%3D1%7D%5EtX_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sum_{i=1}^tX_i' title='\sum_{i=1}^tX_i' class='latex' /> nằm xa giá trị kỳ vọng <img src='http://s.wordpress.com/latex.php?latex=tp&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='tp' title='tp' class='latex' />. Phân bố của tổng này có hai cái &#8220;đuôi&#8221; mỏng ở hai đầu, còn lại tập trung vào gần trị kỳ vọng (giống như hình ngọn núi), gọi là hiện tượng concentration.</p>
<p>Với mọi <img src='http://s.wordpress.com/latex.php?latex=%5Cdelta%20%5Cin%20%280%2C1%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\delta \in (0,1)' title='\delta \in (0,1)' class='latex' />, chặn Chernoff cho đuôi trên (upper tail) có thể viết như sau:<br />
<center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmbox%7BProb%7D%5Cleft%5B%5Csum_%7Bi%3D1%7D%5EtX_i%20%5Cgeq%20%281%2B%5Cdelta%29tp%5Cright%5D%20%5Cleq%20e%5E%7B-tp%5Cdelta%5E2%2F3%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \mbox{Prob}\left[\sum_{i=1}^tX_i \geq (1+\delta)tp\right] \leq e^{-tp\delta^2/3}' title='\displaystyle \mbox{Prob}\left[\sum_{i=1}^tX_i \geq (1+\delta)tp\right] \leq e^{-tp\delta^2/3}' class='latex' /></center><br />
và cho đuôi dưới (lower tail) ta có<br />
<center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmbox%7BProb%7D%5Cleft%5B%5Csum_%7Bi%3D1%7D%5EtX_i%20%5Cleq%20%281-%5Cdelta%29tp%5Cright%5D%20%5Cleq%20e%5E%7B-tp%5Cdelta%5E2%2F2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \mbox{Prob}\left[\sum_{i=1}^tX_i \leq (1-\delta)tp\right] \leq e^{-tp\delta^2/2}' title='\displaystyle \mbox{Prob}\left[\sum_{i=1}^tX_i \leq (1-\delta)tp\right] \leq e^{-tp\delta^2/2}' class='latex' /></center><br />
Nói theo ngôn ngữ phổ thông thì: khi <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> tiến ra vô cùng, khả năng mà <img src='http://s.wordpress.com/latex.php?latex=%5Csum_%7Bi%3D1%7D%5EtX_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sum_{i=1}^tX_i' title='\sum_{i=1}^tX_i' class='latex' /> nằm xa trung tâm tiến đến <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> theo hàm mũ (exponentially reduced).
</p></blockquote>
<p>Để dùng chặn Chernoff, xét trường hợp <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in L' title='x \in L' class='latex' /> trước. Đặt <img src='http://s.wordpress.com/latex.php?latex=X_i%3D1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='X_i=1' title='X_i=1' class='latex' /> nếu thuật toán <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> <strong>không</strong> chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> trong lần chạy thứ <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=1%20%5Cleq%20i%20%5Cleq%20t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1 \leq i \leq t' title='1 \leq i \leq t' class='latex' />; ngược lại thì gán <img src='http://s.wordpress.com/latex.php?latex=X_i%3D0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='X_i=0' title='X_i=0' class='latex' />. Gọi <img src='http://s.wordpress.com/latex.php?latex=p&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p' title='p' class='latex' /> là xác suất mà <img src='http://s.wordpress.com/latex.php?latex=A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='A' title='A' class='latex' /> không chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' />. Ta có <img src='http://s.wordpress.com/latex.php?latex=p%20%3D%20%5Ctext%7BProb%7D%5BX_i%20%3D%201%5D%20%5Cleq%201%2F3&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p = \text{Prob}[X_i = 1] \leq 1/3' title='p = \text{Prob}[X_i = 1] \leq 1/3' class='latex' />. Thuật toán &#8220;bầu cử dân chủ&#8221; không chấp nhận <img src='http://s.wordpress.com/latex.php?latex=x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x' title='x' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=%5Csum_i%20X_i%20%5Cgeq%20t%2F2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sum_i X_i \geq t/2' title='\sum_i X_i \geq t/2' class='latex' />. Do đó, xác suất mà <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \in L' title='x \in L' class='latex' /> không được chấp nhận cũng giảm theo hàm mũ:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Ctext%7BProb%7D%5Cleft%5B%20%5Csum_%7Bi%3D1%7D%5Et%20X_i%20%5Cgeq%20t%2F2%20%5Cright%5D%20%5Cleq%20%5Ctext%7BProb%7D%5Cleft%5B%20%5Csum_%7Bi%3D1%7D%5Et%20X_i%20%5Cgeq%20%281%2B1%2F2%29tp%20%5Cright%5D%20%5Cleq%20e%5E%7B-tp%281%2F2%29%5E2%2F3%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \text{Prob}\left[ \sum_{i=1}^t X_i \geq t/2 \right] \leq \text{Prob}\left[ \sum_{i=1}^t X_i \geq (1+1/2)tp \right] \leq e^{-tp(1/2)^2/3}' title='\displaystyle \text{Prob}\left[ \sum_{i=1}^t X_i \geq t/2 \right] \leq \text{Prob}\left[ \sum_{i=1}^t X_i \geq (1+1/2)tp \right] \leq e^{-tp(1/2)^2/3}' class='latex' /></center></p>
<p>Phân tích tương tự cho thấy khi <img src='http://s.wordpress.com/latex.php?latex=x%20%5Cnotin%20L&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x \notin L' title='x \notin L' class='latex' />, xác suất nó được chấp nhận (false positive) cũng giảm theo hàm mũ. Như vậy, nếu chiến lược là lặp tuần tự thì chúng ta có thể giảm xác suất lỗi theo hàm mũ như trong trường hợp &#8220;lỗi một bên&#8221; kiểu <img src='http://s.wordpress.com/latex.php?latex=%5Cmathsf%7BcoRP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{coRP}' title='\mathsf{coRP}' class='latex' />. Và cũng như trong trường hợp lỗi một bên, tổng số random bits dùng sẽ là <img src='http://s.wordpress.com/latex.php?latex=tr&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='tr' title='tr' class='latex' />, hơi quá lớn cho một số ứng dụng.</p>
<p><strong>Có thể nào áp dụng phương pháp &#8220;lặp dùng expanders&#8221; cho trường hợp lỗi hai bên được không?</strong> Như trong phân tích trên, chúng ta cần chặn xác suất mà một random walk gồm <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> bước bị giam cầm trong <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> trong <em>ít nhất một nửa</em> số bước. Cái random walk này có thể đi vào <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> và đi ra khỏi <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> nhiều lần, miễn là tổng số bước nằm trong <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> ít nhất là <img src='http://s.wordpress.com/latex.php?latex=t%2F2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t/2' title='t/2' class='latex' />. Định lý trong mục 8.e (bài PCP 7) quá yếu cho mục tiêu này. Tuy nhiên, chúng ta có thể sửa lại chứng minh định lý 8.e một chút để có định lý sau đây:</p>
<blockquote><p>
<strong>Định lý (Khó &#8220;giam cầm&#8221; random walk trên expander ở một tập các bước cố định).</strong> </p>
<p>Cho trước một tập <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> các đỉnh, <img src='http://s.wordpress.com/latex.php?latex=%7CB%7C%20%5Cleq%20%5Cbeta%20n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|B| \leq \beta n' title='|B| \leq \beta n' class='latex' /> của một <img src='http://s.wordpress.com/latex.php?latex=%28n%2Cd%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(n,d,\alpha)' title='(n,d,\alpha)' class='latex' />-spectral expander <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />, một số nguyên dương <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' />, và một tập con <img src='http://s.wordpress.com/latex.php?latex=K%5Csubseteq%20%5C%7B0%2C1%2C%5Cdots%2Ct%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='K\subseteq \{0,1,\dots,t\}' title='K\subseteq \{0,1,\dots,t\}' class='latex' />. Gọi <img src='http://s.wordpress.com/latex.php?latex=%28B%2CK%2Ct%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(B,K,t)' title='(B,K,t)' class='latex' /> là sự kiện mà cái random walk gồm <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> bước trên <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> bị giam giữ trong tập <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> trong toàn bộ các bước trong tập <img src='http://s.wordpress.com/latex.php?latex=K&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='K' title='K' class='latex' />. (Nghĩa là, nếu <img src='http://s.wordpress.com/latex.php?latex=K%3D%5C%7B0%2C%203%2C%204%2C%206%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='K=\{0, 3, 4, 6\}' title='K=\{0, 3, 4, 6\}' class='latex' /> thì đỉnh khởi điểm, đỉnh ở bước ngẫu nhiên thứ <img src='http://s.wordpress.com/latex.php?latex=3%2C%204%2C%206&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='3, 4, 6' title='3, 4, 6' class='latex' /> nằm trong <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' />, còn các đỉnh khác trong <img src='http://s.wordpress.com/latex.php?latex=t-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t-1' title='t-1' class='latex' /> bước ta không quan tâm.) Ta có, </p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Ctext%7BProb%7D%5Cleft%5B%28B%2CK%2Ct%29%5Cright%5D%20%5Cleq%20%28%5Calpha%20%2B%20%281-%5Calpha%29%5Cbeta%29%5E%7B%7CK%7C-1%7D.&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \text{Prob}\left[(B,K,t)\right] \leq (\alpha + (1-\alpha)\beta)^{|K|-1}.' title='\displaystyle \text{Prob}\left[(B,K,t)\right] \leq (\alpha + (1-\alpha)\beta)^{|K|-1}.' class='latex' /></center>
</p></blockquote>
<p><strong>Bài tập:</strong> chứng minh định lý trên. (Gợi ý: gần giống hệt chứng minh định lý &#8220;giam cầm&#8221; kia.)</p>
<p><strong>Bài tập:</strong> dùng định lý trên để phân tích chiến lược &#8220;lặp dùng expanders&#8221; cho một thuật toán lỗi hai phía.</p>
<p>Tóm lại, với expanders ta có thể khuếch đại gap cho cả trường hợp không có completeness bằng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />. Bài tới viết về một phương pháp xây dựng rất cụ thể các họ expanders: phương pháp dùng zig-zag product mới được giải Godel. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2009/05/31/pcp8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>PCP 7 &#8212; Expanders: góc nhìn xác suất</title>
		<link>http://www.procul.org/blog/2009/05/29/pcp7/</link>
		<comments>http://www.procul.org/blog/2009/05/29/pcp7/#comments</comments>
		<pubDate>Fri, 29 May 2009 15:07:39 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[Xác suất & thống kê]]></category>
		<category><![CDATA[Expanders]]></category>
		<category><![CDATA[PCP]]></category>
		<category><![CDATA[xác suất]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=1453</guid>
		<description><![CDATA[8.d. Spectral expanders và tốc độ hội tụ của random walks trên expanders Trong bài này chúng ta sẽ chứng minh rằng một đồ thị có spectral gap lớn thì &#8220;tương đương&#8221; với tốc độ hội tụ của một random walk trên đồ thị càng cao. (Sở dĩ ta để tương đương trong ngoặc kép [...]]]></description>
			<content:encoded><![CDATA[<p><strong>8.d. Spectral expanders và tốc độ hội tụ của random walks trên expanders</strong></p>
<p>Trong bài này chúng ta sẽ chứng minh rằng một đồ thị có spectral gap lớn thì &#8220;tương đương&#8221; với tốc độ hội tụ của một random walk trên đồ thị càng cao. (Sở dĩ ta để <em>tương đương</em> trong ngoặc kép là vì một chiều chứng minh cần thay đổi đồ thị một chút.)</p>
<p><strong>8.d.1. Random walk trên đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular, điều kiện hội tụ</strong></p>
<p>Hầu hết những kết quả ta sẽ chứng minh trong đề mục này đúng cho cả các đồ thị không regular, nhưng chúng ta chỉ phát triển các kết quả trên các đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular cho tiện. Xét một đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> với adjacency matrix <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' />. Định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%7B%5Cbf%20A%7D%20%3D%20%5Cfrac%201%20d%20%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat {\bf A} = \frac 1 d {\bf A}' title='\hat {\bf A} = \frac 1 d {\bf A}' class='latex' />. Ma trận <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat {\bf A}' title='\hat {\bf A}' class='latex' /> còn được gọi là normalized adjacency matrix, và nó cũng chính là  transition probability matrix của chuỗi Markov trên đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Ở đây, chúng ta không cần biết lý thuyết về chuỗi Markov để hiểu bài này. Nếu bạn muốn biết thêm về chuỗi Markov thì tôi giới thiệu quyển <a href="http://www.amazon.com/gp/product/0521633966?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0521633966">Markov Chains</a><img src="http://www.assoc-amazon.com/e/ir?t=bk06d-20&#038;l=as2&#038;o=1&#038;a=0521633966" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" /> của Norris. Về random walks trên các đồ thị thì <a href="http://www.cs.elte.hu/~lovasz/erdos.pdf">bài này</a> của Laci Lovasz là một bài tổng hợp tốt, và <a href="http://front.math.ucdavis.edu/math.PR/0001057">quyển sách của Doyle và Snell</a> (miễn phí) là kinh điển, tuy hơi cũ.</p>
<p>Để bắt đầu một random walk trên một đồ thị thì trước hết ta chọn một đỉnh của đồ thị làm khởi điểm theo một phân bố xác suất <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%20%3D%20%5Cpi%5E%7B%280%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi = \pi^{(0)}' title='\pi = \pi^{(0)}' class='latex' /> nào đó: <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5E%7B%280%29%7D_v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^{(0)}_v' title='\pi^{(0)}_v' class='latex' /> là xác suất mà đỉnh <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> là đỉnh khởi đầu. Đương nhiên <img src='http://s.wordpress.com/latex.php?latex=0%20%5Cleq%20%5Cpi%5E%7B%280%29%7D_v%20%5Cleq%201%2C%20%5Cforall%20v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0 \leq \pi^{(0)}_v \leq 1, \forall v' title='0 \leq \pi^{(0)}_v \leq 1, \forall v' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Csum_v%20%5Cpi%5E%7B%280%29%7D_v%20%3D%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sum_v \pi^{(0)}_v = 1' title='\sum_v \pi^{(0)}_v = 1' class='latex' />. Khi đang ở một đỉnh <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> ở bước này thì đến bước kế tiếp ta chọn ngẫu nhiên một một đỉnh kề với <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> (với xác suất <img src='http://s.wordpress.com/latex.php?latex=1%2Fd&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/d' title='1/d' class='latex' />) và &#8220;bước qua&#8221; bên đó. Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5E%7B%28t%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^{(t)}' title='\pi^{(t)}' class='latex' /> là phân bố xác suất của random walk ở thời điểm <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' />, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5E%7B%28t%29%7D_v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^{(t)}_v' title='\pi^{(t)}_v' class='latex' /> là xác suất mà chúng ta ở đỉnh <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' /> sau <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> bước. Dễ thấy rằng phân bố xác suất ở thời điểm <img src='http://s.wordpress.com/latex.php?latex=t%2B1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t+1' title='t+1' class='latex' /> là</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cpi%5E%7B%28t%2B1%29%7D%20%3D%20%5Chat%20%7B%5Cbf%20A%7D%20%5Cpi%5E%7B%28t%29%7D.&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \pi^{(t+1)} = \hat {\bf A} \pi^{(t)}.' title='\displaystyle \pi^{(t+1)} = \hat {\bf A} \pi^{(t)}.' class='latex' /></center> </p>
<p>Trong lý thuyết chuỗi Markov, phương trình trên gọi là <a href="http://en.wikipedia.org/wiki/Chapman-Kolmogorov_equation">phương trình Chapman-Kolmogorov</a>, đơn giản là ứng dụng công thức tính conditional probability. </p>
<p><span id="more-1453"></span></p>
<p><strong>Bài tập:</strong> chứng minh công thức Chapman-Kolmogorov trên.</p>
<p><strong>Bài tập:</strong> công thức có còn đúng không nếu đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là đồ thị có hướng? Nếu không đúng thì phải sửa làm sao cho đúng?</p>
<p>Từ đó ta có:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cpi%5E%7B%28t%29%7D%20%3D%20%5Chat%20%7B%5Cbf%20A%7D%5Et%20%5Cpi%2C%20%5C%20%5Cforall%20t%20%5Cgeq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \pi^{(t)} = \hat {\bf A}^t \pi, \ \forall t \geq 0' title='\displaystyle \pi^{(t)} = \hat {\bf A}^t \pi, \ \forall t \geq 0' class='latex' /></center></p>
<p>Như đã viết trong bài <a href="http://www.procul.org/blog/2007/10/23/eigen/">Trị đặc trưng và vector đặc trưng</a>, hễ nhìn thấy lũy thừa của các ma trận, đặc biệt là các ma trận thực và đối xứng, thì ta phải nghĩ ngay đến các vector và trị đặc trưng. Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_1%20%5Cgeq%20%5Cdots%20%5Cgeq%20%5Chat%20%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_1 \geq \dots \geq \hat \lambda_n' title='\hat \lambda_1 \geq \dots \geq \hat \lambda_n' class='latex' /> là bộ eigenvalues của <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat {\bf A}' title='\hat {\bf A}' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%5Cgeq%20%5Cdots%20%5Cgeq%20%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 \geq \dots \geq \lambda_n' title='\lambda_1 \geq \dots \geq \lambda_n' class='latex' /> là bộ eigenvalues của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' />. Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_i%20%3D%20%5Cfrac%201%20d%20%5Clambda_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_i = \frac 1 d \lambda_i' title='\hat \lambda_i = \frac 1 d \lambda_i' class='latex' />, và hơn nữa <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_i' title='\hat \lambda_i' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_i' title='\lambda_i' class='latex' /> có cùng các eigenvectors. Gọi các eigenvectors trực chuẩn tương ứng là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D_1%2C%20%5Cdots%2C%20%7B%5Cbf%20u%7D_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}_1, \dots, {\bf u}_n' title='{\bf u}_1, \dots, {\bf u}_n' class='latex' />. Trong bài PCP 6 chúng ta đã chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D_1%20%3D%20%7B%5Cbf%201%7D%2F%5Csqrt%20n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}_1 = {\bf 1}/\sqrt n' title='{\bf u}_1 = {\bf 1}/\sqrt n' class='latex' />. </p>
<p>Đến đây, biểu diễn <img src='http://s.wordpress.com/latex.php?latex=%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi' title='\pi' class='latex' /> thành tổ hợp tuyến tính của các vectors <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}_i' title='{\bf u}_i' class='latex' />, ta có <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%20%3D%20%5Csum_%7Bi%7D%5Calpha_i%20%7B%5Cbf%20u%7D_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi = \sum_{i}\alpha_i {\bf u}_i' title='\pi = \sum_{i}\alpha_i {\bf u}_i' class='latex' />, trong đó <img src='http://s.wordpress.com/latex.php?latex=%5Calpha_i%20%3D%20%5Clangle%20%5Cpi%2C%20%7B%5Cbf%20u%7D_i%20%5Crangle&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha_i = \langle \pi, {\bf u}_i \rangle' title='\alpha_i = \langle \pi, {\bf u}_i \rangle' class='latex' />. Từ đó, suy ra <img src='http://s.wordpress.com/latex.php?latex=%5Calpha_1%20%3D%201%2F%5Csqrt%20n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha_1 = 1/\sqrt n' title='\alpha_1 = 1/\sqrt n' class='latex' /> (<strong>Bài tập:</strong> tại sao?) và vì thế</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cpi%5E%7B%28t%29%7D%20%3D%20%5Chat%20%7B%5Cbf%20A%7D%5Et%5Cpi%20%3D%20%5Csum_i%20%5Calpha_i%20%5Chat%20%7B%5Cbf%20A%7D%5Et%20%7B%5Cbf%20u%7D_i%20%3D%20%5Csum_i%20%5Calpha_i%20%5Chat%20%5Clambda_i%5Et%20%3D%20%5Cfrac%7B%5Cbf%201%7D%7Bn%7D%20%2B%20%5Csum_%7Bi%3D2%7D%5En%20%5Calpha_i%20%5Chat%20%5Clambda_i%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \pi^{(t)} = \hat {\bf A}^t\pi = \sum_i \alpha_i \hat {\bf A}^t {\bf u}_i = \sum_i \alpha_i \hat \lambda_i^t = \frac{\bf 1}{n} + \sum_{i=2}^n \alpha_i \hat \lambda_i^t' title='\displaystyle \pi^{(t)} = \hat {\bf A}^t\pi = \sum_i \alpha_i \hat {\bf A}^t {\bf u}_i = \sum_i \alpha_i \hat \lambda_i^t = \frac{\bf 1}{n} + \sum_{i=2}^n \alpha_i \hat \lambda_i^t' class='latex' />.</center></p>
<p>Do đó, nếu <img src='http://s.wordpress.com/latex.php?latex=%7C%5Clambda_i%7C%3C1%2C%20%5Cforall%20i%20%5Cgeq%202&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|\lambda_i|&lt;1, \forall i \geq 2' title='|\lambda_i|&lt;1, \forall i \geq 2' class='latex' /> thì <img src='http://s.wordpress.com/latex.php?latex=%5Clim_%7Bt%20%5Cto%20%5Cinfty%7D%20%5Cpi%5E%7B%28t%29%7D%20%3D%20%5Cfrac%7B%5Cbf%201%7D%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lim_{t \to \infty} \pi^{(t)} = \frac{\bf 1}{n}' title='\lim_{t \to \infty} \pi^{(t)} = \frac{\bf 1}{n}' class='latex' /> bất kể khởi điểm có phân bố gì. Chú ý rằng <img src='http://s.wordpress.com/latex.php?latex=%5Cfrac%7B%5Cbf%201%7D%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\frac{\bf 1}{n}' title='\frac{\bf 1}{n}' class='latex' /> chính là cái phân bố đều (uniform distribution).  Chúng ta vừa chứng minh được chiều thuận của định lý sau đây. Điều kỳ kiệu là chiều nghịch cũng đúng.</p>
<blockquote><p>
<strong>Điều kiện hội tụ của random walk trên đồ thị</strong></p>
<p>Cho <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là một đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular. Định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%28G%29%20%3D%20%5Cmax%5C%7B%20%7C%5Chat%20%5Clambda_2%7C%2C%20%7C%5Chat%20%5Clambda_n%7C%20%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda(G) = \max\{ |\hat \lambda_2|, |\hat \lambda_n| \}' title='\hat \lambda(G) = \max\{ |\hat \lambda_2|, |\hat \lambda_n| \}' class='latex' />. Ta có  <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%28G%29%20%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda(G) &lt;1' title='\hat \lambda(G) &lt;1' class='latex' /> nếu và chỉ nếu</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clim_%7Bt%20%5Cto%20%5Cinfty%7D%20%5Cpi%5E%7B%28t%29%7D%20%3D%20%5Cfrac%7B%5Cbf%201%7D%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lim_{t \to \infty} \pi^{(t)} = \frac{\bf 1}{n}' title='\displaystyle \lim_{t \to \infty} \pi^{(t)} = \frac{\bf 1}{n}' class='latex' />, bất kể phân bố khởi điểm là gì.</center>
</p></blockquote>
<p><em>Chứng minh</em>. Bây giờ chúng ta chứng minh chiều nghịch, nghĩa là nếu <img src='http://s.wordpress.com/latex.php?latex=%5Clim_%7Bt%20%5Cto%20%5Cinfty%7D%20%5Cpi%5E%7B%28t%29%7D%20%3D%20%5Cfrac%7B%5Cbf%201%7D%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lim_{t \to \infty} \pi^{(t)} = \frac{\bf 1}{n}' title='\lim_{t \to \infty} \pi^{(t)} = \frac{\bf 1}{n}' class='latex' /> bất kể phân bố khởi điểm, thì <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda%28G%29%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda(G)&lt;1' title='\hat\lambda(G)&lt;1' class='latex' />. Chỉ cần chứng minh <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_2%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_2&lt;1' title='\hat \lambda_2&lt;1' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_n%3E-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_n&gt;-1' title='\hat \lambda_n&gt;-1' class='latex' /> là đủ. Từ bài PCP 6, và quan hệ <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_i%20%3D%20%5Cfrac%201%20d%20%5Clambda_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_i = \frac 1 d \lambda_i' title='\hat \lambda_i = \frac 1 d \lambda_i' class='latex' />, ta biết <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda_2%3C1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda_2&lt;1' title='\hat\lambda_2&lt;1' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là đồ thị liên thông, và <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda_n%3E-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda_n&gt;-1' title='\hat \lambda_n&gt;-1' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không phải là đồ thị bipartite.</p>
<p>Trước hết, giả sử <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không liên thông, ta sẽ chứng minh rằng tồn tại hai phân bố khởi điểm khác nhau làm cho random walk hội tụ về hai trạng thái cân bằng khác nhau. Các bài tập sau đây &#8220;mạnh&#8221; hơn cần thiết, nhưng có giá trị mô phạm; các bạn không quen với chuỗi Markov nên làm thử:</p>
<p><strong>Bài tập:</strong> Giả sử tồn tại vector <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%20%3D%20%5Clim_%7Bt%20%5Cto%20%5Cinfty%7D%20%5Cpi%5E%7B%28t%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi = \lim_{t \to \infty} \pi^{(t)}' title='\pi = \lim_{t \to \infty} \pi^{(t)}' class='latex' />. Chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi' title='\pi' class='latex' /> là một distribution, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%5Csum_i%20%5Cpi_i%3D1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sum_i \pi_i=1' title='\sum_i \pi_i=1' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=0%20%5Cleq%20%5Cpi_i%20%5Cleq%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0 \leq \pi_i \leq 1' title='0 \leq \pi_i \leq 1' class='latex' />. Ngoài ra, chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%7B%5Cbf%20A%7D%5Cpi%20%3D%20%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat {\bf A}\pi = \pi' title='\hat {\bf A}\pi = \pi' class='latex' />, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi' title='\pi' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />-eigenvector. Một phân bố <img src='http://s.wordpress.com/latex.php?latex=%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi' title='\pi' class='latex' /> thỏa mãn <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%7B%5Cbf%20A%7D%5Cpi%20%3D%20%5Cpi&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat {\bf A}\pi = \pi' title='\hat {\bf A}\pi = \pi' class='latex' /> thì được gọi là một phân bố cân bằng.</p>
<p><strong>Bài tập:</strong> dùng định lý Perron-Frobenius, chứng minh rằng luôn tồn tại một phân bố cân bằng <img src='http://s.wordpress.com/latex.php?latex=%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma' title='\sigma' class='latex' />, cho dù <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không phải là đồ thị regular.</p>
<p><strong>Bài tập:</strong> gọi <img src='http://s.wordpress.com/latex.php?latex=%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma' title='\sigma' class='latex' /> là một phân bố cân bằng. Chứng minh rằng nếu <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5E%7B%280%29%7D%20%3D%20%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^{(0)} = \sigma' title='\pi^{(0)} = \sigma' class='latex' />, nghĩa là nếu trạng thái khởi đầu là một phân bố cân bằng, thì <img src='http://s.wordpress.com/latex.php?latex=%5Clim_%7Bt%20%5Cto%20%5Cinfty%7D%20%5Cpi%5E%7B%28t%29%7D%20%3D%20%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lim_{t \to \infty} \pi^{(t)} = \sigma' title='\lim_{t \to \infty} \pi^{(t)} = \sigma' class='latex' />.</p>
<p>Như vậy, đến đây ta chỉ cần chứng minh rằng nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không liên thông thì có ít nhất hai phân bố cân bằng khác nhau là được. Nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không liên thông thì <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />-eigenspace của <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat {\bf A}' title='\hat {\bf A}' class='latex' /> có dimension <img src='http://s.wordpress.com/latex.php?latex=%5Cgeq%202&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\geq 2' title='\geq 2' class='latex' />. Đặt <img src='http://s.wordpress.com/latex.php?latex=%5Csigma%20%3D%20%5Cfrac%7B%5Cbf%201%7D%7Bn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma = \frac{\bf 1}{n}' title='\sigma = \frac{\bf 1}{n}' class='latex' /> thì đây là một phân bố cân bằng do <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular. Gọi <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20y%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf y}' title='{\bf y}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />-eigenvector bất kỳ độc lập tuyến tính với <img src='http://s.wordpress.com/latex.php?latex=%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma' title='\sigma' class='latex' />. Với bất kỳ hệ số <img src='http://s.wordpress.com/latex.php?latex=c&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c' title='c' class='latex' /> nào, ta có <img src='http://s.wordpress.com/latex.php?latex=%5Chat%7B%5Cbf%20A%7D%28c%20%5Csigma%20%2B%20%7B%5Cbf%20y%7D%29%20%3D%20c%5Csigma%20%2B%20%7B%5Cbf%20y%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat{\bf A}(c \sigma + {\bf y}) = c\sigma + {\bf y}' title='\hat{\bf A}(c \sigma + {\bf y}) = c\sigma + {\bf y}' class='latex' /> bởi vì <img src='http://s.wordpress.com/latex.php?latex=%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma' title='\sigma' class='latex' /> cũng là một <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />-eigenvector. Với <img src='http://s.wordpress.com/latex.php?latex=c&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c' title='c' class='latex' /> đủ lớn thì <img src='http://s.wordpress.com/latex.php?latex=c%5Csigma%2B%7B%5Cbf%20y%7D%20%5Cgeq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='c\sigma+{\bf y} \geq 0' title='c\sigma+{\bf y} \geq 0' class='latex' />. Sau khi normalize, ta kết luận rẳng tồn tại một phân bố cân bằng <img src='http://s.wordpress.com/latex.php?latex=%5Ctau%20%3D%20%5Calpha%28c%20%5Csigma%20%2B%20%7B%5Cbf%20y%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\tau = \alpha(c \sigma + {\bf y})' title='\tau = \alpha(c \sigma + {\bf y})' class='latex' />. Phân bố này khác <img src='http://s.wordpress.com/latex.php?latex=%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma' title='\sigma' class='latex' /> bởi vì <img src='http://s.wordpress.com/latex.php?latex=%5Csigma&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sigma' title='\sigma' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf y' title='\bf y' class='latex' /> là độc lập tuyến tính.</p>
<p>Kế tiếp, ta chứng minh rằng nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là bipartite thì giới hạn <img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clim_%7Bt%20%5Cto%20%5Cinfty%7D%20%5Cpi%5E%7B%28t%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lim_{t \to \infty} \pi^{(t)}' title='\displaystyle \lim_{t \to \infty} \pi^{(t)}' class='latex' /> không luôn tồn tại. Giả sử <img src='http://s.wordpress.com/latex.php?latex=G%3D%28U%2CV%3BE%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G=(U,V;E)' title='G=(U,V;E)' class='latex' />. Do <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular, dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%7CU%7C%3D%7CV%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|U|=|V|' title='|U|=|V|' class='latex' />. Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5EU&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^U' title='\pi^U' class='latex' /> là phân bố mà các đỉnh trong <img src='http://s.wordpress.com/latex.php?latex=U&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='U' title='U' class='latex' /> được gán xác suất <img src='http://s.wordpress.com/latex.php?latex=1%2F%7CU%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/|U|' title='1/|U|' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5EV&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^V' title='\pi^V' class='latex' /> là phân bố mà các đỉnh trong <img src='http://s.wordpress.com/latex.php?latex=V&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='V' title='V' class='latex' /> được gán xác suất <img src='http://s.wordpress.com/latex.php?latex=1%2F%7CV%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1/|V|' title='1/|V|' class='latex' />. Nếu ta bắt đầu random walk bằng <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5EU&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^U' title='\pi^U' class='latex' /> thì random walk sẽ giao động giữa <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5EU&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^U' title='\pi^U' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Cpi%5EV&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\pi^V' title='\pi^V' class='latex' />, không hội tụ.</p>
<div align=right>QED</div>
<p><strong>8.d.2. Random walk trên đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular, tốc độ hội tụ</strong></p>
<p>Chúng ta quan tâm hơn đến tốc độ hội tụ của random walk. Làm thế nào để đo tốc độ hội tụ về phân bố đều <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%201%7D%2Fn&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf 1}/n' title='{\bf 1}/n' class='latex' />? Về mặt xác suất, hàm khoảng cách (distance function) tự nhiên nhất có lẽ là <a href="http://en.wikipedia.org/wiki/Total_variation">total variation distance</a>. Cho hai phân bố <img src='http://s.wordpress.com/latex.php?latex=P&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='P' title='P' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=Q&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='Q' title='Q' class='latex' /> trên một không gian xác suất hữu hạn <img src='http://s.wordpress.com/latex.php?latex=%5COmega&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Omega' title='\Omega' class='latex' />, total variation distance giữa <img src='http://s.wordpress.com/latex.php?latex=P&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='P' title='P' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=Q&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='Q' title='Q' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%5Cmax_%7BS%20%5Csubset%20%5COmega%7D%20%7CP%28S%29%20-%20Q%28S%29%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\max_{S \subset \Omega} |P(S) - Q(S)|' title='\max_{S \subset \Omega} |P(S) - Q(S)|' class='latex' />. Khi <img src='http://s.wordpress.com/latex.php?latex=%5COmega&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Omega' title='\Omega' class='latex' /> là hữu hạn, không khó chứng minh được rằng <img src='http://s.wordpress.com/latex.php?latex=%20%5Cmax_%7BS%20%5Csubset%20%5COmega%7D%20%7CP%28S%29%20-%20Q%28S%29%7C%20%3D%20%5Cfrac%201%202%20%5C%7CP-Q%5C%7C_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \max_{S \subset \Omega} |P(S) - Q(S)| = \frac 1 2 \|P-Q\|_1' title=' \max_{S \subset \Omega} |P(S) - Q(S)| = \frac 1 2 \|P-Q\|_1' class='latex' />. (<strong>Bài tập:</strong> chứng minh điều này, nghĩa là total variation distance bằng một nửa <img src='http://s.wordpress.com/latex.php?latex=l_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='l_1' title='l_1' class='latex' />-norm, khi <img src='http://s.wordpress.com/latex.php?latex=%5COmega&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Omega' title='\Omega' class='latex' /> hữu hạn.) Như vậy, để đo tốc độ hội tụ, chúng ta có thể đo khoảng cách <img src='http://s.wordpress.com/latex.php?latex=%5C%7C%5Cpi%5E%7B%28t%29%7D%20-%20%7B%5Cbf%201%7D%2Fn%5C%7C_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\|\pi^{(t)} - {\bf 1}/n\|_1' title='\|\pi^{(t)} - {\bf 1}/n\|_1' class='latex' /> xem nó tiến đến <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> nhanh như thế nào.</p>
<blockquote><p><strong>Định lý. (Hội tụ theo <img src='http://s.wordpress.com/latex.php?latex=l_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='l_1' title='l_1' class='latex' />)</strong> Định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D%20%3D%20%7B%5Cbf%201%7D%2Fn&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u} = {\bf 1}/n' title='{\bf u} = {\bf 1}/n' class='latex' /> cho tiện. Ta có <img src='http://s.wordpress.com/latex.php?latex=%20%5C%7C%5Cpi%5E%7B%28t%29%7D-%5Cmathbf%20u%5C%7C_1%20%5Cleq%20%5Csqrt%20n%20%5Chat%5Clambda%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \|\pi^{(t)}-\mathbf u\|_1 \leq \sqrt n \hat\lambda^t' title=' \|\pi^{(t)}-\mathbf u\|_1 \leq \sqrt n \hat\lambda^t' class='latex' /></p></blockquote>
<p>Nhờ bất đẳng thức Cauchy-Schwarz, chúng ta chỉ cần chứng minh định lý sau đây là đủ</p>
<blockquote><p><strong>Định lý (Hội tụ theo <img src='http://s.wordpress.com/latex.php?latex=l_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='l_2' title='l_2' class='latex' />)</strong> <img src='http://s.wordpress.com/latex.php?latex=%20%5C%7C%5Cpi%5E%7B%28t%29%7D-%5Cmathbf%20u%5C%7C_2%20%5Cleq%20%5Chat%5Clambda%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt=' \|\pi^{(t)}-\mathbf u\|_2 \leq \hat\lambda^t' title=' \|\pi^{(t)}-\mathbf u\|_2 \leq \hat\lambda^t' class='latex' /></p></blockquote>
<p><em>Chứng minh.</em> Chú ý rằng <img src='http://s.wordpress.com/latex.php?latex=%20%20%5C%7C%5Cpi%5E%7B%28t%29%7D-%5Cmathbf%20u%5C%7C_2%20%3D%20%5C%7C%5Chat%7B%5Cmathbf%20A%7D%5Et%5Cpi%5E%7B%280%29%7D%20-%20%5Cmathbf%20u%5C%7C_2%20%3D%20%20%5C%7C%5Chat%7B%5Cmathbf%20A%7D%5Et%28%5Cpi%5E%7B%280%29%7D%20-%20%5Cmathbf%20u%29%5C%7C_2%20%3D%20%20%5C%7C%5Chat%7B%5Cmathbf%20A%7D%5Et%5Cmathbf%20v%5C%7C_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='  \|\pi^{(t)}-\mathbf u\|_2 = \|\hat{\mathbf A}^t\pi^{(0)} - \mathbf u\|_2 =  \|\hat{\mathbf A}^t(\pi^{(0)} - \mathbf u)\|_2 =  \|\hat{\mathbf A}^t\mathbf v\|_2' title='  \|\pi^{(t)}-\mathbf u\|_2 = \|\hat{\mathbf A}^t\pi^{(0)} - \mathbf u\|_2 =  \|\hat{\mathbf A}^t(\pi^{(0)} - \mathbf u)\|_2 =  \|\hat{\mathbf A}^t\mathbf v\|_2' class='latex' />. Trong đó, <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20v%20%3D%20%5Cpi%5E%7B%280%29%7D%20-%20%5Cmathbf%20u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf v = \pi^{(0)} - \mathbf u' title='\mathbf v = \pi^{(0)} - \mathbf u' class='latex' /> vuông góc với <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf u' title='\mathbf u' class='latex' /> and <img src='http://s.wordpress.com/latex.php?latex=%5C%7C%5Cmathbf%20v%5C%7C_2%20%5Cleq%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\|\mathbf v\|_2 \leq 1' title='\|\mathbf v\|_2 \leq 1' class='latex' />. (<strong>Bài tập:</strong> tại sao <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20v%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf v}' title='{\bf v}' class='latex' /> vuông góc với <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}' title='{\bf u}' class='latex' /> và có chiều dài <img src='http://s.wordpress.com/latex.php?latex=%5Cleq%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\leq 1' title='\leq 1' class='latex' />?). Kế hoạch của chúng ta sẽ là chứng minh rằng</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5C%7C%20%5Chat%20%7B%5Cbf%20A%7D%5Et%20%7B%5Cbf%20v%7D%5C%7C_2%20%5Cleq%20%5Chat%20%5Clambda%20%5C%7C%20%5Chat%20%7B%5Cbf%20A%7D%5E%7Bt-1%7D%20%7B%5Cbf%20v%7D%5C%7C_2%20%5Cleq%20%5Cdots%20%5Cleq%20%5Chat%5Clambda%5E%7Bt-1%7D%20%5C%7C%20%5Chat%20%7B%5Cbf%20A%7D%20%7B%5Cbf%20v%7D%5C%7C_2%20%5Cleq%20%5Chat%5Clambda%5Et%20%5C%7C%7B%5Cbf%20v%7D%5C%7C_2%20%5Cleq%20%5Chat%5Clambda%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \| \hat {\bf A}^t {\bf v}\|_2 \leq \hat \lambda \| \hat {\bf A}^{t-1} {\bf v}\|_2 \leq \dots \leq \hat\lambda^{t-1} \| \hat {\bf A} {\bf v}\|_2 \leq \hat\lambda^t \|{\bf v}\|_2 \leq \hat\lambda^t' title='\displaystyle \| \hat {\bf A}^t {\bf v}\|_2 \leq \hat \lambda \| \hat {\bf A}^{t-1} {\bf v}\|_2 \leq \dots \leq \hat\lambda^{t-1} \| \hat {\bf A} {\bf v}\|_2 \leq \hat\lambda^t \|{\bf v}\|_2 \leq \hat\lambda^t' class='latex' /></center></p>
<p>Để chứng minh điều này, trước hết ta chứng minh rằng mỗi lần ta nhân <img src='http://s.wordpress.com/latex.php?latex=%5Chat%7B%5Cmathbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat{\mathbf A}' title='\hat{\mathbf A}' class='latex' /> với một vector <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf y' title='\mathbf y' class='latex' /> vuông góc với <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf u' title='\mathbf u' class='latex' />, chúng ta &#8220;co rút&#8221; chiều dài của <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf y' title='\mathbf y' class='latex' /> lại một tỉ lệ ít nhất là <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda' title='\hat\lambda' class='latex' />. Cụ thể hơn, xét vector <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%200%20%5Cneq%20y%20%5Cperp%20u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf 0 \neq y \perp u' title='\bf 0 \neq y \perp u' class='latex' /> thì </p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5C%7C%5Chat%7B%5Cbf%20A%7D%7B%5Cbf%20y%7D%5C%7C_2%20%3D%20%5Csqrt%7B%5Clangle%20%5Chat%7B%5Cbf%20A%7D%7B%5Cbf%20y%7D%2C%20%5Chat%7B%5Cbf%20A%7D%7B%5Cbf%20y%7D%20%5Crangle%7D%20%3D%20%5Csqrt%7B%5Clangle%20%7B%5Cbf%20y%7D%2C%20%5Chat%7B%5Cbf%20A%7D%5E2%7B%5Cbf%20y%7D%20%5Crangle%7D%20%3D%20%5C%7C%7B%5Cbf%20y%7D%5C%7C_2%20%5Csqrt%7BR_%7B%5Chat%7B%5Cbf%20A%7D%5E2%7D%28%7B%5Cbf%20y%7D%29%7D%20%5Cleq%20%5Chat%20%5Clambda%20%5C%7C%7B%5Cbf%20y%7D%5C%7C_2%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \|\hat{\bf A}{\bf y}\|_2 = \sqrt{\langle \hat{\bf A}{\bf y}, \hat{\bf A}{\bf y} \rangle} = \sqrt{\langle {\bf y}, \hat{\bf A}^2{\bf y} \rangle} = \|{\bf y}\|_2 \sqrt{R_{\hat{\bf A}^2}({\bf y})} \leq \hat \lambda \|{\bf y}\|_2 ' title='\displaystyle \|\hat{\bf A}{\bf y}\|_2 = \sqrt{\langle \hat{\bf A}{\bf y}, \hat{\bf A}{\bf y} \rangle} = \sqrt{\langle {\bf y}, \hat{\bf A}^2{\bf y} \rangle} = \|{\bf y}\|_2 \sqrt{R_{\hat{\bf A}^2}({\bf y})} \leq \hat \lambda \|{\bf y}\|_2 ' class='latex' /></center></p>
<p>Cần giải thích bất đẳng thức cuối cùng rõ hơn một chút. Lưu ý rằng <img src='http://s.wordpress.com/latex.php?latex=R_%7B%5Chat%7B%5Cbf%20A%7D%5E2%7D%28%7B%5Cbf%20y%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='R_{\hat{\bf A}^2}({\bf y})' title='R_{\hat{\bf A}^2}({\bf y})' class='latex' /> là cái Rayleigh quotient của ma trận <img src='http://s.wordpress.com/latex.php?latex=%5Chat%7B%5Cbf%20A%7D%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat{\bf A}^2' title='\hat{\bf A}^2' class='latex' />. Các eigenvalues của ma trận này là bình phương các eigenvalues của <img src='http://s.wordpress.com/latex.php?latex=%5Chat%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat{\bf A}' title='\hat{\bf A}' class='latex' />. Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda^2' title='\hat\lambda^2' class='latex' /> là eigenvalue lớn nhì của <img src='http://s.wordpress.com/latex.php?latex=%5Chat%7B%5Cbf%20A%7D%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat{\bf A}^2' title='\hat{\bf A}^2' class='latex' />. Từ đó ta có bất đẳng thức cuối, vì <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf y' title='\bf y' class='latex' /> vuông góc với eigenvector thứ nhất. (Nhớ lại định lý tính eigenvalues bằng Rayleigh quotients trong bài trước.)</p>
<p><strong>Bài tập:</strong> chứng minh rằng với mọi số nguyên <img src='http://s.wordpress.com/latex.php?latex=j%20%5Cgeq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='j \geq 0' title='j \geq 0' class='latex' /> thì vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20y%7D%20%3D%20%5Chat%7B%5Cbf%20A%7D%5Ej%7B%5Cbf%20v%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf y} = \hat{\bf A}^j{\bf v}' title='{\bf y} = \hat{\bf A}^j{\bf v}' class='latex' /> vuông góc với <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf u' title='\bf u' class='latex' />.</p>
<p>Từ kết quả bài tập, áp dụng bất đẳng thức <img src='http://s.wordpress.com/latex.php?latex=%5C%7C%5Chat%7B%5Cbf%20A%7D%7B%5Cbf%20y%7D%5C%7C_2%20%5Cleq%20%5Chat%20%5Clambda%20%5C%7C%7B%5Cbf%20y%7D%5C%7C_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\|\hat{\bf A}{\bf y}\|_2 \leq \hat \lambda \|{\bf y}\|_2' title='\|\hat{\bf A}{\bf y}\|_2 \leq \hat \lambda \|{\bf y}\|_2' class='latex' /> đệ qui <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần là xong.</p>
<div align=right>QED</div>
<p><strong>8.d.3. Tốc độ hội tụ và spectral expanders</strong></p>
<p>Chúng ta đã thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda(G)' title='\hat\lambda(G)' class='latex' /> càng xa <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' /> thì tốc độ hội tụ của random walk càng lớn.</p>
<blockquote><p>
<strong>Định nghĩa. (Spectral expander)</strong> Một <img src='http://s.wordpress.com/latex.php?latex=%28n%2Cd%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(n,d,\alpha)' title='(n,d,\alpha)' class='latex' />-spectral expander là một đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> có <img src='http://s.wordpress.com/latex.php?latex=n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n' title='n' class='latex' /> đỉnh thỏa <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%28G%29%20%5Cleq%20%5Calpha&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda(G) \leq \alpha' title='\hat \lambda(G) \leq \alpha' class='latex' />. Ta cần <img src='http://s.wordpress.com/latex.php?latex=%28n%2Cd%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(n,d,\alpha)' title='(n,d,\alpha)' class='latex' />-spectral expanders với <img src='http://s.wordpress.com/latex.php?latex=%5Calpha&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha' title='\alpha' class='latex' /> càng nhỏ càng tốt.
</p></blockquote>
<p>Nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%28n%2Cd%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(n,d,\alpha)' title='(n,d,\alpha)' class='latex' />-spectral expander với <img src='http://s.wordpress.com/latex.php?latex=%5Calpha%20%3C%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha &lt; 1' title='\alpha &lt; 1' class='latex' /> là một hằng số thì <img src='http://s.wordpress.com/latex.php?latex=d-%5Clambda_2%20%5Cgeq%20d%5Calpha&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d-\lambda_2 \geq d\alpha' title='d-\lambda_2 \geq d\alpha' class='latex' />; do đó spectral gap của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> cũng lớn. </p>
<p>Ngược lại, nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> có spectral gap bị chặn dưới bởi một hằng số, ví dụ <img src='http://s.wordpress.com/latex.php?latex=d-%5Clambda_2%20%5Cgeq%20%5Cbeta%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d-\lambda_2 \geq \beta&gt;0' title='d-\lambda_2 \geq \beta&gt;0' class='latex' />, thì &#8230; chưa chắc <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> đã là một spectral expander; nguyên nhân chính là <img src='http://s.wordpress.com/latex.php?latex=d-%5Clambda_2%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d-\lambda_2&gt;0' title='d-\lambda_2&gt;0' class='latex' /> không nhất thiết dẫn tới <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda_n%3E-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda_n&gt;-1' title='\hat\lambda_n&gt;-1' class='latex' />. Nói cách khác, một đồ thị liên thông thì không liên quan đến tính bipartite của nó. May mà có một cách rất đơn giản để &#8220;sửa&#8221; <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> lại để cho nó chắc chắn không là bipartite.  Chúng ta thêm các self-loops vào tất cả các đỉnh của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Nói các khác, cộng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' /> vào mỗi entry trên đường chéo của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}' title='{\bf A}' class='latex' />. Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Clambda%27_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda&#039;_i' title='\lambda&#039;_i' class='latex' /> là các trị đặc trưng mới (sau khi thêm self-loops), có thể thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Clambda%27_i%20%3D%20%5Clambda_i%2B1%2C%20%5Cforall%20i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda&#039;_i = \lambda_i+1, \forall i' title='\lambda&#039;_i = \lambda_i+1, \forall i' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%27_i%20%3D%20%5Cfrac%7B%5Clambda_i%2B1%7D%7Bd%2B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda&#039;_i = \frac{\lambda_i+1}{d+1}' title='\hat \lambda&#039;_i = \frac{\lambda_i+1}{d+1}' class='latex' />. Từ đó, <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%27_2%20%5Cleq%20%5Cfrac%7Bd%2B1-%5Cbeta%7D%7Bd%2B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda&#039;_2 \leq \frac{d+1-\beta}{d+1}' title='\hat \lambda&#039;_2 \leq \frac{d+1-\beta}{d+1}' class='latex' />. Và, <img src='http://s.wordpress.com/latex.php?latex=%5Chat%20%5Clambda%27_n%20%5Cgeq%20%5Cfrac%7B-d%2B1%7D%7Bd%2B1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat \lambda&#039;_n \geq \frac{-d+1}{d+1}' title='\hat \lambda&#039;_n \geq \frac{-d+1}{d+1}' class='latex' />. Do đó, <img src='http://s.wordpress.com/latex.php?latex=%5Chat%5Clambda%27&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\hat\lambda&#039;' title='\hat\lambda&#039;' class='latex' /> cách &#8220;xa&#8221; <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> (sau &#8220;sửa chữa&#8221;) là một spectral expander. </p>
<p><strong>8.e. &#8220;Giam cầm&#8221; random walk trên expanders rất là khó.</strong></p>
<p>Bây giờ chúng ta thảo luận một ứng dụng rất quan trọng của expanders từ góc nhìn xác suất. Ứng dụng này đại khái nói rằng, xác suất mà một random walk ở mãi trong một tập đỉnh nhỏ sẽ giảm theo hàm mũ.</p>
<p>Gọi <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%28n%2Cd%2C%5Calpha%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(n,d,\alpha)' title='(n,d,\alpha)' class='latex' />-spectral expander, và <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> là một tập đỉnh của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=%7CB%7C%20%5Cleq%20%5Cbeta%20n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|B| \leq \beta n' title='|B| \leq \beta n' class='latex' />. Giả sử ta thực hiện một random walk trên đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />, bước <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> bước, với phân bố khởi điểm là phân bố đều (uniform distribution). Xác suất mà chúng ta không thăm đỉnh nào ngoài <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> là bao nhiêu?</p>
<blockquote><p>
<strong>Định lý (Khó &#8220;giam cầm&#8221; random walk trên expander). </strong> Gọi <img src='http://s.wordpress.com/latex.php?latex=%28B%2Ct%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(B,t)' title='(B,t)' class='latex' /> là sự kiện mà cái random walk bị giam giữ trong tập <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /> trong toàn bộ <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> bước. Ta có, <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5Cleft%5B%28B%2Ct%29%5Cright%5D%20%5Cleq%20%5Csqrt%5Cbeta%20%28%5Calpha%20%2B%20%281-%5Calpha%29%5Cbeta%29%5Et&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}\left[(B,t)\right] \leq \sqrt\beta (\alpha + (1-\alpha)\beta)^t' title='\text{Prob}\left[(B,t)\right] \leq \sqrt\beta (\alpha + (1-\alpha)\beta)^t' class='latex' />. Do đó, nếu <img src='http://s.wordpress.com/latex.php?latex=%5Calpha%2C%20%5Cbeta%20%3C%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\alpha, \beta &lt; 1' title='\alpha, \beta &lt; 1' class='latex' /> thì xác suất &#8220;giam cầm&#8221; này giảm theo hàm mũ.
</p></blockquote>
<p><em>Chứng minh.</em> Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20P%20%3D%20%28p_%7Bij%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf P = (p_{ij})' title='\mathbf P = (p_{ij})' class='latex' /> là ma trận &#8220;<em>chiếu vào <img src='http://s.wordpress.com/latex.php?latex=B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='B' title='B' class='latex' /></em>&#8220;, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=p_%7Bii%7D%20%3D%201%2C%20%5Cforall%20i%20%5Cin%20B&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p_{ii} = 1, \forall i \in B' title='p_{ii} = 1, \forall i \in B' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=p_%7Bij%7D%3D0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='p_{ij}=0' title='p_{ij}=0' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=i%2Cj&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i,j' title='i,j' class='latex' /> khác. Ta có:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Ctext%7BProb%7D%5Cleft%5B%28B%2Ct%29%5Cright%5D%20%3D%20%5C%7C%28%5Cmathbf%7BP%5Chat%20A%7D%29%5Et%5Cmathbf%7BPu%7D%5C%7C_1%20%3D%20%5C%7C%28%5Cmathbf%7BP%5Chat%20AP%7D%29%5Et%5Cmathbf%7BPu%7D%5C%7C_1%20%5Cleq%20%5Csqrt%20n%20%5C%7C%28%5Cmathbf%7BP%5Chat%20AP%7D%29%5Et%5Cmathbf%7BPu%7D%5C%7C_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \text{Prob}\left[(B,t)\right] = \|(\mathbf{P\hat A})^t\mathbf{Pu}\|_1 = \|(\mathbf{P\hat AP})^t\mathbf{Pu}\|_1 \leq \sqrt n \|(\mathbf{P\hat AP})^t\mathbf{Pu}\|_2' title='\displaystyle \text{Prob}\left[(B,t)\right] = \|(\mathbf{P\hat A})^t\mathbf{Pu}\|_1 = \|(\mathbf{P\hat AP})^t\mathbf{Pu}\|_1 \leq \sqrt n \|(\mathbf{P\hat AP})^t\mathbf{Pu}\|_2' class='latex' /><br />
</center></p>
<p><strong>Bài tập:</strong> chứng minh đẳng thức thứ nhất.</p>
<p>Đẳng thức thứ hai là do ma trận <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20P&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf P' title='\mathbf P' class='latex' /> là <a href="http://en.wikipedia.org/wiki/Idempotent">idempotent</a>. Bất đẳng thức cuối cùng là theo Cauchy-Schwarz. Để chặn <img src='http://s.wordpress.com/latex.php?latex=%5Ctext%7BProb%7D%5Cleft%5B%28B%2Ct%29%5Cright%5D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\text{Prob}\left[(B,t)\right]' title='\text{Prob}\left[(B,t)\right]' class='latex' /> chúng ta cần biết ma trận <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BM%20%3D%20P%5Chat%20AP%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{M = P\hat AP}' title='\mathbf{M = P\hat AP}' class='latex' /> <em>co rút</em> chiều dài một vector cỡ bao nhiêu sau mỗi lần nhân ma trận này vào vector. (Cái &#8220;mẹo&#8221; này chúng ta đã dùng trong phần trước.) Với mỗi vector <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20y%20%5Cneq%20%7B%5Cbf%200%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf y \neq {\bf 0}' title='\mathbf y \neq {\bf 0}' class='latex' />, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cfrac%7B%5C%7C%5Cmathbf%7BMy%7D%5C%7C%7D%7B%5C%7C%5Cmathbf%20y%5C%7C%7D%20%3D%20%5Csqrt%7BR_%7B%5Cbf%20M%5E2%7D%28%7B%5Cbf%20y%7D%29%7D%20%5Cleq%20%5Csqrt%7B%5Clambda_1%28%7B%5Cbf%20M%7D%5E2%29%7D%20%3D%20%5Clambda_1%28%7B%5Cbf%20M%7D%29%20%3D%20%5Cmax_%7B%5Cmathbf%20z%5Cneq%20%5Cmathbf%200%7D%20%5Cfrac%7B%5Cmathbf%20z%5ET%5Cmathbf%7BMz%7D%7D%7B%5Cmathbf%20z%5ET%5Cmathbf%20z%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \frac{\|\mathbf{My}\|}{\|\mathbf y\|} = \sqrt{R_{\bf M^2}({\bf y})} \leq \sqrt{\lambda_1({\bf M}^2)} = \lambda_1({\bf M}) = \max_{\mathbf z\neq \mathbf 0} \frac{\mathbf z^T\mathbf{Mz}}{\mathbf z^T\mathbf z}' title='\displaystyle \frac{\|\mathbf{My}\|}{\|\mathbf y\|} = \sqrt{R_{\bf M^2}({\bf y})} \leq \sqrt{\lambda_1({\bf M}^2)} = \lambda_1({\bf M}) = \max_{\mathbf z\neq \mathbf 0} \frac{\mathbf z^T\mathbf{Mz}}{\mathbf z^T\mathbf z}' class='latex' /></center></p>
<p>Đến đây, xét một vector <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20z%20%5Cneq%20%7B%5Cbf%200%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf z \neq {\bf 0}' title='\mathbf z \neq {\bf 0}' class='latex' /> bất kỳ. Đặt <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7Bx%20%3D%20Pz%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{x = Pz}' title='\mathbf{x = Pz}' class='latex' />. Thì, <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20z%5ET%5Cmathbf%7BMz%7D%20%3D%20%5Cmathbf%20z%5ET%5Cmathbf%7BP%5Chat%20APz%7D%20%3D%20%5Clangle%20%5Cmathbf%7B%5Chat%20Ax%2C%20x%7D%20%5Crangle&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf z^T\mathbf{Mz} = \mathbf z^T\mathbf{P\hat APz} = \langle \mathbf{\hat Ax, x} \rangle' title='\mathbf z^T\mathbf{Mz} = \mathbf z^T\mathbf{P\hat APz} = \langle \mathbf{\hat Ax, x} \rangle' class='latex' />. Trước hết, biểu diễn <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf x' title='\mathbf x' class='latex' /> thành tổ hợp tuyến tính của các eigenvectors trực chuẩn của <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7B%5Chat%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{\hat A}' title='\mathbf{\hat A}' class='latex' />: <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20x%20%3D%20c_1%5Cmathbf%20u_1%20%2B%20c_2%20%5Cmathbf%20u_2%20%2B%20%5Ccdots%20c_n%20%5Cmathbf%20u_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf x = c_1\mathbf u_1 + c_2 \mathbf u_2 + \cdots c_n \mathbf u_n' title='\mathbf x = c_1\mathbf u_1 + c_2 \mathbf u_2 + \cdots c_n \mathbf u_n' class='latex' />. Định nghĩa thành phần song song <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20x%5E%7B%5C%7C%7D%20%3D%20c_1%5Cmathbf%20u_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf x^{\|} = c_1\mathbf u_1' title='\mathbf x^{\|} = c_1\mathbf u_1' class='latex' /> với eigenvector thứ nhất, và thành phân vuông góc <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20x%5E%7B%5Cperp%7D%20%3D%20%5Cmathbf%7Bx-x%5E%7B%5C%7C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf x^{\perp} = \mathbf{x-x^{\|}}' title='\mathbf x^{\perp} = \mathbf{x-x^{\|}}' class='latex' />. Ta có,</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clangle%20%5Cmathbf%7B%5Chat%20Ax%2C%20x%7D%20%5Crangle%20%3D%20%5Clangle%20%5Cmathbf%7B%5Chat%20A%20x%5E%7B%5C%7C%7D%7D%20%2B%20%5Cmathbf%7B%5Chat%20A%20x%5E%7B%5Cperp%7D%7D%2C%20%5Cmathbf%20x%5E%7B%5C%7C%7D%20%2B%20%5Cmathbf%20x%5E%7B%5Cperp%7D%20%5Crangle%20%3D%20%5C%7C%5Cmathbf%20x%5E%7B%5C%7C%7D%5C%7C%5E2%20%2B%20%5Clangle%20%5Cmathbf%7B%5Chat%20A%20x%5E%5Cperp%2C%20x%5E%5Cperp%7D%20%5Crangle&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \langle \mathbf{\hat Ax, x} \rangle = \langle \mathbf{\hat A x^{\|}} + \mathbf{\hat A x^{\perp}}, \mathbf x^{\|} + \mathbf x^{\perp} \rangle = \|\mathbf x^{\|}\|^2 + \langle \mathbf{\hat A x^\perp, x^\perp} \rangle' title='\displaystyle \langle \mathbf{\hat Ax, x} \rangle = \langle \mathbf{\hat A x^{\|}} + \mathbf{\hat A x^{\perp}}, \mathbf x^{\|} + \mathbf x^{\perp} \rangle = \|\mathbf x^{\|}\|^2 + \langle \mathbf{\hat A x^\perp, x^\perp} \rangle' class='latex' /></center></p>
<p>Cái mẹo lần trước cho ta:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clangle%20%5Cmathbf%7B%5Chat%20A%20x%5E%5Cperp%2C%20x%5E%5Cperp%7D%20%5Crangle%20%3D%20%5C%7C%5Cmathbf%20x%5E%5Cperp%5C%7C%5E2%20%5Cfrac%7B%5Clangle%20%5Cmathbf%7B%5Chat%20A%20x%5E%5Cperp%2C%20x%5E%5Cperp%7D%20%5Crangle%7D%7B%5C%7C%5Cmathbf%20x%5E%5Cperp%5C%7C%5E2%7D%20%5Cleq%20%5Chat%5Clambda%20%5C%7C%5Cmathbf%20x%5E%5Cperp%5C%7C%5E2%20%5Cleq%20%5Calpha%20%5Cleft%28%20%5C%7C%7B%5Cbf%20x%7D%5C%7C%5E2%20-%20%5C%7C%5Cmathbf%20x%5E%7B%5C%7C%7D%5C%7C%5E2%5Cright%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \langle \mathbf{\hat A x^\perp, x^\perp} \rangle = \|\mathbf x^\perp\|^2 \frac{\langle \mathbf{\hat A x^\perp, x^\perp} \rangle}{\|\mathbf x^\perp\|^2} \leq \hat\lambda \|\mathbf x^\perp\|^2 \leq \alpha \left( \|{\bf x}\|^2 - \|\mathbf x^{\|}\|^2\right)' title='\displaystyle \langle \mathbf{\hat A x^\perp, x^\perp} \rangle = \|\mathbf x^\perp\|^2 \frac{\langle \mathbf{\hat A x^\perp, x^\perp} \rangle}{\|\mathbf x^\perp\|^2} \leq \hat\lambda \|\mathbf x^\perp\|^2 \leq \alpha \left( \|{\bf x}\|^2 - \|\mathbf x^{\|}\|^2\right)' class='latex' /></center></p>
<p>Áp dụng bất đẳng thức <a href="http://en.wikipedia.org/wiki/Cauchy%E2%80%93Schwarz_inequality">Cauchy-Schwarz</a>, ta có <img src='http://s.wordpress.com/latex.php?latex=%5C%7C%5Cmathbf%20x%5E%7B%5C%7C%7D%5C%7C%5E2%20%3D%20c_1%5E2%20%3D%20%5Clangle%20%5Cmathbf%20x%2C%20%5Cmathbf%20u_1%5Crangle%5E2%20%5Cleq%20%5Cbeta%20%5C%7C%5Cmathbf%20x%5C%7C%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\|\mathbf x^{\|}\|^2 = c_1^2 = \langle \mathbf x, \mathbf u_1\rangle^2 \leq \beta \|\mathbf x\|^2' title='\|\mathbf x^{\|}\|^2 = c_1^2 = \langle \mathbf x, \mathbf u_1\rangle^2 \leq \beta \|\mathbf x\|^2' class='latex' />, và do đó</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clangle%20%5Cmathbf%7B%5Chat%20Ax%2C%20x%7D%20%5Crangle%20%5Cleq%20%5Calpha%5C%7C%5Cmathbf%20x%5C%7C%5E2%20%2B%20%281-%5Calpha%29%5C%7C%5Cmathbf%20x%5E%5C%7C%5C%7C%5E2%20%5Cleq%20%28%5Calpha%20%2B%20%281-%5Calpha%29%5Cbeta%29%5C%7C%5Cmathbf%20x%5C%7C%5E2%20%5Cleq%20%28%5Calpha%20%2B%20%281-%5Calpha%29%5Cbeta%29%5C%7C%5Cmathbf%20z%5C%7C%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \langle \mathbf{\hat Ax, x} \rangle \leq \alpha\|\mathbf x\|^2 + (1-\alpha)\|\mathbf x^\|\|^2 \leq (\alpha + (1-\alpha)\beta)\|\mathbf x\|^2 \leq (\alpha + (1-\alpha)\beta)\|\mathbf z\|^2' title='\displaystyle \langle \mathbf{\hat Ax, x} \rangle \leq \alpha\|\mathbf x\|^2 + (1-\alpha)\|\mathbf x^\|\|^2 \leq (\alpha + (1-\alpha)\beta)\|\mathbf x\|^2 \leq (\alpha + (1-\alpha)\beta)\|\mathbf z\|^2' class='latex' /></center></p>
<p>Vì thế, mỗi lần chúng ta nhân <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20M&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf M' title='\mathbf M' class='latex' /> vào vector <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf y' title='\mathbf y' class='latex' /> (có nghĩa là áp dụng phép biến đổi tuyến tính tương ứng vào <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf y' title='\bf y' class='latex' />) chúng ta giảm chiều dài của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20y&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf y' title='\bf y' class='latex' /> một tỉ lệ ít nhất là <img src='http://s.wordpress.com/latex.php?latex=%28%5Calpha%20%2B%20%281-%5Calpha%29%5Cbeta%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(\alpha + (1-\alpha)\beta)' title='(\alpha + (1-\alpha)\beta)' class='latex' />. Chúng ta sẽ áp dụng <img src='http://s.wordpress.com/latex.php?latex=t&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t' title='t' class='latex' /> lần, và vector đầu tiên <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%7BPu%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf{Pu}' title='\mathbf{Pu}' class='latex' /> có chiều dài <img src='http://s.wordpress.com/latex.php?latex=%5Csqrt%7B%5Cbeta%2Fn%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sqrt{\beta/n}' title='\sqrt{\beta/n}' class='latex' />. Định lý đã được chứng minh xong.</p>
<div align=right>QED</div>
<p>Lần tới, chúng ta sẽ xét một vài ví dụ về ứng dụng của định lý trên và của expanders trong việc tiết kiệm random bits và khuếch đại gap trong các PCP reductions.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2009/05/29/pcp7/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>PCP 6 &#8212; Expanders: góc nhìn đại số</title>
		<link>http://www.procul.org/blog/2009/05/22/pcp6/</link>
		<comments>http://www.procul.org/blog/2009/05/22/pcp6/#comments</comments>
		<pubDate>Fri, 22 May 2009 22:32:59 +0000</pubDate>
		<dc:creator>NQH</dc:creator>
				<category><![CDATA[Lý thuyết tính toán]]></category>
		<category><![CDATA[Thuật Toán]]></category>
		<category><![CDATA[Expanders]]></category>
		<category><![CDATA[PCP]]></category>
		<category><![CDATA[xác suất]]></category>
		<category><![CDATA[Đại số tuyến tính]]></category>

		<guid isPermaLink="false">http://www.procul.org/blog/?p=1298</guid>
		<description><![CDATA[8.c. Algebraic graph theory và spectral expansion Để định nghĩa expanders từ góc nhìn đại số, ta cần biết một chút về algebraic graph theory và đại số tuyến tính. Về AGT thì tôi giới thiệu 2 quyển sau đây: Algebraic Graph Theory của Biggs, Spectral Graph Theory của Fan Chung. Về đại số tuyến [...]]]></description>
			<content:encoded><![CDATA[<p><strong>8.c. Algebraic graph theory và spectral expansion</strong></p>
<p>Để định nghĩa expanders từ góc nhìn đại số, ta cần biết một chút về algebraic graph theory và đại số tuyến tính. Về AGT thì tôi giới thiệu 2 quyển sau đây: <a href="http://www.amazon.com/gp/product/0521458978?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0521458978">Algebraic Graph Theory</a><img src="http://www.assoc-amazon.com/e/ir?t=bk06d-20&#038;l=as2&#038;o=1&#038;a=0521458978" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" /> của Biggs, <a href="http://www.amazon.com/gp/product/0821803158?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0821803158">Spectral Graph Theory</a><img src="http://www.assoc-amazon.com/e/ir?t=bk06d-20&#038;l=as2&#038;o=1&#038;a=0821803158" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" /> của Fan Chung. Về đại số tuyến tính thì quyển tôi thích nhất vẫn là <a href="http://www.amazon.com/gp/product/0521386322?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0521386322">Matrix Analysis</a><img src="http://www.assoc-amazon.com/e/ir?t=bk06d-20&#038;l=as2&#038;o=1&#038;a=0521386322" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" /> của Horn và Johnson, kế đến là <a href="http://www.amazon.com/gp/product/0980232716?ie=UTF8&#038;tag=bk06d-20&#038;linkCode=as2&#038;camp=1789&#038;creative=9325&#038;creativeASIN=0980232716">Introduction to Linear Algebra, Fourth Edition</a><img src="http://www.assoc-amazon.com/e/ir?t=bk06d-20&#038;l=as2&#038;o=1&#038;a=0980232716" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" /> của Strang. Nếu bạn nóng lòng thì có thể đọc <a href="http://www.cse.buffalo.edu/%7Ehungngo/classes/2007/Network%20Coding/notes/LA-intro.pdf">lecture note</a> này của tôi cũng đủ.</p>
<p>Trong bài này, chúng ta sẽ chứng minh cái gọi là bất đẳng thức Cheeger-Alon-Milman. Bất đẳng thức này cho thấy sự &#8220;tương đương&#8221; của hai số đo: edge-expansion rate và spectral gap, theo nghĩa là: <img src='http://s.wordpress.com/latex.php?latex=h%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='h(G)' title='h(G)' class='latex' /> càng lớn thì spectral gap của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> càng lớn và ngược lại. </p>
<p>Spectral gap là gì? Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> là adjacency matrix của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Do ma trận này là ma trận thực và đối xứng, nó có đủ bộ eigenvectors vuông góc nhau và các eigenvalues đều là số thực. (Xem thêm bài <a href="http://www.procul.org/blog/2007/10/23/eigen/">Trị đặc trưng và vector đặc trưng</a>.) Gọi các eigenvalues của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%5Cgeq%20%5Clambda_2%20%5Cdots%20%5Cgeq%20%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 \geq \lambda_2 \dots \geq \lambda_n' title='\lambda_1 \geq \lambda_2 \dots \geq \lambda_n' class='latex' />. Chúng ta cũng sẽ gọi chúng là eigenvalues của đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Khi <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular graph thì <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%3D%20d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 = d' title='\lambda_1 = d' class='latex' />. Spectral gap là khoảng cách giữa <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_2' title='\lambda_2' class='latex' />, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=d-%5Clambda_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d-\lambda_2' title='d-\lambda_2' class='latex' />.</p>
<blockquote><p><strong>Định lý Cheeger-Alon-Milman</strong>. Với mọi đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cfrac%7Bd-%5Clambda_2%7D%7B2%7D%20%5Cleq%20h%28G%29%20%5Cleq%20%5Csqrt%7B2d%28d-%5Clambda_2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\frac{d-\lambda_2}{2} \leq h(G) \leq \sqrt{2d(d-\lambda_2)}' title='\frac{d-\lambda_2}{2} \leq h(G) \leq \sqrt{2d(d-\lambda_2)}' class='latex' /></center>
</p></blockquote>
<p><span id="more-1298"></span></p>
<p><strong>8.c.1. Hai định lý quan trọng của đại số tuyến tính</strong></p>
<blockquote><p>
<strong>Định lý. (Tính eigenvalues dùng Rayleigh quotient)</strong></p>
<p>Xét một ma trận thực và đối xứng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}' title='{\bf A}' class='latex' /> với eigenvalues <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%5Cgeq%20%5Cdots%20%5Cgeq%20%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 \geq \dots \geq \lambda_n' title='\lambda_1 \geq \dots \geq \lambda_n' class='latex' />. Gọi các orthonormal eigenvectors tương ứng là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D_1%2C%20%5Cdots%2C%20%7B%5Cbf%20u%7D_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}_1, \dots, {\bf u}_n' title='{\bf u}_1, \dots, {\bf u}_n' class='latex' />. Định nghĩa thương số Rayleigh như sau:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20R_%7B%7B%5Cbf%20A%7D%7D%28%7B%5Cbf%20x%7D%29%20%20%3D%20%5Cfrac%7B%7B%5Cbf%20x%7D%5ET%7B%5Cbf%20A%7D%7B%5Cbf%20x%7D%7D%7B%7B%5Cbf%20x%7D%5ET%7B%5Cbf%20x%7D%7D%2C%20%5C%20%5C%20%7B%5Cbf%20x%7D%20%5Cin%20%5Cmathbb%20R%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle R_{{\bf A}}({\bf x})  = \frac{{\bf x}^T{\bf A}{\bf x}}{{\bf x}^T{\bf x}}, \ \ {\bf x} \in \mathbb R^n' title='\displaystyle R_{{\bf A}}({\bf x})  = \frac{{\bf x}^T{\bf A}{\bf x}}{{\bf x}^T{\bf x}}, \ \ {\bf x} \in \mathbb R^n' class='latex' /></center></p>
<p>Ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clambda_1%20%3D%20%5Cmax_%7B%7B%5Cbf%20x%7D%20%5Cneq%20%7B%5Cbf%200%7D%7D%20R_%7B%7B%5Cbf%20A%7D%7D%28%7B%5Cbf%20x%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lambda_1 = \max_{{\bf x} \neq {\bf 0}} R_{{\bf A}}({\bf x})' title='\displaystyle \lambda_1 = \max_{{\bf x} \neq {\bf 0}} R_{{\bf A}}({\bf x})' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clambda_n%20%3D%20%5Cmin_%7B%7B%5Cbf%20x%7D%20%5Cneq%20%7B%5Cbf%200%7D%7D%20R_%7B%7B%5Cbf%20A%7D%7D%28%7B%5Cbf%20x%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lambda_n = \min_{{\bf x} \neq {\bf 0}} R_{{\bf A}}({\bf x})' title='\displaystyle \lambda_n = \min_{{\bf x} \neq {\bf 0}} R_{{\bf A}}({\bf x})' class='latex' /></center></p>
<p>Tổng quát hơn, với mọi <img src='http://s.wordpress.com/latex.php?latex=1%20%5Cleq%20k%20%5Cleq%20n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1 \leq k \leq n' title='1 \leq k \leq n' class='latex' /> ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clambda_k%20%3D%20%5Cmax_%7B%5Csubstack%7B%7B%5Cbf%20x%7D%20%5Cneq%20%7B%5Cbf%200%7D%20%5C%5C%20%7B%5Cbf%20x%7D%20%5Cperp%20%7B%5Cbf%20u%7D_1%2C%5Cdots%2C%20%7B%5Cbf%20u%7D_%7Bk-1%7D%7D%7D%20R_%7B%7B%5Cbf%20A%7D%7D%28%7B%5Cbf%20x%7D%29%20%3D%20%5Cmin_%7B%5Csubstack%7B%7B%5Cbf%20x%7D%20%5Cneq%20%7B%5Cbf%200%7D%20%5C%5C%20%7B%5Cbf%20x%7D%20%5Cperp%20%7B%5Cbf%20u%7D_%7Bk%2B1%7D%2C%5Cdots%2C%20%7B%5Cbf%20u%7D_%7Bn%7D%7D%7D%20R_%7B%7B%5Cbf%20A%7D%7D%28%7B%5Cbf%20x%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lambda_k = \max_{\substack{{\bf x} \neq {\bf 0} \\ {\bf x} \perp {\bf u}_1,\dots, {\bf u}_{k-1}}} R_{{\bf A}}({\bf x}) = \min_{\substack{{\bf x} \neq {\bf 0} \\ {\bf x} \perp {\bf u}_{k+1},\dots, {\bf u}_{n}}} R_{{\bf A}}({\bf x})' title='\displaystyle \lambda_k = \max_{\substack{{\bf x} \neq {\bf 0} \\ {\bf x} \perp {\bf u}_1,\dots, {\bf u}_{k-1}}} R_{{\bf A}}({\bf x}) = \min_{\substack{{\bf x} \neq {\bf 0} \\ {\bf x} \perp {\bf u}_{k+1},\dots, {\bf u}_{n}}} R_{{\bf A}}({\bf x})' class='latex' /></center>
</p></blockquote>
<p>Định lý thứ hai gọi là <a href="http://pcpcourse.wordpress.com/2008/09/21/some-linear-algebra/">định lý Perron-Frobenius</a> có hai phiên bản, phiên bản cho các ma trận dương, và phiên bản cho các ma trận không âm. Chúng tương tự nhau. Trong bài này chúng ta chỉ cần phiên bản cho các ma trận không âm. Cho một ma trận không âm <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> tùy ý, định nghĩa <em>spectral radius</em> của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}' title='{\bf A}' class='latex' /> <img src='http://s.wordpress.com/latex.php?latex=%5Crho%28%7B%5Cbf%20A%7D%29%20%3A%3D%20%5Cmax%20%5C%7B%20%7C%5Clambda%7C%20%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\rho({\bf A}) := \max \{ |\lambda| \}' title='\rho({\bf A}) := \max \{ |\lambda| \}' class='latex' /> là <a href="http://en.wikipedia.org/wiki/Absolute_value">modulus</a> lớn nhất của các eigenvalues của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}' title='{\bf A}' class='latex' />. (Các eigenvalues có thể phức.)</p>
<blockquote><p>
<strong>Định lý Perron-Frobenius cho các ma trận không âm</strong>. Cho một ma trận không âm <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> với spectral radius <img src='http://s.wordpress.com/latex.php?latex=%5Crho&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\rho' title='\rho' class='latex' />. Ta có</p>
<ul>
<li> <img src='http://s.wordpress.com/latex.php?latex=%5Crho&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\rho' title='\rho' class='latex' /> là một eigenvalue của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}' title='{\bf A}' class='latex' />
<li> Tồn tại một <img src='http://s.wordpress.com/latex.php?latex=%5Crho&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\rho' title='\rho' class='latex' />-eigenvector không âm
</ul>
</blockquote>
<p><strong>8.c.2. Giới thiệu Algebraic Graph Theory</strong></p>
<p>Để chứng minh định lý Cheeger-Alon-Milman, trước hết hãy duyệt qua algebraic graph theory một chút. Bộ eigenvalues <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%5Cgeq%20%5Clambda_2%20%5Cgeq%20%5Cdots%20%5Cgeq%20%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_n' title='\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_n' class='latex' /> được gọi là <em>spectrum</em> của đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Ta dùng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}_i' title='{\bf u}_i' class='latex' /> để ký hiệu eigenvector tương ứng với <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_i' title='\lambda_i' class='latex' />. Không mất tính tổng quát, giả sử bộ vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20u%7D_1%2C%20%5Cdots%2C%20%7B%5Cbf%20u%7D_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf u}_1, \dots, {\bf u}_n' title='{\bf u}_1, \dots, {\bf u}_n' class='latex' /> là một hệ cơ sở trực chuẩn (orthonormal). Cái spectrum của một đồ thị chứa khá nhiều thông tin về cái đồ thị đó. </p>
<blockquote><p><strong>Định lý</strong>. Gọi <img src='http://s.wordpress.com/latex.php?latex=%5CDelta%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Delta(G)' title='\Delta(G)' class='latex' /> là max-degree của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Nhớ là ta vẫn giả sử <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%5Cgeq%20%5Clambda_2%20%5Cgeq%20%5Cdots%20%5Cgeq%20%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_n' title='\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_n' class='latex' />. Ta có:</p>
<ul>
<li> (i) <img src='http://s.wordpress.com/latex.php?latex=%7C%5Clambda_i%7C%20%5Cleq%20%5Clambda_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|\lambda_i| \leq \lambda_1' title='|\lambda_i| \leq \lambda_1' class='latex' />, với mọi <img src='http://s.wordpress.com/latex.php?latex=i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='i' title='i' class='latex' />
<li> (ii) <img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cfrac%7B2%7CE%28G%29%7C%7D%7Bn%7D%20%5Cleq%20%5Clambda_1%20%5Cleq%20%5CDelta%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \frac{2|E(G)|}{n} \leq \lambda_1 \leq \Delta(G)' title='\displaystyle \frac{2|E(G)|}{n} \leq \lambda_1 \leq \Delta(G)' class='latex' />.
<li> (iii) Spectrum của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> đối xứng xung quanh <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là bipartite. (Đối xứng quanh <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%20%3D%20-%5Clambda_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1 = -\lambda_n' title='\lambda_1 = -\lambda_n' class='latex' />, <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_2%20%3D%20-%20%5Clambda_%7Bn-1%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_2 = - \lambda_{n-1}' title='\lambda_2 = - \lambda_{n-1}' class='latex' />, vân vân.) Do đó, nếu <img src='http://s.wordpress.com/latex.php?latex=%7C%5Clambda_n%7C%20%3C%20%5Clambda_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|\lambda_n| &lt; \lambda_1' title='|\lambda_n| &lt; \lambda_1' class='latex' /> thì đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không phải là bipartite.
</ul>
</blockquote>
<p><em>Chứng minh</em>. Theo định lý Perron-Frobenius thì <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1' title='\lambda_1' class='latex' /> chính là spectral radius của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> &#8212; phần <em>(i)</em> đã được chứng minh.</p>
<p>Để chứng minh phần <em>(ii)</em>, lưu ý rằng việc <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf x' title='\bf x' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%5Clambda&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda' title='\lambda' class='latex' />-eigenvector của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> (nghĩa là <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20Ax%7D%20%3D%20%5Clambda%20%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf Ax} = \lambda \bf x' title='{\bf Ax} = \lambda \bf x' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20x%20%5Cneq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf x \neq 0' title='\bf x \neq 0' class='latex' />) tương đương với đẳng thức sau đây:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clambda%20x_u%20%3D%20%5Csum_%7Bv%20%5Cin%20%5CGamma%28u%29%7D%20a_%7Buv%7D%20x_v%2C%20%5Cforall%20u%20%5Cin%20V%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lambda x_u = \sum_{v \in \Gamma(u)} a_{uv} x_v, \forall u \in V(G)' title='\displaystyle \lambda x_u = \sum_{v \in \Gamma(u)} a_{uv} x_v, \forall u \in V(G)' class='latex' />. </center></p>
<p>Sở dĩ ta phải để <img src='http://s.wordpress.com/latex.php?latex=a_%7Buv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a_{uv}' title='a_{uv}' class='latex' /> ở đó là vì đồ thị <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> có thể có nhiều cạnh giữa <img src='http://s.wordpress.com/latex.php?latex=u%2Cv&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='u,v' title='u,v' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=a_%7Buv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a_{uv}' title='a_{uv}' class='latex' /> là số cạnh giữa <img src='http://s.wordpress.com/latex.php?latex=u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='u' title='u' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v' title='v' class='latex' />. Nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là đồ thị đơn thì không cần <img src='http://s.wordpress.com/latex.php?latex=a_%7Buv%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='a_{uv}' title='a_{uv}' class='latex' /> trong biểu thức trên, vì ta đã tính tổng qua các <img src='http://s.wordpress.com/latex.php?latex=v%20%5Cin%20%5CGamma%28u%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v \in \Gamma(u)' title='v \in \Gamma(u)' class='latex' /> rồi. (Cũng nhớ là <img src='http://s.wordpress.com/latex.php?latex=%5CGamma%28u%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\Gamma(u)' title='\Gamma(u)' class='latex' /> là tập các đỉnh kề với <img src='http://s.wordpress.com/latex.php?latex=u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='u' title='u' class='latex' />.) Từ đây chứng minh <em>(ii)</em> rất dễ. Gọi <img src='http://s.wordpress.com/latex.php?latex=u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='u' title='u' class='latex' /> là đỉnh mà <img src='http://s.wordpress.com/latex.php?latex=%7Cx_u%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|x_u|' title='|x_u|' class='latex' /> lớn nhất trong các đỉnh. Dĩ nhiên <img src='http://s.wordpress.com/latex.php?latex=x_u%5Cneq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_u\neq 0' title='x_u\neq 0' class='latex' /> vì <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf x' title='\bf x' class='latex' /> là eigenvector. Ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%7C%5Clambda%7C%20%7Cx_u%7C%20%5Cleq%20%5Csum_%7Bv%20%5Cin%20%5CGamma%28u%29%7D%20a_%7Buv%7D%20%7Cx_v%7C%20%5Cleq%20%5Ctext%7Bdeg%7D%28u%29%20%7Cx_u%7C%20%5Cleq%20%5CDelta%28G%29%20%7Cx_u%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle |\lambda| |x_u| \leq \sum_{v \in \Gamma(u)} a_{uv} |x_v| \leq \text{deg}(u) |x_u| \leq \Delta(G) |x_u|' title='\displaystyle |\lambda| |x_u| \leq \sum_{v \in \Gamma(u)} a_{uv} |x_v| \leq \text{deg}(u) |x_u| \leq \Delta(G) |x_u|' class='latex' />. </center></p>
<p>Do bất đẳng thức đúng với mọi eigenvalue <img src='http://s.wordpress.com/latex.php?latex=%5Clambda&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda' title='\lambda' class='latex' /> của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />, ta kết luận <img src='http://s.wordpress.com/latex.php?latex=%7C%5Clambda_1%7C%20%5Cleq%20%5CDelta%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|\lambda_1| \leq \Delta(G)' title='|\lambda_1| \leq \Delta(G)' class='latex' />. Bây giờ ta chặn dưới <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1' title='\lambda_1' class='latex' />. Ta dùng định lý tính eigenvalues bằng thương số Rayleigh như đã phát biểu ở trên. Gọi <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf 1' title='\bf 1' class='latex' /> là vector mà tất cả các tọa độ đều bằng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />. Ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clambda_1%20%5Cgeq%20%5Cfrac%7B%7B%5Cbf%201%7D%5ET%7B%5Cbf%20A%201%7D%7D%7B%7B%5Cbf%201%7D%5ET%7B%5Cbf%201%7D%7D%20%3D%20%5Cfrac%7B2%7CE%28G%29%7C%7D%7Bn%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lambda_1 \geq \frac{{\bf 1}^T{\bf A 1}}{{\bf 1}^T{\bf 1}} = \frac{2|E(G)|}{n} ' title='\displaystyle \lambda_1 \geq \frac{{\bf 1}^T{\bf A 1}}{{\bf 1}^T{\bf 1}} = \frac{2|E(G)|}{n} ' class='latex' /></center></p>
<p>Chú ý rằng chặn dưới này là degree trung bình của đồ thị, và nó chặt vì chặn dưới bằng chặn trên khi đồ thị là regular. Thật ra chúng ta vừa chứng minh một bất đẳng thức cơ bản của bất kỳ ma trận thực đối xứng nào: <img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Clambda_%7B%5Cmax%7D%28%7B%5Cbf%20A%7D%29%20%5Cgeq%20%5Cfrac%201%20n%20%5Csum_i%20%5Csum_j%20a_%7Bij%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \lambda_{\max}({\bf A}) \geq \frac 1 n \sum_i \sum_j a_{ij}' title='\displaystyle \lambda_{\max}({\bf A}) \geq \frac 1 n \sum_i \sum_j a_{ij}' class='latex' />.</p>
<p>Bây giờ đến phần <em>(iii)</em>. Giả sử <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là bipartite trước. Có thể thêm vào một số đỉnh đơn lẻ để hai bên của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> có số đỉnh bằng nhau. (&#8220;Hậu quả&#8221; của việc thêm vào một số đỉnh lẻ là thêm một số eigenvalues bằng <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' />, không ảnh hưởng đến kết luận.) Khi đó, có thể viết <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> dưới dạng <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D%20%3D%20%5Cbegin%7Bbmatrix%7D%200%20%26%20%7B%5Cbf%20B%7D%5C%5C%20%7B%5Cbf%20B%7D%5ET%20%26%200%20%5Cend%7Bbmatrix%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A} = \begin{bmatrix} 0 &amp; {\bf B}\\ {\bf B}^T &amp; 0 \end{bmatrix}' title='{\bf A} = \begin{bmatrix} 0 &amp; {\bf B}\\ {\bf B}^T &amp; 0 \end{bmatrix}' class='latex' />. Dễ thấy rằng <img src='http://s.wordpress.com/latex.php?latex=%5Cbegin%7Bbmatrix%7D%20%7B%5Cbf%20x%7D%20%5C%5C%20%7B%5Cbf%20y%7D%20%5Cend%7Bbmatrix%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\begin{bmatrix} {\bf x} \\ {\bf y} \end{bmatrix}' title='\begin{bmatrix} {\bf x} \\ {\bf y} \end{bmatrix}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%5Clambda&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda' title='\lambda' class='latex' />-eigenvector của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=%5Cbegin%7Bbmatrix%7D%20%7B%5Cbf%20x%7D%20%5C%5C%20%7B%5Cbf%20-y%7D%20%5Cend%7Bbmatrix%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\begin{bmatrix} {\bf x} \\ {\bf -y} \end{bmatrix}' title='\begin{bmatrix} {\bf x} \\ {\bf -y} \end{bmatrix}' class='latex' /> là một <img src='http://s.wordpress.com/latex.php?latex=%28-%5Clambda%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(-\lambda)' title='(-\lambda)' class='latex' />-eigenvector của <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20A&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf A' title='\bf A' class='latex' />. Từ đó kết luận rằng <img src='http://s.wordpress.com/latex.php?latex=%5Clambda&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda' title='\lambda' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=-%5Clambda&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='-\lambda' title='-\lambda' class='latex' /> có cùng multiplicity trong spectrum. (<strong>Bài tập:</strong> tại sao?)</p>
<p>Ngược lại, giả sử cái spectrum của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> đối xứng qua <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' />. Chú ý rằng, với mọi số nguyên dương <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' />, bộ eigenvalues của <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20A%7D%5Ek&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf A}^k' title='{\bf A}^k' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%5Ek%2C%20%5Cdots%2C%20%5Clambda_n%5Ek&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1^k, \dots, \lambda_n^k' title='\lambda_1^k, \dots, \lambda_n^k' class='latex' /> &#8212; vẫn đối xứng qua <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> nếu <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' /> lẻ. Do đó, trace<img src='http://s.wordpress.com/latex.php?latex=%28%7B%5Cbf%20A%7D%5Ek%29%20%3D%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='({\bf A}^k) = 0' title='({\bf A}^k) = 0' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' /> lẻ. Nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> không phải là bipartite thì <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> phải có một cycle chiều dài lẻ, do đó trace<img src='http://s.wordpress.com/latex.php?latex=%28%7B%5Cbf%20A%7D%5Ek%29%20%5Cneq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='({\bf A}^k) \neq 0' title='({\bf A}^k) \neq 0' class='latex' /> với <img src='http://s.wordpress.com/latex.php?latex=k&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='k' title='k' class='latex' /> lẻ nào đó. (<strong>Bài tập:</strong> tại sao?)</p>
<div align=right>QED</div>
<p><strong>Bài tập.</strong> Chứng minh rằng spectrum của <img src='http://s.wordpress.com/latex.php?latex=K_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='K_n' title='K_n' class='latex' /> là <img src='http://s.wordpress.com/latex.php?latex=n-1%2C-1%2C%5Cdots%2C-1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='n-1,-1,\dots,-1' title='n-1,-1,\dots,-1' class='latex' /></p>
<p><strong>Bài tập.</strong> Hai đồ thị là <em>co-spectral</em> nếu chúng có cùng spectrum. Xây dựng một ví dụ hai đồ thị co-spectral nhưng không isomorphic. </p>
<blockquote><p><strong>Định lý</strong>. Xét một đồ thị <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-regular <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />.</p>
<ul>
<li> (i) <img src='http://s.wordpress.com/latex.php?latex=%5Clambda_1%3Dd&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\lambda_1=d' title='\lambda_1=d' class='latex' />, và <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20u_1%20%3D%20%5Cfrac%7B%5Cbf%201%7D%7B%5Csqrt%20n%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf u_1 = \frac{\bf 1}{\sqrt n}' title='\bf u_1 = \frac{\bf 1}{\sqrt n}' class='latex' />. Trong đó <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf 1' title='\bf 1' class='latex' /> ký hiệu vector mà tất cả các tọa độ đều bằng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />.
<li> (ii) <img src='http://s.wordpress.com/latex.php?latex=d%20%3E%20%5Clambda_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d &gt; \lambda_2' title='d &gt; \lambda_2' class='latex' /> nếu và chỉ nếu <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> là đồ thị liên thông.
</ul>
</blockquote>
<p><em>Chứng minh.</em> Phần <em>(i)</em> là <strong>bài tập</strong>. Ta chứng minh phần <em>(ii)</em>. Xét một <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-eigenvector <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf x' title='\bf x' class='latex' />. Gọi <img src='http://s.wordpress.com/latex.php?latex=x_u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_u' title='x_u' class='latex' /> là tọa độ có giá trị tuyệt đối lớn nhất. Bằng cách thay <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf x' title='\bf x' class='latex' /> bởi <img src='http://s.wordpress.com/latex.php?latex=-%20%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='- \bf x' title='- \bf x' class='latex' /> nếu cần, ta có thể giả sử rằng <img src='http://s.wordpress.com/latex.php?latex=x_u%3E0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_u&gt;0' title='x_u&gt;0' class='latex' />. Từ đó, dùng cùng cái mẹo như trong chứng minh trước, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20d%20x_u%20%5Cleq%20%5Csum_%7Bv%20%5Cin%20%5CGamma%28u%29%7D%20a_%7Buv%7D%20%7Cx_v%7C%20%5Cleq%20%5Ctext%7Bdeg%7D%28u%29%20%7Cx_u%7C%20%5Cleq%20d%20x_u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle d x_u \leq \sum_{v \in \Gamma(u)} a_{uv} |x_v| \leq \text{deg}(u) |x_u| \leq d x_u' title='\displaystyle d x_u \leq \sum_{v \in \Gamma(u)} a_{uv} |x_v| \leq \text{deg}(u) |x_u| \leq d x_u' class='latex' />. </center></p>
<p>Ta kết luận rằng <img src='http://s.wordpress.com/latex.php?latex=x_v%20%3D%20x_u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_v = x_u' title='x_v = x_u' class='latex' /> với mọi <img src='http://s.wordpress.com/latex.php?latex=v%20%5Cin%20%5CGamma%28u%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='v \in \Gamma(u)' title='v \in \Gamma(u)' class='latex' />. Do đó, các giá trị <img src='http://s.wordpress.com/latex.php?latex=x_u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_u' title='x_u' class='latex' /> phải bằng nhau trong mỗi thành phần liên thông của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Dimension của <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' />-eigenspace bằng chính tổng số thành phần liên thông (connected component) của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' />. Vì thế, <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> liên thông nếu và chỉ nếu eigenvalue <img src='http://s.wordpress.com/latex.php?latex=d&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='d' title='d' class='latex' /> có multiplicity bằng <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' />.</p>
<div align=right>QED</div>
<p><strong>8.c.3 Chứng minh định lý Cheeger-Alon-Milman</strong></p>
<p><strong>Spectral gap lớn thì expansion rate lớn</strong></p>
<p>Định lý này có hai phần. Phần dễ là bất đẳng thức đầu tiên <img src='http://s.wordpress.com/latex.php?latex=%5Cfrac%7Bd-%5Clambda_2%7D%7B2%7D%20%5Cleq%20h%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\frac{d-\lambda_2}{2} \leq h(G)' title='\frac{d-\lambda_2}{2} \leq h(G)' class='latex' /> và ta chứng minh nó trước. Có thể hiểu bất đẳng thức này một cách nôm na là giá trị tối thiểu của một biểu thức trên các vector nguyên thì lớn hơn giá trị tối thiểu của cùng một biểu thức trên các vectors thực. (Kỹ thuật này gọi là <em>relaxation</em>, rất phổ biến trong optimization.)</p>
<p>Trước hết, chúng ta &#8220;symmetrize&#8221; định nghĩa của <img src='http://s.wordpress.com/latex.php?latex=h%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='h(G)' title='h(G)' class='latex' />. Thay vì <img src='http://s.wordpress.com/latex.php?latex=%5Cpartial%20S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\partial S' title='\partial S' class='latex' /> ta viết là <img src='http://s.wordpress.com/latex.php?latex=E%28S%2C%5Cbar%20S%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='E(S,\bar S)' title='E(S,\bar S)' class='latex' /> để biểu thị định nghĩa của <img src='http://s.wordpress.com/latex.php?latex=%5Cpartial%20S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\partial S' title='\partial S' class='latex' /> là tập các cạnh giữa <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' /> và phần bù <img src='http://s.wordpress.com/latex.php?latex=%5Cbar%20S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bar S' title='\bar S' class='latex' />. Ký hiệu <img src='http://s.wordpress.com/latex.php?latex=E%28S%2C%5Cbar%20S%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='E(S,\bar S)' title='E(S,\bar S)' class='latex' /> trông sẽ &#8220;symmetric&#8221; hơn.</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%7Bh%28G%29%20%3D%20%5Cmin_%7B%7CS%7C%5Cleq%20n%2F2%7D%20%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%7CS%7C%7D%20%5Cgeq%20%5Cmin_%7B%7CS%7C%5Cleq%20n%2F2%7D%20%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%7CS%7C%5Cfrac%7B2%7C%5Cbar%20S%7C%7D%7Bn%7D%7D%7D%20%3D%20%5Cfrac%201%202%20%5Cmin_%7B%5Cemptyset%20%5Cneq%20S%20%5Csubset%20V%7D%20%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%5Cfrac%201%20n%20%7CS%7C%7C%5Cbar%20S%7C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle{h(G) = \min_{|S|\leq n/2} \frac{|E(S,\bar S)|}{|S|} \geq \min_{|S|\leq n/2} \frac{|E(S,\bar S)|}{|S|\frac{2|\bar S|}{n}}} = \frac 1 2 \min_{\emptyset \neq S \subset V} \frac{|E(S,\bar S)|}{\frac 1 n |S||\bar S|}' title='\displaystyle{h(G) = \min_{|S|\leq n/2} \frac{|E(S,\bar S)|}{|S|} \geq \min_{|S|\leq n/2} \frac{|E(S,\bar S)|}{|S|\frac{2|\bar S|}{n}}} = \frac 1 2 \min_{\emptyset \neq S \subset V} \frac{|E(S,\bar S)|}{\frac 1 n |S||\bar S|}' class='latex' /></center></p>
<p>Định nghĩa <em>sparsity</em> của <img src='http://s.wordpress.com/latex.php?latex=G&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='G' title='G' class='latex' /> như sau</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%7B%5Cphi%28G%29%20%3D%20%5Cmin_%7B%5Cemptyset%20%5Cneq%20S%20%5Csubset%20V%7D%20%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%5Cfrac%201%20n%20%7CS%7C%7C%5Cbar%20S%7C%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle{\phi(G) = \min_{\emptyset \neq S \subset V} \frac{|E(S,\bar S)|}{\frac 1 n |S||\bar S|}}' title='\displaystyle{\phi(G) = \min_{\emptyset \neq S \subset V} \frac{|E(S,\bar S)|}{\frac 1 n |S||\bar S|}}' class='latex' /></center></p>
<p>Như thế, chúng ta mới vừa chứng minh rằng  <img src='http://s.wordpress.com/latex.php?latex=h%28G%29%20%5Cgeq%20%5Cfrac%201%202%20%5Cphi%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='h(G) \geq \frac 1 2 \phi(G)' title='h(G) \geq \frac 1 2 \phi(G)' class='latex' />. Còn phải chứng minh <img src='http://s.wordpress.com/latex.php?latex=%5Cphi%28G%29%20%5Cgeq%20d%20-%20%5Clambda_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\phi(G) \geq d - \lambda_2' title='\phi(G) \geq d - \lambda_2' class='latex' /> nữa là xong. Để làm điều này, đầu tiên ta viết lại biểu thức của <img src='http://s.wordpress.com/latex.php?latex=%5Cphi%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\phi(G)' title='\phi(G)' class='latex' /> cho có vẻ đại số hơn. (Biểu thức hiện nay có tính tổ hợp.) Tưởng tượng gán giá trị <img src='http://s.wordpress.com/latex.php?latex=1&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='1' title='1' class='latex' /> cho mỗi đỉnh trong <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='0' title='0' class='latex' /> cho mỗi đỉnh trong <img src='http://s.wordpress.com/latex.php?latex=%5Cbar%20S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bar S' title='\bar S' class='latex' />, chúng ta có một vector <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20x%20%5Cin%20%5C%7B0%2C1%5C%7D%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf x \in \{0,1\}^n' title='\mathbf x \in \{0,1\}^n' class='latex' />. Dễ thấy rằng</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cphi%28G%29%20%3D%20%5Cmin_%7B%5Csubstack%7B%5Cbf%20x%20%5Cin%20%5C%7B0%2C1%5C%7D%5En%5C%5C%20%7B%5Cbf%20x%7D%20%5Cneq%20%7B%5Cbf%200%7D%2C%20%5C%20%7B%5Cbf%20x%7D%20%5Cnot%5Cparallel%20%7B%5Cbf%201%7D%7D%7D%5C%20%5Cfrac%7B%5Csum_%7Buv%5Cin%20E%7D%28x_u-x_v%29%5E2%7D%7B%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_u%5Csum_v%20%28x_u-x_v%29%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \phi(G) = \min_{\substack{\bf x \in \{0,1\}^n\\ {\bf x} \neq {\bf 0}, \ {\bf x} \not\parallel {\bf 1}}}\ \frac{\sum_{uv\in E}(x_u-x_v)^2}{\frac{1}{2n} \sum_u\sum_v (x_u-x_v)^2}' title='\displaystyle \phi(G) = \min_{\substack{\bf x \in \{0,1\}^n\\ {\bf x} \neq {\bf 0}, \ {\bf x} \not\parallel {\bf 1}}}\ \frac{\sum_{uv\in E}(x_u-x_v)^2}{\frac{1}{2n} \sum_u\sum_v (x_u-x_v)^2}' class='latex' /></center></p>
<p>Trong đó, <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D%20%5Cnot%5Cparallel%20%7B%5Cbf%201%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x} \not\parallel {\bf 1}' title='{\bf x} \not\parallel {\bf 1}' class='latex' /> nghĩa là vector <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20x&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf x' title='\bf x' class='latex' /> không song song với vector <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf 1' title='\bf 1' class='latex' />. Do đó, <img src='http://s.wordpress.com/latex.php?latex=%5Cphi%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\phi(G)' title='\phi(G)' class='latex' /> chính là giá trị tối ưu của một bài toán tối thiểu hóa trên tập các vectors <img src='http://s.wordpress.com/latex.php?latex=%5C%7B0%2C1%5C%7D%5En%20%5Csubseteq%20%5Cmathbb%20R%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\{0,1\}^n \subseteq \mathbb R^n' title='\{0,1\}^n \subseteq \mathbb R^n' class='latex' />. Giá trị tối thiểu dĩ nhiên là lớn hơn hoặc bằng giá trị tối thiểu của cùng biểu thức trên tập các vectors thực. Cụ thể hơn, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%7B%5Cphi%28G%29%20%5Cgeq%20%5Cmin_%7B%5Csubstack%7B%5Cbf%20x%20%5Cin%20%5Cmathbb%20R%5En%5C%5C%20%7B%5Cbf%20x%7D%20%5Cneq%20%7B%5Cbf%200%7D%2C%20%5C%20%7B%5Cbf%20x%7D%20%5Cnot%5Cparallel%20%7B%5Cbf%201%7D%7D%7D%20%5Cfrac%7B%5Csum_%7Buv%5Cin%20E%7D%28x_u-x_v%29%5E2%7D%7B%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_u%5Csum_v%20%28x_u-x_v%29%5E2%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle{\phi(G) \geq \min_{\substack{\bf x \in \mathbb R^n\\ {\bf x} \neq {\bf 0}, \ {\bf x} \not\parallel {\bf 1}}} \frac{\sum_{uv\in E}(x_u-x_v)^2}{\frac{1}{2n} \sum_u\sum_v (x_u-x_v)^2}}' title='\displaystyle{\phi(G) \geq \min_{\substack{\bf x \in \mathbb R^n\\ {\bf x} \neq {\bf 0}, \ {\bf x} \not\parallel {\bf 1}}} \frac{\sum_{uv\in E}(x_u-x_v)^2}{\frac{1}{2n} \sum_u\sum_v (x_u-x_v)^2}}' class='latex' /></center></p>
<p>Lưu ý rằng, nếu ta cộng (hay trừ) cùng một đại lượng vào (ra khỏi) mỗi tọa độ <img src='http://s.wordpress.com/latex.php?latex=x_u&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_u' title='x_u' class='latex' /> thì giá trị biểu thức không đổi. Do đó, có thể thay mỗi vector <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20x%20%5Cin%20%5Cmathbb%20R%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf x \in \mathbb R^n' title='\mathbf x \in \mathbb R^n' class='latex' /> bằng <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20z%20%5Cin%20%5Cmathbb%20R%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf z \in \mathbb R^n' title='\mathbf z \in \mathbb R^n' class='latex' /> trong đó <img src='http://s.wordpress.com/latex.php?latex=z_u%20%3D%20x_u%20-%20%5Cfrac%201%20n%20%5Csum_v%20x_v&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='z_u = x_u - \frac 1 n \sum_v x_v' title='z_u = x_u - \frac 1 n \sum_v x_v' class='latex' />. Chú ý rằng, <img src='http://s.wordpress.com/latex.php?latex=%5Csum_u%20z_u%20%3D%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\sum_u z_u = 0' title='\sum_u z_u = 0' class='latex' />, hay nói cách khác <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20z%20%5Cperp%20%5Cmathbf%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf z \perp \mathbf 1' title='\mathbf z \perp \mathbf 1' class='latex' />. Vì thế,</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cphi%28G%29%20%5Cgeq%20%5Cmin_%7B%5Csubstack%7B%7B%5Cbf%200%7D%20%5Cneq%20%5Cmathbf%20z%20%5Cin%20%5Cmathbb%20R%5En%5C%5C%20%5Cmathbf%20z%20%5Cperp%20%5Cmathbf%201%7D%7D%20%5Cfrac%7B%5Csum_%7Buv%5Cin%20E%7D%28z_u-z_v%29%5E2%7D%7B%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_u%5Csum_v%20%28z_u-z_v%29%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \phi(G) \geq \min_{\substack{{\bf 0} \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \frac{\sum_{uv\in E}(z_u-z_v)^2}{\frac{1}{2n} \sum_u\sum_v (z_u-z_v)^2}' title='\displaystyle \phi(G) \geq \min_{\substack{{\bf 0} \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \frac{\sum_{uv\in E}(z_u-z_v)^2}{\frac{1}{2n} \sum_u\sum_v (z_u-z_v)^2}' class='latex' /></center></p>
<p>Đến đây, viết lại tử số</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Csum_%7Buv%5Cin%20E%7D%28z_u-z_v%29%5E2%20%3D%20d%5Cmathbf%20z%5ET%5Cmathbf%20z%20-%20%5Cmathbf%20z%5ET%5Cmathbf%20A%5Cmathbf%20z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \sum_{uv\in E}(z_u-z_v)^2 = d\mathbf z^T\mathbf z - \mathbf z^T\mathbf A\mathbf z' title='\displaystyle \sum_{uv\in E}(z_u-z_v)^2 = d\mathbf z^T\mathbf z - \mathbf z^T\mathbf A\mathbf z' class='latex' /></center></p>
<p>Hơn nữa, do <img src='http://s.wordpress.com/latex.php?latex=%5Cmathbf%20z%20%5Cperp%20%5Cmathbf%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathbf z \perp \mathbf 1' title='\mathbf z \perp \mathbf 1' class='latex' /> có thể viết lại mẫu số thành <img src='http://s.wordpress.com/latex.php?latex=%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_u%5Csum_v%20%28z_u-z_v%29%5E2%20%3D%20%5Cmathbf%20z%5ET%5Cmathbf%20z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\frac{1}{2n} \sum_u\sum_v (z_u-z_v)^2 = \mathbf z^T\mathbf z' title='\frac{1}{2n} \sum_u\sum_v (z_u-z_v)^2 = \mathbf z^T\mathbf z' class='latex' />. Vì vậy,</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cphi%28G%29%20%5Cgeq%20%5Cmin_%7B%5Csubstack%7B%7B%5Cbf%200%7D%20%5Cneq%20%5Cmathbf%20z%20%5Cin%20%5Cmathbb%20R%5En%5C%5C%20%5Cmathbf%20z%20%5Cperp%20%5Cmathbf%201%7D%7D%20%5Cleft%28%20d%20-%20%5Cfrac%7B%5Cmathbf%20z%5ET%5Cmathbf%20A%5Cmathbf%20z%7D%7B%5Cmathbf%20z%5ET%5Cmathbf%20z%7D%20%5Cright%29%20%3D%20d%20-%20%5Cmax_%7B%5Csubstack%7B%7B%5Cbf%200%7D%20%5Cneq%20%5Cmathbf%20z%20%5Cin%20%5Cmathbb%20R%5En%5C%5C%20%5Cmathbf%20z%20%5Cperp%20%5Cmathbf%201%7D%7D%20%5Cfrac%7B%5Cmathbf%20z%5ET%5Cmathbf%20A%5Cmathbf%20z%7D%7B%5Cmathbf%20z%5ET%5Cmathbf%20z%7D%20%3D%20d-%5Clambda_2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \phi(G) \geq \min_{\substack{{\bf 0} \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \left( d - \frac{\mathbf z^T\mathbf A\mathbf z}{\mathbf z^T\mathbf z} \right) = d - \max_{\substack{{\bf 0} \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \frac{\mathbf z^T\mathbf A\mathbf z}{\mathbf z^T\mathbf z} = d-\lambda_2' title='\displaystyle \phi(G) \geq \min_{\substack{{\bf 0} \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \left( d - \frac{\mathbf z^T\mathbf A\mathbf z}{\mathbf z^T\mathbf z} \right) = d - \max_{\substack{{\bf 0} \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \frac{\mathbf z^T\mathbf A\mathbf z}{\mathbf z^T\mathbf z} = d-\lambda_2' class='latex' /></center></p>
<div align=right>QED</div>
<p><strong>Expansion rate lớn thì spectral gap lớn</strong></p>
<p>Đây là phần khó của định lý. Tôi theo <a href="http://lucatrevisan.wordpress.com/tag/expanders/">chứng minh</a> của Luca Trevisan, tự nhiên hơn chứng minh của Alon-Milman một chút. Muốn hiểu chứng minh của Alon-Milman thì phải hiểu chứng minh bất đẳng thức Cheeger trong hình học Riemann. Chúng ta phải chứng minh rằng <img src='http://s.wordpress.com/latex.php?latex=h%28G%29%20%5Cleq%20%5Csqrt%7B2d%28d-%5Clambda_2%29%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='h(G) \leq \sqrt{2d(d-\lambda_2)}' title='h(G) \leq \sqrt{2d(d-\lambda_2)}' class='latex' />. Chứng minh này gồm hai bước. Bước một là viết lại định nghĩa tổ hợp của <img src='http://s.wordpress.com/latex.php?latex=h%28G%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='h(G)' title='h(G)' class='latex' /> thành giá trị tối thiểu của một hàm liên tục, chuyển từ rời rạc sang liên tục. Bước hai về cơ bản là tí toáy với bất đẳng thức Cauchy-Schwarz là xong.</p>
<p><strong>Bước 1.</strong> Với một vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D%20%5Cin%20%5Cmathbb%20R%5En&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x} \in \mathbb R^n' title='{\bf x} \in \mathbb R^n' class='latex' /> bất kỳ, định nghĩa med<img src='http://s.wordpress.com/latex.php?latex=%28%7B%5Cbf%20x%7D%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='({\bf x})' title='({\bf x})' class='latex' /> là median của tập <img src='http://s.wordpress.com/latex.php?latex=%5C%7Bx_1%2C%5Cdots%2Cx_n%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\{x_1,\dots,x_n\}' title='\{x_1,\dots,x_n\}' class='latex' />. Ta sẽ chứng minh rằng</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmin_%7B%5Csubstack%7B%5Cemptyset%20%5Cneq%20S%20%5Csubseteq%20V%5C%5C%20%7CS%7C%20%5Cleq%20n%2F2%7D%7D%20%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%7CS%7C%7D%20%3D%20%5Cmin_%7B%5Csubstack%7B%7B%5Cbf%200%20%5Cneq%20x%7D%20%5Cin%20%5Cmathbb%20R%5En%20%5C%5C%20%5Ctext%7Bmed%7D%28%7B%5Cbf%20x%7D%29%20%3D%200%7D%7D%20%5Cfrac%7B%5Csum_%7Bij%20%5Cin%20E%7D%7Cx_i-x_j%7C%7D%7B%5Csum_i%20%7Cx_i%7C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \min_{\substack{\emptyset \neq S \subseteq V\\ |S| \leq n/2}} \frac{|E(S,\bar S)|}{|S|} = \min_{\substack{{\bf 0 \neq x} \in \mathbb R^n \\ \text{med}({\bf x}) = 0}} \frac{\sum_{ij \in E}|x_i-x_j|}{\sum_i |x_i|}' title='\displaystyle \min_{\substack{\emptyset \neq S \subseteq V\\ |S| \leq n/2}} \frac{|E(S,\bar S)|}{|S|} = \min_{\substack{{\bf 0 \neq x} \in \mathbb R^n \\ \text{med}({\bf x}) = 0}} \frac{\sum_{ij \in E}|x_i-x_j|}{\sum_i |x_i|}' class='latex' />.</center></p>
<p>Thứ nhất, giả sử <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' /> là tập tối thiểu hóa biểu thức bên vế trái, nghĩa là <img src='http://s.wordpress.com/latex.php?latex=h%28G%29%20%3D%20%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%7CS%7C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='h(G) = \frac{|E(S,\bar S)|}{|S|}' title='h(G) = \frac{|E(S,\bar S)|}{|S|}' class='latex' />. Đặt <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' /> là characteristic vector của tập <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' />. Do <img src='http://s.wordpress.com/latex.php?latex=%7CS%7C%20%5Cleq%20n%2F2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|S| \leq n/2' title='|S| \leq n/2' class='latex' />, med<img src='http://s.wordpress.com/latex.php?latex=%28x%29%3D0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(x)=0' title='(x)=0' class='latex' />. Dễ thấy <img src='http://s.wordpress.com/latex.php?latex=%7CE%28S%2C%5Cbar%20S%29%7C%20%3D%20%5Csum_%7Bij%20%5Cin%20E%7D%7Cx_i-x_j%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|E(S,\bar S)| = \sum_{ij \in E}|x_i-x_j|' title='|E(S,\bar S)| = \sum_{ij \in E}|x_i-x_j|' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7CS%7C%20%3D%20%5Csum_i%20%7Cx_i%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|S| = \sum_i |x_i|' title='|S| = \sum_i |x_i|' class='latex' />. Do đó, vế trái <img src='http://s.wordpress.com/latex.php?latex=%5Cgeq&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\geq' title='\geq' class='latex' /> vế phải.</p>
<p>Thứ hai, gọi <img src='http://s.wordpress.com/latex.php?latex=P&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='P' title='P' class='latex' /> là giá trị của vế phải cho tiện. Ta sẽ chứng minh rằng tồn tại <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' /> để cho <img src='http://s.wordpress.com/latex.php?latex=%5Cfrac%7B%7CE%28S%2C%5Cbar%20S%29%7C%7D%7B%5Cmin%28%7CS%7C%2C%20%7C%5Cbar%20S%7C%29%7D%20%5Cleq%20P&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\frac{|E(S,\bar S)|}{\min(|S|, |\bar S|)} \leq P' title='\frac{|E(S,\bar S)|}{\min(|S|, |\bar S|)} \leq P' class='latex' /> là hoàn tất bước 1. Xét vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' /> tối thiểu hóa biểu thức bên trong vế phải. Không mất tính tổng quát, ta giả sử <img src='http://s.wordpress.com/latex.php?latex=%5Cmax_i%20x_i%20-%20%5Cmin_i%20x_i%20%3D%201&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\max_i x_i - \min_i x_i = 1' title='\max_i x_i - \min_i x_i = 1' class='latex' />. Chọn một số <img src='http://s.wordpress.com/latex.php?latex=t%20%5Cin%20%5B%5Cmin_i%20x_i%2C%20%5Cmax_i%20x_i%5D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='t \in [\min_i x_i, \max_i x_i]' title='t \in [\min_i x_i, \max_i x_i]' class='latex' /> ngẫu nhiên (uniformly). Định nghĩa <img src='http://s.wordpress.com/latex.php?latex=S%20%3D%20%5C%7Bi%20%5C%20%7C%20%5C%20x_i%20%5Cgeq%20t%5C%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S = \{i \ | \ x_i \geq t\}' title='S = \{i \ | \ x_i \geq t\}' class='latex' />. Như vậy tập <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' /> này là một tập đỉnh ngẫu nhiên. (Cái mẹo tạo tập ngẫu nhiên kiểu này rất phổ biến trong các thiết kế thuật toán ngẫu nhiên cho các loại cut problems.) Ta muốn chứng minh rằng </p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmathbb%20E%5Cleft%5B%20%7CE%28S%2C%5Cbar%20S%29%7C%20-%20P%20%5Ccdot%20%5Cmin%28%7CS%7C%2C%20%7C%5Cbar%20S%7C%29%20%5Cright%5D%20%5Cleq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \mathbb E\left[ |E(S,\bar S)| - P \cdot \min(|S|, |\bar S|) \right] \leq 0' title='\displaystyle \mathbb E\left[ |E(S,\bar S)| - P \cdot \min(|S|, |\bar S|) \right] \leq 0' class='latex' /></center></p>
<p>Từ đó suy ra rằng tồn tại <img src='http://s.wordpress.com/latex.php?latex=S&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='S' title='S' class='latex' /> thỏa điều kiện cần thỏa. (Đây là ý tưởng của phương pháp dùng &#8220;<a href="http://www.cse.buffalo.edu/%7Ehungngo/classes/2008/694/notes/expectation.pdf">argument from expectation</a>&#8221; của phương pháp xác suất.) Trước hết, </p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmathbb%20E%5Cleft%5B%20%7CE%28S%2C%5Cbar%20S%29%7C%20%5Cright%5D%20%3D%20%5Csum_%7Bij%20%5Cin%20E%7D%20%5Ctext%7BProb%7D%5B%20%28i%5Cin%20S%2C%20j%5Cin%20%5Cbar%20S%29%20%5Cvee%20%28i%20%5Cin%20%5Cbar%20S%2C%20j%5Cin%20S%29%5D%20%3D%20%5Csum_%7Bij%20%5Cin%20E%7D%20%7Cx_i-x_j%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \mathbb E\left[ |E(S,\bar S)| \right] = \sum_{ij \in E} \text{Prob}[ (i\in S, j\in \bar S) \vee (i \in \bar S, j\in S)] = \sum_{ij \in E} |x_i-x_j|' title='\displaystyle \mathbb E\left[ |E(S,\bar S)| \right] = \sum_{ij \in E} \text{Prob}[ (i\in S, j\in \bar S) \vee (i \in \bar S, j\in S)] = \sum_{ij \in E} |x_i-x_j|' class='latex' /></center></p>
<p>Kế tiếp, không mất tính tổng quát, giả sử rằng <img src='http://s.wordpress.com/latex.php?latex=x_1%20%5Cleq%20x_2%20%5Cleq%20%5Cdots%20%5Cleq%20x_n&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_1 \leq x_2 \leq \dots \leq x_n' title='x_1 \leq x_2 \leq \dots \leq x_n' class='latex' />. Lưu ý rằng med<img src='http://s.wordpress.com/latex.php?latex=%28%7B%5Cbf%20x%7D%29%3D0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='({\bf x})=0' title='({\bf x})=0' class='latex' />, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmathbb%20E%5Cleft%5B%20%5Cmin%28%7CS%7C%2C%20%7C%5Cbar%20S%7C%29%20%5Cright%5D%20%3D%20%5Csum_%7Bk%3D1%7D%5E%7Bn%2F2%7D%20%5Ctext%7BProb%7D%5B%20%5Cmin%28%7CS%7C%2C%20%7C%5Cbar%20S%7C%29%20%5Cgeq%20k%5D%20%3D%20%5Csum_%7Bk%3D1%7D%5E%7Bn%2F2%7D%20%7Cx_%7Bn-k%7D-x_k%7C%20%3D%20%5Csum_%7Bi%3D1%7D%5En%20%7Cx_i%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \mathbb E\left[ \min(|S|, |\bar S|) \right] = \sum_{k=1}^{n/2} \text{Prob}[ \min(|S|, |\bar S|) \geq k] = \sum_{k=1}^{n/2} |x_{n-k}-x_k| = \sum_{i=1}^n |x_i|' title='\displaystyle \mathbb E\left[ \min(|S|, |\bar S|) \right] = \sum_{k=1}^{n/2} \text{Prob}[ \min(|S|, |\bar S|) \geq k] = \sum_{k=1}^{n/2} |x_{n-k}-x_k| = \sum_{i=1}^n |x_i|' class='latex' /></center></p>
<p>Nhờ linearity of expectation, ta có kết luận (mạnh hơn cần thiết) rằng </p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmathbb%20E%5Cleft%5B%20%7CE%28S%2C%5Cbar%20S%29%7C%20-%20P%20%5Ccdot%20%5Cmin%28%7CS%7C%2C%20%7C%5Cbar%20S%7C%29%20%5Cright%5D%20%3D%20%5Csum_%7Bij%20%5Cin%20E%7D%20%7Cx_i-x_j%7C%20-%20P%20%5Ccdot%20%5Csum_%7Bi%3D1%7D%5En%20%7Cx_i%7C%20%3D%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \mathbb E\left[ |E(S,\bar S)| - P \cdot \min(|S|, |\bar S|) \right] = \sum_{ij \in E} |x_i-x_j| - P \cdot \sum_{i=1}^n |x_i| = 0' title='\displaystyle \mathbb E\left[ |E(S,\bar S)| - P \cdot \min(|S|, |\bar S|) \right] = \sum_{ij \in E} |x_i-x_j| - P \cdot \sum_{i=1}^n |x_i| = 0' class='latex' /></center></p>
<p><strong>Bước 2</strong>. Chúng ta cần chứng minh rằng</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cmin_%7B%5Csubstack%7B%7B%5Cbf%200%20%5Cneq%20x%7D%20%5Cin%20%5Cmathbb%20R%5En%20%5C%5C%20%5Ctext%7Bmed%7D%28%7B%5Cbf%20x%7D%29%20%3D%200%7D%7D%20%5Cfrac%7B%5Csum_%7Bij%20%5Cin%20E%7D%7Cx_i-x_j%7C%7D%7B%5Csum_i%20%7Cx_i%7C%7D%20%5Cleq%20%5Csqrt%7B2d%20%5Cmin_%7B%5Csubstack%7B%5Cmathbf%200%20%5Cneq%20%5Cmathbf%20z%20%5Cin%20%5Cmathbb%20R%5En%5C%5C%20%5Cmathbf%20z%20%5Cperp%20%5Cmathbf%201%7D%7D%20%5Cfrac%7B%5Csum_%7Bij%5Cin%20E%7D%28z_i-z_j%29%5E2%7D%7B%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_i%5Csum_j%20%28z_u-z_v%29%5E2%7D%7D%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \min_{\substack{{\bf 0 \neq x} \in \mathbb R^n \\ \text{med}({\bf x}) = 0}} \frac{\sum_{ij \in E}|x_i-x_j|}{\sum_i |x_i|} \leq \sqrt{2d \min_{\substack{\mathbf 0 \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \frac{\sum_{ij\in E}(z_i-z_j)^2}{\frac{1}{2n} \sum_i\sum_j (z_u-z_v)^2}} ' title='\displaystyle \min_{\substack{{\bf 0 \neq x} \in \mathbb R^n \\ \text{med}({\bf x}) = 0}} \frac{\sum_{ij \in E}|x_i-x_j|}{\sum_i |x_i|} \leq \sqrt{2d \min_{\substack{\mathbf 0 \neq \mathbf z \in \mathbb R^n\\ \mathbf z \perp \mathbf 1}} \frac{\sum_{ij\in E}(z_i-z_j)^2}{\frac{1}{2n} \sum_i\sum_j (z_u-z_v)^2}} ' class='latex' /></center></p>
<p>Chiến lược khá rõ ràng: gọi <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20z%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf z}' title='{\bf z}' class='latex' /> là vector tối thiểu hóa biểu thức bên trong vế phải. Xây dựng một vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' /> từ <img src='http://s.wordpress.com/latex.php?latex=%5Cbf%20z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\bf z' title='\bf z' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D%20%5Cneq%200&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x} \neq 0' title='{\bf x} \neq 0' class='latex' />, med<img src='http://s.wordpress.com/latex.php?latex=%28%7B%5Cbf%20x%7D%29%3D0&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='({\bf x})=0' title='({\bf x})=0' class='latex' />, và</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cfrac%7B%5Csum_%7Bij%20%5Cin%20E%7D%7Cx_i-x_j%7C%7D%7B%5Csum_i%20%7Cx_i%7C%7D%20%5Cleq%20%5Csqrt%7B2d%20%5Cfrac%7B%5Csum_%7Bij%5Cin%20E%7D%28z_i-z_j%29%5E2%7D%7B%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_i%5Csum_j%20%28z_i-z_j%29%5E2%7D%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \frac{\sum_{ij \in E}|x_i-x_j|}{\sum_i |x_i|} \leq \sqrt{2d \frac{\sum_{ij\in E}(z_i-z_j)^2}{\frac{1}{2n} \sum_i\sum_j (z_i-z_j)^2}}' title='\displaystyle \frac{\sum_{ij \in E}|x_i-x_j|}{\sum_i |x_i|} \leq \sqrt{2d \frac{\sum_{ij\in E}(z_i-z_j)^2}{\frac{1}{2n} \sum_i\sum_j (z_i-z_j)^2}}' class='latex' />.</center></p>
<p>(Để cho tiện dùng về sau, định nghĩa <img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20Z%20%3D%20%5Cfrac%7B%5Csum_%7Bij%5Cin%20E%7D%28z_i-z_j%29%5E2%7D%7B%5Cfrac%7B1%7D%7B2n%7D%20%5Csum_i%5Csum_j%20%28z_i-z_j%29%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle Z = \frac{\sum_{ij\in E}(z_i-z_j)^2}{\frac{1}{2n} \sum_i\sum_j (z_i-z_j)^2}' title='\displaystyle Z = \frac{\sum_{ij\in E}(z_i-z_j)^2}{\frac{1}{2n} \sum_i\sum_j (z_i-z_j)^2}' class='latex' />.)</p>
<p>Làm thế nào để &#8220;xây dựng&#8221; một vector <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' /> như thế? Phản ứng đầu tiên là thử <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%3Dz%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x=z}' title='{\bf x=z}' class='latex' /> rồi dùng Cauchy-Schwarz, nhưng thử vài lần không được. Phản ứng thứ hai là chọn <img src='http://s.wordpress.com/latex.php?latex=%7B%5Cbf%20x%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='{\bf x}' title='{\bf x}' class='latex' /> sao cho <img src='http://s.wordpress.com/latex.php?latex=%7Cx_i-x_j%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|x_i-x_j|' title='|x_i-x_j|' class='latex' /> &#8220;xấp xỉ&#8221; <img src='http://s.wordpress.com/latex.php?latex=%28z_i-z_j%29%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='(z_i-z_j)^2' title='(z_i-z_j)^2' class='latex' /> và <img src='http://s.wordpress.com/latex.php?latex=%7Cx_i%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='|x_i|' title='|x_i|' class='latex' /> &#8220;xấp xỉ&#8221; <img src='http://s.wordpress.com/latex.php?latex=z_i%5E2&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='z_i^2' title='z_i^2' class='latex' /> rồi xem ép được đến đâu. Có vẻ như <img src='http://s.wordpress.com/latex.php?latex=x_i%20%3D%20%7Cz_i%7Cz_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_i = |z_i|z_i' title='x_i = |z_i|z_i' class='latex' /> có lý. (Đây chính là phát kiến thứ hai của Luca Trevisan. Phát kiến thứ nhất là bước 1.) Khi gán <img src='http://s.wordpress.com/latex.php?latex=x_i%20%3D%20%7Cz_i%7Cz_i&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='x_i = |z_i|z_i' title='x_i = |z_i|z_i' class='latex' />, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%7Cx_i-x_j%7C%20%5Cleq%20%7Cz_i-z_j%7C%28%7Cz_i%7C%2B%7Cz_j%7C%29&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle |x_i-x_j| \leq |z_i-z_j|(|z_i|+|z_j|)' title='\displaystyle |x_i-x_j| \leq |z_i-z_j|(|z_i|+|z_j|)' class='latex' /></center></p>
<p>Do đó, Cauchy-Schwarz cho ta</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Csum_%7Bij%20%5Cin%20E%7D%20%7Cx_i-x_j%7C%20%5Cleq%20%5Csqrt%7B%20%5Csum_%7Bij%20%5Cin%20E%7D%20%28z_i-z_j%29%5E2%20%7D%20%5Csqrt%7B%20%5Csum_%7Bij%20%5Cin%20E%7D%20%28%7Cz_i%7C%2B%7Cz_j%7C%29%5E2%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \sum_{ij \in E} |x_i-x_j| \leq \sqrt{ \sum_{ij \in E} (z_i-z_j)^2 } \sqrt{ \sum_{ij \in E} (|z_i|+|z_j|)^2}' title='\displaystyle \sum_{ij \in E} |x_i-x_j| \leq \sqrt{ \sum_{ij \in E} (z_i-z_j)^2 } \sqrt{ \sum_{ij \in E} (|z_i|+|z_j|)^2}' class='latex' /></center></p>
<p>Đến đây, nhớ lại định nghĩa của <img src='http://s.wordpress.com/latex.php?latex=Z&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='Z' title='Z' class='latex' /> như trên, ta có</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Csum_%7Bij%20%5Cin%20E%7D%20%28z_i-z_j%29%5E2%20%3D%20%5Cfrac%7BZ%7D%7B2n%7D%20%5Csum_%7Bi%2Cj%7D%20%28z_i-z_j%29%5E2%20%3D%20%5Cfrac%7BZ%7D%7B2n%7D%20%5Cleft%28%20%5Csum_%7Bi%2Cj%7D%20%28z_i%5E2%2Bz_j%5E2%29%20-%202%5Cleft%5B%20%5Csum_i%20z_i%20%5Cright%5D%5E2%20%5Cright%29%20%5Cleq%20Z%20%5Csum_i%20%7Cx_i%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \sum_{ij \in E} (z_i-z_j)^2 = \frac{Z}{2n} \sum_{i,j} (z_i-z_j)^2 = \frac{Z}{2n} \left( \sum_{i,j} (z_i^2+z_j^2) - 2\left[ \sum_i z_i \right]^2 \right) \leq Z \sum_i |x_i|' title='\displaystyle \sum_{ij \in E} (z_i-z_j)^2 = \frac{Z}{2n} \sum_{i,j} (z_i-z_j)^2 = \frac{Z}{2n} \left( \sum_{i,j} (z_i^2+z_j^2) - 2\left[ \sum_i z_i \right]^2 \right) \leq Z \sum_i |x_i|' class='latex' /></center></p>
<p>và Cauchy-Schwarz lần nữa cho ta</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Csum_%7Bij%20%5Cin%20E%7D%20%28%7Cz_i%7C%2B%7Cz_j%7C%29%5E2%20%5Cleq%20%5Csum_%7Bij%20%5Cin%20E%7D%202%28z_i%5E2%20%2B%20z_j%5E2%29%20%3D%202d%20%5Csum_i%20z_i%5E2%20%3D%202d%5Csum_i%20%7Cx_i%7C&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \sum_{ij \in E} (|z_i|+|z_j|)^2 \leq \sum_{ij \in E} 2(z_i^2 + z_j^2) = 2d \sum_i z_i^2 = 2d\sum_i |x_i|' title='\displaystyle \sum_{ij \in E} (|z_i|+|z_j|)^2 \leq \sum_{ij \in E} 2(z_i^2 + z_j^2) = 2d \sum_i z_i^2 = 2d\sum_i |x_i|' class='latex' /></center>.</p>
<p>Gom tất cả lại, ta hoàn tất chứng minh:</p>
<p><center><img src='http://s.wordpress.com/latex.php?latex=%5Cdisplaystyle%20%5Cdisplaystyle%20%5Csum_%7Bij%20%5Cin%20E%7D%20%7Cx_i-x_j%7C%20%5Cleq%20%5Csqrt%7BZ%20%5Csum_i%20%7Cx_i%7C%7D%20%5Csqrt%7B2d%5Csum_i%20%7Cx_i%7C%7D%20%3D%20%5Csqrt%7B2dZ%7D%20%5Csum_i%20%7Cx_i%7C%20&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\displaystyle \displaystyle \sum_{ij \in E} |x_i-x_j| \leq \sqrt{Z \sum_i |x_i|} \sqrt{2d\sum_i |x_i|} = \sqrt{2dZ} \sum_i |x_i| ' title='\displaystyle \displaystyle \sum_{ij \in E} |x_i-x_j| \leq \sqrt{Z \sum_i |x_i|} \sqrt{2d\sum_i |x_i|} = \sqrt{2dZ} \sum_i |x_i| ' class='latex' /></center></p>
<div align=right>QED</div>
]]></content:encoded>
			<wfw:commentRss>http://www.procul.org/blog/2009/05/22/pcp6/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

