8.d. Spectral expanders và tốc độ hội tụ của random walks trên expanders
Trong bài này chúng ta sẽ chứng minh rằng một đồ thị có spectral gap lớn thì “tương đương” với tốc độ hội tụ của một random walk trên đồ thị càng cao. (Sở dĩ ta để tương đương trong ngoặc kép là vì một chiều chứng minh cần thay đổi đồ thị một chút.)
8.d.1. Random walk trên đồ thị -regular, điều kiện hội tụ
Hầu hết những kết quả ta sẽ chứng minh trong đề mục này đúng cho cả các đồ thị không regular, nhưng chúng ta chỉ phát triển các kết quả trên các đồ thị -regular cho tiện. Xét một đồ thị
-regular
với adjacency matrix
. Định nghĩa
. Ma trận
còn được gọi là normalized adjacency matrix, và nó cũng chính là transition probability matrix của chuỗi Markov trên đồ thị
. Ở đây, chúng ta không cần biết lý thuyết về chuỗi Markov để hiểu bài này. Nếu bạn muốn biết thêm về chuỗi Markov thì tôi giới thiệu quyển Markov Chains
của Norris. Về random walks trên các đồ thị thì bài này của Laci Lovasz là một bài tổng hợp tốt, và quyển sách của Doyle và Snell (miễn phí) là kinh điển, tuy hơi cũ.
Để bắt đầu một random walk trên một đồ thị thì trước hết ta chọn một đỉnh của đồ thị làm khởi điểm theo một phân bố xác suất nào đó:
là xác suất mà đỉnh
là đỉnh khởi đầu. Đương nhiên
và
. Khi đang ở một đỉnh
ở bước này thì đến bước kế tiếp ta chọn ngẫu nhiên một một đỉnh kề với
(với xác suất
) và “bước qua” bên đó. Gọi
là phân bố xác suất của random walk ở thời điểm
, nghĩa là
là xác suất mà chúng ta ở đỉnh
sau
bước. Dễ thấy rằng phân bố xác suất ở thời điểm
là
Trong lý thuyết chuỗi Markov, phương trình trên gọi là phương trình Chapman-Kolmogorov, đơn giản là ứng dụng công thức tính conditional probability.
Bài tập: chứng minh công thức Chapman-Kolmogorov trên.
Bài tập: công thức có còn đúng không nếu đồ thị là đồ thị có hướng? Nếu không đúng thì phải sửa làm sao cho đúng?
Từ đó ta có:
Như đã viết trong bài Trị đặc trưng và vector đặc trưng, hễ nhìn thấy lũy thừa của các ma trận, đặc biệt là các ma trận thực và đối xứng, thì ta phải nghĩ ngay đến các vector và trị đặc trưng. Gọi là bộ eigenvalues của
và
là bộ eigenvalues của
. Dễ thấy rằng
, và hơn nữa
và
có cùng các eigenvectors. Gọi các eigenvectors trực chuẩn tương ứng là
. Trong bài PCP 6 chúng ta đã chứng minh rằng
.
Đến đây, biểu diễn thành tổ hợp tuyến tính của các vectors
, ta có
, trong đó
. Từ đó, suy ra
(Bài tập: tại sao?) và vì thế
Do đó, nếu thì
bất kể khởi điểm có phân bố gì. Chú ý rằng
chính là cái phân bố đều (uniform distribution). Chúng ta vừa chứng minh được chiều thuận của định lý sau đây. Điều kỳ kiệu là chiều nghịch cũng đúng.
Điều kiện hội tụ của random walk trên đồ thị
Cho
là một đồ thị
-regular. Định nghĩa
. Ta có
nếu và chỉ nếu
, bất kể phân bố khởi điểm là gì.
Chứng minh. Bây giờ chúng ta chứng minh chiều nghịch, nghĩa là nếu bất kể phân bố khởi điểm, thì
. Chỉ cần chứng minh
và
là đủ. Từ bài PCP 6, và quan hệ
, ta biết
nếu và chỉ nếu
là đồ thị liên thông, và
nếu và chỉ nếu
không phải là đồ thị bipartite.
Trước hết, giả sử không liên thông, ta sẽ chứng minh rằng tồn tại hai phân bố khởi điểm khác nhau làm cho random walk hội tụ về hai trạng thái cân bằng khác nhau. Các bài tập sau đây “mạnh” hơn cần thiết, nhưng có giá trị mô phạm; các bạn không quen với chuỗi Markov nên làm thử:
Bài tập: Giả sử tồn tại vector . Chứng minh rằng
là một distribution, nghĩa là
và
. Ngoài ra, chứng minh rằng
, nghĩa là
là một
-eigenvector. Một phân bố
thỏa mãn
thì được gọi là một phân bố cân bằng.
Bài tập: dùng định lý Perron-Frobenius, chứng minh rằng luôn tồn tại một phân bố cân bằng , cho dù
không phải là đồ thị regular.
Bài tập: gọi là một phân bố cân bằng. Chứng minh rằng nếu
, nghĩa là nếu trạng thái khởi đầu là một phân bố cân bằng, thì
.
Như vậy, đến đây ta chỉ cần chứng minh rằng nếu không liên thông thì có ít nhất hai phân bố cân bằng khác nhau là được. Nếu
không liên thông thì
-eigenspace của
có dimension
. Đặt
thì đây là một phân bố cân bằng do
là
-regular. Gọi
là một
-eigenvector bất kỳ độc lập tuyến tính với
. Với bất kỳ hệ số
nào, ta có
bởi vì
cũng là một
-eigenvector. Với
đủ lớn thì
. Sau khi normalize, ta kết luận rẳng tồn tại một phân bố cân bằng
. Phân bố này khác
bởi vì
và
là độc lập tuyến tính.
Kế tiếp, ta chứng minh rằng nếu là bipartite thì giới hạn
không luôn tồn tại. Giả sử
. Do
là
-regular, dễ thấy rằng
. Gọi
là phân bố mà các đỉnh trong
được gán xác suất
, và
là phân bố mà các đỉnh trong
được gán xác suất
. Nếu ta bắt đầu random walk bằng
thì random walk sẽ giao động giữa
và
, không hội tụ.
8.d.2. Random walk trên đồ thị -regular, tốc độ hội tụ
Chúng ta quan tâm hơn đến tốc độ hội tụ của random walk. Làm thế nào để đo tốc độ hội tụ về phân bố đều ? Về mặt xác suất, hàm khoảng cách (distance function) tự nhiên nhất có lẽ là total variation distance. Cho hai phân bố
và
trên một không gian xác suất hữu hạn
, total variation distance giữa
và
là
. Khi
là hữu hạn, không khó chứng minh được rằng
. (Bài tập: chứng minh điều này, nghĩa là total variation distance bằng một nửa
-norm, khi
hữu hạn.) Như vậy, để đo tốc độ hội tụ, chúng ta có thể đo khoảng cách
xem nó tiến đến
nhanh như thế nào.
Định lý. (Hội tụ theo
) Định nghĩa
cho tiện. Ta có
Nhờ bất đẳng thức Cauchy-Schwarz, chúng ta chỉ cần chứng minh định lý sau đây là đủ
Định lý (Hội tụ theo
)
Chứng minh. Chú ý rằng . Trong đó,
vuông góc với
and
. (Bài tập: tại sao
vuông góc với
và có chiều dài
?). Kế hoạch của chúng ta sẽ là chứng minh rằng
Để chứng minh điều này, trước hết ta chứng minh rằng mỗi lần ta nhân với một vector
vuông góc với
, chúng ta “co rút” chiều dài của
lại một tỉ lệ ít nhất là
. Cụ thể hơn, xét vector
thì
Cần giải thích bất đẳng thức cuối cùng rõ hơn một chút. Lưu ý rằng là cái Rayleigh quotient của ma trận
. Các eigenvalues của ma trận này là bình phương các eigenvalues của
. Dễ thấy rằng
là eigenvalue lớn nhì của
. Từ đó ta có bất đẳng thức cuối, vì
vuông góc với eigenvector thứ nhất. (Nhớ lại định lý tính eigenvalues bằng Rayleigh quotients trong bài trước.)
Bài tập: chứng minh rằng với mọi số nguyên thì vector
vuông góc với
.
Từ kết quả bài tập, áp dụng bất đẳng thức đệ qui
lần là xong.
8.d.3. Tốc độ hội tụ và spectral expanders
Chúng ta đã thấy rằng càng xa
thì tốc độ hội tụ của random walk càng lớn.
Định nghĩa. (Spectral expander) Một
-spectral expander là một đồ thị
-regular
có
đỉnh thỏa
. Ta cần
-spectral expanders với
càng nhỏ càng tốt.
Nếu là một
-spectral expander với
là một hằng số thì
; do đó spectral gap của
cũng lớn.
Ngược lại, nếu có spectral gap bị chặn dưới bởi một hằng số, ví dụ
, thì … chưa chắc
đã là một spectral expander; nguyên nhân chính là
không nhất thiết dẫn tới
. Nói cách khác, một đồ thị liên thông thì không liên quan đến tính bipartite của nó. May mà có một cách rất đơn giản để “sửa”
lại để cho nó chắc chắn không là bipartite. Chúng ta thêm các self-loops vào tất cả các đỉnh của
. Nói các khác, cộng
vào mỗi entry trên đường chéo của
. Gọi
là các trị đặc trưng mới (sau khi thêm self-loops), có thể thấy rằng
và
. Từ đó,
. Và,
. Do đó,
cách “xa”
và
(sau “sửa chữa”) là một spectral expander.
8.e. “Giam cầm” random walk trên expanders rất là khó.
Bây giờ chúng ta thảo luận một ứng dụng rất quan trọng của expanders từ góc nhìn xác suất. Ứng dụng này đại khái nói rằng, xác suất mà một random walk ở mãi trong một tập đỉnh nhỏ sẽ giảm theo hàm mũ.
Gọi là một
-spectral expander, và
là một tập đỉnh của
sao cho
. Giả sử ta thực hiện một random walk trên đồ thị
, bước
bước, với phân bố khởi điểm là phân bố đều (uniform distribution). Xác suất mà chúng ta không thăm đỉnh nào ngoài
là bao nhiêu?
Định lý (Khó “giam cầm” random walk trên expander). Gọi
là sự kiện mà cái random walk bị giam giữ trong tập
trong toàn bộ
bước. Ta có,
. Do đó, nếu
thì xác suất “giam cầm” này giảm theo hàm mũ.
Chứng minh. Gọi là ma trận “chiếu vào
“, nghĩa là
và
với mọi
khác. Ta có:
Bài tập: chứng minh đẳng thức thứ nhất.
Đẳng thức thứ hai là do ma trận là idempotent. Bất đẳng thức cuối cùng là theo Cauchy-Schwarz. Để chặn
chúng ta cần biết ma trận
co rút chiều dài một vector cỡ bao nhiêu sau mỗi lần nhân ma trận này vào vector. (Cái “mẹo” này chúng ta đã dùng trong phần trước.) Với mỗi vector
, ta có
Đến đây, xét một vector bất kỳ. Đặt
. Thì,
. Trước hết, biểu diễn
thành tổ hợp tuyến tính của các eigenvectors trực chuẩn của
:
. Định nghĩa thành phần song song
với eigenvector thứ nhất, và thành phân vuông góc
. Ta có,
Cái mẹo lần trước cho ta:
Áp dụng bất đẳng thức Cauchy-Schwarz, ta có , và do đó
Vì thế, mỗi lần chúng ta nhân vào vector
(có nghĩa là áp dụng phép biến đổi tuyến tính tương ứng vào
) chúng ta giảm chiều dài của
một tỉ lệ ít nhất là
. Chúng ta sẽ áp dụng
lần, và vector đầu tiên
có chiều dài
. Định lý đã được chứng minh xong.
Lần tới, chúng ta sẽ xét một vài ví dụ về ứng dụng của định lý trên và của expanders trong việc tiết kiệm random bits và khuếch đại gap trong các PCP reductions.

One Comment
Anh Hưng à vậy tôi có thể sử dụng các kết quả trên cho việc tìm điểm cực tiểu trên parapoloid không ạ?