Thông điệp ngắn
- DropBox is pretty good. First time using it for collaborative writing
- Via @nprnews: In The Eye Of The Beholder: Art, Justin Bieber And The Best Equation Ever | http://t.co/RpQNbpI
- This is f***ing hilarious: "About your f***ing website." http://bit.ly/b3TwUH
- RT @TelegraphNews Netflix lets its staff take as much holiday as they want, whenever they want – and it works http://bit.ly/ajRs6J
- Google Making Extraordinary Counteroffers To Stop Flow Of Employees To Facebook http://t.co/M2kCTgj via @techcrunch
Phản hồi mới
- Vietcong on Làm gì nhân vụ Hoàng Sa, Trường Sa?
- Nguyễn Văn Huân on Gỡ rối tơ lòng
- Nguyen Phuong Thao on Ngô Bảo Châu!
- Ngô Quang Hưng on Phép “chuyển giản” trong học máy
- v.hoat on Gỡ rối tơ lòng
- v.hoat on HM 1 — “Học máy” từ góc nhìn của lý thuyết tính toán, mô hình nhất quán
- Nguyễn Xuân Long on Phép “chuyển giản” trong học máy
- Administrator on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Na K54 on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Na K54 on VC
-
Bài mới
- Phép “chuyển giản” trong học máy
- 20 vạn dặm dưới đáy biển
- HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- VC
- Rabbi and Priest
- Toán ứng dụng và Toán lý thuyết (Nguyễn Tiến Dũng)
- CS Theory Overflow
- Hãy để ngày ấy lụi tàn
- Bình loạn trong chương trình (máy tính)
- Makefile tổng quát
Thư khố
Chuyên Mục
- Âm Nhạc (39)
- Ảnh hưởng của CNTT (3)
- Bảo mật và mật mã học (67)
- Blog cầu (5)
- Bơi (1)
- Các hệ thống máy tính (9)
- Các hội nghị KHMT (11)
- Công nghệ phần mềm (6)
- Chính trị trong ngành (29)
- Chưa phân loại (34)
- CNTT các nước và VN (47)
- Combinatorics (16)
- Cơ sở dữ liệu (2)
- Danh ngôn (12)
- Dành cho du học sinh (97)
- Games (2)
- Giáo dục (76)
- Giới thiệu sách (33)
- KHMT và Kinh Tế (1)
- KHMT và luật pháp (6)
- KHMT và sinh học (5)
- KHMT và triết học (3)
- Lập trình (3)
- Lịch sử Việt Nam (2)
- Lý thuyết mã hóa (2)
- Lý thuyết tính toán (53)
- Lý thuyết thông tin (15)
- Mạng máy tính (34)
- Mỹ quốc (12)
- Nghiên cứu nghiên kiếc (50)
- Nhân vật và sự kiện (127)
- Quả đất của ta (1)
- Thông báo (23)
- Thuật ngữ chuyên ngành (8)
- Thuật Toán (51)
- Tin tức đó đây (68)
- Toán Ứng Dụng (3)
- Toán tối ưu (5)
- Trang web hay (31)
- Trí tuệ nhân tạo (41)
- Vui – Giải Trí (216)
- Vượt định kiến (2)
- Xác suất & thống kê (50)
- Xuất bản (14)
Báo chí
Bảo mật
Blog Việt
Chưa phân loại
Giáo dục
Kỹ thuật
Khoa học khác
Kinh tế, luật pháp, xã hội
- A Tiny Revolution
- Andrew Sullivan.com
- Chicago’s Law Faculty
- Computing Chris
- Creative Capitalism
- Crooked Timber
- Daily Kos
- Freakonomics
- Free exchange
- Furdlog
- Instapundit
- Marginal Revolution
- Social Science Statistics
- Structured Procrastination
- The Becker-Posner Blog
- The Volokh Conspiracy
- Vietnam Quant. Society
- Đỗ Quốc Anh
Lý thuyết & thuật toán
Toán học
Vật Lý
PCP 8 — Expanders: tiết kiệm random bits và khuếch đại gap
8.f. Sơ lược về các kết quả xây dựng một họ expanders
Trong đa số các ứng dụng (xem dưới đây), cho trước một hằng số
, chúng ta muốn là có một hằng số
sao cho một họ
của các spectral expanders tồn tại, và mỗi thành viên trong họ có thể xây dựng được trong polynomial time.
Ví dụ: có thể xây dựng một họ các expanders như sau. Gọi
là số nguyên tố thứ
. Đặt
(nhóm Abel). Với một đỉnh bất kỳ
thì nối
với các hàng xóm
. Trong đó, các phép tính cộng, trừ, nghịch đảo là tính trên nhóm. Và, ta định nghĩa nghịch đảo của
là
. Đáng lẽ, ta có thể xây dựng đồ thị thứ
rất nhanh, nhưng vì không biết cách nào để sinh số nguyên tố thứ
ngoài cách cơ bắp (thử từng số từ
trở đi và dùng thuật toán AKS), cho nên tổng thời gian chạy để sinh ra đồ thị thứ
là
.
Ví dụ: Grigory Margulis (giải Fields năm 1978) chứng minh từ hồi 1973 rằng họ đồ thị xây dựng như sau là một họ expanders. Đặt
. Định nghĩa
Trong đồ thị thứ
, đỉnh
sẽ được nối với
đỉnh
(và sẽ có
đỉnh khác nối với nó dùng định nghĩa này). Vì thế, đây là đồ thị
-regular. Gabber và Galil hồi năm 1981 chứng minh rằng đây là họ
các spectral expanders, có thể xây dựng được một cách rất cụ thể như trên. Nếu có thời gian và hứng thú tôi sẽ duyệt qua chứng minh này dùng phương pháp của Jimbo và Marouka hồi năm 1987 (dùng giải tích Fourier).
Ví dụ: Alon và Boppana khoảng năm 1990 chứng minh được rằng, nếu
là một đồ thị
-regular thì
. Do đó, với một họ
spectral expanders ta chỉ có thể hy vọng là
là tối ưu rồi. (Đây là tối ưu về mặt eigenvalue, nhưng không nhất thiết là tối ưu về edge/vertex expansion rate.) Lubotzky-Phillips-Sarnak hồi 1988 xây dựng một họ các đồ thị đạt đến ngưỡng này. Các đồ thị này gọi là các đồ thị Ramanujan. Phép xây dựng của họ có tính rất cụ thể. Họ đồ thị mà họ xây dựng là các Cayley graphs của một họ các nhóm tuyến tính tổng quát. Quyển sách nho nhỏ dễ thương này là giới thiệu tốt về Ramanujan graphs: Elementary Number Theory, Group Theory and Ramanujan Graphs (London Mathematical Society Student Texts)
.
Ví dụ: Gần đây, tích zig-zag là một cách khác nữa để xây dựng một cách rất cụ thể một họ expanders. Chúng ta sẽ định nghĩa và chứng minh kết quả vừa đạt giải thưởng Godel năm 2008 này trong bài tới.
Chứng minh. Gọi latex
là lũy thừa bậc
của đồ thị
, nghĩa là
nếu và chỉ nếu khoảng cách giữa
và
trong
nhiều nhất là
. Dễ thấy rằng adjacency matrix của
là
, trong đó
là adjacency matrix của
. Do đó,
. Chỉ cần chọn
sao cho
là xong!
8.g. Tiết kiệm random bits dùng expanders
Để giảm xác suất lỗi của thuật toán
xuống, phương pháp đơn giản nhất là chạy
lần độc lập, và chấp nhận
nếu và chỉ nếu cả
lần
đều chấp nhận
. Khi đó, nếu
thì
, nghĩa là xác suất lỗi đã được giảm theo hàm mũ. Điểm bất lợi của phương pháp “lặp tuần tự” (sequential repetition) này là, nếu tổng số random bits mà
cần trong một lần chạy là
bits, thì tổng số random bits cần dùng là
.
Dùng expanders, chúng ta có thể giảm tổng số random bits cần dùng xuống mà vẫn giảm được xác suất lỗi của
theo hàm mũ. Giả sử ta xây dựng được (một cách rất cụ thể) một
-spectral expander với
là các hằng số. Mỗi một đỉnh của expander này được "dán nhãn" là một chuỗi
bits. Vì thế, có thể xem mỗi đỉnh của expander như một chuỗi random bits để tặng cho thuật toán
. Nếu chúng ta chọn
đỉnh ngẫu nhiên, độc lập nhau, và đưa chúng cho
thì kết quả như trước. Ý tưởng “lặp dùng expander” là: thay vì chọn
đỉnh ngẫu nhiên độc lập nhau, thì ta chọn
đỉnh ngẫu nhiên bằng cách chọn một khởi điểm ngẫu nhiên và bước
bước ngẫu nhiên. Dùng các đỉnh gặp dọc đường làm chuỗi ngẫu nhiên cho
chạy. Cuối cùng, vẫn chấp nhận
nếu và chỉ nếu
luôn chấp nhận
trong cả
lần này. Tổng số bits ngẫu nhiên ta dùng là
. Do
là hằng số, tổng số bits ngẫu nhiên trở nên tuyến tính trên hai tham số
, thay vì
như trong cách lặp tuần tự.
Trực quan là: do random walk trên expanders mau chóng hội tụ đến trạng thái cân bằng là phân bố đều, lấy mẫu bằng random walk cũng gần tốt bằng lấy mẫu hoàn toàn ngẫu nhiên, độc lập.
Khi
thì
luôn chấp nhận
bất kể random walk của ta là gì. Khi
, gọi
là tập các chuỗi ngẫu nhiên làm cho
chấp nhận
. Do
, ta có
. Xác suất mà
chấp nhận
chính là xác suất mà cái random walk của ta bị “giam cầm” trong
trong toàn bộ
bước. Từ bài trước, xác suất này
cũng giảm theo hàm mũ!
8.h. Khuếch đại gap dùng expanders
Ý tưởng trong mục 8.g. cũng dùng được để chứng minh một kết quả khó xấp xỉ mạnh hơn cho bài toán Max-Clique. Nhớ rằng, trong bài PCP 3 chúng ta đã chứng minh rằng, nếu
và nếu
, thì chúng ta không thể xấp xỉ Max-Clique đến tỉ lệ
với bất kỳ
nào.
Từ định lý PCP, ta biết rằng tồn tại một
-restricted verifier cho
với completeness
và soundness
. Dùng expander như trong mục 8.g và lập lại verifier này
lần, chúng ta có thể giảm soundness xuống còn
với
là một hằng số . Completeness vẫn bằng
. Tổng số query bits ta dùng là
. Tổng số random bits ta dùng là
. Do đó, để giữ cho
, ta có thể lập lại verifier đến
(hoặc bất kỳ một hằng số nào nhân với
lần).
Như vậy, ta kết luận rằng không thể xấp xỉ Max-Clique đến tỉ lệ
với mọi
. Có một điểm hơi tinh tế cần chú ý là, khi viết tỉ lệ khó xấp xỉ, ta phải viết nó thành hàm số của kích thước instance của bài toán Max-Clique. Tổng số đỉnh của đồ thị trong FGLSS reduction là
. Dễ thấy rằng
với
là một hằng số. Do đó, ta kết luận rằng
Kết quả trên rất mạnh, là vì thuật toán ngu xuẩn xuất ra một đỉnh đã có tỉ lệ xấp xỉ là
. Sau này, chúng ta sẽ chứng minh rằng xấp xỉ Max-Clique đến tỉ lệ
là không thể được (trừ phi
) với mọi
cho trước.
8.i. Tiết kiệm random bits cho các thuật toán “lỗi hai bên”
Có một điểm khá tinh tế là ý tưởng “lặp tuần tự” hoặc “lặp dùng expanders” để giảm xác suất lỗi sẽ không áp dụng trực tiếp được cho các thuật toán bị lỗi hai bên; hoặc cho các PCP verifiers không có completeness bằng
.
Để giảm lỗi (ở cả hai phía — cả false positives lẫn false negatives), chúng ta cần một thuật toán khác, không thể đơn giản chỉ “lặp lại
lần và chấp nhận
nếu
chấp nhận
toàn bộ
lần”. (Bài tập: ta gặp khó khăn gì khi dùng chiến lược đơn giản này?)
Trước hết, chiến lược “lặp tuần tự” cho trường hợp lỗi hai bên này là chạy
lần độc lập, với
lẻ, và chấp nhận
nếu và chỉ nếu
chấp nhân trong đa số các lần chạy; không chấp nhận
trong trường hợp ngược lại. Để phân tích thuật toán “bầu cử dân chủ” này, chúng ta cần biết chặn Chernoff — một trong những bất đẳng thức hữu dụng nhất trong lý thuyết xác suất.
Để dùng chặn Chernoff, xét trường hợp
trước. Đặt
nếu thuật toán
không chấp nhận
trong lần chạy thứ
,
; ngược lại thì gán
. Gọi
là xác suất mà
không chấp nhận
. Ta có
. Thuật toán “bầu cử dân chủ” không chấp nhận
nếu và chỉ nếu
. Do đó, xác suất mà
không được chấp nhận cũng giảm theo hàm mũ:
Phân tích tương tự cho thấy khi
, xác suất nó được chấp nhận (false positive) cũng giảm theo hàm mũ. Như vậy, nếu chiến lược là lặp tuần tự thì chúng ta có thể giảm xác suất lỗi theo hàm mũ như trong trường hợp “lỗi một bên” kiểu
. Và cũng như trong trường hợp lỗi một bên, tổng số random bits dùng sẽ là
, hơi quá lớn cho một số ứng dụng.
Có thể nào áp dụng phương pháp “lặp dùng expanders” cho trường hợp lỗi hai bên được không? Như trong phân tích trên, chúng ta cần chặn xác suất mà một random walk gồm
bước bị giam cầm trong
trong ít nhất một nửa số bước. Cái random walk này có thể đi vào
và đi ra khỏi
nhiều lần, miễn là tổng số bước nằm trong
ít nhất là
. Định lý trong mục 8.e (bài PCP 7) quá yếu cho mục tiêu này. Tuy nhiên, chúng ta có thể sửa lại chứng minh định lý 8.e một chút để có định lý sau đây:
Bài tập: chứng minh định lý trên. (Gợi ý: gần giống hệt chứng minh định lý “giam cầm” kia.)
Bài tập: dùng định lý trên để phân tích chiến lược “lặp dùng expanders” cho một thuật toán lỗi hai phía.
Tóm lại, với expanders ta có thể khuếch đại gap cho cả trường hợp không có completeness bằng
. Bài tới viết về một phương pháp xây dựng rất cụ thể các họ expanders: phương pháp dùng zig-zag product mới được giải Godel.