9. Tiền xu Chernoff-Bernstein và mẹo trung vị
9.1. Tiền xu Chernoff-Bernstein
Thảy lần độc lập một đồng xu mà xác suất ra mặt ngửa là
thì trị kỳ vọng của số lần ra mặt ngửa là
. Ông Chernoff bảo rằng xác suất mà tổng số mặt ngửa quấn quít xung quanh
sẽ tiến đến
theo tốc độ hàm mũ khi
tăng. Một bài tập tốt là bạn thử áp dụng bất đẳng thức Markov và bất đẳng thức Chebyshev trong hai bài trước để so sánh với bất đẳng thức Chernoff trong bài này. Bạn sẽ thấy rằng chặn Chernoff tốt hơn hẳn.
Điều kỳ diệu là, ta có thể chứng minh BĐT Chernoff dùng BĐT Markov cộng với cái mẹo dùng hàm sinh mô-măng (moment generating function) của ông Bernstein. Nói đúng ra, ông Berstein đã chứng minh được BĐT kiểu Chernoff từ mấy chục năm trước khi Chernoff chứng minh BĐT Chernoff, chỉ có điều các BĐT Bernstein nằm ở dạng hơi khác thôi. Xem một bài giảng do bác Xuân Long ghi lại. Dùng cái mẹo của Bernstein, chúng ta có thể chứng minh một họ các BĐT loại này. Ta ghi lại đây ba cái chặn căn bản:
Chặn Chernoff: Gọi
là các biến Bernoulli độc lập, trong đó
. Đặt
thì
. Với
bất kỳ, ta có
À, tháng 4 vừa rồi có 2 ông hàng xóm cũ của hòa thượng THT tìm được chứng minh kiểu tổ hợp của các chặn Chernoff. Xem video này và bài này.
9.2. Cái mẹo trung vị
Bây giờ quay lại với bài toán lấy mẫu trong bài GT 8. Chúng ta đã chứng minh được rằng, để đảm bảo thì cần
mẫu. Như vậy, nếu ta lấy
mẫu thì
. Ta gọi
là một ước lượng yếu. (Yếu vì độ tin cậy là
thay vì
tí hin như ta muốn.) Hãy thực hiện độc lập
ước lượng yếu
, và gọi
là ước lượng tốt nếu quả thật
. Ta biết xác suất mà
tốt là lớn hơn
, do đó số ước lượng tốt sẽ giao động xung quanh
. Vấn đề là ta không biết ước lượng nào là tốt!
Đến đây thì cái mẹo trung vị xuất hiện. Nếu hơn số ước lượng yếu là tốt thì chắc chắn trung vị (median) của đám
sẽ tốt! (Bài tập nhé!)
Do đó nếu thuật toán của ta in ra trung vị của đám
thì xác suất mà
là ước lượng tốt sẽ lớn hơn xác suất hơn nửa số ước lượng yếu là tốt. Đặt
nếu
là tốt, và
trong trường hợp còn lại. Thì
. Đặt
thì
. Do đó, theo chặn Chernoff,
Vì thế, xác suất mà là tồi sẽ nhỏ hơn
nếu
. Tổng số mẫu chúng ta cần lấy sẽ là
nhỏ hơn hẳn số mẫu cần thiết khi dùng chặn Chebyshev.

3 Comments
Chặn Chernoff đúng là rất tốt, để có sai số giảm theo hàm mũ thì chỉ cần poly mẫu và do vậy thực hiện được bởi poly-time machine
. Nhưng chặn Chebyshev cũng có những tác dụng rất lớn mà chặn Chernoff không thể cho ta. Một ví dụ rất hay là nó có thể dùng để save randomness. Mấu chốt là muốn dùng chặn Chernoff thì các biến phải độc lạp nhau, trong khi đó chặn Chebyshev không cần điều đó. Chẳng hạn, khi các biến độc lập nhau đôi một (pairwise independent) thì không dùng được chặn Chernoff, trong khi lại dùng được chặn Chebyshev.
biến ngẫu nhiên
thì ta có thể tạo ra
biến, mỗi biến
(
là tập con của tập
) tương ứng với XOR của các biến
với
thuộc
. Khi đó các biến
và
là độc lập với nhau đôi một. Ta có thể sử dụng
biến này trong các thí nghiệm của ta và sau đó sử dụng chặn Chebyshev để đánh giá kết quả. Như vậy tóm lại, trong một số trường hợp, thay vì cần
bít ngẫu nhiên thì ta chỉ cần
bít nữa thôi, tất nhiên phải trả giá là độ sai số không cực tốt. (Đây là kỹ thuật này được Goldreich-Levin sử dụng trong việc xây dựng hard-core predicate từ one-way function)
Quay lại với vấn đề về saving randomness. Nếu ta có
NQH wrote: Nếu hơn {m/2} số ước lượng yếu là tốt thì chắc chắn trung vị (median) của đám {\bar \mu_i} sẽ tốt! (Bài tập nhé!)
Thưa anh Hưng, có phải là: nêu TV là trung vị của biến ngẫu nhiên mu, TV là giá trị ngưỡng phân tách trường hợp ước lượng yếu và ước lượng tốt, nên thoả mãn P(mu > TV >= 1/2 và P(mu =1/2. Do vậy, nếu nhiều hơn m/2 số mu là ước lượng yếu là tốt thì chứng tỏ TV đứng lệch về phía số ước lượng yếu là tốt.
Anh Hà, tôi không hiểu câu ” TV đứng lệch về phía số ước lượng yếu là tốt”. Tôi nghĩ anh đã nghĩ sai hướng.
Đại khái, nếu có m ước lượng, mà hơn m/2 trong chúng nằm trong đoạn [a,b] thì chắc chắn trung vị của m ước lượng cũng nằm trong đoạn [a,b]. Khẳng định này không liên quan gì đến xác suất.