Bổ đề Sauer
Bài học máy qua góc nhìn của lý thuyết tính toán số 4 có chứng minh bổ đề Sauer (bổ đề 5.2) bằng quy nạp. Tuy nhiên, một chứng minh bằng quy nạp không hay lắm vì nó “giấu” trực quan của chứng minh. Trong bài này, chúng ta sẽ chứng minh bổ đề Sauer bằng một kỹ thuật rất phổ biến trong extremal combinatorics gọi là kỹ thuật shifting. Xem các tham khảo sau đây để biết thêm về kỹ thuật shifting:
[1] P. Frankl: The shifting technique in extremal set theory, in Surveys in Combinatorics 1987 (C Whitehead, ed.), London Math. Soc. Lecture Note Series 123, Cambridge University Press (1987), 81–110.
[2] B. Bollobás, Combinatorics: Set Systems, Hypergraphs, Families of Vectors and Combinatorial Probability. Cambridge University Press 1986.
Rất nhiều định lý cổ điển như định lý Erdos-Ko-Rado (đã chứng minh trên blog này bằng kỹ thuật định trị hai cách) hay định lý Kruskal-Katona đều chứng minh được bằng kỹ thuật shifting. Kỹ thuật này cũng được ứng dụng gần đây trong nhánh phân tích các hàm Boolean. Nhánh này liên hệ mật thiết đến computational learning theory, coding theory, approximation algorithms, và complexity theory: toàn là các đề tài trung tâm của theoretical CS hiện nay.
Ta sẽ phát biểu lại bổ đề Sauer. Gọi
là một lớp các hàm số từ
vào
. Có thể hiểu
là một bộ các tập con của
. Chú ý rằng cả
lẫn
đều có thể vô hạn (thậm chí không đếm được). Với một tập con hữu hạn
, định nghĩa projection của
lên
như sau:
. Trong ngữ cảnh “học máy” thì projection của lớp giả thuyết
lên một tập hữu hạn các mẫu là bộ tất cả các cách mà các giả thuyết này phân lớp các mẫu này.
Một tập
bị băm nát bởi
nếu
chính là tập tất cả các tập con của
. VC-dimension của
là kích thước lớn nhất của một tập con của
bị băm nát bởi
. Nếu
băm nát một tập con có kích thước lớn tùy ý thì VC-dimension của
là vô hạn.
Bổ đề Sauer:
Giả sử
có VC-dimension hữu hạn, bằng
. Xét một tập con
bất kỳ của
. Ta có,
Chứng minh. Đặt
. Dĩ nhiên
là hữu hạn, và là một bộ các tập con của
. Không mất tính tổng quát, ta có thể giả sử
. Do
không băm nát bất kỳ tập con nào có kích thước
, dễ thấy rằng
cũng không băm nát bất kỳ tập con nào của
với kích thước
. Ta sẽ dùng tính chất này để chặn trên
.
Chúng ta sẽ “xê dịch” (shift)
từ từ để thành một bộ
các tập con mới của
thỏa mãn các điều kiện sau đây:
- Nếu
bị băm nát bởi
thì
cũng bị băm nát bởi
.
là một ideal của Boolean lattice trên
, nghĩa là nếu
thì tất cả các tập con của
đều là thành viên của
.
Giả sử ta tìm được
thỏa mãn các điều kiện trên, thì một tập con
của
bị
băm nát nếu và chỉ nếu
. Nhưng
không băm nát bất kỳ tập con nào có kích thước
. Do đó, tất cả các thành viên của
đều có kích thước
. Vì thế
.
Đến đây, ta mô tả phép “dịch chuyển”
thành
thỏa mãn các điều kiện 1, 2, 3 ở trên bằng một thuật toán. Giả sử
.
1. For (to
) do 2. Foreach (
) do 3. If (
and
), then 4. Replace
by
5. Endif 6. Endfor 7. Endfor 8. Repeat 1--7 until
no longer changes. Call this final collection
![]()
Với mỗi vòng lặp 1–7, nếu bộ
không đổi thì thuật toán kết thúc, còn nếu có đổi thì một thành viên nào đó của
bị giảm kích thước. Kích thước của các thành viên của
không thể giảm mãi (mà
vẫn thay đổi), do đó thuật toán sẽ kết thúc.
Bây giờ ta chứng minh rằng
thỏa mãn ba điều kiện 1, 2, và 3 ở trên.
- Điều kiện 1 đã rõ ràng, vì ta chỉ biến
thành
khi
- Ta chứng minh rằng tính chất này bất biến sau mỗi lần ta thực hiện vòng lặp 2–6 với một phần tử
bất kỳ trong thuật toán trên. Giả sử
là bộ tập hợp trước khi vòng lặp này được thực hiện, và
là bộ tập hợp sau khi vòng lặp này được thực hiện.
Giả sử
bị băm nát bởi
. Nếu
thì dĩ nhiên
đã bị băm nát trước thay đổi. Do đó, có thể giả sử
.Xét một tập con
nào đó. Ta cần chứng minh rằng
với
. Do
bị băm nát sau vòng lặp,
với
. Nếu
thì
cũng thuộc
. Bây giờ xét trường hợp
. Tồn tại
sao cho
. Rõ ràng là
cũng thuộc
. Nhưng
“còn sống sót” sau vòng lặp chứng tỏ là
, và do đó
. - Tính chất này đã rõ.

. Xét một tập con 
to
) do
2. Foreach (
and