Thông điệp ngắn
- RT @TelegraphNews Netflix lets its staff take as much holiday as they want, whenever they want – and it works http://bit.ly/ajRs6J
- Google Making Extraordinary Counteroffers To Stop Flow Of Employees To Facebook http://t.co/M2kCTgj via @techcrunch
- 'Power corrupts. PowerPoint corrupts absolutely." http://bit.ly/cWQUjP
- Lecture on lectures http://bit.ly/d6ODHd
- How panhandlers use free credit cards - thestar.com http://t.co/j3pSXMB
Phản hồi mới
- Administrator on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Na K54 on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Na K54 on VC
- xuanlong on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Duy on VC
- xuanlong on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Ngô Quang Hưng on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- Ngô Quang Hưng on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- XuanLong Nguyen on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
- XuanLong Nguyen on HM5 — Định lý Vapnik-Chervonenkis cho mô hình giả thuyết không nhất quán
-
Bài mới
Thư khố
Chuyên Mục
- Âm Nhạc (39)
- Ảnh hưởng của CNTT (3)
- Bảo mật và mật mã học (67)
- Blog cầu (5)
- Bơi (1)
- Các hệ thống máy tính (9)
- Các hội nghị KHMT (11)
- Công nghệ phần mềm (6)
- Chính trị trong ngành (29)
- Chưa phân loại (34)
- CNTT các nước và VN (47)
- Combinatorics (16)
- Cơ sở dữ liệu (2)
- Danh ngôn (12)
- Dành cho du học sinh (97)
- Games (2)
- Giáo dục (76)
- Giới thiệu sách (33)
- KHMT và Kinh Tế (1)
- KHMT và luật pháp (6)
- KHMT và sinh học (5)
- KHMT và triết học (3)
- Lập trình (3)
- Lịch sử Việt Nam (2)
- Lý thuyết mã hóa (2)
- Lý thuyết tính toán (53)
- Lý thuyết thông tin (15)
- Mạng máy tính (34)
- Mỹ quốc (12)
- Nghiên cứu nghiên kiếc (50)
- Nhân vật và sự kiện (127)
- Quả đất của ta (1)
- Thông báo (23)
- Thuật ngữ chuyên ngành (8)
- Thuật Toán (51)
- Tin tức đó đây (68)
- Toán Ứng Dụng (3)
- Toán tối ưu (5)
- Trang web hay (31)
- Trí tuệ nhân tạo (40)
- Vui – Giải Trí (216)
- Vượt định kiến (2)
- Xác suất & thống kê (49)
- Xuất bản (14)
Báo chí
Bảo mật
Blog Việt
Chưa phân loại
Giáo dục
Kỹ thuật
Khoa học khác
Kinh tế, luật pháp, xã hội
- A Tiny Revolution
- Andrew Sullivan.com
- Chicago’s Law Faculty
- Computing Chris
- Creative Capitalism
- Crooked Timber
- Daily Kos
- Freakonomics
- Free exchange
- Furdlog
- Instapundit
- Marginal Revolution
- Social Science Statistics
- Structured Procrastination
- The Becker-Posner Blog
- The Volokh Conspiracy
- Vietnam Quant. Society
- Đỗ Quốc Anh
Lý thuyết & thuật toán
Toán học
Vật Lý
Bổ đề Sauer
Bài học máy qua góc nhìn của lý thuyết tính toán số 4 có chứng minh bổ đề Sauer (bổ đề 5.2) bằng quy nạp. Tuy nhiên, một chứng minh bằng quy nạp không hay lắm vì nó “giấu” trực quan của chứng minh. Trong bài này, chúng ta sẽ chứng minh bổ đề Sauer bằng một kỹ thuật rất phổ biến trong extremal combinatorics gọi là kỹ thuật shifting. Xem các tham khảo sau đây để biết thêm về kỹ thuật shifting:
Rất nhiều định lý cổ điển như định lý Erdos-Ko-Rado (đã chứng minh trên blog này bằng kỹ thuật định trị hai cách) hay định lý Kruskal-Katona đều chứng minh được bằng kỹ thuật shifting. Kỹ thuật này cũng được ứng dụng gần đây trong nhánh phân tích các hàm Boolean. Nhánh này liên hệ mật thiết đến computational learning theory, coding theory, approximation algorithms, và complexity theory: toàn là các đề tài trung tâm của theoretical CS hiện nay.
Ta sẽ phát biểu lại bổ đề Sauer. Gọi
là một lớp các hàm số từ
vào
. Có thể hiểu
là một bộ các tập con của
. Chú ý rằng cả
lẫn
đều có thể vô hạn (thậm chí không đếm được). Với một tập con hữu hạn
, định nghĩa projection của
lên
như sau:
. Trong ngữ cảnh “học máy” thì projection của lớp giả thuyết
lên một tập hữu hạn các mẫu là bộ tất cả các cách mà các giả thuyết này phân lớp các mẫu này.
Một tập
bị băm nát bởi
nếu
chính là tập tất cả các tập con của
. VC-dimension của
là kích thước lớn nhất của một tập con của
bị băm nát bởi
. Nếu
băm nát một tập con có kích thước lớn tùy ý thì VC-dimension của
là vô hạn.
Chứng minh. Đặt
. Dĩ nhiên
là hữu hạn, và là một bộ các tập con của
. Không mất tính tổng quát, ta có thể giả sử
. Do
không băm nát bất kỳ tập con nào có kích thước
, dễ thấy rằng
cũng không băm nát bất kỳ tập con nào của
với kích thước
. Ta sẽ dùng tính chất này để chặn trên
.
Chúng ta sẽ “xê dịch” (shift)
từ từ để thành một bộ
các tập con mới của
thỏa mãn các điều kiện sau đây:
Giả sử ta tìm được
thỏa mãn các điều kiện trên, thì một tập con
của
bị
băm nát nếu và chỉ nếu
. Nhưng
không băm nát bất kỳ tập con nào có kích thước
. Do đó, tất cả các thành viên của
đều có kích thước
. Vì thế
.
Đến đây, ta mô tả phép “dịch chuyển”
thành
thỏa mãn các điều kiện 1, 2, 3 ở trên bằng một thuật toán. Giả sử
.
Với mỗi vòng lặp 1–7, nếu bộ
không đổi thì thuật toán kết thúc, còn nếu có đổi thì một thành viên nào đó của
bị giảm kích thước. Kích thước của các thành viên của
không thể giảm mãi (mà
vẫn thay đổi), do đó thuật toán sẽ kết thúc.
Bây giờ ta chứng minh rằng
thỏa mãn ba điều kiện 1, 2, và 3 ở trên.
Giả sử
bị băm nát bởi
. Nếu
thì dĩ nhiên
đã bị băm nát trước thay đổi. Do đó, có thể giả sử
.
Xét một tập con
nào đó. Ta cần chứng minh rằng
với
. Do
bị băm nát sau vòng lặp,
với
. Nếu
thì
cũng thuộc
. Bây giờ xét trường hợp
. Tồn tại
sao cho
. Rõ ràng là
cũng thuộc
. Nhưng
“còn sống sót” sau vòng lặp chứng tỏ là
, và do đó
.