Stochastic processes: Thêm một số sách hay miễn phí online
Khi chúng ta học những kiến thực cơ bản đầu tiên probability theory, ta biết đến những hàm phân phối cho biến thực/tự nhiên ngẫu nhiên kinh điển như Gaussian, Poisson, Bernoulli, Laplace, Dirichlet, Cauchy, v.v. Stochastic processes là gì ? Một cách nôm na, stochastic processes là những hàm phân phối cho những objects phức tạp hơn, như một collection of variables, hoặc các hàm số, hoặc các đồ thị (graphs), v.v.
Có thể định nghĩa đủ thứ hàm phân phối lên các objects cần quan tâm. Cuộc sống của chúng ta có thể được mô hình bằng các loại objects khác nhau, khi thì có tính chất combinatorial, khi thì analytical. (Ví dụ, Graphical models là một phương pháp tổng quát để định nghĩa một dạng stochastic processes). Do đó, stochastic processes có nhiều ứng dụng trong việc mô hình, tìm hiểu và dự đoán với data. Về mặt lý thuyết, nghiên cứu tính chất và cách sử dụng các stochastic processes mới rất thú vị không chỉ với những người nghiên cứu về xác suất thống kê thuần túy, mà cả với những người làm về data modeling.
Một số sách sau đây rất tốt về probability theory và stochastic processes.
- Convergence of Stochastic Processes của David Pollard (Yale). Sự trình bày về empirical processes được coi là kinh điển, tuy đây chỉ là một phần nhỏ của quyển sách. Một phần lớn sách nói về khái niệm weak convergence (convergence in distribution) trong không gian Euclidean và các metric spaces khác. Hiểu biết các khái niệm này là bước đệm quan trọng trong việc nghiên cứu và sử dụng các loại stochastic processes trong không gian vô hạn chiều (function spaces).
Empirical processes theory hiện là một trong những nền tảng lý thuyết cơ bản của machine learning, đặc biệt là nonparametric statistic/learning. - The random geometry of equilibrium phases của Olle Häggström (Chalmers Univ of Technology, Sweden). Một quyển sách hay về các mô hình Markov Random Fields trong statistical physics, và các hiện tượng phase transition và percolation trong những loại mô hình này. MRF cũng chính là một dạng graphical models (với undirected graphs), có nhiều ứng dụng trong parametric machine learning và statistics. Một trong những topics có thể học được từ quyển sách này là làm thế nào có thể định nghĩa được consistent stochastic processes cho graph với infinite vertices mà chỉ dựa vào các local constraints của graphs. Đối với finite graphs thì không có vấn đề gì. Các graphical models chúng ta gặp trong ứng dụng (như Hidden markov models chẳng hạn) đều chỉ có số đỉnh (vertices) là hữu hạn. Nghiên cứu về infinite graphs cho chúng ta hiểu biết sâu hơn về finite graphs có số lượng đỉnh rất lớn. Các khái niệm phase transition, mixing time of Monte Markov chains, uniqueness of Gibbs measures có liên hệ cực kỳ thú vị trong stochastic graphs cho infinite graphs. Đây là một trong những lĩnh vực có sự giao thoa rất lý thú giữa vật lý thống kê, lý thuyết tính toán, và lý thuyết về learning/ xác suất thống kê.
- Reversible Markov Chains and Random Walks on Graphs của David Aldous (Berkeley) và Jim Fill (Johns Hopkins). Đây là một quyển sách khá sâu về Markov Chains.
- Probability in Banach spaces của Ledoux và Michel Talagrand (Paris 6). Đây là quyển sách advanced về lý thuyết xác suất đối với biến ngẫu nhiên thuộc Banach spaces. Nhiều chủ đề quan trọng như isoperimetric inequalities, concentration of product measures, và ứng dụng cho empirical processes.
- Stochastic Calculus for mathematical finance của Steven Shreve (CMU). Quyển sách rất hay để học về stochastic partial differential equations; các mô hình thống kê cho finance và stochastic control.
- Lecture notes về stochastic processes của Amir Dembo (Stanford).
Vào thăm homepage của Talagrand còn có nhiều quyển sách miễn phí rất hay khác, như quyển sách về Mean field models for spin glass nghiên cứu về hiện tượng phase transition trong vật lý bằng lý thuyết xác suất chặt chẽ. Có thể rất lý thú cho dân làm về statistical physics, lý thuyết các thuật toán ngẫu nhiên monte carlo markov chain, và dân làm về machine learning.
Ngoài ra, có thể tham khảo thêm danh sách sách miễn phí trên mạng của nhiều ngành toán, trong đó có lý thuyết xác suất nói chung, và stochastic processes nói riêng.

Cảm ơn anh Long đã chia sẻ những thông tin thú vị về Graphical Models và các mô hình thống kê. Em cũng có theo dõi về Probablistic Graphical Models, nhưng hẹp hơn và cụ thể hơn so với những vấn đề mà anh Long đề cập ở trên.
Em có ứng dụng Conditional Random Fields (CRFs - John Lafferty, ICML 2001) vào một số bài toán trong NLP và bio-informatics. Em train mô hình này dùng phương pháp Maximum Likelihood Estimation (khác với max-margin training cho Markov Networks của Ben Taskar chỗ lab anh). Thường thì mọi người làm về CRFs đều sử dụng các phương pháp tối ưu hóa như Conjugate Gradient hoặc quasi-Newton Methods (Variable Metric) để tìm cực trị toàn cục của likelihood function (hàm này đảm bảo convex). Vấn đề là những phương pháp tối ưu này tại mỗi bước lặp đều cần thông tin về giá trị hàm likelihood và vector gradident hiện thời của likelihood function. Việc tính toán giá trị hàm và vector gradient của hàm này trên thực tế rất mất thời gian vì cần phải ước lượng phần chuẩn hóa Z (còn gọi là normalizing factor hay partition function). Nó là tổng của tất cả các cách labeling cho tất cả các nodes trên graph. Kể cả khi mô hình là dạng linear-chain và sử dụng quy hoạch động để tính toán (forward-backward computation) thì cũng rất chậm, đặc biệt là khi mình mô hình hóa các local potential functions theo second-order hoặc 3-order Markov dependency.
Ở hội nghị NIPS-2005 vừa rồi P. Ravikumar và J. Lafferty có bài “Preconditioner Approximation for Probabilistic Graphical Models” có nêu cách xấp xỉ hóa partition function dựa vào Mean Field hay Self-consistent Field Theory trong vật lý thống kê và tính toán mà anh đề cập. Em chưa được đọc bài này vì ko có PDF trên Internet (kể cả NIPS-2005 online proceedings và homepage của tác giả).
Anh có thể bình luận thêm một chút về điểm em vừa nêu được ko. Không nhất thiết phải cho CRFs mà cho Graphical Models chung chung cũng được.
(xin lỗi vì em viết lẫn lộn tiếng Việt lẫn tiếng Anh).
Hieu đã đề nghị chính các tác giả gửi pdf chưa? Chắc họ sẽ gửi thôi.
Anh Long nhân tiện có thể bình luận về chất lượng của các bài NIPS “not online” không ạ?
Chào Hiếu, rất vui được biết thêm một đồng nghiệp. Mình bị miss buổi nói chuyện hôm đó của Ravikumar, chỉ nghe được đoạn cuối (và nghe qua tóm tắt từ bác Bùi Hải Hưng cùng dự hội nghị) nên không thể bình luận sâu được. Cảm nhận ban đầu thì đây là một thuật toán inference thú vị, vì khác với tất cả các thuật toán quen biết (junction tree, belief propagation, mean field) ở chỗ đây không phải là một giải thuật iterative. Ý tưởng dựa trên việc chuyển bài toán inference thành bài toán tính toán preconditioner của matrices. Theo mình nhớ thì kết quả experiment cũng tương tự như basic (factorized) mean field method. So sánh với structured mean field methods vẫn chưa được làm cẩn thận.
Chào tvhvt, các bài chưa online có lẽ là do tác giả vẫn còn đang sửa hoặc hoàn thiện thêm nên không muốn đưa lên mạng sớm. Thực ra thì cách đây vài hôm (13 tháng 1/2006) thì mới là hạn deadline để nộp pdf file của nips papers đến cho ban tổ chức để họ làm việc xuất bản. Hầu hết các bài báo ở nips sẽ xuất hiện online trong một thời gian gần. Bạn thử chờ thêm một tẹo nữa xem.
Cảm ơn anh Long và tvhvt. Em cũng đã có gửi email cho Ravikumar để xin bài đó, nhưng khá lâu mà chưa thấy tác giả trả lời. Hy vọng là sẽ có bản online sớm.
http://www.cs.cmu.edu/~lafferty/pub/precondnips.pdf
Cảm ơn bác tvhvt. Em đã lấy bài này về rồi.
Cảm ơn anh Nguyễn Xuân Long đã giới thiệu nhiều đầu sách về Stochastic processes. Hiện tại em đang đọc về ARMA models with stable innovations. Em đang rất cần cuốn:
G.Samorodnitsky and M.S.Taqqu, Stable non Gaussian processes: Models with in finite variance ,Chapman and Hall,New York,1994.
Anh có nguồn nào có thể down được không ạ? Mong được anh giúp đỡ vì em đang rất cần nó mà chưa biêt tìm ở đâu.
Trân trọng cảm ơn anh! Chúc anh và gia đình sức khỏe!
@sonbsu: Rất tiếc tôi không có quyển này.
Chào các thầy, chào các anh. Tôi đang bắt đầu vào nghiên cứu về ứng dụng của Xích Markov ẩn trong Biomathematics. Tôi muốn hỏi về thuật toán Viterbi, cách vận hành của thuật toán. Mong các thầy, các anh cho biết về vấn đề này. Xin cảm ơn nhiều.
Tôi không hiểu anh Long định nghĩa “Stochastic processes” trong lĩnh vực nào:
Stochastic processes là gì ? Một cách nôm na, stochastic processes là những hàm phân phối cho những objects phức tạp hơn, như một collection of variables, hoặc các hàm số, hoặc các đồ thị (graphs), v.v.
Trong xác suất thống kê thì định nghĩa này hoàn toàn sai.
Tôi định nghĩa theo xstk đấy chứ. Sai đâu xin bạn chỉ cho. Ngoài lĩnh vực xstk còn lĩnh vực nào nói về stochastic processes nữa ?
cam on cac ban