Thiên nga đen [1]

Tôi đọc xong quyển Black Swan của Nassim Nicholas Taleb vài tuần trước. Đã định viết review ngay mà đến giờ mới “giáng bút”. Đã có một đống reviews quyển sách NY Times Best Seller này từ rất nhiều các báo chí danh tiếng. Tôi không đọc hầu hết các reviews này, tự viết bao giờ cũng thích hơn!

225px-black_swans.jpg (Ảnh của Wikipedia.) Trước khi khám phá ra thiên nga đen tồn tại trên đời (ở Úc), người ta đã tin rằng tất cả các thiên nga đều trắng. Một sự kiện bất ngờ như thế thay đổi toàn bộ thế giới quan (về thiên nga) của nhân loại. Đây là cái theme của quyến sách.

Nhận xét chung: Taleb không có nhiều ý tưởng thật sự mới, nhưng lối trình bày provocative và các bằng chứng trải rộng nhiều nhánh tư duy cho ta một bức tranh nhiều màu sắc về đề tài này. Quyển sách hấp dẫn dù khá dài dòng văn tự, ta có cảm giác như đang ngồi nhậu với một ông chú biết nhiều nhưng … hơi xỉn và đang lè nhè dông dài. Quan trọng hơn cả, nó làm ta suy nghĩ! Đó là thành công của quyển sách.

Trong Black Swan, Taleb muốn thuyết phục chúng ta các luận điểm chính sau đây.

1. Extremistan và Mediocristan: Sự vận hành của thế giới trong một domain nào đó (lịch sử, kinh tế, tài chính, thời tiết, v.v.) thuộc về một trong hai loại: Extremistan và Mediocristan. Theo ngôn ngữ thống kê thì Extremistan chứa các fat-tail distributions, và Mediocristan chứa các loại distributions kiểu Gaussian.

Ví dụ: xét 1000 người bất kỳ đang đọc blog KHMT (wishful thinking is a virtue!). Bỗng nhiên Bill Gates ghé qua làm cho cái mean-income tăng đột biến, trong khi đó dù có Yao Ming nhắm nhé thì vẫn không làm tăng chiều cao trung bình lên mấy. Income distribution thuộc về Extremistan, còn height-distribution thuộc về Mediocristan.

Taleb đưa ra rất nhiều ví dụ để minh chứng rằng thế giới này càng lúc càng bị ảnh hưởng sâu sắc bởi các Extremistan distributions: ngày 11/9, sự phát triển đột biến của Internet, Google, vụ sụp đổ của Long-Term Capital Management, vụ sập thị trường chứng khoán năm 1987, chiến tranh, sự khám phá ra thiên nga đen ở Úc, v.v.. Đây là các distributions mà một sự kiện hiếm hoi có thể thay đổi toàn bộ cấu trúc của distribution. Do đó, khi cái sự kiện unlikely này xảy ra, hậu quả thường rất nghiêm trọng vì chúng ta tập trung “model” cái “bình thường” (với một Gaussian-like distribution nào đó mà Taleb gọi là “trò lừa đảo trí thức vĩ đại”).

Nhận xét: ý tưởng này không mới. Tôi rất ngạc nhiên là Taleb, một người đọc rất nhiều như ông thể hiện trong sách (thậm chí NP-completeness cũng được nhắc đến ở một footnote), lại không nhắc gì đến The Structure of Scientific Revolutions của Kuhn. Cái mới ở đây — và xuyên suốt quyển sách — là cách trình bày vấn đề của Taleb, và lối hành văn trịch thượng đội lối hài hước, hoặc hài hước đội lốt trịch thượng. Lúc đầu đọc thấy hơi khó chịu, nhưng đọc một chút rồi thấy têu tếu. Về mặt kỹ thuật thì GARCH, Extreme Value Theory, robust statistics là ví dụ của các phát triển kỹ thuật để giải quyết trường hợp thiên nga đen. Phỏng vấn Taleb ở đây có nhiều câu hỏi hay mà Taleb không trả lời thỏa đáng. Tờ The American Statistician cũng có các bài review trong số tháng 8, và bài trả lời của Tabeb.

2. Narrative Fallacy: đây là một lỗi logic có nguồn gốc sinh học. Taleb cho rằng (và tôi đồng ý) rằng con người có xu hướng dùng pattern recognition để “fit” các quan sát mới vào các mô hình đã có sẵn trong đầu. Báo chí, ví dụ, khi báo cáo các tin tức thường tìm cách ghép chúng vào nhau theo một trật tự nhân quả nào đó để cho dễ nhớ và dễ “make sense of the world”. Cụ thể hơn, ngay sau khi Saddam Hussein bị bắt thì Bloomberg News chạy cái tít sau đây: “U.S. Treasuries Rise; Hussein Capture May Not Curb Terrorism”, nửa tiếng sau đó thì U.S. Treasuries giảm và họ đổi ngay một cái tít khác: “U.S. Treasuries Fall; Hussein Capture Boots Allure of Risky Assets”.

Taleb đưa ra rất nhiều ví dụ kiểu này để minh họa rằng cái xu hướng “make sense of the world” của con người làm cho chúng ta có thói quen xấu nhét những cái “nhân” nhố nhăng để giải thích cái “quả” nào đó. Khi đã “fit” một cái nhân vào thì thường là ta rơi vào cái hố Mediocristan, trong khi cái ta đang quan sát có thể lại là Extremistan — cái mà Taleb cho rằng đang có xu hướng thống trị thế giới.

Nhận xét: ý tưởng này cũng không mới. Người ta đã biết về xu hướng “pattern recoginition” này của não bộ trong các nghiên cứu y sinh học từ lâu. Tôi đọc trong quyển The God Delusionthe Selfish Gene của Richard Dawkins thấy nói nhiều về đề tài này. Ví dụ: khi nhìn thấy một cái bóng cây buổi tối, đôi khi ta giật mình vì tưởng nó là bóng người. Trong ngữ cảnh khác, tôi để ý thấy các tranh luận trên các diễn đàn Internet thường dẫn đến deadlock vì mỗi người tìm cách “fit” các quan sát và luận điểm vào mô hình họ có sẵn. Anh nào biết game theory thì dùng game theory để giải thích. Chị nào sùng đạo thì bảo thượng đế muốn thế. Anh nào nghiêng cánh trái thì trích Marx, chị nào nghiêng cánh phải thì trích Friedman. Đối với cá nhân tôi, như có lần tôi đã nói, “mèo trắng mèo đen miễn là bắt được chuột”. (Hừm, bạn đừng nghĩ tôi “fit” lý luận này vào Đặng 🙂 ).

(còn tiếp)

Chủ đề : Giới thiệu sách, Xác suất & thống kêBookmark the permalink. Trackbacks are closed, but you can post a comment.

5 Comments

  1. dongta
    Posted 30/07/2007 at 9:35 am | Permalink

    Đọc tên Nassim Taleb thấy quen quen. Hóa ra bác này nghiên cứu về Financial Math và cũng là tác giả của cuốn “Fooled by Randomness”, một cuốn sách rất nổi tiếng khác 🙂

  2. Posted 31/07/2007 at 3:24 pm | Permalink

    Nghe bác Hưng review thì tôi cũng thấy chưa có ý tưởng gì mới, nhưng có lẽ cũng là quyển sách thú vị vì nó cũng là một cách bác Taleb “fit” các hiện tượng kinh tế xã hội vào statistical thinking của bác ấy. Tôi chờ phần review tiếp theo xem có nên đọc hay không.

    Các cuộc cách mạng (trong khoa học nói riêng và mọi thứ khác nói chung) xảy ra khi các mô hình cũ không còn work, và nhu cầu của một mô hình mới dần chín muồi cho đến khi một bộ não vĩ đại nào đó cuối cùng túm được nó. (Đôi khi thì ta gọi đó là “new way of thinking”, nhưng kỳ thực với God thì đó chỉ là một richer model). Còn giữa những khoảng breakthroughs như thế thì những người bình thường như chúng ta bận rộn pattern-recognize, và tweak các mô hình đã có. Một số sẽ quả cảm đưa ra dự báo về các mô hình về tương lai, nhưng thường là sai toét cả. Chúng ta có thể dự báo được được (ở mức độ meta) các mô hình tương lai được không?

    Đáng tiếc câu trả lời là không thể. Prediction theory trong xác suất thống kê không cho phép ta làm điều đó. Với một Bayesian, nếu ta trùm lên một prior vào các mô hình có thể thì prior vẫn chỉ ôm đồm những khả năng ta đã lường trước mà thôi (Hay ta cần một prior hoàn toàn mới, nhưng nếu thế thì còn gọi là prior làm sao được nữa) Với một frequentist, assumptions đằng sau anh ta là replications của những hiện tượng cũ, và thời gian chỉ giúp cho anh ta “fit” cái cũ tốt hơn mà thôi.

    Những hạn chế này bằng cách sự dụng các prior bao trùm không gian lớn (vô hạn chiều). Đó chính là công việc của nonparametric statistics. Nhưng không gian lớn thì việc tìm kiếm mô hình tốt nhất cũng khó khăn hơn, mất thời gian hơn nhiều. Và khi mô hình càng phức tạp, thì việc tìm kiếm ra nó, về mặt computational càng ngày càng bất khả thi. Điều này có vẻ trái với một thực tế là các cuộc cách mạng về khoa học và kỹ thuật của loài người vẫn tiếp tục với tốc độ đáng kinh ngạc. Loài người có một cách nào đó để tìm kiếm ra những mô hình mới không phải bằng nonparametric estimation!

    Tôi nghĩ có một ingredient bị missing trong prediction theory trong statistics, đó chính là sức mạnh của decentralization. Làm thế nào để decentralize sự tính toán để rồi ở đâu đó ta sẽ tìm được mô hình mới mà các phương pháp centralized đều bó tay vì không khai thác được structure. Sức mạnh của decentralization có thể ngụ ý là việc tìm mô hình mới không phải là quá khó, nhưng ta có thể tận dụng đưọc structure của vấn đế như thế nào đó, để tạo ra một decentralized infrastructure mà qua đó mô hình mới được tìm thấy bởi một decentralized component nào đó với xác suất cao.

    Về một chuyện khác: Thế còn các breakthroughs ngay ngành tổng quát gọi là “pattern recognition” là gì. Đâu là những mô hình mới đã đưọc sáng tạo? Xin được điểm qua:
    — Fisher discriminant analysis, logistic regression (nửa đầu TK 20)
    — Perceptron (Rosenblatt, 1958): separating hyperplane algorithm. Cognitive science-inspired, nhưng sau đó bị ruồng rẫy bởi Minsky và Papert (bác Papert bị tai nạn xe máy ở Hà nội năm ngoái).
    — Neural network (phát triển từ perceptron thành nhiều layers, do công của nhiều người: Werbos, 1974;
    Ho (198?), Rumelhart et al (1986). Về mặt technical, thì đóng góp của NN là đi từ linear sang nonlinear pattern recognition. Nhưng về mặt chính trị ngành thì NN cổ vũ và energize rất nhiều người theo đuổi prediction theory (nhiều anh sau đó nhảy ra áp dụng NN để predict stock market, nhưng tất nhiên là chả đi đến đâu).
    — Support vector machine (Vapnik et al, 1995) một sự phát triển từ perceptron sang một dạng “optimal separating hyperplane”, và chuyển linear in low-dimensional spaces sang linear in functional spaces (i.e., từ parametric sang nonparametric), và một loss function hoàn toàn mới.
    — Adaboost: một dạng linear in functional spaces với loss function hoàn toàn mới.
    — Wavelet-based models: chuyển linear sang nonlinear (in functional spaces).
    — Graph-based models: arbitrarily complex (parametric) models
    — Các mô hình nonparametric khác: gauss processes, dirichlet processes, …

    Mặc dù có một số continuity giữa các breakthroughs nhưng người ta chỉ thấy một chút liên tục sau khi đã hiểu chúng khá rõ, đã đưa chúng vào một toolbox to đẹp hơn, còn tại thời điểm các bài báo ra đời thì chúng thường thể hiện những cách suy nghĩa hoàn toàn mới mẻ và độc đáo.

    Ai dự đoán được mô hình tiếp theo là gì? Người đó chắc chắn sẽ rất nổi tiếng.

  3. Posted 31/07/2007 at 3:38 pm | Permalink

    BTW, những thứ như robust statistics, extreme value theory có lẽ chỉ có thể giải quyết được thiên nga trắng có đốm đen thôi. Cho nên Wall street vẫn phải thuê các PhD’s về stats, applied math và computer science để nghĩ out of the box.

  4. Hoàng Minh Châu
    Posted 27/05/2008 at 10:53 pm | Permalink

    Bài review của bác Hưng rất hay. Khâm phục.
    Tuy nhiên, tôi có một vài câu hỏi:
    1. Nếu “Narrative Fallacy” là một lỗi logic có nguồn gốc sinh học, tức là tính phổ biến của nó rất cao và không thể tránh được thì có nên coi nó là lỗi không. Ngoài ra, nếu không dùng phương pháp pattern recognition thì một người khi quan sát 1 hiện tượng, muốn tìm tới bản chất, sẽ phải bắt đầu tư duy từ đâu?
    2. Khi muốn tin một cái gì đó, người ta hay phạm phải comfirmation bias. Nhưng hình như, khi một người không muốn tin vào điều gì đó, thì lại không phải phạm vào lỗi này?
    3. Mọi phát minh khoa học trong phòng thí nghiệm đều là comfirmation bias? Sự khác nhau giữa khoa học và nguỵ biện chỉ là một bên thì người ta chưa tìm được bằng chứng sai, còn một bên đã tìm được?

  5. Kiều Phương
    Posted 28/05/2008 at 7:29 am | Permalink

    Chào Châu
    1_Narrative Fallacy là lỗi logic có tính sinh học hay ko mình ko biết, nhưng lỗi nào thì vẫn là lỗi, dù cho có nhiều người cùng coi đó là bình thường thì vẫn cứ là lỗi.
    Ví dụ : chính quyền Quốc xã thực thi chính sách bài Do thái, cộng đồng đó đều coi đó là bình thường, nhưng rõ ràng họ đã phạm phải tội ác ( hay là lỗi vi phạm đạo đức con người )
    2_”Confirmation bias dùng để chỉ các niềm tin xây dựng trên sự lựa chọn bằng chứng khẳng định mà cố tình bỏ qua bằng chứng phủ định.”
    Trong trường hợp bạn nói, thì có thể coi: niềm tin của người đó là “tôi tin rằng tôi ko tin vào “điều gì đó” là đúng”, và họ bỏ qua các bằng chứng chỉ ra niềm tin đó là sai. vẫn là Confirmation bias
    3_Chưa chắc là khoa học đều bị Confirmation bias. Tôi nghĩ lỗi hay gặp là chưa nhìn nhận từ đủ mọi góc độ (Bayesian reasoning). 1 nhà khoa học mà bị Confirmation bias thì thật là khủng khiếp

Post a Comment

Your email is never published nor shared. Required fields are marked *

You may use these HTML tags and attributes <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*
*