Thiên nga đen [2]

Ngô Quang Hưng | 01 tháng 08, 2007 | Bản để in Bản để in

(viết tiếp review quyển Thiên Nga Đen, xem phần 1)

3. Confirmation Bias:

Đây là một trong những lỗi logic nhiều người phạm phải mà tôi thấy bức xúc nhất trong các lỗi logic. Do đó, tôi rất đồng cảm với Taleb về các thảo luận xung quanh lỗi confirmation bias. (Dĩ nhiên, như các phần các trong quyển sách, Taleb viết ngông nghênh và phóng đại, có khả năng làm một số bạn đọc phiền lòng.)

Confirmation bias là lỗi chỉ nhăm nhăm đi tìm bằng chứng ủng hộ một mệnh đề nào đó, rồi cho rằng mệnh đề đó đúng. Các ví dụ của Taleb đa phần nhắm “bắn” vào các ngành tài chính, kinh tế, và khoa học xã hội. Ví dụ, Taleb cho rằng thị trường tài chính về cơ bản là không dự đoán được, nhưng người ta vẫn lăng xê nhiều “thiên tài” bằng cách như sau: anh nào đầu tư lỗ lã thì bị đuổi, anh nào đầu tư có lời thì được giữ lại. Như vậy, cơ chế giữ nhân viên kiểu này nghiễm nhiên giữ lại “thiên tài”, cho dù họ chỉ may mắn đầu tư có lời. (Tôi không chuyên về tài chính nên xin dành cho các chuyên gia “bắn” lại Taleb về ví dụ này.) Taleb có một ví dụ khác tôi thấy rất hay: ai cũng kể vào resumé của mình tất cả những thành tích mà mình đã đạt được, nhằm minh chứng rằng mình khá/giỏi về một lãnh vực nào đó. Đây cũng là một dạng confirmation bias. Taleb cho rằng, nếu ta kể trong resumé những thứ mà ta không biết, hoặc đã thất bại trong lãnh vực nọ, hoặc liệt kê cả thành lẫn bại, thì có phải là thông tin chính xác hơn, và resumé ít ấn tượng hơn không.

Nhận xét: riêng về đề tài này tôi có rất nhiều ví dụ tự mình quan sát thấy hàng ngày.

  • Những người tin bói toán thường chỉ nhớ những gì thầy bói nói đúng, nâng ông thầy bói lên thành “thông thiên bác học”. Một số người muốn chứng minh họ có giác quan thứ sáu bằng cách phạm lỗi lầm kiểu như sau, “tôi vừa nghĩ đến anh X thì anh X gọi điện thoại”. Hừm, những khi nghĩ đến anh X mà anh X không gọi điện thoại thì ta đâu có nhớ tới sự kiện đó. Trong quyển sách best-seller Surely you’re joking Mr. Feynman, Richard Feynman có kể lại vài chuyện về cái “giác quan thứ sáu” này rất tếu. Vân Vân và vân vân.
  • Tôi đi đón con ở nhà trẻ, hay thấy cô giáo bế con mình! Nếu không ý thức về confirmation bias, có thể tôi đã kết luận rằng con mình buổi chiều hay quấy nên cô giáo bế, hoặc cô giáo thích con mình nên hay bế nó. Trên thực tế, cả hai kết luận đều sai, tôi chỉ chú ý khi đứa trẻ cô bế là con mình.
  • Từ ví dụ “resume” của Taleb, tôi nghĩ đến ví dụ sau đây. Chúng ta thường hay khen “anh X thông minh lắm”, sau đó cho nhiều bằng chứng cho thấy anh X thông minh như giành giải nhất IMO năm 19yy, có Ph.D. xuất sắc ngành zzz, vân vân. Nhưng nếu, cũng anh X nọ, ta lại đi liệt kê một danh sách những điều ngu ngốc anh ta đã làm (tôi đảm bảo là khá dài — nếu suy từ bụng tôi ra), thì mệnh đề “anh X thông minh lắm” biến thành mệnh đề rỗng. (Cần thêm quantifiers cho các mệnh đề kiểu đó!)
  • Về mặt kỹ thuật, nhiều quyển sách lý thuyết xác suất có nêu ra trò lừa đảo sau đây, minh họa rất tốt cho cái confirmation bias. Giả sử mỗi sáng chủ nhật, bạn nhận được một email từ công ty Đoán Giá Xì Tốc Inc. dự đoán stock của AT&T tuần tới sẽ tăng hay giảm. Email này để minh chứng là họ nói đúng, và nói với bạn rằng nếu bạn trả cho họ 100USD, họ sẽ gửi dự đoán tuần kế tiếp cho. Hơn thế nữa, công ty Đoán Giá Xì Tốc Inc. sẽ bồi hoàn toàn bộ 100USD nếu họ đoán sai. Hấp dẫn chưa?

    Bạn chưa tin tưởng lắm, vì sợ họ lừa đảo gì đó. Tuần sau, bạn thấy họ đã đoán đúng tuần trước, và lại nhận được một email y chang như thế. Họ đoán đúng liên tục 7 tuần liền! À hah. Chắc công ty này (CEO tên là NQH) phải sở hữu “thiên tài” đoán giá xì tốc. Đến đây thì bạn tin sái cổ. Xác suất đoán ngẫu nhiên mà trúng 7 lần liên tục là 1/128. Rất thấp!

    Công ty đó có “thiên tài” thế này. Tuần đầu tiên họ gửi email đến 128 người, một nửa số đó đoán stock tăng, một nửa đoán stock giảm. Tuần sau họ chỉ gửi email đến 64 người mà lượt email đầu đã đoán trúng! Cứ thế 7 tuần liền. Dĩ nhiên, họ không chỉ gửi ra 128 emails mà sẽ gửi 128 triệu email. Nếu chỉ 1/100 số người nhận “7 lần đoán trúng” này bị lừa, cho họ 100USD, thì họ đã kiếm được 10 triệu USD trong 7 tuần. Đơn giản chưa? Chẳng qua, bạn tin “thiên tài” của họ vì bạn chỉ có bằng chứng “confirm” cái thiên tài đó mà không biết về các bằng chứng ngược lại. Tôi rất thích ví dụ này vì nói xong ai cũng hiểu ngay ý nghĩa của lỗi “confirmation bias”.

  • Về mặt triết học thì Karl Popper (và phần nào, cả David Hume trước đó) đã thiết kế cả một nền tảng lý thuyết về confirmation bias và cái ông gọi là corroboration of evidence (xem quyển Logic of Scientific Discovery, và quyển Cọnjectures and Refutations). Tuy nhiên, tôi lại thích nhất tư tưởng của Popper như ông trình bày rất rõ ràng trong quyển Poverty of Historicism (bác Nguyễn Quang A đã dịch quyển này sang tiếng Việt với tựa đề “Sự khốn cùng của Chủ nghĩa lịch sử,”, tiếc rằng bản dịch này cực rối rắm, kiểu sấm Hegel). Cho dù Lakatos đã có những phê phán sắc sảo về chi tiết kỹ thuật, tôi vẫn thấy cơ sở lý luận của Popper về cơ bản là cách tốt nhất để phân biệt khoa học và ngụy khoa học, dự đoán khoa học và “rùa rắn khoa học” kiểu công ty Đoán Xì Tốc Inc.

    Popper quan sát thấy rằng, rất nhiều nhánh “khoa học xã hội” (bao gồm MarxFreud) phạm phải narrative fallacy và confirmation bias. Họ có một lý thuyết vĩ đại nào đó, sau đó “fit” các sự kiện lịch sử vào lý thuyết đó. Sự kiện lịch sử nào không fit vào lý thuyết thì được xem là “outlier”. Không có một lý thuyết khoa học xã hội nào dự đoán chính xác được cái gì. Ngoài ra, lối trình bày lý thuyết một cách mù mờ làm cho các “lý thuyết” này tưởng chừng như đoán được nhiều thứ mà thật ra cũng chỉ là “trò lừa đảo vĩ đại” theo lời Taleb. Một lỗi nữa cũng rất nghiêm trọng là khi lịch sử không “fit” vào lý thuyết nào thì các “nhà khoa học” này thay đổi lý thuyết để “fit” lịch sử.

    Taleb có nhắc đến Popper vài trang, nhưng tôi thấy Taleb chưa “give full credit” cho Popper. Toàn bộ quyển sách của Taleb có thể được tóm gọn là “tư tưởng Popper qua ngôn ngữ xác suất đại chúng”.

    Riêng về dự đoán thì tôi đồng ý với Popper 2 tay 2 chân. Khi nào bạn đọc một lý thuyết chính trị vĩ đại nào đó, bạn thử làm thí nghiệm sau đây trong đầu: nếu ta đem lý thuyết này dự đoán tương lai thì nó đúng được bao nhiêu phần trăm? (Nhớ đừng phạm phải lỗi confirmation bias.) Khi làm thí nghiệm này xong tôi thường thấy các lý thuyết này không ấn tượng như chiều dày của quyển sách chứa nó nữa! Popper đã có một quan sát rất chính xác, nếu chỉ chăm chăm đi tìm bằng chứng ủng hộ một mệnh đề mù mờ nào đó, thì chúng ta gần như có thể chứng minh bất kỳ điều gì!

(còn tiếp.)

Chủ đề: Giới thiệu sách & Xác suất & thống kê |

13 lời bình cho bài “Thiên nga đen [2]”

  1. 1
    dongta viết:

    Bài review rất hay anh Hưng ạ.

    Em cũng đã nhiều lần cảm thấy rất khó khi giải thích về confirmation bias (từ mới học) cho non-mathematical aged minds. Dân làm tài chính thì đủ loại, tạo thành 1 continuous spectrum từ respected mathematicians (như Varadhan vừa được giải Abel) cho đến pure gamblers. Có 1 lần em nói chuyện với 1 vài VNese MBA về Investment Finance thì thấy đa số đều thần tượng Warren Buffet và rằng good sense would make them rich like Warren.

    Một ví dụ liên quan đến “đoán giá xì tốc” của anh nữa là Self-fulfilling Prophecy mà trong 1 blog gần đây em gọi là “Expert’s Prediction Effect”:

    Vì Taleb cũng là tác giả của cuốn “Fooled by Randomness” nên em không ngạc nhiên khi ông này nói nhiều về Confirmation Bias trong Black Swan (sẽ cố gắng đọc). Ngoài ra còn có cuốn Freakconomics thuộc hàng best-selling. Freakonomics tuy viết về những discoveries không có gì đặc biệt (to my opinion) nhưng cũng được giới khoa học ủng hộ nhiệt liệt vì ủng hộ tinh thần chất vấn các standard believes và cách nghĩ dễ nuốt đối với young students. Ở trường em, cuốn Freakonomics được liệt vào danh sách almost required books to read for freshmen. Nói cái này đi hơi xa chủ đề một tí nhưng em liên tưởng các bức xúc kiểu này có magnitude as a wave function with respect to time: lên rồi lại xuống, đến khi bức xúc quá thì lại lên và đến khi ngấy (bão hòa) thì dần dần lại xuống trở lại.

  2. 2
    Ngô Quang Hưng viết:

    Hi Đông Tà,

    Kết quả nổi tiếng nhất, và cũng gây tranh cãi nhất, trong Freakonomics là kết quả của Donohue & Levitt (2001) là legalized abortion làm giảm crime. Tuy nhiên, Foote và Goetz (2005) tìm ra lỗi trong bài báo của D&L. Sau đó D&L có bài số 2 sửa lại (data & method), và cũng bị chỉ trích bởi Dills & Miron (2006). Trích bài của Dills & Miron:

    Donohue and Levitt (2001) (DLI) consider the hypothesis that U.S. legalization of abortion in the early 1970s caused much of the decline in crime in the 1990s. Foote and Goetz (2006) (FG) show, however, that one key result in DLI contained a coding error; summies for state-year interactions were inadvertently omitted from the regressions. FG demonstrate that correcting this error, along with estimating the regressions using arrest rates rather than arrest levels, suggests virtually no effect of legalized abortion on crime.

    Donohue and Levitt (2006) (DLII) acknowledge the coding error and agree that correcting the mistake and using arrest rates suggests no effect of legalized abortion on crime. DLII argue, however, that use of an improved abortion measure and an instrumental variable revives or even strengthens their original result.

    Our conclusion is that the kind of analysis considered in Table VII of DLII does not suggest a quantitatively important effect of legalized abortion on crime.

    Tôi cũng thích quyển Freakonomics, nhưng nó không phải sách kinh tế cho đại chúng tốt nhất. Tôi đã giới thiệu O’Rourke chẳng hạn. Ngoài ra còn có undercover economist, armchair economist, economic hitman , hoặc quyển mới ra của Cowen (tôi chưa đọc nhưng thấy giới thiệu tốt), v.v.

  3. 3
    dongta viết:

    Bọn trường em khuyên sinh viên năm 1 đọc không phải vì nó là sách kinh tế tốt mà có lẽ vì nó là một cuốn sách dễ nuốt cho young students về philosophy of scientific inquiries (just my thought).

    Anh Hưng vài năm gần đây chịu khó đọc sách Kinh Tế phổ thông nhểy :D. Nhìn danh sách thấy kinh người.

  4. 4
    dongta viết:

    Ah, cái blog entry “Expert’s Prediction Effect” là ở đây: http://blog.khoatran.com/2007/07/17/experts-prediction-effect/

  5. 5
    Bach Hung Nguyen viết:

    Bác Hưng với các bác khác làm cái list sách kinh tế phổ thông một phát đê. Dạo này em cũng muốn ti toe học tập các bác đi đọc thêm mấy cái sách này để lúc nào các bác bình này nọ em còn biết tí.

  6. 6
    Ngô Quang Hưng viết:

    Hi Nguyên, tôi chẳng phải chuyên gia nên không dám đưa một definitive list. Tuy nhiên tôi giới thiệu algorithm sau đây:

    (1) đọc một introductory-text trước, ví dụ như quyển của Samuelson,

    (2) sau đó đọc mấy quyển sách tôi vừa link tới ở trên để hiểu ứng dụng cụ thể đời thực của các khái niệm trong sách,

    (3) sau đó nhìn vào danh sách các Nobel Laureates ngành kinh tế và vào Amazon tìm các quyển kinh điển của họ — quyển nào best-seller hơn thì đọc trước vì nhiều khả năng là dễ hiểu hơn (Friedman, Hayek, Sen, Schelling, Stigler thường là dễ theo dõi & relevant hơn). Ngoài ra một số kinh tế gia và triết gia trước thời có giải Nobel kinh tế cũng cực kỳ quan trọng như (dĩ nhiên) Smith, Keynes, Marx, Locke, Mill, v.v.

  7. 7
    thaidn viết:

    Mới có một vụ lừa đảo giống như Đoán Giá Xì Tốc Inc. đó anh Hưng. Xem ở http://vnexpress.net/Vietnam/Phap-luat/2007/08/3B9F9C91/

  8. 8
    Ngô Quang Hưng viết:

    Cảm ơn Thái! Vụ này hơi dở là gọi điện thoại rất kém hiệu quả (tốn nhiều thời gian mà gọi được ít người), dễ bị bắt.

    Sớm hay muộn cũng có chú dùng botnet “chỉ đạo” bà con đánh đề :-)

  9. 9
    Kiều Phương viết:

    Em có điểm này băn khoăn sau khi đọc bài viết của anh Hưng
    Giả sử em là 1 công ty chuyên tư vấn xì tốc làm ăn chân chính, thuê chuyên gia đàng hoàng và em muốn PR với khách hàng tiềm năng. Tuy nhiên, tất cả khách hàng đều đọc entry trên của anh, và vì thế họ ko bị Confirmation Bias. Vậy, giả sử em cũng gửi mail dự đoán free cho vài khách hàng. Có 2 khả năng xảy ra:
    1_Em dự đoán đúng, và khách hàng quy cho em là lừa đảo vì biểu hiện chả khác gì ví dụ của anh
    2_Em dự đoán sai, và khách hàng ko tin tưởng xài dịch vụ em cung cấp
    Như thế kiểu gì thì em cũng thất bại. Tức là em (hay bất cứ ai) dự báo xì tốc cũng thất bại nếu mọi người đều ko bị Confirmation Bias
    Có thể kết luận lại rằng: chừng nào mà người ta còn tin vào các dự báo thì khi đó người ta còn nhiễm Confirmation Bias ? tức là nếu muốn đảm bảo tính logic trong cuộc sống, chúng ta ko nên dự đoán tương lai ?_?

  10. 10
    Ngô Quang Hưng viết:

    @Kiều Phương: câu hỏi rất hay!

    Confirmation bias dùng để chỉ các niềm tin xây dựng trên sự lựa chọn bằng chứng khẳng định mà cố tình bỏ qua bằng chứng phủ định. Khách hàng của Phương, nếu không có thông tin gì khác ngoài việc công ty Phương đoán đúng, thì không phạm phải confirmation bias (cho dù cty của Phương là lừa đảo thật!). Chẳng qua là một dạng Bayesian reasoning. Bà cô tôi đi xem thầy bói, chỉ cố tình nhớ những lần thầy bói nói đúng mà bỏ qua những lần thầy bói nói sai thì phạm phải confirmation bias.

    Tôi đoán là ngày mai mặt trời mọc! Cho đến khi nào có ai đó chỉ cho tôi một hôm mặt trời không mọc thì tôi chưa phạm confirmation bias.

    Quay lại trường hợp khách hàng công ty xì tốc. Bài học là: với một hiện tượng mà common-sense cho thấy khó xảy ra thì ta phải quan sát cùng một hiện tượng từ nhiều góc độ (ví dụ như từ góc độ của 127 khách hàng khác, ngoài bản thân ta) trước khi khẳng định.

  11. 11
    Kiều Phương viết:

    Chào anh Hưng

    Em sẽ phải đọc thêm nhiều về Baysian reasoning và Confirmation bias mới đc, cái này tạm để sau vậy ^^
    Trở lại vụ công ty xì tốc: cách giải quyết của anh là tham khảo 127 khách hàng để có cái nhìn khách quan. Tuy nhiên điều đó trên thực tế là ko thể vì:
    1_Liệu 127 khách hàng kia có chịu nói thật với anh ?
    2_Với con số 127 thì có thể mất cả ngày trời check mail, phone….nhưng với con số thực tế công ty đó spam mail thì ta bó tay rồi

    Tương tự, em thấy có những cái ta ko thể nhìn đc nó 1 cách khách quan từ mọi góc độ (vì nhiều lý do: chính trị, tôn giáo, niềm tin, phong tục, giáo dục thời trẻ, thậm chí là giới hạn nhận thức của ta lúc đó….) Vậy có cách nào giải quyết bài toán xác định tính đúng đắn của hiện tượng common-sense ở đây? Em có cảm giác mơ hồ là ta ko thể đạt đc chân lý tuyệt đối, mà chỉ có thể hơi hơi logic 1 chút xíu thôi.

    Liệu suy nghĩ của em có thể coi là 1 lỗi logic ko?

  12. 12
    Ngô Quang Hưng viết:

    Kiều Phương: chân lý vật lý (physical truth) luôn là tương đối vì phụ thuộc vào những gì ta quan sát được và trực quan (trong tư duy Bayesian thì gọi là “prior”). Quan sát được thêm thì có khi phải đổi model (kiểu Newton đến Einstein đến cơ lượng tử). Biết thêm thông tin về 127 khách hàng khác thì ta phải đổi quan niệm về công ty nọ.

  13. 13
    Thái viết:

    Anh Hưng viết tiếp review cho cuốn sách này đi anh. Em đang đọc nó, rồi đọc review của anh thấy mọi thứ rõ ràng hơn rất nhiều.

    (có vẻ như em đang bị confirmation bias, biết đâu review tiếp theo của anh lại làm cho mọi thứ rối mù thì sao :-p)

Ghi lời bình của bạn: