Gỡ rối tơ lòng

Các thắc mắc về KHMT, về toán học máy tính, về cách ghi bình luận trên blog, … xin post ở đây. Chúng tôi sẽ cố gắng trả lời nếu khả năng và thời gian cho phép. Các bạn đọc cũng có thể trả lời và thảo luận các câu hỏi. Nếu câu hỏi có liên hệ sâu hơn thì ta chuyển thành một bài mới.

525 Comments

  1. mlteppi
    Posted 25/11/2011 at 10:38 am | Permalink

    Prof. Jakob Nordstrom ở KTH (Stockholm) đang muốn kiếm PhD students
    (lĩnh vực theoretical computer science) và có nhờ một bạn Việt Nam forward thông
    báo này. Nên nhờ blog Khoa Học Máy Tính thông báo rông rãi cho các bạn sinh viên biết.

    Linh thêm chi tiết đây:
    http://www.csc.kth.se/~jakobn/openings/PhDpositionAug12FlyerEn.pdf
    http://www.csc.kth.se/~jakobn/openings/D-2011-0503-Eng.php

  2. mlteppi
    Posted 25/11/2011 at 10:41 am | Permalink

    A Presentation Talk on PhD Scholarship in NTU for Students in Hanoi & Ho Chi Minh, Vietnam

    The College of Engineering at Nanyang Technological University is conducting a presentation talk on the various types of scholarships available for PhD candidates in Hanoi & Ho Chi Ming, Vietnam.

    Hanoi Session
    Date: 30 November 2011
    Time of Presentation: 2.30pm – 3.15pm
    Time of Examination: 3.30pm – 6.00pm
    Venue: Hotel Nikko Hanoi, 84, Tran Nham Tong Street
    (Website: http://www.hotelnikkohanoi.com.vn)

    Ho Chi Minh Session
    Date: 3 December 2011
    Time of Presentation: 9.00am – 9.45am
    Time of Examination: 10.00am – 1.00pm
    Venue: Legend Hotel, Ho Chi Minh City, 2A-4A, Ton Duc Thang Street, District 1
    (Website: http://www.legendsaigon.com)

    If you have any friend from good universities in Vietnam, please invite them to attend this recruitment talk.

    please register via this link – http://coe.ntu.edu.sg/Graduate/RegisterEvent/Pages/VietnamTripNov2011.aspx

    Regards

  3. babatn
    Posted 04/12/2011 at 4:43 am | Permalink

    Chào các bạn. Mình là Tâm ở thái nguyên.
    Mình đang tìm hiểu về data mining. và đang làm cái bài tập có tên là ;”hãy chỉ ra các khách hàng có nhiều ngu cơ rời bỏ nghân hàng nhất dựa vào các thông tin của khách hàng, thông tin khách hàng giao dịch với ngân hàng.
    Nhưng mình không biết bắt đầu từ đâu. bạn pro nào có thể gợi ý cho mình được không ?
    Thank you very much !

    • Tuan Le
      Posted 16/12/2011 at 2:43 am | Permalink

      Quy trình khai thác dữ liệu có thể có các bước như sau:
      1) Thu thập tất cả những dữ liệu về khách hàng, càng nhiều càng tốt (ít thì dăm ba trăm, nhiều thì vài trăm ngàn khách hàng).
      2) Tìm hiểu xem những dữ liệu này chất lượng như thế nào (thiếu – nhiều người không có thông tin về tuổi chẳng hạn, sai lệch – ví dụ có khách hàng lương tháng 1 tỷ chẳng hạn, v.v…)
      3) Quyết định xem mình sẽ làm gì với những dữ liệu có chất lượng không cao (bỏ đi không xét khách hàng đó hay cột giá trị đó, thay thế bằng một giá trị hợp lý… tùy theo mức độ thống kê được…)
      4) Sau khi có được dữ liệu đã được tinh chỉnh, thì thiết lập các con số thông kê sơ bộ hay các đồ thị phân bố cho dữ liệu để tìm hiểu xem danh sách khách hàng mình đang có trông như thế nào. Ví dụ, bao nhiêu % là nam hay nữ, độ tuổi, địa chỉ ở khu vực nào, mức lương ra sao, v.v… Tức là mình sẽ có một bức tranh sơ bộ về danh sách khách hàng mình đang có.
      6) Dựa vào lịch sử giao dịch của khách hàng để xác định xem khách hàng đó có phải là khách hàng đã đóng tài khoản ở ngân hàng không. Đây chính là biến đầu ra (Output Variable).

      7) Bài toán sẽ được đặt lại: Cho trước những đặc điểm của các khách hàng (Input variables), hãy tìm những đặc điểm chung của các khách hàng có Output Variable là “Đóng”.

      8 ) Nếu làm thủ công thì dựa vào các phương pháp thống kê và xác xuất, bạn có thể nêu được xác xuất một khách hàng với các giá trị của Input Variable cụ thể sẽ đóng tài khoản tại ngân hàng là bao nhiêu %, và từ đó sẽ khái quát được các đặt điểm của khách hàng sẽ đóng tài khoản. Cách làm này sẽ rất mất thời gian.

      9) Nếu bạn dùng software như SAS, Clementine, v.v… thì trên đó đã có sẵn các mô hình thống kê xác suất bạn chỉ cần áp dụng nó cho dữ liệu mà bạn đang có để máy tính sẽ tính toán và đưa ra kết quả. Bạn có thể dùng các mô hình cây quyết định (Decision Tree) để làm việc này, hay phức tạp hơn và có thể chính xác hơn là phân tích hành vi của khách hàng qua các giao dịch (dùng các mô hình của chuỗi thời gian – Time Series).

      10) So sánh các kết quả từ các mô hình và lựa ra mô hình nào cho kết quả tốt nhất.

      *** Cái đầu tiên bạn nên làm là đọc càng nhiều tài liệu về data mining càng tốt, khi đã có kiến thức cơ bản thì hãy áp dụng nó vào bài tập.

      Chúc may mắn.

  4. Ngoc Tran
    Posted 19/12/2011 at 4:23 pm | Permalink

    Chào các bạn Mình đang học môn Programming Logic .Các bạn có thể giúp mình về sách giải bài tập hoặc lớp online CSS . Chân thành cảm ơn !

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>