Các thắc mắc về KHMT, về toán học máy tính, về cách ghi bình luận trên blog, … xin post ở đây. Chúng tôi sẽ cố gắng trả lời nếu khả năng và thời gian cho phép. Các bạn đọc cũng có thể trả lời và thảo luận các câu hỏi. Nếu câu hỏi có liên hệ sâu hơn thì ta chuyển thành một bài mới.
Thông điệp ngắn
- Wall Street's Sexiest Model - Forbes http://t.co/JTfwhOP1
- In China, Human Costs Are Built Into an iPad http://t.co/hUJDjFyv
- RT @vardi: Why Science is Failing Us: http://t.co/ID2mrc8b
- RT @fortnow: Talk on Science of Insecurity http://t.co/FMMnviY4 (via Klaus-Joern Lange)
- RT @TheEconomist: An obstetrician, numismatist and hater of the Fed and the UN might just win in #Iowa http://t.co/pO1biDyC
Phản hồi mới
- NQH on Tìm hiểu về các hệ thống cơ sở dữ liệu lớn [2]
- NQH on Cử chỉ đẹp
- zyx on Cử chỉ đẹp
- Khoa on Tìm hiểu về các hệ thống cơ sở dữ liệu lớn [2]
- Nam on Cử chỉ đẹp
- Khoa on Các câu hỏi phỏng vấn [41]
- NXL on Lẽ phải không cần cái mác “trí thức”
- NQH on Lẽ phải không cần cái mác “trí thức”
- NQH on Cử chỉ đẹp
- Teo on Cử chỉ đẹp
- tríThức86 on Lẽ phải không cần cái mác “trí thức”
- NQH on Lẽ phải không cần cái mác “trí thức”
- Trithuc4 on Lẽ phải không cần cái mác “trí thức”
- Nguoi quen on Cử chỉ đẹp
- NQH on Cử chỉ đẹp
-
Bài mới
Thư khố
Chuyên Mục
- Âm Nhạc (54)
- Ảnh hưởng của CNTT (6)
- Ảo giác (3)
- Bảo mật và mật mã học (74)
- Biển Đông (6)
- Blog cầu (5)
- Bơi (6)
- Các hệ thống máy tính (9)
- Các hội nghị KHMT (12)
- Công nghệ phần mềm (6)
- Chính trị trong ngành (30)
- Chưa phân loại (41)
- CNTT các nước và VN (47)
- Combinatorics (22)
- Cơ sở dữ liệu (3)
- Danh ngôn (13)
- Dành cho du học sinh (108)
- Games (2)
- Giáo dục (85)
- Giới thiệu sách (36)
- KHMT và Kinh Tế (1)
- KHMT và luật pháp (6)
- KHMT và sinh học (6)
- KHMT và triết học (3)
- Lập trình (16)
- Lịch Sử (1)
- Lịch sử Việt Nam (2)
- Lý thuyết mã hóa (4)
- Lý thuyết tính toán (55)
- Lý thuyết thông tin (17)
- Mạng máy tính (36)
- Mỹ quốc (12)
- Nghiên cứu nghiên kiếc (50)
- Nhân vật và sự kiện (132)
- Python (2)
- Quả đất của ta (1)
- Siêu Nhiên (1)
- Thông báo (28)
- Thần kinh học (1)
- Thầy bói nói mò (1)
- Thuật ngữ chuyên ngành (8)
- Thuật Toán (59)
- Thơ (4)
- Tin tức đó đây (94)
- Toán Ứng Dụng (9)
- Toán tối ưu (5)
- Trang web hay (31)
- Trí tuệ nhân tạo (48)
- Vui – Giải Trí (267)
- Vượt định kiến (25)
- Xác suất & thống kê (62)
- Xuất bản (14)
- Y Học (2)
Báo chí
Bảo mật
Blog Việt
- Bùi Nguyên Cẩm Ly
- Giáp Văn Dương
- Hoàng Hoài Minh
- Huy Đức
- Lê Hồng Giang
- Minh Biện
- Ngô Bảo Châu
- Nguyễn Ngọc Tư
- Nguyễn Tiến Dũng
- Nguyễn Văn Tuấn
- Nguyễn Đình Đăng
- Nhiệt Huyết
- Phạm Thị Hoài
- Quỹ Trí Tuệ Việt Nam
- Talawas
- Thành Nguyễn
- Tin Khó Tin
- Trang Hạ
- Trần Hữu Dũng
- Trần Vinh Dự
- Vũ Hà Văn
- Vũ Hoàng Linh
- Đàm Thanh Sơn
- Đông A
- Đỗ Quốc Anh
- Đoàn Kết
Chưa phân loại
Giáo dục
Kỹ thuật
Khoa học khác
Kinh tế, luật pháp, xã hội
- A Tiny Revolution
- Andrew Sullivan.com
- Chicago’s Law Faculty
- Computing Chris
- Creative Capitalism
- Crooked Timber
- Daily Kos
- Freakonomics
- Free exchange
- Furdlog
- Instapundit
- Marginal Revolution
- Social Science Statistics
- Structured Procrastination
- The Becker-Posner Blog
- The Volokh Conspiracy
- Vietnam Quant. Society
- Đỗ Quốc Anh
Lý thuyết & thuật toán
- Algorithmic Game Theory
- Combinatorics and More
- Comp. Complexity Blog
- CS Theory Overflow
- ECCC
- Ernie’s 3D Pancakes
- Glob of Thoughts
- Godel's Lost Letter
- In Theory
- Luca Trevisan
- Machine Learning (Theory)
- My Biased Coin
- My slice of pizza
- Rudy’s Blog
- Sariel’s Blog
- Shtetl-Optimized
- tcs math
- The Geomblog
- The Quantum Pontiff
- Theory Matters
Mạng
Não học
Toán học
Vật Lý
525 Comments
Prof. Jakob Nordstrom ở KTH (Stockholm) đang muốn kiếm PhD students
(lĩnh vực theoretical computer science) và có nhờ một bạn Việt Nam forward thông
báo này. Nên nhờ blog Khoa Học Máy Tính thông báo rông rãi cho các bạn sinh viên biết.
Linh thêm chi tiết đây:
http://www.csc.kth.se/~jakobn/openings/PhDpositionAug12FlyerEn.pdf
http://www.csc.kth.se/~jakobn/openings/D-2011-0503-Eng.php
A Presentation Talk on PhD Scholarship in NTU for Students in Hanoi & Ho Chi Minh, Vietnam
The College of Engineering at Nanyang Technological University is conducting a presentation talk on the various types of scholarships available for PhD candidates in Hanoi & Ho Chi Ming, Vietnam.
Hanoi Session
Date: 30 November 2011
Time of Presentation: 2.30pm – 3.15pm
Time of Examination: 3.30pm – 6.00pm
Venue: Hotel Nikko Hanoi, 84, Tran Nham Tong Street
(Website: http://www.hotelnikkohanoi.com.vn)
Ho Chi Minh Session
Date: 3 December 2011
Time of Presentation: 9.00am – 9.45am
Time of Examination: 10.00am – 1.00pm
Venue: Legend Hotel, Ho Chi Minh City, 2A-4A, Ton Duc Thang Street, District 1
(Website: http://www.legendsaigon.com)
If you have any friend from good universities in Vietnam, please invite them to attend this recruitment talk.
please register via this link – http://coe.ntu.edu.sg/Graduate/RegisterEvent/Pages/VietnamTripNov2011.aspx
Regards
Chào các bạn. Mình là Tâm ở thái nguyên.
Mình đang tìm hiểu về data mining. và đang làm cái bài tập có tên là ;”hãy chỉ ra các khách hàng có nhiều ngu cơ rời bỏ nghân hàng nhất dựa vào các thông tin của khách hàng, thông tin khách hàng giao dịch với ngân hàng.
Nhưng mình không biết bắt đầu từ đâu. bạn pro nào có thể gợi ý cho mình được không ?
Thank you very much !
Quy trình khai thác dữ liệu có thể có các bước như sau:
1) Thu thập tất cả những dữ liệu về khách hàng, càng nhiều càng tốt (ít thì dăm ba trăm, nhiều thì vài trăm ngàn khách hàng).
2) Tìm hiểu xem những dữ liệu này chất lượng như thế nào (thiếu – nhiều người không có thông tin về tuổi chẳng hạn, sai lệch – ví dụ có khách hàng lương tháng 1 tỷ chẳng hạn, v.v…)
3) Quyết định xem mình sẽ làm gì với những dữ liệu có chất lượng không cao (bỏ đi không xét khách hàng đó hay cột giá trị đó, thay thế bằng một giá trị hợp lý… tùy theo mức độ thống kê được…)
4) Sau khi có được dữ liệu đã được tinh chỉnh, thì thiết lập các con số thông kê sơ bộ hay các đồ thị phân bố cho dữ liệu để tìm hiểu xem danh sách khách hàng mình đang có trông như thế nào. Ví dụ, bao nhiêu % là nam hay nữ, độ tuổi, địa chỉ ở khu vực nào, mức lương ra sao, v.v… Tức là mình sẽ có một bức tranh sơ bộ về danh sách khách hàng mình đang có.
6) Dựa vào lịch sử giao dịch của khách hàng để xác định xem khách hàng đó có phải là khách hàng đã đóng tài khoản ở ngân hàng không. Đây chính là biến đầu ra (Output Variable).
7) Bài toán sẽ được đặt lại: Cho trước những đặc điểm của các khách hàng (Input variables), hãy tìm những đặc điểm chung của các khách hàng có Output Variable là “Đóng”.
8 ) Nếu làm thủ công thì dựa vào các phương pháp thống kê và xác xuất, bạn có thể nêu được xác xuất một khách hàng với các giá trị của Input Variable cụ thể sẽ đóng tài khoản tại ngân hàng là bao nhiêu %, và từ đó sẽ khái quát được các đặt điểm của khách hàng sẽ đóng tài khoản. Cách làm này sẽ rất mất thời gian.
9) Nếu bạn dùng software như SAS, Clementine, v.v… thì trên đó đã có sẵn các mô hình thống kê xác suất bạn chỉ cần áp dụng nó cho dữ liệu mà bạn đang có để máy tính sẽ tính toán và đưa ra kết quả. Bạn có thể dùng các mô hình cây quyết định (Decision Tree) để làm việc này, hay phức tạp hơn và có thể chính xác hơn là phân tích hành vi của khách hàng qua các giao dịch (dùng các mô hình của chuỗi thời gian – Time Series).
10) So sánh các kết quả từ các mô hình và lựa ra mô hình nào cho kết quả tốt nhất.
*** Cái đầu tiên bạn nên làm là đọc càng nhiều tài liệu về data mining càng tốt, khi đã có kiến thức cơ bản thì hãy áp dụng nó vào bài tập.
Chúc may mắn.
Chào các bạn Mình đang học môn Programming Logic .Các bạn có thể giúp mình về sách giải bài tập hoặc lớp online CSS . Chân thành cảm ơn !