Bài 18: Giới thiệu Học Máy (Machine Learning): Dạy Máy Tính ‘Học’
1. Mở Đầu (Hook & Mục Tiêu)
Bạn hãy tưởng tượng mình đang điều khiển một con tàu vũ trụ tiến vào một vùng không gian hoàn toàn mới. Thay vì phải tự tay lập trình hàng triệu dòng mã kiểu: “Nếu gặp tảng đá màu xanh thì rẽ trái, nếu gặp tảng đá màu đỏ thì rẽ phải”, bạn chỉ cần đưa cho hệ thống máy tính của tàu hàng ngàn tấm ảnh về các vụ va chạm trong quá khứ. Sau một hồi quan sát, hệ thống tự nói với bạn: “Thuyền trưởng, tôi đã hiểu quy luật rồi, hãy để tôi tự lái qua vùng thiên thạch này!”.
Đó chính là khoảnh khắc Machine Learning (Học Máy) ra đời. Chúng ta không còn cầm tay chỉ việc cho máy tính nữa, mà chúng ta dạy nó cách tự rút ra quy luật từ dữ liệu.
Mục tiêu bài học:
• Hiểu bản chất của Machine Learning (ML) và sự khác biệt với lập trình truyền thống.
• Phân biệt 3 “phong cách học” của máy tính: Có giám sát, Không giám sát và Học tăng cường.
• Làm quen với tư duy của các thuật toán kinh điển như Hồi quy tuyến tính và Phân loại.
2. Lý Thuyết & Khái Niệm (HaivanStory’s Voice)
Machine Learning Là Gì? (Trí Tuệ Từ Kinh Nghiệm)
Trong lập trình truyền thống, bạn đưa vào Dữ liệu + Quy tắc để máy tính cho ra Kết quả. Trong Machine Learning, bạn đưa vào Dữ liệu + Kết quả (quá khứ) để máy tính tự xây dựng nên Quy tắc.
Hãy coi ML như một “đứa trẻ thiên tài” trên tàu vũ trụ. Nhiệm vụ của bạn không phải là nhồi nhét kiến thức, mà là đưa cho nó thật nhiều “trải nghiệm” (dữ liệu).
Ba “Lớp Học” Của Máy Tính
Để một hệ thống AI có thể học, nó thường tham gia vào một trong ba loại hình đào tạo sau:
1 Học Có Giám Sát (Supervised Learning): * Ẩn dụ: Giống như có một người thầy (Dữ liệu đã dán nhãn) đứng bên cạnh. Thầy đưa cho máy ảnh một ngôi sao và bảo: “Đây là Sao Hỏa”, đưa ảnh khác và bảo: “Đây là Sao Kim”.
◦ Mục tiêu: Sau khi xem đủ nhiều, khi gặp một tấm ảnh mới, máy sẽ tự tin nói: “Đây chắc chắn là Sao Hỏa!”.
◦ Ứng dụng: Dự đoán giá nhà, lọc thư rác (Spam).
2 Học Không Giám Sát (Unsupervised Learning):
◦ Ẩn dụ: Máy tính bị bỏ lại trong một căn phòng đầy những mẫu đá vũ trụ lạ lẫm mà không có ai chỉ bảo.
◦ Mục tiêu: Nó sẽ tự quan sát và nhận ra: “Đám đá này cứng và đen, đám kia mềm và xanh”. Nó tự gom nhóm (Clustering) những thứ giống nhau lại.
◦ Ứng dụng: Phân loại nhóm khách hàng, tìm ra các thiên hà có cấu trúc tương tự nhau.
3 Học Tăng Cường (Reinforcement Learning):
◦ Ẩn dụ: Giống như dạy một chú chó máy làm xiếc hoặc robot thám hiểm tìm đường trong hang động.
◦ Mục tiêu: Nếu máy đi đúng đường, nó được cộng điểm (phần thưởng). Nếu đâm vào tường, nó bị trừ điểm (hình phạt). Qua hàng triệu lần thử sai, nó sẽ tìm ra con đường tối ưu nhất.
◦ Ứng dụng: AlphaGo chơi cờ, xe tự lái.
Hai “Vũ Khí” Đầu Tiên Của Phi Hành Đoàn
Để bắt đầu, chúng ta thường dùng hai loại thuật toán đơn giản nhưng cực kỳ mạnh mẽ:
• Hồi quy tuyến tính (Linear Regression): Dùng để dự đoán một con số cụ thể. Ví dụ: Dựa vào lượng nhiên liệu còn lại, dự đoán tàu có thể bay thêm được bao nhiêu năm ánh sáng nữa? Công thức đơn giản nhất mà máy tính sẽ tìm ra có dạng: y=ax+b.
• Phân loại (Classification – ví dụ Naive Bayes): Dùng để đưa ra lựa chọn “Có” hoặc “Không”. Ví dụ: Dựa vào tần số sóng nhận được, máy tính quyết định đây là “Tín hiệu từ người ngoài hành tinh” hay chỉ là “Tiếng ồn vũ trụ” dựa trên xác suất.
Gợi ý từ Coursera: Bạn nên xem video “What is Machine Learning?” trong khóa học danh tiếng Machine Learning Specialization của thầy Andrew Ng. Đây là “kinh thánh” cho bất kỳ ai muốn bước chân vào thế giới AI.
3. Thực Hành & Vận Dụng (Hands-on & Interactive)
Google Colab (Thực hành cốt lõi): Chúng ta sẽ không cần viết những thuật toán phức tạp ngay bây giờ. Hãy sử dụng thư viện scikit-learn để xem máy tính “học” như thế nào.
• Link Notebook: Lab 18: Bài Học Đầu Tiên Của AI
◦ Nhiệm vụ 1: Nạp một bộ dữ liệu nhỏ về “Kích thước thiên thạch” và “Khối lượng”.
◦ Nhiệm vụ 2: Dùng thuật toán LinearRegression để máy tính tìm ra mối liên hệ.
◦ Nhiệm vụ 3: Thử đưa vào một kích thước mới và xem máy tính dự đoán khối lượng là bao nhiêu.
SoloLearn Quiz:
• Machine Learning Concepts Quiz – Kiểm tra xem bạn đã phân biệt được các loại hình học máy chưa.
4. Câu Chuyện HaivanStory & Liên Hệ Thực Tế
Trên con tàu “Viễn Vọng”, robot trợ lý tên là Zola ban đầu rất vụng về. Khi Haivan yêu cầu Zola pha một ly cà phê không trọng lực, Zola đã làm đổ tung tóe vì không hiểu định luật vật lý tại đó.
Thay vì viết lại toàn bộ code cho Zola, Haivan đã bật chế độ Học tăng cường. Mỗi lần Zola giữ được ly cà phê ổn định, Haivan nhấn nút “Khen ngợi”. Sau 500 lần làm đổ và 100 lần thành công, Zola đã tự rút ra được góc nghiêng hoàn hảo để pha cà phê trong môi trường không trọng lực.
Liên hệ thực tế: Machine Learning đang ở quanh bạn. Khi Spotify gợi ý một bài hát bạn cực kỳ thích, đó là vì nó đã quan sát “lịch sử nghe nhạc” của bạn (Học có giám sát). Khi Gmail tự động phân loại thư quảng cáo vào mục riêng, đó là nhờ các thuật toán phân loại đang hoạt động không ngừng nghỉ.
5. Tổng Kết & Hướng Đi Tiếp Theo
Hôm nay bạn đã chính thức bước vào kỷ nguyên của Trí tuệ nhân tạo:
• Bạn đã biết Machine Learning là việc dạy máy tính học từ dữ liệu.
• Bạn đã phân biệt được 3 “lớp học”: Có giám sát, Không giám sát và Tăng cường.
• Bạn đã thấy được cách Hồi quy và Phân loại giải quyết các bài toán thực tế.
Hướng đi tiếp theo: Machine Learning không thể làm việc với dữ liệu “bẩn”. Trong bài sau, chúng ta sẽ quay lại một kỹ năng cực kỳ quan trọng của Module 4 để bổ trợ cho Module 5: Kỹ Thuật Làm Sạch Dữ Liệu (Data Cleaning) — giúp “đứa trẻ AI” của chúng ta không học nhầm những điều sai trái.
6. Kêu Gọi Hành Động (Call to Action)
Nếu bạn có một robot giúp việc, bạn muốn nó “học” điều gì từ thói quen của bạn nhất? Hãy comment chia sẻ ý tưởng đó nhé! Đừng quên lưu lại bài viết này, vì đây là nền móng quan trọng nhất để bạn hiểu về tương lai của nhân loại trong kỷ nguyên AI.



