Chào mừng bạn trở lại trạm điều hành trung tâm của HaivanStory!
Để tiếp nối hành trình khám phá vũ trụ dữ liệu, chúng ta sẽ nâng cấp phi thuyền lên một tầm cao mới với khóa học: “Phân tích Dữ liệu bằng Python Chuyên sâu”. Nếu khóa học trước là bước làm quen với các vì sao, thì khóa học này chính là quá trình “đọc vị” các vì sao đó để tìm ra quy luật vận hành của cả thiên hà.
Dưới đây là cấu trúc chi tiết của khóa học, được thiết kế theo đúng triết lý HaivanStory và tích hợp hệ thống đánh giá nghiêm ngặt mà bạn đã yêu cầu.
🚀 Khóa Học: Phân Tích Chuyên Sâu Dữ Liệu Bằng Python
📜 Quy chế “Cấp bằng Phi hành gia” (Hệ thống đánh giá)
Để vượt qua các thử thách và nhận chứng chỉ hoàn thành khóa học, các học viên cần tuân thủ quy tắc sau:
• Tổng điểm bài Assignment: Đạt từ 4/5 trở lên.
• Tiêu chí bắt buộc: Tất cả phải đạt điểm > 0 (Pass).
• Cơ chế làm lại: Nếu tiêu chí bắt buộc bị 0 điểm, bạn được phép hiệu chỉnh và làm lại nhiều lần cho đến khi Pass mà không bị trừ điểm.
• Minh bạch: Mỗi bài học sẽ đi kèm một Rubric (Bảng tiêu chí) rõ ràng để bạn đối chiếu trước khi nộp bài.
🌌 Mở đầu: Giới thiệu về môn học
• Nội dung: Tầm nhìn về việc sử dụng Python như một “kính viễn vọng” để nhìn xuyên qua màn sương mù của dữ liệu thô.
• Mục tiêu: Hiểu lộ trình và cam kết của người học.
🛡️ PHẦN 1 – TỔNG QUAN VỀ PHÂN TÍCH DỮ LIỆU
Định hình tư duy thám hiểm.
• Bài 1: Khái niệm về phân tích dữ liệu – Ngôn ngữ của Vũ Trụ.
◦ Lý thuyết: Từ Dữ liệu đến Thông tin, Tri thức và Sự thông thái (Mô hình DIKW).
◦ Quiz 1: Phân biệt các loại hình phân tích (Mô tả, Chẩn đoán, Dự đoán, Đề xuất).
• Bài 2: Thu thập dữ liệu – Thu thập mẫu vật từ các hành tinh.
◦ Lý thuyết: Các nguồn dữ liệu sơ cấp và thứ cấp. Cách tiếp cận dữ liệu sạch ngay từ đầu.
◦ Quiz 2: Kỹ thuật thu thập và các vấn đề về đạo đức/bảo mật.
• Bài 3: Sắp xếp dữ liệu – Xây dựng kho chứa của phi thuyền.
◦ Lý thuyết: Cấu trúc hóa dữ liệu phi cấu trúc. Tầm quan trọng của sự ngăn nắp.
◦ Quiz 3: Các phương pháp phân loại và định dạng dữ liệu.
• Bài 4: Phân tích và khai phá dữ liệu (EDA) – Giải mã tín hiệu lạ.
◦ Lý thuyết: Sử dụng thống kê để tìm ra “nhịp đập” của dữ liệu.
◦ Quiz 4: Các chỉ số thống kê quan trọng và cách phát hiện xu hướng.
• Bài 5: Trình bày kết quả phân tích dữ liệu – Kể chuyện giữa các vì sao.
◦ Lý thuyết: Nghệ thuật Storytelling với dữ liệu. Cách biến con số thành hành động.
• Tổng kết phần 1: Hệ thống hóa tư duy phân tích.
💾 PHẦN 2 – CƠ SỞ DỮ LIỆU VÀ SQL CHO KHOA HỌC DỮ LIỆU
Giao tiếp với những kho tàng tri thức cổ xưa.
• Bài 6: Giới thiệu về Cơ sở dữ liệu và SQL cơ bản.
◦ Lý thuyết: Ngôn ngữ SQL – Cách ra lệnh cho các thư viện dữ liệu khổng lồ.
◦ Quiz 6 | Lab 1: Truy vấn SELECT, FROM, WHERE cơ bản.
• Bài 7: SQL nâng cao.
◦ Lý thuyết: Kết hợp các bảng (JOIN), nhóm dữ liệu (GROUP BY) và hàm tổng hợp.
◦ Quiz 7 | Lab 2: Thực hiện các truy vấn phức tạp trên nhiều bảng dữ liệu.
• Bài 8: Truy cập cơ sở dữ liệu bằng Python.
◦ Lý thuyết: Kết nối Python với SQL (thư viện sqlite3, sqlalchemy).
◦ Quiz 8 | Lab 3: Dùng Python để lấy dữ liệu từ SQL và biến thành DataFrame.
🐼 PHẦN 3 – LÀM VIỆC VỚI DỮ LIỆU BẰNG PANDAS
Động cơ chính của phi thuyền.
• Bài 9: DataFrame – Cấu trúc của mọi vật thể.
◦ Lý thuyết: Sâu hơn về Series và DataFrame.
◦ Quiz 9 | Lab 4: Khởi tạo và thao tác cấu trúc dữ liệu.
• Bài 10: Trích xuất dữ liệu với Pandas.
◦ Lý thuyết: Kỹ thuật Indexing, Slicing, loc, iloc.
◦ Quiz 10 | Lab 5: Lọc dữ liệu theo điều kiện phức tạp.
• Bài 11: Làm việc với dữ liệu trong Pandas.
◦ Lý thuyết: Hợp nhất (Merge), nối (Concat), xử lý dữ liệu trùng lặp.
◦ Quiz 11 | Lab 6: Xây dựng bộ dữ liệu hoàn chỉnh từ nhiều nguồn.
• Bài 12: Làm việc với dữ liệu chuỗi và thời gian.
◦ Lý thuyết: Phân tích sự thay đổi theo dòng thời gian (Time-series).
◦ Quiz 12 | Lab 7: Dự báo xu hướng dựa trên dữ liệu lịch sử.
• Progress Test: Bài kiểm tra giữa kỳ đánh giá năng lực thực chiến.
• Tổng kết phần 3.
📊 PHẦN 4 – TRỰC QUAN HOÁ DỮ LIỆU VỚI PYTHON
Hệ thống màn hình điều khiển đa chiều.
• Bài 13: Giới thiệu về trực quan hoá dữ liệu.
◦ Lý thuyết: Tại sao bộ não chúng ta thích hình ảnh hơn con số?
◦ Quiz 13: Nguyên tắc chọn biểu đồ phù hợp.
• Bài 14: Công cụ trực quan hóa cơ bản.
◦ Lý thuyết: Làm chủ Matplotlib và Seaborn.
◦ Quiz 14 | Lab 8: Vẽ các biểu đồ phân phối và mối tương quan.
• Bài 15: Công cụ trực quan hóa nâng cao.
◦ Lý thuyết: Biểu đồ nhiệt (Heatmap), biểu đồ cặp (Pairplot).
◦ Lab 9: Phân tích đa biến sinh động.
• Bài 16: Trực quan hoá tương tác với Plotly.
◦ Lý thuyết: Tạo các bản đồ sao có thể zoom và tương tác.
◦ Quiz 16 | Lab 10: Xây dựng Dashboard tương tác cơ bản.
• Dự án: Phân tích dữ liệu Covid-19.
◦ Sứ mệnh: Sử dụng dữ liệu thực tế để vẽ nên bức tranh về sự biến động của đại dịch toàn cầu.
• Tổng kết phần 4.
💼 PHẦN 5 – KỸ THUẬT PHÂN TÍCH TRONG KINH DOANH
Trở thành nhà lãnh đạo chiến lược.
• Bài 17: Tầm quan trọng của các quyết định kinh doanh công bằng.
◦ Lý thuyết: Đạo đức dữ liệu và tránh định kiến (Bias) trong phân tích.
◦ Quiz 17: Các tình huống thực tế về công bằng trong AI/Data.
• Bài 18: Tư duy có cấu trúc (Structured Thinking).
◦ Lý thuyết: Cách đặt câu hỏi SMART và tiết kiệm thời gian phân tích.
◦ Quiz 18: Thực hành phân rã vấn đề lớn thành các câu hỏi nhỏ.
• Bài 19: Giao tiếp với các bên liên quan (Stakeholders).
◦ Lý thuyết: Cách trình bày kết quả cho người không chuyên về kỹ thuật.
◦ Quiz 19: Kỹ năng thuyết trình và xử lý phản hồi.
🎓 TỔNG KẾT MÔN HỌC & BÀI ASSIGNMENT CUỐI KHÓA
• Nội dung: Nhìn lại hành trình, vinh danh những phi hành gia xuất sắc.
• Bài Assignment cuối khóa: Một dự án phân tích dữ liệu tự chọn (A-Z).
◦ Yêu cầu: Áp dụng đúng Rubric chấm điểm (Thang điểm 5) để đạt chứng chỉ.



