Dự Án Capstone: Truy Tìm “Trái Đất Thứ Hai” – Phân Loại Hành Tinh Có Thể Ở Được

1. Mở Đầu (Hook & Mục Tiêu)

Giữa hàng tỷ ngôi sao trong dải Ngân Hà, liệu chúng ta có cô đơn? Các kính viễn vọng không gian như Kepler hay James Webb đã gửi về dữ liệu của hàng ngàn Exoplanets (Hành tinh ngoài hệ Mặt Trời). Nhưng câu hỏi hóc búa nhất là: Hành tinh nào trong số đó thực sự có thể duy trì sự sống?

Trong dự án Capstone này, bạn sẽ nhập vai một Nhà Thiên văn học Dữ liệu. Nhiệm vụ của bạn là xây dựng một mô hình AI để phân loại xem một hành tinh là “Có thể ở được” (Habitable) hay “Không thể ở được” dựa trên những chỉ số vật lý khắc nghiệt.

Mục tiêu dự án:

• Thực hành kỹ năng phân loại (Classification) với dữ liệu thiên văn học thực tế từ NASA.

• Hiểu về khái niệm Vùng Goldilocks (Vùng ở được xung quanh một ngôi sao).

• Đánh giá mô hình dựa trên độ nhạy (Recall) để đảm bảo không bỏ sót bất kỳ “Trái Đất thứ hai” nào.

2. Quy Trình Thực Hiện (HaivanStory’s Voice)

Để tìm kiếm một hành tinh có sự sống, phi thuyền của chúng ta cần đi qua các chặng kiểm soát nghiêm ngặt:

Giai đoạn 1: Quét Bản Đồ Thiên Hà (Loading Data)

Chúng ta sẽ sử dụng bộ dữ liệu NASA Exoplanet Archive. Dữ liệu này bao gồm các thông số như:

• Planet Mass & Radius: Kích thước và khối lượng hành tinh (Quá lớn sẽ là hành tinh khí, quá nhỏ sẽ không giữ được khí quyển).

• Orbital Period: Thời gian hành tinh quay quanh sao mẹ.

• Distance to Star: Khoảng cách đến ngôi sao (Quá gần sẽ nóng cháy, quá xa sẽ đóng băng).

Giai đoạn 2: Bộ Lọc Khí Quyển (EDA & Preprocessing)

Không phải hành tinh nào cũng có dữ liệu hoàn hảo. Chúng ta cần:

• Xử lý giá trị thiếu: Những hành tinh bị mất thông tin nhiệt độ sẽ bị loại bỏ hoặc thay thế.

• Chuẩn hóa dữ liệu: Vì khối lượng hành tinh có thể gấp hàng triệu lần bán kính, chúng ta cần đưa chúng về cùng một hệ quy chiếu để mô hình AI không bị “choáng”.

Giai đoạn 3: Huấn Luyện Robot Thám Hiểm (Classification Modeling)

Chúng ta sẽ thử nghiệm với thuật toán Random Forest hoặc K-Nearest Neighbors (KNN). Mô hình sẽ nhìn vào các hành tinh đã biết (như Trái Đất, Sao Hỏa, Sao Mộc) để học cách nhận diện đặc điểm của một “vùng xanh”.

Giai đoạn 4: Xác Nhận Sự Sống (Evaluation)

Trong nhiệm vụ này, Recall (Độ nhạy) là ưu tiên số 1. Chúng ta thà nhầm lẫn một hành tinh chết là “có thể ở được” (để cử tàu đến kiểm tra) còn hơn là bỏ qua một hành tinh thực sự có sự sống.

3. Thực Hành (Hands-on & Interactive)

Google Colab (Trung tâm chỉ huy thám hiểm): Tôi đã chuẩn bị một bộ dữ liệu rút gọn từ kho lưu trữ của NASA để bạn bắt đầu ngay lập tức.

• Link Notebook: Project: Exoplanet Habitability Classifier

◦ Bước 1: Khám phá dữ liệu và vẽ biểu đồ phân tán giữa nhiệt độ hành tinh và khoảng cách sao.

◦ Bước 2: Tiền xử lý dữ liệu và dán nhãn (Habitable vs Non-habitable).

◦ Bước 3: Huấn luyện mô hình Phân loại.

◦ Bước 4: Xuất ra Confusion Matrix để xem chúng ta đã bỏ sót bao nhiêu “Trái Đất 2.0”.

4. Câu Chuyện HaivanStory & Liên Hệ Thực Tế

Năm 2014, kính viễn vọng Kepler phát hiện ra Kepler-186f, hành tinh đầu tiên có kích thước tương đương Trái Đất nằm trong vùng ở được của một ngôi sao khác. Lúc đó, các nhà khoa học đã phải xử lý hàng terabyte dữ liệu nhiễu để khẳng định điều này.

Nhờ có Machine Learning, ngày nay chúng ta có thể làm việc đó trong vài giây. Haivan thường ví von rằng: AI chính là chiếc “mắt thần” giúp nhân loại nhìn xuyên qua bóng tối của không gian. Mỗi lần mô hình của bạn báo “1” (Habitable), đó là một tia hy vọng mới cho hành trình di cư của nhân loại vào tương lai.

Thực tế ngày nay: NASA hiện đang sử dụng AI để lọc dữ liệu từ hàng triệu tín hiệu ánh sáng, giúp phát hiện ra các hành tinh mới nhanh hơn gấp 10 lần so với phương pháp thủ công của con người.

5. Tổng Kết & Chúc Mừng

Nếu bạn đã hoàn thành dự án này, bạn đã thực sự tốt nghiệp khóa huấn luyện “Phi hành gia Dữ liệu”:

• Bạn đã biết cách xử lý dữ liệu thiên văn học phức tạp.

• Bạn hiểu cách vận hành của mô hình Phân loại (Classification).

• quan trọng nhất, bạn đã học được cách đặt câu hỏi cho dữ liệu để tìm ra những giá trị thay đổi vận mệnh nhân loại.

6. Kêu Gọi Hành Động (Call to Action)

Trong danh sách các hành tinh bạn vừa phân loại, có hành tinh nào có chỉ số giống Trái Đất nhất không? Hãy đặt tên cho hành tinh đó và chia sẻ các thông số của nó (Khối lượng, Khoảng cách) dưới phần bình luận nhé!

Đừng quên gắn thẻ #HaivanStoryExoplanet để chúng ta cùng lập bản đồ cho những hành tinh mới này!

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *